Бета-тестування національної моделі LLM заплановане на весну 2026 року, повідомив перший віцепрем'єр.

Запустити бета-тестування національної LLM (велика мовна модель - ІФ-У) заплановано навесні 2026 року, повідомив перший віцепрем'єр-міністр цифрової трансформації Михайло Федоров.

"А назву для української LLM оберуть самі українці -- у січні розпочнемо голосування в "Дії", - написав він у Телеграм-каналі в середу.

За його інформацією, у січні планується створення першої бази текстів, яка слугуватиме для навчання LLM. Крім того, буде вдосконалено токенізатор, що розділяє слова на складові частини для забезпечення швидшої та ефективнішої обробки мовних даних, а також розроблені власні бенчмарки для оцінки якості.

Федоров пояснив, що наразі триває збір даних для навчання LLM. "Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями -- це терабайти унікальних даних", - зауважив перший віцепрем'єр.

Він додав, що фахівці працюють над створенням тестів мовної моделі, які допоможуть оцінювати й покращувати її якість.

"Паралельно створюємо юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі", - підкреслив Федоров.

Відзначається, що технічним партнером цього проєкту виступає провідний український оператор мобільного зв'язку "Київстар", який забезпечує фінансування для створення національної великої мовної моделі, що в подальшому буде передана державі.

Перший віцепрем'єр зазначив, що група незалежних фахівців з різних секторів буде оцінювати якість розробки. Зокрема, модель піддаватимуть перевірці на технічні характеристики, етичні аспекти, безпеку для користувачів, а також на знання української мови та розуміння національного контексту.

У грудні 2025 року повідомлялось, що Міністерство цифрової трансформації разом з найбільшим українським оператором мобільного зв'язку "Київстар" обрали модель Gemma 3 від Google (відкрита ШІ-модель) для тренування української LLM.

У своєму прес-релізі "Київстар" зазначив, що модель Gemma вже показала вражаючі результати як основа для MamayLM та Lapa LLM — перших українських мовних моделей, а також для INSAIT BgGPT — сучасної мовної моделі для болгари.

#Google #Університет #Українська мова #Українці #Знання #Інтернет #Київстар #Михайло Федоров #Магістр права #Оператор (професія) #Мобільний зв'язок #Оператор мобільної мережі #болгарська мова

Читайте також

Найпопулярніше
Древко на гербі
У бібліотеку Ірландії повернули книгу, яка була втраченя більш ніж 50 років.
Акторку з популярного серіалу "Сексуальне виховання" викликали до суду у справі про сексуальне насильство: деталі ситуації.
Актуальне
"Кінець диктаторського режиму: Чи впаде влада в Ірані?" - новини bigmir)net
Загибель тирана. Чи впаде режим в Ірані?
У Тегерані та кількох інших областях Ірану відбулося відключення інтернету у зв'язку з масовими протестами, повідомляють засоби масової інформації.
Теги