Бета-тестування національної моделі LLM заплановане на весну 2026 року, повідомив перший віцепрем'єр.

Запустити бета-тестування національної LLM (велика мовна модель - ІФ-У) заплановано навесні 2026 року, повідомив перший віцепрем'єр-міністр цифрової трансформації Михайло Федоров.

"А назву для української LLM оберуть самі українці -- у січні розпочнемо голосування в "Дії", - написав він у Телеграм-каналі в середу.

За його інформацією, у січні планується створення першої бази текстів, яка слугуватиме для навчання LLM. Крім того, буде вдосконалено токенізатор, що розділяє слова на складові частини для забезпечення швидшої та ефективнішої обробки мовних даних, а також розроблені власні бенчмарки для оцінки якості.

Федоров пояснив, що наразі триває збір даних для навчання LLM. "Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями -- це терабайти унікальних даних", - зауважив перший віцепрем'єр.

Він додав, що фахівці працюють над створенням тестів мовної моделі, які допоможуть оцінювати й покращувати її якість.

"Паралельно створюємо юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі", - підкреслив Федоров.

Відзначається, що технічним партнером цього проєкту виступає провідний український оператор мобільного зв'язку "Київстар", який забезпечує фінансування для створення національної великої мовної моделі, що в подальшому буде передана державі.

Перший віцепрем'єр зазначив, що група незалежних фахівців з різних секторів буде оцінювати якість розробки. Зокрема, модель піддаватимуть перевірці на технічні характеристики, етичні аспекти, безпеку для користувачів, а також на знання української мови та розуміння національного контексту.

У грудні 2025 року повідомлялось, що Міністерство цифрової трансформації разом з найбільшим українським оператором мобільного зв'язку "Київстар" обрали модель Gemma 3 від Google (відкрита ШІ-модель) для тренування української LLM.

У своєму прес-релізі "Київстар" зазначив, що модель Gemma вже показала вражаючі результати як основа для MamayLM та Lapa LLM — перших українських мовних моделей, а також для INSAIT BgGPT — сучасної мовної моделі для болгари.

#Google #Університет #Українська мова #Українці #Знання #Інтернет #Київстар #Михайло Федоров #Магістр права #Оператор (професія) #Мобільний зв'язок #Оператор мобільної мережі #болгарська мова

Читайте також

Найпопулярніше
Древко на гербі
У бібліотеку Ірландії повернули книгу, яка була втраченя більш ніж 50 років.
Акторку з популярного серіалу "Сексуальне виховання" викликали до суду у справі про сексуальне насильство: деталі ситуації.
Актуальне
Прийом заявок на конкурс "Я -- журналіст!" триватиме до 15 лютого.
До ініціативи "зимового вступу" приєдналися більше 80 навчальних закладів вищої освіти.
Працівників КМДА та комунальних служб затримали за розкрадання 4,5 мільйона гривень під час ремонту вулиці.
Теги