Україна запускає національну мовну модель: Мінцифри та «Київстар» шукають партнерів для створення власного ШІ

Міністерство цифрової трансформації України спільно з компанією Київстар оголосили про старт пошуку партнерів для створення національної великої мовної моделі. Ідеться про стратегічний технологічний проєкт, який має стати основою для українських ШІ-помічників у державному секторі, бізнесі та освіті — аналогів глобальних рішень на кшталт ChatGPT чи Gemini, але навчених на українській мові, реаліях і суспільному контексті. У Міністерство цифрової трансформації України підкреслюють, що мова йде не про локалізацію іноземного продукту, а про формування власної інтелектуальної інфраструктури, здатної працювати з українськими запитами без спотворень, втрати смислів і залежності від зовнішніх рішень.

Проєкт розглядають як базовий елемент цифрового суверенітету. Національна LLM має стати технологічним фундаментом для електронних послуг, державних консультацій, автоматизації документообігу, освітніх платформ і бізнес-рішень. У Мінцифри наголошують, що сучасні універсальні мовні моделі часто не враховують український правовий простір, історичний досвід, війну та соціальні реалії, що створює ризики помилкових або поверхових відповідей. Саме тому держава ініціює створення системи, яка з самого початку формуватиметься на українському знанні та культурному коді.

Для цього міністерство запрошує до співпраці партнерів із різних сфер — бізнесу, освіти, науки, культури та медіа. Ключова вимога — наявність якісних текстів українською мовою. Контент партнерів стане навчальним матеріалом для моделі, яка в перспективі відповідатиме на запити мільйонів користувачів. У відомстві підкреслюють, що саме різноманітність і глибина джерел визначать інтелектуальний рівень майбутнього ШІ, його здатність мислити не шаблонно, а з урахуванням контексту.

Перелік даних, які можуть бути корисними для навчання моделі, охоплює майже всі ключові сфери суспільного життя. Медіа можуть надати новини, інтерв’ю, блоги та публіцистику, формуючи еталон сучасної української мови та журналістських стандартів. Освітні й наукові установи — контент курсів, підручники, наукові статті та дисертації, що створять інтелектуальне підґрунтя моделі. Літературна сфера — художні твори, критику та рецензії — допоможе ШІ краще відчувати стилістику, образність і культурні алюзії. Окремий пласт становлять історичні матеріали та оцифровані архіви, які дозволять моделі коректно працювати з минулим України без імперських або колоніальних викривлень. Бізнес-дані, зокрема технічна документація, описи товарів, відкриті відгуки та корпоративні блоги, дадуть змогу ШІ розуміти специфіку українського ринку та підприємницького середовища.

У Мінцифри пояснюють, що кожен сектор відіграватиме власну роль у формуванні моделі. Медіа й видавництва зададуть мовну та стилістичну планку, університети й наукові інституції — логіку, аргументацію та аналітичну глибину, а бізнес — практичну орієнтацію та розуміння економічних процесів. У результаті національна LLM має стати не просто генератором текстів, а інструментом, здатним консультувати, аналізувати й допомагати ухвалювати рішення в українському контексті.

Окремий акцент робиться на захисті інтелектуальної власності. У міністерстві заявляють, що для партнерів розроблено прозорі юридичні умови, які гарантують використання наданих матеріалів виключно для розвитку українського ШІ. Контент не передаватиметься третім сторонам і не використовуватиметься в комерційних продуктах поза межами визначених домовленостей. Усі учасники, які зроблять внесок у створення моделі, будуть офіційно зазначені в підсумковому звіті про її розробку, що має стати не лише формою подяки, а й елементом публічної відповідальності держави.

Ініціатива створення національної мовної моделі вписується у ширший контекст війни та післявоєнного відновлення. Україна дедалі більше стикається з інформаційними викликами, дезінформацією та потребою швидкого доступу до достовірних знань. Власний ШІ, навчений на українських джерелах, може стати інструментом протидії маніпуляціям, підтримки громадян і масштабування державних сервісів у складних умовах. Водночас проєкт відкриває нові можливості для бізнесу й науки, створюючи попит на якісний україномовний контент і стимулюючи розвиток цифрової економіки.

У Мінцифри наголошують, що створення національної LLM — це довгострокова інвестиція, результат якої визначатиме конкурентоспроможність України в цифровому світі на роки вперед. Успіх ініціативи залежить не лише від технологій, а й від готовності суспільства ділитися знанням і брати участь у формуванні спільного інтелектуального ресурсу. Саме тому міністерство закликає всіх, хто має цінні україномовні дані, долучатися до проєкту та стати частиною створення українського штучного інтелекту.