"Київстар" та Мінцифри підписали меморандум про співпрацю для створення LLM

Найбільший український оператор зв’язку "Київстар” та Міністерство цифрової трансформації (Мінцифри) підписали меморандум про співпрацю над великою мовною моделлю (LLM).
"Ми зможемо запускати сервіси в державі, не зберігаючи дані за кордоном або в інших місцях, які є сумнівними або можуть бути враженими. Будемо це зберігати на власній інфраструктурі, використовуючи нашу власну LLM-матерію. Можливо, не тільки її, але фундаментально точно і цю модель, а також інші продукти. І це дасть нам змогу запускати більше сервісів", - сказав віце-прем’єр – очільник Мінцифри Михайло Федоров на заході з нагоди підписання документа в Києві у вівторок.
За його словами, створення української LLM дасть можливість збирати унікальну кількість даних та працювати з defence-tech, обробляти та генерувати певні рішення.
"Там будуть наші науковці, роботи наших науковців, наших бібліотек. Все буде оцифровано й використовуватися для навчання цієї моделі. Цю модель можна буде використовувати для того, щоб різні організації, бізнеси, вже навчені працювати з цією моделлю, могли апгрейдувати, використовувати для своїх бізнесових цілей", - пояснив Федоров.
Розробка інструменту триватиме дев'ять місяців, після чого протягом року відбуватиметься бета-тестування. Модель буде створено на одному з open-source рішень, без залучення державних коштів. Першу версію планують запустити до грудня 2025 року.
На базі мовної моделі держава має на меті створити AI-сервіси для громадян та інструментів з метою оптимізації внутрішніх процесів. У планах Мінцифри та WINWIN AI Center of Excellence - запуск AI-асистента у "Дії", AI-інструментів для аналізу нормативно-правових актів та роботи з європейським законодавством, AI-інструментів у "Мрії" для створення індивідуальних освітніх траєкторій для школярів тощо. Усього це понад 10 продуктів на базі ШІ.
Україномовна LLM надаватиме більш релевантні та точні відповіді для користувачів, ніж глобальні моделі, оскільки буде додатково натренована (pre-trained) на українських даних. Планується, що завдяки глибшому розумінню мовної специфіки (діалектів, термінології та контексту) вона краще орієнтуватиметься в багатьох темах, зокрема пов’язаних з українською історією, культурою і суспільним досвідом. Це забезпечить не лише лінгвістичну, а й змістовну точність відповідей.
За словами Федорова, буде створено комітет, що аналізуватиме, на яких даних навчається модель, загрози для неї. У свою чергу, "Київстар" виступатиме операційним виконавцем процесу і формуватиме проєктний офіс для розробки моделі: підбиратиме команду, забезпечуватиме обчислювальні потужності для попереднього навчання (pre-train) української моделі тощо. Також компанія повністю покриває фінансову частину розробки LLM, адже національна LLM розробляється коштом бізнесу без використання державного бюджету.
"Я вважаю, що будь-яка країна з точки зору національної безпеки повинна мати свою національну великопроводну модель. Це знизує кошторості, це національна безпека, локальний контент, можливість забезпечити всі державні органи безкоштовно", - наголосив СЕО "Київстару" Олександр Комаров.
"Київстар" станом на березень 2025 року обслуговував близько 22,7 млн абонентів мобільного зв’язку та понад 1,1 млн абонентів "Домашнього Інтернету". Компанія надає послуги з використанням широкого спектру мобільних і фіксованих технологій, зокрема 4G, Big Data, Cloud solutions, сервіси для кіберзахисту, цифрове ТБ тощо та задекларувала інвестиції в нові телеком технології протягом 2023-2027 рр. в $1 млрд.