Бета-тестирование национальной LLM планируется весной 2026 г. - первый вице-премьер
Запустить бета-тестирование национальной LLM (большая языковая модель - ИФ-У) запланировано весной 2026 года, сообщил первый вице-премьер-министр цифровой трансформации Михаил Федоров.
"А название для украинской LLM выберут сами украинцы - в январе начнем голосование в "Дії", - написал он в телеграм-канале в среду.
По его словам, в январе будет сформирована первая база текстов для тренировки LLM, улучшен токенизатор, который разделяет слова на элементы, для быстрой и продуктивной обработки языка, а также собственные бенчмарки для оценки качества.
Федоров пояснил, что сейчас продолжается сбор данных для обучения LLM. "Для высокого качества информации из интернета недостаточно, поэтому работаем с государственными органами, медиа, университетами и другими институтами - это терабайты уникальных данных", - отметил первый вице-премьер.
Он добавил, что специалисты работают над созданием тестов языковой модели, которые помогут оценивать и улучшать ее качество.
"Параллельно создаем юридический фреймворк, чтобы ответственно работать с данными, которые нам предоставляют для тренировки модели", - подчеркнул Федоров.
Отмечается, что техническим партнером проекта является крупнейший украинский оператор мобильной связи "Киевстар", который финансирует разработку национальной большой языковой модели с последующей передачей ее государству.
Первый вице-премьер уточнил, что качество разработки будет тестировать группа независимых экспертов из разных отраслей. В частности, модель будут проверять на техническое качество, этичность и безопасность для пользователей, знание украинского языка и понимание национального контекста.
В декабре 2025 года сообщалось, что Министерство цифровой трансформации вместе с крупнейшим украинским оператором мобильной связи "Киевстар" выбрали модель Gemma 3 от Google (открытая ИИ-модель) для тренировки украинской LLM.
В своем релизе "Киевстар" тогда напомнил, что модель Gemma уже продемонстрировала результаты как базовая модель для MamayLM и Lapa LLM - первых украинских LLM, а также для INSAIT BgGPT - современной LLM для болгарского языка.