Телеком

Минцифры вместе с "Киевстаром" выбрали модель Gemma от Google для тренировки национальной LLM

Министерство цифровой трансформации вместе с крупнейшим украинским оператором мобильной связи "Киевстар" выбрали модель Gemma 3 от Google (открытая ИИ-модель) для тренировки украинского LLM (большая языковая модель - ИФ-У), сообщил первый вице-премьер-министр цифровой трансформации Михаил Федоров.

"Вместе с Kyivstar выбрали большую языковую модель, на которой предварительно обучим национальный украинский LLM. Ею станет Gemma 3 от Google", - написал Федоров в телеграм-канале в понедельник.

По его словам, преимуществами Gemma является оптимальный баланс производительности и ресурсов, поддержка украинского языка и функционирование не только с текстом, но и с изображениями.

В пресс-релизе "Киевстар" отмечается, что планируется улучшить работу модели с украинским языком, что уменьшит ошибки при создании украиноязычных текстов и оптимизирует вычислительные затраты при использовании модели. Также в планах - дообучить модель на украиноязычных текстах, которые сейчас собирают эксперты и создать бенчмарки (тесты) для более точной настройки модели для дальнейшего использования.

"Модель поддерживает более 140 языков вместе с украинским, имеет до 128 тыс. токенов, мультимодальные возможности и гибкую архитектуру, что позволяет адаптировать ее под различные задачи", - добавил в релизе директор по разработке диджитал-продуктов Киевстар Михаил Нестор.

В свою очередь Chief AI Officer Минцифры и CEO WINWIN AI Center of Excellence Даниил Цьвок пояснил, что при выборе модели ориентировались на то, как модель уже обрабатывает тексты на украинском языке и ее контролируемость при дообучении.

По его словам, это поможет минимизировать лингвистические и этические риски в украинской LLM.

В своем релизе "Киевстар" напомнил, что модель Gemma уже продемонстрировала результаты как базовая модель для MamayLM и Lapa LLM - первых украинских LLM, а также для INSAIT BgGPT - современной LLM для болгарского языка. 

Реклама
Реклама

ЕЩЕ ПО ТЕМЕ

ПОСЛЕДНЕЕ