Весь модельный ряд GigaChat получил значительный апгрейд. Иллюстрация пресс-службы Сбера
Значительный апргейд получил весь модельный ряд нейросети Сбера. Так, флагманская модель GigaChat 2 MAX стала еще мощнее и уверенно опережает многие зарубежные аналоги в задачах на русском языке. GigaChat 2 Pro демонстрирует качество на уровне предыдущей версии МАХ и справляется с задачами, в которых важны креатив и точность. При этом сама модель стала менее требовательна к ресурсам. А GigaChat 2 Lite, базовая модель для решения легких задач, по качеству теперь сопоставима с предыдущей версией Pro: на ней можно быстрее и выгоднее решать сложные задачи.
Одним из преимуществ GigaChat 2.0 стала возможность разработки более продуктивных автономных помощников – AI-агентов (от Artificial intelligence – искусственный интеллект). Они способны рассуждать и самостоятельно решать сложные многокомпонентные задачи. Прогресс был достигнут благодаря увеличению знаний GigaChat в математике, естественных и гуманитарных науках, а также улучшению способностей нейросети в написании качественного программного кода.
Для создания AI-агентов на языках программирования Python и JS можно использовать SDK LangChain – популярный инструмент, упрощающий разработку приложений с большими языковыми моделями (Large Language Model – LLM). GigaChat с ним полностью совместим – пакеты совместимости размещены в публичном репозитории GigaChain.
Кроме того, нейросети нового модельного ряда обрабатывают в четыре раза больше контекста беседы, гораздо дольше удерживают его, отвечают на сложные длинные вопросы и анализируют больше текста. Если раньше в один запрос можно было загрузить примерно 48 страниц A4 с текстом (шрифт 14 pt), то теперь максимальный объем запроса вырос почти до 200 страниц. Поэтому GigaChat 2.0 стал более эффективным в создании чат-ботов.
Новые модели в два раза лучше решают рабочие задачи – в два раза точнее следуют инструкциям пользователя и на 25% лучше отвечают на вопросы, т.е. соблюдают заданные форматы и условия и формируют ответы в определенном стиле. Это помогает эффективнее решать рабочие задачи: готовить сопроводительную правовую документацию, анализировать обращения клиентов и т.д.
По данным независимого бенчмарка MERA для русского языка, GigaChat 2 MAX занимает первое место среди AI-моделей. Результаты бенчмарков формата MMLU на русском и английском языках показывают, что новый модельный ряд не уступает показателям мировых лидеров или даже превосходит их. Наиболее впечатляющие результаты показала флагманская модель линейки. GigaChat 2 MAX по сравнению с DeepSeek-V3, Qwen2. 5 (версия Qwen-2. 5-75b), GPT4o и LLaMA 70B лучше отвечает на фактологические вопросы на русском языке и следует заданному формату. Модель также опережает зарубежные аналоги на бенчмарке для оценки кодовых способностей HumanEval и более глубоко разбирается в точных науках.
На данный момент GigaChat 2. 0 доступен бизнес-клиентам и пользователям в облаке через API, его также можно развернуть локально в инфраструктуре компании (on-premise). При этом пользователи сохраняют доступ к версиям первого поколения и могут протестировать новинку, прежде чем перейти на нее. Подбор оптимальной версии и текстовых запросов (промптов) не требует владения навыками программирования.
«GigaChat 2.0 – не просто рост метрик и технических характеристик, а значительный шаг в развитии русскоязычных больших языковых моделей, – подчеркнул старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев. – Мы создали модель на уровне лучших мировых решений, а в задачах на русском языке модель превосходит большинство из них. Сильные отечественные нейросети стратегически важны для любого бизнеса, который ведет свою деятельность в России. 15 тыс. внешних клиентов уже используют GigaChat, и мощное обновление нашей линейки позволит еще большему числу клиентов эффективнее решать огромный спектр задач. Совершенствуя процессы с помощью искусственного интеллекта, компании получат уникальную возможность опередить конкурентов, увеличить прибыль и повысить лояльность потребителей».