0
0
1716

GigaChat научился распознавать изображения

11:30 07.10.2024


Нейросетевая модель Сбера GigaChat Pro обрела новую модальность. Теперь в качестве запроса пользователь может отправить иллюстрацию, чтобы сервис использовал ее как дополнительный контекст. Модель определит, сколько людей на фото, во что они одеты, даст совет по стилю одежды и многое другое.

Модель также научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные, которые в них содержатся. Например, студенты могут сфотографировать часть учебного материала или конспекта, загрузить изображение и в несколько кликов получить короткое содержание текста, его ключевую тему и сформировать план дальнейшей работы с ним.

Функциональность доступна и бизнес-клиентам через API. Компании могут использовать искусственный интеллект в еще большем числе сценариев: модерировать и классифицировать отзывы, систематизировать медиаконтент, автоматизировать линию поддержки (когда клиент прикладывает к обращению скрин или фото). Ретейлеры могут загружать изображение товара и просить сервис придумать к нему продающее описание.

Кроме того, в четыре раза был увеличен размер контекста как GigaChat Pro, так и версии GigaChat Lite – с 8 тыс. до 32 тыс. токенов. Если раньше в один запрос можно было загрузить объем текста, сопоставимый с 15 страницами A4 (шрифт 14 pt), то теперь максимальный объем запроса вырос до 60 страниц. Кроме того, у моделей повысился уровень математических знаний, а GigaChat Pro научился лучше форматировать текст – расставлять параграфы, заголовки, используя выделения и списки.

«Мультимодальность расширяет способы и сферы применения больших языковых моделей, она же – ключевой тренд развития генеративного искусственного интеллекта, – отметил Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка. – Теперь GigaChat умеет распознавать изображения – и это не просто еще один важный шаг в развитии нашего сервиса, он открывает широкий спектр новых возможностей для наших пользователей. В том числе появляется много сценариев использования GigaChat API для бизнеса. Кроме того, увеличение размера контекста системы в четыре раза позволит поддерживать более длинные диалоги с пользователями и проще реализовывать кейсы с механикой RAG».

Модель GigaChat Pro бесплатно доступна всем пользователям через веб-версию, Telegram и «ВКонтакте». Разработчикам и бизнесу модели доступны через GigaChat API.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


22:00 11.03.2025
Рубио: Вот что на столе. Украина готова прекратить стрелять и начать переговоры
0
127
21:35 11.03.2025
По итогам переговоров в Джидде, США возобновят поставки оружия и разведданных Украине - AP
0
188
21:20 11.03.2025
Украина, по предложению США, согласилась на временное 30-дневное прекращение огня - текст заявленя
0
269
20:32 11.03.2025
ЕС не хватает «тысяч танков и орудий» - еврокомиссар
0
249
20:00 11.03.2025
Ущерб нефтепроводу «Дружба» от атаки украинского дрона устранен российским оператором – МИД Венгрии
0
284
19:00 11.03.2025
Армения по-прежнему заинтересована в получении статуса наблюдателя в БРИКС - Мирзоян
0
346
17:40 11.03.2025
США с 12 марта повысят до 50% пошлины на поставки стали и алюминия из Канады
0
463
17:12 11.03.2025
Поставки нефти в Венгрию остановлены из-за удара ВСУ по нефтепроводу «Дружба» — Сийярто
0
515
17:00 11.03.2025
США продвигаются в переговорах с Украиной — Уолтц
0
560
16:32 11.03.2025
Напавший на восьмиклассников в школе Нижнего Новгорода задержан — полиция
0
522

Возврат к списку