GigaChat научился распознавать изображения
11:30 07.10.2024
Нейросетевая модель Сбера GigaChat Pro обрела новую модальность. Теперь в качестве запроса пользователь может отправить иллюстрацию, чтобы сервис использовал ее как дополнительный контекст. Модель определит, сколько людей на фото, во что они одеты, даст совет по стилю одежды и многое другое.
Модель также научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные, которые в них содержатся. Например, студенты могут сфотографировать часть учебного материала или конспекта, загрузить изображение и в несколько кликов получить короткое содержание текста, его ключевую тему и сформировать план дальнейшей работы с ним.
Функциональность доступна и бизнес-клиентам через API. Компании могут использовать искусственный интеллект в еще большем числе сценариев: модерировать и классифицировать отзывы, систематизировать медиаконтент, автоматизировать линию поддержки (когда клиент прикладывает к обращению скрин или фото). Ретейлеры могут загружать изображение товара и просить сервис придумать к нему продающее описание.
Кроме того, в четыре раза был увеличен размер контекста как GigaChat Pro, так и версии GigaChat Lite – с 8 тыс. до 32 тыс. токенов. Если раньше в один запрос можно было загрузить объем текста, сопоставимый с 15 страницами A4 (шрифт 14 pt), то теперь максимальный объем запроса вырос до 60 страниц. Кроме того, у моделей повысился уровень математических знаний, а GigaChat Pro научился лучше форматировать текст – расставлять параграфы, заголовки, используя выделения и списки.
«Мультимодальность расширяет способы и сферы применения больших языковых моделей, она же – ключевой тренд развития генеративного искусственного интеллекта, – отметил Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка. – Теперь GigaChat умеет распознавать изображения – и это не просто еще один важный шаг в развитии нашего сервиса, он открывает широкий спектр новых возможностей для наших пользователей. В том числе появляется много сценариев использования GigaChat API для бизнеса. Кроме того, увеличение размера контекста системы в четыре раза позволит поддерживать более длинные диалоги с пользователями и проще реализовывать кейсы с механикой RAG».
Модель GigaChat Pro бесплатно доступна всем пользователям через веб-версию, Telegram и «ВКонтакте». Разработчикам и бизнесу модели доступны через GigaChat API.
Комментарии отключены - материал старше 3 дней
Новости
- 20:45 26.12.2024
- Контракта на поставку газа через Украину нет, и за 3-4 дня заключить его невозможно - Путин
- 20:40 26.12.2024
- Чтобы поставлять газ в Европу через Польшу, «достаточно только кнопку включить и все» - Путин
- 20:30 26.12.2024
- Путин считает Словакию приемлемым вариантом площадки для переговоров по Украине
- 20:20 26.12.2024
- Azerbaijan Airlines выплатит компенсации пострадавшим и семьям погибших в авиакатастрофе в Казахстане
- 20:10 26.12.2024
- Путин: У нас пока немного систем „Орешник“. Они у нас есть, но мы не спешим их применять
- 20:00 26.12.2024
- Путин отреагировал на слова Трампа о заморозке конфликта на Украине
- 18:30 26.12.2024
- Власти Перу объявили зоной экологического бедствия большую часть побережья провинции Талара из-за разлива нефти
- 18:20 26.12.2024
- Ограничения на работу аэропорта Калуги сняты - Росавиация
- 18:10 26.12.2024
- По опросу число жители Западной Европы, готовых поддерживать Украину «пока Россия не отступит», значительно снизилось
- 18:05 26.12.2024
- В новой стратегии обороны Молдавии главной угрозой стране названа Россия
комментарии(0)