0
0
3359

Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion

15:22 10.04.2024


Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion – OmniFusion 1.1. Технический репорт со статьей модели уже вышел на первое место в разделе Daily trending papers на HuggingFace.

Первая в России мультимодальная языковая модель, способная поддерживать визуальный диалог и отвечать на вопросы пользователей по картинкам, теперь поддерживает русский язык. Open-source-код для обучения и веса доступны к использованию и могут быть применены в том числе при разработке коммерческих продуктов.

OmniFusion — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе – аудио, 3D- и видеоконтента.

Модель распознает и описывает изображения. С ее помощью можно объяснить, что изображено на фото, узнать рецепт для приготовления блюда по фотографии ингредиентов, проанализировать карту помещения или узнать, как собрать устройство по фото отдельных его частей. Модель также умеет распознавать текст и решать задачи. Например, с ее помощью можно решить логические задачи, написанный на доске математический пример или распознать формулу, а также получить их представления в формате LaTeX. Спектр возможностей широкий: уже сейчас модель может проанализировать медицинское изображение и указать на нем какую-то проблему. Разумеется, для того, чтобы подобная модель помогала ставить диагнозы, ее необходимо дополнительно обучать на профильных датасетах с привлечением экспертов из медицины.

В основе архитектуры модели лежит методика совмещения предварительно обученной большой языковой модели и ее «глаз» – визуальных энкодеров, которые позволяют кодировать информацию на изображении в числовой вектор, называемый эмбеддингом. Обучением OmniFusion занимается научная группа FusionBrain Института AIRI при участии ученых из Sber AI и SberDevices.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


20:40 24.01.2025
Трамп хочет реорганизовать Федеральное агентство по ЧС
0
806
19:12 24.01.2025
Будущее мира определят отношения США и Китая - Рубио
0
991
18:21 24.01.2025
Ростех открыл «Биотех-лабораторию» для московских школьников
0
892
17:41 24.01.2025
Евросоюз попросил Дамаск избавиться от военных баз России для снятия санкций
0
1261
17:12 24.01.2025
До 30 тыс. поляков могут быть депортированы из США — МИД Польши
0
1184
17:00 24.01.2025
Путин рассчитывает на дополнительные доходы бюджета в этом году
0
1135
16:32 24.01.2025
ЭПЦ изменит название на Эстонскую христианскую православную церковь — тартуский епископ
0
963
16:12 24.01.2025
В 2024 году контракт с ВС РФ заключили около 450 тыс. человек — Медведев
0
960
16:00 24.01.2025
Послы 27 стран ЕС утвердили приостановку безвизового режима для дипломатов Грузии
0
987
15:32 24.01.2025
ВСУ потеряли за сутки в Курской области более 190 солдат и 3 танка, включая Abrams — МО РФ
0
1031

Возврат к списку