Сбербанк участвует в разработке новых технологий распознавания текста, сообщил первый заместитель председателя правления Сбербанка Александр Ведяхин. "За последние два года технологии машинного перевода существенно продвинулись и вышли на прикладной уровень. Прежде всего это произошло за счет использования моделей глубокого обучения, а в последние полгода значительный прогресс стал возможен за счет активного развития так называемых языковых трансформеров, - рассказал он. - И хотя команда Сбера пока не занимается машинным переводом, наши недавние разработки в области обработки неструктурированной информации также вышли на новый уровень".
Произошло это, по словам Александра Ведяхина, прежде всего за счет усиления ставки на междисциплинарный подход: "Эксперты в предметной области работают в плотной связке со специалистами по глубокому обучению разных направлений - от обработки естественного языка (NLP) до компьютерного зрения (CV)".
Примером успеха такой коллаборации являются наработки, которыми Сбербанк уже начал делиться с профессиональным сообществом на соревнованиях по искусственному интеллекту в преддверии AI Journey 2020, сообщил Александр Ведяхин. "Один из таких хакатонов - как раз про понимание собственноручно написанных рукописей Петром I. Трек называется "Digital Пётр", который мы подготовили в партнерстве с Российским историческим обществом. В рамках него участникам предоставляется возможность улучшить алгоритмы распознавания рукописей со стартовой точностью в 92% до более высоких значений".
По сути дела, речь идет о понимании старорусского языка и так называемой скорописи - вида кириллического письма, популярного в период с XV вплоть до начала XIX веков, пояснил Александр Ведяхин. "На сегодняшний день это один из наиболее точных алгоритмов распознавания рукописного текста. И единственный алгоритм, способный "читать" старорусскую письменность, - подчеркнул он. - История имеет для России огромное значение, а технологии XXI века позволяют нам заглянуть в прошлое, понять, о чем думали и говорили наши великие предшественники. У нашего поколения есть уникальный шанс узнать из подлинных рукописей о том, как развивалось Российское государство, ведь это крайне важно для будущего нашей страны".
Ранее сообщалось, что технологию прямого перевода текстов между 100 языками на основе искусственного интеллекта разработал Facebook. В компании анонсировали систему, которая сможет переводить тексты без применения английского языка в качестве промежуточного. Большинство таких технологий сначала переводят тексты с источника на английский, а затем на другой иностранный язык. Из-за этого процесс получается сложным и громоздким, теряется точность некоторых элементов текста.
Чтобы создать новый искусственный интеллект, Facebook использовал сервис CommonCrawl для сбора текстовых примеров по всей сети. Разработчики проанализировали весь материал при помощи системы FastTex и сформировали базу данных из 7,5 млрд предложений, которые система использует для перевода.
комментарии(1)
0
Ksenia 17:32 21.10.2020
здорово, что банк создаёт такие полезные наработки и делится ими с другими. я думаю, что много кому пригодятся такие высокотехнологичные решения, поскольку применять их можно в совершенно разных областях.