Научные книги сейчас издаются маленькими тиражами, и компьютер здесь отчасти выручает ученых. В научной библиотеке Математического института им. Стеклова РАН.
Фото Наталии Преображенской (НГ-фото)
Популярный в народе образ филолога, прячущегося от мира за штабелями книг, постепенно начал меняться. Перед исследователем слова обязательно вырастет компьютер, а многие пузатые тома на его столе «похудеют» до тоненьких компакт-дисков. Некоторых таких ученых XXI века можно было увидеть на конференции «Современные информационные технологии и филология», проходившей в Институте мировой литературы имени А.М. Горького РАН.
Научные книги сейчас издаются маленькими тиражами и стоят дорого, съездить в Москву или другой крупный город в библиотеку тоже недешево и непросто. Компьютер здесь отчасти выручает ученого: если есть доступ к интернету, можно посидеть в виртуальном читальном зале. У филологов заслуженным авторитетом пользуется бесплатная Фундаментальная электронная библиотека «Русская литература и фольклор» (http://feb-web.ru). В ней выложены произведения классической литературы, научные труды, справочные издания. Когда книгу оцифровывают для ФЭБ, то педантично воспроизводят ее структуру, пагинацию (разбивка на страницы), пунктуацию и орфографию, – чтобы добросовестному читателю, скачавшему какую-то цитату, не нужно было перепроверять ее содержание и библиографическое описание.
Для фольклористов возможности, которые предоставляет компьютер, вообще неоценимы. С компакт-диска можно не только послушать аудио- и видеозапись исполнения песен или частушек, но и почитать текстовую расшифровку и научный комментарий. «Фольклор принципиально мультимедиен, – подвел итог Юрий Шейкин, заведующий кафедрой искусствоведения Арктического государственного университета культуры и искусства (Якутск). – Его уже нельзя издавать иначе».
Новейшие информационные технологии не только обеспечивают доступ к массиву текстов, но и дают инструмент для их исследования. Александр Евдокимов, старший научный сотрудник ИМЛИ РАН, рассказал на конференции, какие локальные поисковики могут быть полезны филологу. Утилита AVSearch позволяет выделить в документах искомое слово или словосочетание. Программа CSDiff умеет автоматически сравнивать содержимое двух текстовых файлов – ее использование могло бы пригодиться, скажем, при подготовке академических собраний сочинений. Конечно, «пока не будет создан искусственный интеллект, осмысливать тексты художественных и не только художественных произведений сможет только человек». Но утилита TextAnalyst уже способна создавать из текстового файла или их группы семантическую цепь, где понятия размещены в зависимости от частотности их употребления, и гипертекст, позволяющий судить о логических взаимосвязях отдельных слов и предложений.
Справочная система «Национальный корпус русского языка» (НКРЯ) дает возможность обнаруживать закономерности в употреблении слов. Доктор филологических наук Николай Перцов, ведущий научный сотрудник Института русского языка имени В.В. Виноградова РАН, воспользовавшись данными НКРЯ, смог сделать вывод: некоторые прежние суждения лингвистов на этот счет неверны или уже устарели. Например, считалось, что при употреблении глагола «промахнуться» невозможно или очень трудно указать на «объект» (куда целились), «инструмент» (из чего целились) и «средство» (чем стреляли). А Николаю Викторовичу поисковик на сайте корпуса (www.ruscorpora.ru) указал на фрагменты из современных текстов: «динамовский защитник умудрился промахнуться в пустые ворота с метра», «┘промахнулся в меня из снайперки с крыши «Титаника», «он <┘> всадил две пули рябому в грудь, <┘> но третьею промахнулся!».
Для того чтобы сетевыми публикациями можно было пользоваться для научных исследований, тексты должны быть «филологически корректными». Игорь Пильщиков, главный редактор ФЭБ, говорил о том, как непросто выполнить два основных требования к электронному тексту: уже упомянутую точность воспроизведения исходной информации и идентифицируемость объектов. «То есть возможность найти текст внутри информационной системы, в том числе если он находится внутри другого текста, – поясняет Игорь Алексеевич. – Вот повесть Лермонтова «Тамань» в большом почете у английских и американских славистов. Допустим, кто-то из них захочет найти ее в русской электронной библиотеке. Надо обязательно указывать, что «Тамань» входит в роман «Герой нашего времени». Сейчас в раздел Фундаментальной библиотеки, посвященный Баратынскому, мы планируем добавить статью Вацуро «Из литературных отношений Баратынского», а в ней приведено несколько стихотворений Михаила Бестужева-Рюмина, малоизвестного поэта пушкинской поры. Эта статья должна обнаруживаться при поиске произведений как Вацуро, так и процитированного поэта».