CORPUS LINGUISTICS – 2006

Темы Тезисы   Theses Topics Русский/English
   
Н.М. Борковская Во всех отраслях науки наблюдается тенденция к систематизации и формализации накопленных знаний. В свете создания систем понимания текста и извлечения заказанной информации очень актуальной оказывается задача формального описания узких предметных областей (ПО). Корпусная лингвистика является плодотворной средой для моделирования предметных областей. В настоящее время в рамках диссертационного исследования (под руководством Н.Н. Леонтьевой) ведется работа по созданию формализованного описания ПО “Фондовый рынок”. Наиболее частотные слова и словосочетания, характерные для подъязыка фондового рынка, дали материал для создания общей схемы ПО, а также типовых фреймовых структур. Проведенный квантитативный анализ массива позволил выделить не только ключевые термины, которые используются в описании ПО, но и типичные для нее шаблоны. В целом описание предназначено как для человека-переводчика, так и для использования системами машинного перевода и информационного поиска.
Центральным компонентом такого представления знаний ПО является объяснительный англо-русский словарь нового типа, который кроме толкования лексических единиц дает ссылки на схемы и фреймы ПО фондового рынка. Основой для словаря послужил список наиболее употребительных терминов. Удалось проследить и конкретизировать значения описываемых терминов, найти более адекватные русские эквиваленты для двуязычного словаря, а также верифицировать данные существующих словарей относительно корпуса текстов.