CORPUS LINGUISTICS — 2006

Темы Тезисы   Theses Topics Русский/English
   
П. Макагонов, К.О. Сбойчаков, А. Руис Фигероа Описывается методика построения тезаурусов (или онтологий) текстов по узкой тематике (на примере корпуса из более 2000 статей по параллельным, конкурентным и распределенным вычислениям на двух языках). Рассматривается часть структуры тезаурусов, состоящая из концептов наибольшего уровня абстракции. На примере двух тезаурусов, построенных на статьях, опубликованных в период до и после 1998 г., демонстрируется алгоритм выявления динамики развития тематики, охваченной корпусом текстов и концептами верхнего уровня абстракции в тезаурусах. Независимость смыслового содержания концепта от естественного языка позволяет проводить «пространственное» сравнение верхней части структуры тезаурусов по одной и той же тематике на разных языках. Как «пространственные», так и временнЫе сравнения проводятся по методике, близкой к Edit tree algorithm. По статиситке статей, соответствующих определенной теме строится полная логистическая кривая для анализа и прогноза жизненного цикла темы.