Корпусная лингвистика и автоматизация лексикографических работ — Факультет филологии и искусств
руководитель: Захаров Виктор Павлович
Корпусная лингвистика – раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий. Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.
Целесообразность создания и смысл использования корпусов определяется следующими предпосылками:
1) достаточно большой (репрезентативный) объем корпуса гарантирует типичность данных и обеспечивает полноту представления всего спектра языковых явлений;
2) данные разного типа находятся в корпусе в своей естественной контекстной форме, что создает возможность их всестороннего и объективного изучения;
3) однажды созданный и подготовленный массив данных может использоваться многократно, многими исследователями и в различных целях.
Можно сказать, что все современные лингвистические исследования и работы по составлению словарей и грамматик так или иначе ориентированы на использование представительных корпусов текстов.
Совместно с ИЛИ РАН подана заявка («Создание лингвистической системы для автоматизации лексикографических работ») в РФФИ, которая рассматривается.
Формы и объемы представления научных результатов – публикации объемом примерно 2 а.л.
Наполнение
темы
статьи |
организация конференции |
семинары |
диссертации (кфн/дфн) |
6 |
2 |
1 |
1/0 |
Число сотрудников кафедры – исполнителей темы: 5