Корпусная лингвистика и автоматизация лексикографических работ — Факультет филологии и искусств

руководитель: Захаров Виктор Павлович

Корпусная лингвистика – раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий. Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.

Целесообразность создания и смысл использования корпусов определяется следующими предпосылками:

1) достаточно большой (репрезентативный) объем корпуса гарантирует типичность данных и обеспечивает полноту представления всего спектра языковых явлений;

2) данные разного типа находятся в корпусе в своей естественной контекстной форме, что создает возможность их всестороннего и объективного изучения;

3) однажды созданный и подготовленный массив данных может использоваться многократно, многими исследователями и в различных целях.

Можно сказать, что все современные лингвистические исследования и работы по составлению словарей и грамматик так или иначе ориентированы на использование представительных корпусов текстов.

Совместно с ИЛИ РАН подана заявка («Создание лингвистической системы для автоматизации лексикографических работ») в РФФИ, которая рассматривается.

Формы и объемы представления научных результатов – публикации объемом примерно 2 а.л.

Наполнение

темы

статьи

организация конференции

семинары

диссертации

(кфн/дфн)

6

2

1

1/0

Число сотрудников кафедры – исполнителей темы: 5