CORPUS LINGUISTICS — 2006

 
Е.В. Ягунова Основной акцент в данном докладе будет сделан на проблеме так называемых неоднословных целостностей в словаре и корпусе. Проблема неоднословных целостностей рассматривается в функциональном контексте, а именно в контексте функционирования единиц разной природы в речевой деятельности. Говоря о единицах разной природы, прежде всего, рассматриваем сопоставление оперативная единица (единица принятия решения на разных этапах речевосприятия и/или порождения) и/или единица словаря (инвентарная единица (Касевич 1986)). Единицы словаря являются частным случаем оперативных единиц (единица принятия решения на этапе идентификации при восприятии или выбор лексико-грамматической единицы из словаря при порождении речи). Для решения вопроса о том, может ли рассматриваемая единица принадлежать словарю или нет, мы опираемся на следующие данные: — традиционный лингвистический анализ, — эксперименты с носителями языка, — инструментальный анализ (позволяющий определить степень фонетической цельнооформленности), — распределение частот встречаемости в корпусе текстов. Последнее поясним подробнее. Достаточно высокая частота встречаемости того или иного сочетания слов (т.е. как бы его «востребованность» при прочих равных условиях) может служить основанием для предположения о вхождении данного сочетания в словарь на правах отдельной единицы. Рассматривается распределение частот не только (не столько) в «генеральном» корпусе текстов, но в корпусе текстов одного функционального стиля, т.к. человек в процессе речевой деятельности выбирает «текущий словарь», заранее определяя заданный условиями коммуникации тип текста (например, публицистика или бытовой диалог).

В настоящее время набралось немало работ, посвященных вопросам «неоднословных единиц» (Венцов, Касевич, Ягунова 2003), «единиц, эквивалентных слову» (Рогожникова 2003), «многокомпонентных единиц» (Копотев 2004) и т.д. В этих работах рассматриваются разные наборы единиц (выделяемых на принципиально разных основаниях): от «в обнимку», «в течение» до «как …, так», «если …, то» . Как уже рассматривалось выше, множество рассматриваемых единиц неоднородно как с точки зрения функционирования в речевой деятельности, так и с точки зрения традиционного набора параметров (неаддитивность семантики, удовлетворения критериям выделения слова, синтаксическим функциям). В то же время практически все из них могут претендовать на роль некоей единицы (целостности) при уточнении основополагающих функциональных вопросов:

вида речевой деятельности: восприятие / порождение,
этапа или уровня восприятия или порождения речи,
статуса единицы: единица словаря или только оперативная единица. В докладе предлагаются некоторые результаты применения нашего подхода для исследования функционирования неоднословных целостностей в процедурах речевой деятельности для следующих типов единиц:

фонетические слова (например, о маме — ты бы);

составные слова (в соответствии с правилами разметки Национального корпуса русского литературного языка, www.narusco.ru).