CORPUS LINGUISTICS – 2006

 
Е.В. Ягунова Основной акцент в данном докладе будет сделан на проблеме так называемых неоднословных целостностей в словаре и корпусе. Проблема неоднословных целостностей рассматривается в функциональном контексте, а именно в контексте функционирования единиц разной природы в речевой деятельности. Говоря о единицах разной природы, прежде всего, рассматриваем сопоставление оперативная единица (единица принятия решения на разных этапах речевосприятия и/или порождения) и/или единица словаря (инвентарная единица (Касевич 1986)). Единицы словаря являются частным случаем оперативных единиц (единица принятия решения на этапе идентификации при восприятии или выбор лексико-грамматической единицы из словаря при порождении речи). Для решения вопроса о том, может ли рассматриваемая единица принадлежать словарю или нет, мы опираемся на следующие данные: – традиционный лингвистический анализ, – эксперименты с носителями языка, – инструментальный анализ (позволяющий определить степень фонетической цельнооформленности), – распределение частот встречаемости в корпусе текстов. Последнее поясним подробнее. Достаточно высокая частота встречаемости того или иного сочетания слов (т.е. как бы его “востребованность” при прочих равных условиях) может служить основанием для предположения о вхождении данного сочетания в словарь на правах отдельной единицы. Рассматривается распределение частот не только (не столько) в “генеральном” корпусе текстов, но в корпусе текстов одного функционального стиля, т.к. человек в процессе речевой деятельности выбирает “текущий словарь”, заранее определяя заданный условиями коммуникации тип текста (например, публицистика или бытовой диалог).

В настоящее время набралось немало работ, посвященных вопросам “неоднословных единиц” (Венцов, Касевич, Ягунова 2003), “единиц, эквивалентных слову” (Рогожникова 2003), “многокомпонентных единиц” (Копотев 2004) и т.д. В этих работах рассматриваются разные наборы единиц (выделяемых на принципиально разных основаниях): от “в обнимку”, “в течение” до “как …, так”, “если …, то” . Как уже рассматривалось выше, множество рассматриваемых единиц неоднородно как с точки зрения функционирования в речевой деятельности, так и с точки зрения традиционного набора параметров (неаддитивность семантики, удовлетворения критериям выделения слова, синтаксическим функциям). В то же время практически все из них могут претендовать на роль некоей единицы (целостности) при уточнении основополагающих функциональных вопросов:

вида речевой деятельности: восприятие / порождение,
этапа или уровня восприятия или порождения речи,
статуса единицы: единица словаря или только оперативная единица. В докладе предлагаются некоторые результаты применения нашего подхода для исследования функционирования неоднословных целостностей в процедурах речевой деятельности для следующих типов единиц:

фонетические слова (например, о маме – ты бы);

составные слова (в соответствии с правилами разметки Национального корпуса русского литературного языка, www.narusco.ru).