CORPUS LINGUISTICS — 2006

 
М.В. Копотев, Г.Б. Гурин В теоретической лингвистике проблема языковых знаков, лишенных означающего (нулевых знаков), обсуждается уже более ста лет (Ф. де Соссюр, Р. Якобсон, И.А. Мельчук, Г. Майер и др.). Существуют и многочисленные исследования, посвященные выделению нулевых единиц в конкретных языках, в том числе в русском (Г.А. Золотова, П.А. Лекант, Е.Н. Ширяев и др.). Однако для пользователя любого корпуса поиск нулевых единиц является серьезной проблемой, а для разработчиков их учет в схеме аннотирования может стать специальной теоретической и технической задачей.

В докладе обсуждаются основные подходы к выделению нулевых знаков на разных языковых уровнях (прежде морфологическом и синтаксическом) в русском языке; предлагаются алгоритмы поиска таких единиц в существующих русских аннотированных корпусах, а также обсуждается необходимость и возможность включения в схему аннотирования информации о нулевых единицах.