CORPUS LINGUISTICS — 2006

 
С.И. Гиндин, Е.А. Иванова, А.С. Красникова Назначение ряда текстовых корпусов и полнотекстовых информационных систем требует надежности и обоснованности включаемых текстов. Надежность текста означает, что он освобожден от искажений (как случайных, так и намеренных), накопившихся за время его функционирования. Обоснованность означает мотивированный выбор среди различных «законных» модификаций текста. Очевидно, что мотивировка выбора и произведенных «очисток» должна в определенном виде храниться при самом корпусе. Помимо текстологического обоснования, в развитом корпусе данного типа естественно хранить и другие типы комментария к тексту, помогающие его адекватному пониманию и использованию. Все эти разновидности информации образуют в совокупности научный аппарат, или «филологическое сопровождение» текстов корпуса. Филологическое сопровождение текста позволяет отвечать только на заранее предвидимые вопросы пользователя. Для того, чтобы облегчить ему поиск ответа на инициативные вопросы, желательно предусмотреть «филологическое оснащение» — словари, специальные справочники и прочий инструментарий для самостоятельной работы.

Текстовый корпус с подсистемами филологического сопровождения и оснащения и образуют в совокупности систему филологического обеспечения. Доклад подготовлен на материале системы филологического обеспечения по творчеству Брюсова, созданной при участии докладчиков в Институте лингвистики РГГУ.