CORPUS LINGUISTICS — 2006

Темы Тезисы   Theses Topics Русский/English
   
О.Н. Камшилова Материалы международных научных конференций наилучшим образом удовлетворяют требованиям к формированию корпусов текстов lingua franca: они относятся к одной предметной области, совпадают по жанровым и хронологическим характеристикам, имеют ограничение по размеру и формату, содержат необходимые данные для паспортизации текстов в корпусе. Кроме того, их внутренняя структура, выделение позиций Abstracts, Introduction, Conclusion, References сама по себе представляет вариант разметки и может быть основой для создания субкорпусов для специальных исследований. Кодирование лингвистических метаданных и «вертикальное выравнивание» в таких корпусах должно, с одной стороны, опираться на технологический стандарт, а с другой, быть подчинено целям исследования, что обязывает лингвиста к одновременному решению двух задач — собственно исследовательских и технологических. Подобные корпусы по определению не могут быть очень большими, поскольку ограничиваются рамками конкретной конференции. Несмотря на это, исследования в рамках специального корпуса текстов обнаруживают явления общего характера (ср. Biber et al. 1999), которые могут оказаться полезным для описания глобальных тенденций в современном международном научном дискурсе.