CORPUS LINGUISTICS – 2006

 
Е.Л. Алексеева, И.В. Азарова, Л.А. Захарова Корпус агиографических церковнославянских текстов XVI-XVII вв. начал создаваться на кафедре математической лингвистики Санкт-Петербургского государственного университета с конца 70-х годов. К настоящему времени корпус охватывает 52 жития, их общий объем – более 500 тыс. словоупотреблений. Исходно тексты житий представлены в корпусе как смысловая интерпретация текста – вносится разбивка на слова, определяется смысловое расположение выносные буквах. Графематически отражаются такие варианты написания, которые могут иметь содержательную интерпретацию. В рамках проекта “Памятники русской агиографической литературы” жития подвергаются более тщательному анализу: они сопровождаются кратким очерком истории текста, определяются грамматически и семантически аномальные фрагменты. Тексты, прошедшие второй этап обработки, представлены на сайте филологического факультета СПбГУ в формате PDF (по тексту издания) и XML-представления, которое основывается на международных нормах оформления электронных изданий TEI.

Поиск в опубликованных на сайте текстах житий осуществляется по сводному словоуказателю словоформ. В настоящее время разрабатывается схема разметки важных для агиографических текстов текстовых фрагментов: полного или модифицированного цитирования других житийных текстов, что позволит выявить “образцовые” жития с точки зрения средневекового автора, а также устойчивых “формул” выражения духовно-нравственных признаков святости.