CORPUS LINGUISTICS — 2006

 
Е.Л. Алексеева, И.В. Азарова, Л.А. Захарова Корпус агиографических церковнославянских текстов XVI-XVII вв. начал создаваться на кафедре математической лингвистики Санкт-Петербургского государственного университета с конца 70-х годов. К настоящему времени корпус охватывает 52 жития, их общий объем — более 500 тыс. словоупотреблений. Исходно тексты житий представлены в корпусе как смысловая интерпретация текста — вносится разбивка на слова, определяется смысловое расположение выносные буквах. Графематически отражаются такие варианты написания, которые могут иметь содержательную интерпретацию. В рамках проекта «Памятники русской агиографической литературы» жития подвергаются более тщательному анализу: они сопровождаются кратким очерком истории текста, определяются грамматически и семантически аномальные фрагменты. Тексты, прошедшие второй этап обработки, представлены на сайте филологического факультета СПбГУ в формате PDF (по тексту издания) и XML-представления, которое основывается на международных нормах оформления электронных изданий TEI.

Поиск в опубликованных на сайте текстах житий осуществляется по сводному словоуказателю словоформ. В настоящее время разрабатывается схема разметки важных для агиографических текстов текстовых фрагментов: полного или модифицированного цитирования других житийных текстов, что позволит выявить «образцовые» жития с точки зрения средневекового автора, а также устойчивых «формул» выражения духовно-нравственных признаков святости.