CORPUS LINGUISTICS — 2006

Темы Тезисы   Theses Topics Русский/English
   
Т.Ю. Шерстинова Большинство младописьменных языков функционирует преимущественно в устной форме. Фонетика и особенно просодика таких языков изучена очень мало, а сами языки находятся на грани исчезновения. Актуальной является задача создания звукового корпуса младописьменных языков, который был бы представительным с точки зрения просодики (включал в себя разные типы отдельных высказываний, диалоги, монологи и фольклорные тексты). Электронный корпус озвученных текстов, представленный в виде мультимедийной базы данных, позволит сохранить просодические характеристики живой современной речи для будущих поколений и станет основой для научного исследования просодической системы языка. Для такого корпуса разрабатывается специальное представление оцифрованной речи в базе данных, которая позволит проводить автоматическую обработку просодических характеристик, будет определен список существенных диагностических признаков и будут разработаны алгоритмы системно-статистической типологизации полученных данных. В результате применения исследовательского аппарата к звуковому корпусу изучаемого языка будут получен список его основных просодических моделей с подробным описанием их акустических характеристик, а также возможностью прослушивания и дальнейшего анализа представленных образцов звучания. Разрабатываемая система будет апробирована на материале современной ненецкой речи. Впервые будет создан электронный корпус звучащих текстов ненецкого языка, и будет предпринята первая попытка системного описания ненецкой просодики.