CORPUS LINGUISTICS — 2006

 
А.В. Зубов На кафедре информатики и прикладной лингвистики Минского государственного лингвистического университета совместно с Институтом языкознания Национальной Академии Наук создается корпус текстов белорусского языка. Он включает подкорпус текстов белорусского языка (1 млн словоупотреблений) и три параллельных подкорпуса: русско-белорусский, немецко-белорусский, русский и англо-белорусский. Подкорпус белорусских текстов включает тексты художественной литературы (прозу) и публицистические тексты. Параллельные подкорпусы содержат тексты художественной литературы (прозу и стихи), публицистические и научные тексты.

Каждое слово корпуса текстов будет содержать комплекс морфологических, семантических и структурных тэгов.