Автоматический морфологический анализ для корпусов тюркских языков

Аннотация: 

В статье описываются принципы работы автоматического морфологического анализатора для тюркских языков. Выделяются его основные компоненты: грамматический словарь языка; порядковая модель словоформы (набор позиций в словоформе и морфонологических представлений аффиксов для этих позиций); правила сочетаемости аффиксов в пределах словоформы и двухуровневые фонетические правила выбора алломорфов конкретного аффикса. В основе работы парсера лежит алгоритм анализа, разработанный Ф.Крыловым на базе системы StarLing. В качестве иллюстрации приводится версия морфологического анализатора для древнетюркского языка. Работа ведется в рамках масштабного проекта по созданию корпусных ресурсов языков народов России, в частности корпусов на малых тюркских языках РФ.

Ключевые слова: 

корпус языка, морфологический парсер, морфологический анализ, словоизменение, компьютерная модель словоформы, система StarLing.

Прикрепленный файлРазмер
Cтатья374.37 кб