Разработка синтаксического, лексического и морфологического наборов меток для грамматической разметки текстов на казахском языке

Аннотация: 

В статье описывается процесс разработки синтаксического, лексического и морфологического наборов меток для Казахского языка. Морфологическая разметка включает в себя набор меток для обозначения основных грамматических свойств имен и глаголов. Словообразующие суффиксы помечаются маркерами перехода между соответствующими частями речи. Для лексической разметки мы разработали гибкий набор меток, который, в зависимости от приложения, может содержать определенное их количество. Синтаксическая разметка представляет собой компактный набор меток, обозначающий стандартные синтаксические категории. Данная статья является расширенным вариантом статьи [1], опубликованной в сборнике трудов конференции «Theory, Engineering, Language» (TEL 2014). Помимо оригинального материала, статья включает в себя дополнительный раздел по методике работы с аннотаторами при создании разметок.

Ключевые слова: 

вычислительная лингвистика, разработка наборов грамматических меток, синтаксис, части речи, морфология.

Прикрепленный файлРазмер
Cтатья285.54 кб