В статье обсуждается концепция корпуса татарского языка, предлагается модель корпуса, рассматриваются вопросы представления лингвистической информации и принципы морфологической разметки татарских текстов. В качестве отдельного аспекта исследуется проблема репрезентативности текстовой коллекции корпуса, предлагается статистический подход к репрезентативности. Вопросы разработки корпуса татарского языка рассматриваются в связи с особенностями
языковой системы.
Прикрепленный файл | Размер |
---|---|
Статья | 251.03 кб |