инструмент для автоматической сегментации на морфемы

We are happy to announce that the Python implementation of Morfessor,
Morfessor 2.0, has now been officially published at
http://www.cis.hut.fi/projects/morpho/

Morfessor, originally developed by Mathias Creutz and Krista Lagus, is
a method for unsupervised morphological segmentation. Its first
implementation, Morfessor 1.0, was published already in 2005. Since
then, Morfessor has been used to improve processing of morpholigically
complex languages in a wide range of applications such as speech
recognition, information retrieval and machine translation.

Morfessor 2.0 includes a number of new features, including
semi-supervised training and several speed enhancements. The
accompanying Technical Report can be found at
http://urn.fi/URN:ISBN:978-952-60-5501-5

As more Morfessor news are coming up, we invite you to join new
announcement mailing list, morfessor-announce@list.aalto.fi on
https://list.aalto.fi/mailman/listinfo/morfessor-announce

For any questions and comments, contact morfesso[эт]cis.hut.fi.

Об авторе Лидия Пивоварова

СПбГУ - старший преподаватель, University of Helsinki - PhD student http://philarts.spbu.ru/structure/sub-faculties/itah_phil/teachers/pivovarova
Запись опубликована в рубрике Ресурсы/Софт. Добавьте в закладки постоянную ссылку.

4 комментария: инструмент для автоматической сегментации на морфемы

  1. al говорит:

    Пишут в доке,что

    It is mostly targeted to languages with complex but concatenative morphology, such as Finnish and Turkish, but is useful for any language with compound words or non-fusional inflections.

    то есть для русского не годится,да?

    • Да, похоже для русского не очень годится. Вообще ставить вопрос о автоматической сегментации на морфемы для русского языка довольно странно.
      Но попробовать-то никто не запрещал.

  2. спасибо, исправила

  3. Yauhen говорит:

    Спасибо за пост. Есть опечатка в названии.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *