Синтаксические парсеры

Как вы наверняка знаете, на завершившемся Диалоге подводились итоги соревнования синтаксических парсеров.

Выложено 5 тематических докладов: 1 от организаторов и 4 от разработчиков (ABBYY, Яндекс, ЭТАП и питерский SemSin). (Про анализ тональности тоже выложили подборку.)

Что гораздо более интересно, по результатам соревнования сделали TreeBank (корпус с синтаксической разметкой), размеченный тремя парсерами:

  • SyntAutom (Яндекс),
  • SemSin (СПбИТМО, СПб ЭМИ РАН),
  • Russian Malt (Сергей Шаров [Лидсский университет], Йоаким Нивре [Уппсальский университет]).

Можно смотреть и сравнивать результаты разбора. Скачать корпус, по-видимому, нельзя (впрочем, при желании, конечно, можно написать бота).

На том же сайте собрали замечательную подборку ссылок про синтаксический анализ и трибанки.

Об авторе Дмитрий Грановский

— Яндекс, разработчик — СПбГУ, ассистент — OpenCorpora.org, разработчик
Запись опубликована в рубрике Конференции, Ресурсы/Софт. Добавьте в закладки постоянную ссылку.

2 комментария: Синтаксические парсеры

  1. Mary Nikolaeva говорит:

    А еще ABBYY написали про парсеры и диалог статью на хабре.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *