многоязычный новостной корпус с аннотированными событиями

MEVEX is a multilingual corpus of news, annotated with event metadata information. The events in our corpus are from the domain of violence, natural and man made disasters. The main goal of the corpus is an automatic evaluation of event detection and extraction systems in different languages. The event annotation follows the attached event taxonomy. There are 109 topics. Each topic contains comparable articles (source: Wikinews) from different languages. In total, there are 342 articles from 14 languages, with the best coverage of Czech and English.

http://nlp.kiv.zcu.cz/projects/mevex

Об авторе Лидия Пивоварова

СПбГУ - старший преподаватель, University of Helsinki - PhD student http://philarts.spbu.ru/structure/sub-faculties/itah_phil/teachers/pivovarova
Запись опубликована в рубрике Ресурсы/Софт. Добавьте в закладки постоянную ссылку.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *