дорожка по определению русскоязычного парафраза

Приглашаем к участию в дорожке по определению парафраза для русского
языка. Дорожка проводится на основе данных корпуса ParaPhraser
(http://www.paraphraser.ru/). ParaPhraser — это общедоступный корпус
пар русских предложений, вручную размеченных как парафраз, частичный
парафраз или непарафраз. Работа по созданию и анализу корпуса
проводилась в рамках проекта по исследованию структуры новостных
текстов (СПбГУ, Е.В. Ягунова, Е.В. Проноза и др). Размер корпуса в
настоящий момент — 7000 пар, эти данные будут использоваться как
обучающее множество. Тестовое множество накапливается в настоящее
время с помощью краудсорсинга, его предполагаемый размер — около 1000
пар предложений.

Дорожка будет организована согласно стандартной процедуре: участвующие
системы получают на вход пару предложений и возвращают ее класс.
Участникам будет предложено два типа заданий: классификация на два
класса (парафраз — непарафраз) и на три класса (парафраз — частичный
парафраз — непарафраз). Участники могут участвовать в «стандартных»
прогонах, для которых система обучается только на корпусе ParaPhraser,
и «нестандартных», в которых можно использовать любые другие данные.
«Стандартные» и «нестандартные» прогоны оцениваются отдельно.

Более подробное описание заданий, данных и методов оценки можно найти
по ссылке: http://www.paraphraser.ru/download/get?file_id=2

Предварительное расписание дорожки:

Июль 2016: первое информационное письмо, обучающие данные доступны на
странице скачивания корпуса
1 сентября 2016: второе информационное письмо
1 октября 2016: публикация тестовых данных
10 октября 2016: крайний срок подачи ответов
12 октября 2016: публикация результатов
11-12 ноября 2016: семинар с докладами участников и обсуждением
результатов (в рамках конференции AINL, Санкт-Петербург,
http://ainlconf.ru/)
конец декабря 2016: крайний срок подачи полных статей (планируется
публикация сборника с попаданием в международные индексы, детали
уточняются)

Организаторы

Лидия Пивоварова, Университет Хельсинки
Екатерина Проноза, СПбГУ
Елена Ягунова, СПбГУ

Контакты

russian.paraphrase[at]gmail.com

Об авторе Лидия Пивоварова

СПбГУ - старший преподаватель, University of Helsinki - PhD student http://philarts.spbu.ru/structure/sub-faculties/itah_phil/teachers/pivovarova
Запись опубликована в рубрике Конференции, Ресурсы/Софт. Добавьте в закладки постоянную ссылку.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *