Lexical Relations from the Wisdom of the Crowd

Lexical Relations from the Wisdom of the Crowd (LRWC) — набор данных, представляющий суждения людей о семантических связях между русскими словами, полученные при помощи краудсорсинга.

LRWC 1.0 представляет единственный класс семантических отношений — родо-видовые отношения, то есть связи между более частным словом (гипонимом) и более общим словом (гиперонимом).

Для подготовки данных использованы материалы русского Викисловаря, тезауруса РуТез и других источников. На основе этих источников построены гиперонимы для трёхсот наиболее частотных имён существительных по материалам НКРЯ.

Каждая родо-видовая пара была размечена на платформе «Яндекс.Толока» семью разными участниками, каждый из которых является носителем русского языка, достигшим двадцатилетнего возраста на момент первого февраля 2017 г.

Участникам задавался вопрос вида «Правда ли, что котёнок — это разновидность млекопитающего?», где «котёнок» и «млекопитающее» — это гипоним и гипероним, соответственно.

Всего размечено родо-видовых пар: 9 322, из них них 3 940 получили положительные оценки, 5 382 получили отрицательные оценки.

Рубрика: Ресурсы/Софт | Добавить комментарий

RusVectōrēs: отчёт за 2016 год

Веб-сервис дистрибутивно-семантических моделей для русского языка
RusVectōrēs (http://rusvectores.org) снова с вами! За прошедший год у
нас появилось много нового и мы рады поделиться новостями.

Напомним, что RusVectōrēs — это инструмент для работы с лексическими
моделями дистрибутивной семантики (word embeddings) прямо в браузере.
Подобные алгоритмы (word2vec, GloVe, fasttext и другие) произвели
революцию в автоматической обработке естественного языка в последние
несколько лет. Они позволяют «научить» компьютер определять значения
слов, используя в качестве обучающего множества большие массивы текстов
и статистику совместной встречаемости слов в них.

На нашем сервисе можно попробовать в действии модели, обученные на
различных русскоязычных корпусах, а также скачать их для локальной
работы. Чтобы вы могли быстро ознакомиться с тем, что может RusVectōrēs,
мы подготовили краткий видеоролик-скринкаст:
https://www.youtube.com/watch?v=wWG204boB5s

RusVectōrēs можно использовать для демонстрации возможностей
дистрибутивной семантики, для быстрой проверки лингвистических гипотез
или для интересных и полезных игр на занятиях, связанных с семантикой
русского языка. Особо прогрессивные личности даже реализуют на основе
наших моделей поэтичный поисковик по стишкам-пирожкам
(https://habrahabr.ru/post/275913).

Итак, новости за 2016 год:
Читать далее

Рубрика: Ресурсы/Софт | Добавить комментарий

Новые информационные технологии в автоматизированных системах

http://nps.itas.miem.edu.ru/

Уважаемые коллеги!

Оргкомитет юбилейного двадцатого научно-практического семинара “Новые информационные технологии в автоматизированных системах” приглашает Вас принять участие в работе семинара, который планируется провести в 20 апреля 2017 года. Семинар организовывается совместно Институтом прикладной математики им. М.В. Келдыша РАН, Московским институтом электроники и математики национального исследовательского университета «Высшая школа экономики» и Московским государственным техническим университетом им. Н.Э. Баумана. Участие в семинаре является бесплатным. По результатам работы издается сборник трудов семинара, который будет размещен на сайте. Сборник индексируется РИНЦ и Киберленинке.

Научные направления работы семинара: обработка информации, математическое и имитационное моделирование, интеллектуальные системы, машинная графика и зрение, автоматическая обработка текстов, управление и автоматизация производства, организация вычислительных процессов.

Читать далее

Рубрика: Конференции | Добавить комментарий

International Conference Computational Linguistics and Intelligent Systems

Dear Colleague,
We would like to inform you about the International Conference Computational Linguistics and Intelligent Systems (CoLInS 2017).

The main purpose of the CoLInS conference is a discussion of the recent researches results in all areas of Natural Language Processing and Intelligent Systems Development.

Please consider CoLInS 2017 for submitting your paper and informing your colleagues about this event.

The language of CoLInS Main Conference is English.
All submissions will be evaluated by at least three members of the international program committee. Accepted papers must be presented at the conference at least by one of their authors.
All submissions must comply with the Springer LNCS format guidelines. Papers should be written in English, font Times 10pt. Regular papers should be no more than 10 pages, posters no more than 4 pages. Authors are requested to follow the CCIS Style. The first page should contain the title of the paper, names and addresses of all authors (including e-mail), an abstract (100-150 words) and a list of keywords.

Submissions should describe original research. Papers accepted for presentation at CoLInS 2017 cannot be presented or have been presented at another meeting with publicly available published proceedings.

The papers accepted at CoLInS will be published in the electronic conference proceedings.

Important Dates:
Paper Submission deadline: 15 March 2017
Notification of acceptance: 31 March 2017
Notification for camera-ready: 10 April 2017
Conference: 21 April 2017
No Conference Fee. CoLInS doesn’t charge any conference fees.
More information on the conference site http://colins.in.ua/
Welcome to the CoLInS conference!

Greetings,
CoLInS 2017 Program Committee

Рубрика: Без рубрики | Добавить комментарий

International Conference on Speech and Computer — Special Session: Natural Language Processing for Social Media Analysis

Date: 12-Sep-2017 — 16-Sep-2017
Location: Hatfield, England, United Kingdom
Web Site: http://specom.nw.ru/sma2017

Call Deadline: 12-Mar-2017

Meeting Description:

The exploitation of natural language from social media data is an intriguing task in the fields of text mining and natural language processing (NLP), with plenty of applications in social sciences and social media analytics. In this special session, we call for research papers in the broader field of NLP techniques for social media analysis. The topics of interest include (but are not limited to): sentiment analysis in social media and beyond (e.g., stance identification, sarcasm detection, opinion mining), computational sociolinguistics (e.g., identification of demographic information such as gender, age), and NLP tools for social media mining (e.g., topic modeling for social media data, text categorization and clustering for social media).

Call for Papers:
Читать далее

Рубрика: Конференции | Добавить комментарий

List of NLP-related CrowdSourcing Systems

Список инструментов для краудсорсинговой разметки: http://tiny.cc/nlpcrowd

Добавлять можно через форму: http://tiny.cc/nlpcrowd_form

Рубрика: Ресурсы/Софт | 2 комментария

CALL: RusConstr (11 октября 2017 г.)

(For English version see below.)
 
Информационное письмо
11 октября 2017 г. Институт лингвистических исследований РАН (Санкт-Петербург) проводит Пятую конференцию «Русский язык: конструкционные и лексико-семантические подходы» (RusConstr). Программы и тезисы предыдущих конференций (2009, 2011, 2013 и 2015 годов) доступны на сайте ИЛИ РАН. В этот раз конференция проводится в формате однодневного круглого стола, предшествующего Пятнадцатой конференции Ассоциации когнитивных славистов (SCLC2017), которая будет проходить в ИЛИ РАН 12–14 октября 2017 г.
 

Читать далее

Рубрика: Без рубрики | Добавить комментарий

Free Lancaster summer schools 27 — 30 June 2017 — registration open

Lancaster Summer Schools
in Corpus Linguistics and other Digital methods (#LancsSS17)
Lancaster University is pleased to offer six free training events that cover the techniques of corpus linguistics, computational analysis of language and geographical information systems (see the description of the individual schools below). The schools include both lectures and practical sessions that introduce the latest developments in the field and practical applications of cutting-edge analytical techniques. The summer schools are taught by leading experts in the field both from Lancaster University and other institutions (CASS Challenge Panel<http://cass.lancs.ac.uk/?page_id=798>).
The summer schools are intended primarily for postgraduate research students but applications from Masters-level students, postdoctoral researchers, senior researchers, and others will also be considered.
For more information, please visit the webpage: http://ucrel.lancs.ac.uk/summerschool
Dates: 27 — 30 June (four days)
Venue: Lancaster University, Lancaster, UK
Twitter: When tweeting about the summer schools, please use #LancsSS17.
Application: The application process for the 2017 summer schools is now open. Click here<https://docs.google.com/forms/d/e/1FAIpQLSdVARxel3IknAl4ucwnzPtdAyHXylG9RLMwB9f_1_76Bifaiw/viewform?usp=send_form> to apply online. (The application process closes on 1st May 2017 or when a maximum number of registrations is reached.)

Рубрика: Курсы/Образование/Постдоки | Добавить комментарий

Student Challenge on fake news detection

DiscoverText is sponsoring a student data challenge on “fake” news detection using a corpus of 20 million “Trump” Tweets collected between April and August 2016.
The Challenge
– Build a model of fake news on Twitter
– Submit the model using a short video (=<60 seconds)
Requirements
– Teams must use our dataset and online collaborative tools, which we will
provide for free.
– Data export is prohibited.
– The model must focus on the nature and scope of fake news itself, not
external analyses of it.
– Qualitative, quantitative, and mixed methods models are all welcome.
– Collaborative teams must include 2 or 3 students at any educational
institution.
– Faculty supervisors may join one or more teams.
– The challenge is open to students in any country.
– The final report simply needs to be in English.
– Entry Deadline is March 1, 2017: Links to videos presenting the model in
60 seconds or less on YouTube must be Tweeted with the hashtag
#fakenewsdetection.
Prizes
1st Prize: $100 for each student.
2nd Prize: $50 for each student.
3rd Prize: $25 for each student.

Читать далее

Рубрика: Ресурсы/Софт | 1 комментарий

CICLing CFP

CICLing 2017

18th International Conference on
Intelligent Text Processing and Computational Linguistics

Budapest, Hungary — April 17-23, 2017

Springer LNCS, journals

Deadline: Abstract January 25; full text February 1

Monetary prizes for best papers anticipated

www.CICLing.org/2017

TOPICS:
All topics related to computational linguistics,
natural language processing, human language technologies,
information retrieval, opinion mining, sentiment analysis, etc.

PUBLICATION:
Springer LNCS — Lecture Notes in Computer Science;
special issues of journals

KEYNOTE SPEAKERS:
Marco Baroni, Iryna Gurevych, Björn W. Schuller, Hinrich Schütze

CULTURAL PROGRAM:
Three days of cultural activities: Folk festival, Budapest, Visegrád

AWARDS:
Tentative: 1000 euro award fund sponsored by Springer for
Best paper awards and Best student paper award.
Awards for best presentation, best poster, best software

SUBMISSION DEADLINES:
January 25: Registration of tentative abstract / title
(why not register your tentative abstract right now?),
February 1: Full text of the registered papers
(contact us for late submissions)

Want to organize a future CICLing event? Contact us!

See complete CFP and contact on www.CICLing.org/2017

Рубрика: Конференции | Добавить комментарий