Семинар по корпусной и компьютерной лингвистике, CПб

23 января 2014 года (четверг) в 15.00.
Доклад и презентация книги:
Шайкевич А. Я. (ИРЯ им. В.В. Виноградова, Москва).
Дистрибутивно-статистический анализ языка русской прозы.
Заседание пройдет по адресу:
Санкт-Петербург, Филологический факультет, Университетская наб., д. 11, 2-й этаж, ауд. 193
(кафедра математической лингвистики)
Аннотация доклада:
Первый том»Дистрибутивно-статистического анализа языка русской прозы 1850-1870-х гг» адресован лингвистам, интересующимся лингвостатистикой, и более широкому кругу  русистов-филологов. Книга включает три части.
1. Очерк развития метода. ДСА будем называть набор статистических процедур, выявляющих дистрибуцию  элементов корпуса текстов и не используют их смысл как исходное данное. В качестве центрального понятия ДСА используется  понятие интервала текста. На том или ином этапе исследования текст членится на фрагменты равной длины, что позволяет количественно сравнивать реальные совместные появления элементов с математическим ожиданием тех же событий.
2. Во второй части показана механика действия ДСА в микроинтервале ( т.е. в рамках графического слова) на материале  восьми европейских языков. На этом этапе открывается ядро регулярной морфологии.
3. Третья  часть представляет  собой частотный словарь языка прозы этого периода (15 млн. словоупотреблений). От других частотных словарей этот словарь отличается широким включением бинарных словосочетаний.

Об авторе Лидия Пивоварова

СПбГУ - старший преподаватель, University of Helsinki - PhD student http://philarts.spbu.ru/structure/sub-faculties/itah_phil/teachers/pivovarova
Запись опубликована в рубрике Лекции/Семинары. Добавьте в закладки постоянную ссылку.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *