Мы продолжаем серию семинаров по компьютерной лингвистике ABBYY Open. Очередное мероприятие пройдет 31 января в 17.00 в московском офисе ABBYY. Тема – «Сегментно-статистический подход к интернету как корпусу (на примере анализа блогосферы)». На семинаре выступит Владимир Беликов – доктор филологических наук, доцент Отделения теоретической и прикладной лингвистики филфака МГУ, ведущий научный сотрудник Института русского языка РАН.
Его доклад посвящен разумным методам извлечения достоверной лингвистической информации из интернета. В докладе проводится сравнительный анализ Национального корпуса русского языка и различных интернет-корпусов как источников сведений о русском лексическом узусе разного типа. На материале русских толковых словарей и отдельных лингвистических исследований анализируются типичные ошибки и неточности, ставшие результатом игнорирования современных корпусных методов в лексикографии.
Рассматривается сегментная структура русскоязычной блогосферы, демонстрируются разнообразные результаты ее анализа сегментно-статистическим методом при исследовании синхронного состояния и динамики изменений в общерусской и региональной лексике, фразеологии, грамматике. Детально излагается методика лингвистически ориентированного поиска в блогосфере и способы преодоления возникающих при этом трудностей.
Подробная информация и регистрация – на странице ABBYY Open.
Update: видеозапись семинара выложена здесь.
Его доклад посвящен разумным методам извлечения достоверной лингвистической информации из интернета. В докладе проводится сравнительный анализ Национального корпуса русского языка и различных интернет-корпусов как источников сведений о русском лексическом узусе разного типа. На материале русских толковых словарей и отдельных лингвистических исследований анализируются типичные ошибки и неточности, ставшие результатом игнорирования современных корпусных методов в лексикографии.
Рассматривается сегментная структура русскоязычной блогосферы, демонстрируются разнообразные результаты ее анализа сегментно-статистическим методом при исследовании синхронного состояния и динамики изменений в общерусской и региональной лексике, фразеологии, грамматике. Детально излагается методика лингвистически ориентированного поиска в блогосфере и способы преодоления возникающих при этом трудностей.
Подробная информация и регистрация – на странице ABBYY Open.
Update: видеозапись семинара выложена здесь.