Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

Инженеры и лингвисты снова вступили в Диалог

Reading time 3 min
Views 6.9K
В начале июня в подмосковном «Бекасово» состоялась международная конференция по компьютерной лингвистике «Диалог», которую уже много лет делает наша компания. О том, что представляет собой «Диалог», мы писали здесь, поэтому не будем повторяться, а расскажем, что было нового.

Пожалуй, одно из самых важных для нас событий – сборник научных трудов «Диалога» наконец-то будет индексироваться SCOPUS, самой крупной международной системой цитирования. Эта система – не просто индекс научных статей, это своего рода авторитетное подтверждение научной значимости издания, входящего в SCOPUS. Почему это важно? Для подтверждения своего статуса все ученые должны иметь набор публикаций в признанных авторитетными изданиях. Причем для подтверждения собственного научного авторитета за рубежом и продвижения собственных идей и разработок важно иметь публикации в источниках, которые признаны именно международными индексами, типа SCOPUS. Кроме того, войдя в SCOPUS издания автоматически попадают в список ВАК (Высшей аттестационной комиссии). Это дает возможность российским ученым иметь публикации, признанные авторитетными как в мире, так и в России. Скопусовский статус сборника Диалога, придает конференции более высокий статус и мы рады, что теперь участие в «Диалоге» будет придавать больше «веса» научным трудам наших докладчиков.

В этом году одной из доминант «Диалога» была вычислительная семантика, ей был посвящен первый день конференции. Эта область компьютерной лингвистики изучает различные способы компьютерного моделирования значений слов, фраз, предложений, целых текстов. Проблема важная для решения и очень сложная, имеются разные подходы. Например, самый новый — дистрибуционная семантика, в которой значение описывается на основании статистики сочетаемости слов, рассчитываемой по большим текстовым корпусам. В онтологической семантике упор делается на учет знаний о мире, формальная семантика широко использует для описания значений предложений математическую логику, операциональная семантика делает упор на инструктивных аспектах языка: интерпретирует фразы как команды, управляющие некоторым исполнительным устройством, например, роботом. Наконец, традиционная «объяснительная» семантика пытается полностью описать значение с помощью специальных языков толкований.

На конференцию приехали известные ученые, лидеры этих направлений компьютерной семантики: Марко Барони, Барбара Парти, Сергей Ниренбург, Константин Воронцов, Елена Падучева. Днем были интересные доклады, а вечером состоялся специальный круглый стол, на котором можно было сопоставить разные модели, увидеть не только отличия, но и возможности взаимодействия этих подходов. Кажется, что идея «смотра семантических подходов» удалась, и можно ожидать появления новых исследований и исследователей в этой области.

Мы видим, что год от года компьютерная лингвистика начинает все сильнее влиять на отрасль. Использование передовых лингвистических технологий становится основой для конкурентного преимущества решений в области электронного документооборота, обработки, поиска и хранения информации. Поэтому мы решили провести во второй день конференции «День технологий» — по сути, это попытка наглядно показать потенциальным заказчикам лучшие практические решения в области компьютерной лингвистики и получить их объективную сравнительную оценку. С приглашенными докладами выступили представители компаний и организаций, лидирующих в области разработки лингвистических технологий: RCO, ABBYY, Яндекс, IBM, научные группы ВЦ МГУ, НИИ системного программирования, НИИ системного анализа. Послушать их специально приехали представители всяких организаций и ведомств, которые наиболее сильно заинтересованы в применении лингвистических технологий для решения своих задач. Вечером состоялся круглый стол, на котором обсуждались проблемы взаимодействия науки, инженерии и бизнеса в нашей стране. По свидетельству представителей ведомств «им было ОЧЕНЬ интересно, они узнали много нового». Этот «День технологий» был первым, и эксперимент можно считать удавшимся: на следующем «Диалоге» можно будет повторить это мероприятие.

А ещё на конференции были подведены итоги соревнования по автоматическому разрешению анафоры и кореферентности. Такие соревнования для русского языка проводились впервые. В состязании приняли участие семь разработчиков систем автоматического анализа текста: ABBYY, RCO, SemSyn, Open Corpora (St.Petersburg), Mail.ru, Институт системного анализа РАН, Сергей Пономарев. Подробнее об этом – во второй части статьи.
Tags:
Hubs:
+30
Comments 6
Comments Comments 6

Articles

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия