Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных

http://blog.wolfram.com/2015/03/20/new-in-the-wolfram-language-wikipediadata/
  • Перевод
С момента создания сервиса Wolfram|Alpha, Википедия занимала особое место на пути его развития. Мы обычно используем её не как первичный источник данных, но скорее в качестве важнейшего ресурса для улучшения распознавания естественного языка. В частности, для добычи данных о том, как люди описывают те или иные вещи в разговорном/официальном стиле.

В течение многих лет мы разрабатывали различные инструменты для анализа и извлечения информации из Википедии, однако теперь мы добавляем «сервис интеграции» с Википедией, который будет доступен в новой версии языка Wolfram Language (системе Mathematica 10.1, выходящей уже совсем скоро). Теперь встраивать контент из Википедии в рабочие процессы внутри Wolfram Language стало значительно проще.

Конечно, вы можете просто взять текст из статьи в Википедии и передать его новым функциям Wolfram Language для обработки текста и визуализации:





Если Вы не можете указать точного названия статьи, Вы можете искать по названию или содержанию:



Вы даже можете использовать объекты Wolfram Language напрямую в WikipediaData чтобы, скажем, найти похожие статьи на каких-то других языках, которые есть в Википедии.



Одна из моих любимейших функций позволяет исследовать ссылки на статьи внутри какой-то конкретной статье или категории. И основная прелесть в том, что данные можно вывести как с помощью простого списка, так и воспользоваться различными функциями и правилами Wolfram Language для визуализации в виде, скажем, графа. На самом деле, с помощью всего нескольких строк кода, вы можете создать красивую и интересную визуализацию связей между любым набором статей Википедии:



Это всего это лишь верхушка айсберга, и эта функция может делать множество других полезных вещей. Получите бесплатную подписку на Wolfram Programming Cloud, чтобы увидеть, что Вы сможете реализовать вместе с WikipediaData после выхода новой версии Wolfram Language, и не пропустите релизы интеграции с другими сервисами, которые будут выходить в течение следующего года.
Wolfram Research 45,67
Wolfram Language, Mathematica, Wolfram Alpha и др.
Поделиться публикацией
Комментарии 0

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое