войти зарегистрироваться

YahooYahoo! Placemaker — геопарсинг в действии


Совсем недавно – 20 мая, компания Yahoo! объявила о выходе своего нового продукта, на данный момент не имеющего аналогов – Yahoo! Placemaker, сервисе гео-парсинга, основной целью которого является извлечение гео-релевантной информации из документов различного формата. Презентация прошла, как принято говорить, «при большом стечении народу» и закончилась «аплодисментами, переходящими в овацию» – задумка и реализация определенно понравилась, и какое-то время в Твиттере можно было наблюдать довольно-таки позитивный поток комментариев на эту тему. Но вот представление окончено, все расходятся по домам, и начинают задавать вопросы: так что же это такое?

Что такое Placemaker


Как уже было сказано, Placemaker – это веб-сервис, который позволяет извлечь гео-релевантную информацию из некоторого документа. Тут есть сразу несколько моментов, которые нуждаются в пояснении. Во-первых, что это за документы, из которых можно извлекать информацию? А во-вторых, что это за такая гео-релевантная информация, а самое главное – кому и зачем она нужна?

С документами все довольно просто. На данный момент Placemaker поддерживает текст (ну он и в Африке текст), HTML-документы (хотя здесь не все так просто), а так же XML-производные форматы аггрегации новостей — RSS и Atom. Кроме того, Placemaker «понимает» расширение RSS и Atom, известное как GeoRSS, а также способен извлекать дополнительную информацию из микроформатов, которые встраиваются в HTML документ. Про информацию-то и следует поговорить поподробнее.

Что Placemaker может


Если очень кратко, то все возможности PlaceMaker можно определить в три группы, а именно:
  • Какие места (географические) упоминаются в документе и какова их важность?
  • Среди всех мест, с одинаковым названием, о котором именно говорится в документе?
  • О каком месте идет речь в документе вцелом?


Web-разработкаYahoo даёт интерфейс к геоданным

С сегодняшнего дня компания Yahoo открыла программные интерфейсы для доступа к свой глобальной базе географических идентификаторов WoeID (Where on Earth ID). Теперь сторонние сайты могут бесплатно использовать этот сервис на своих сайтах.

Основное предназначение WoeID — присвоение уникальных идентификаторов для объектов, которые находятся на земной поверхности. В этих коротких числовых идентификаторах закодированы точная долгота и широта площади объекта, а также его название, страна, тип объекта и т.д. Это очень удобная система идентификации, которую можно применять в качестве тегов для самой различной информации. Например, она используется для пометки фотографий в сервисе Flickr. Поскольку в системе хранится и другая информация, кроме географических координат, то при поиске фотографий можно ограничить поиск не только квадратом на местности, но конкретными территориями: например, по штату или городу.

Кроме того, в геоплатформу Yahoo встроен поисковик, с помощью которого точные координаты объектов можно получать, просто введя URL с поисковым словом в скобках, например, запрос http://where.yahooapis.com/v1/places.q(moscow%20russia) возвращает координаты города Москва (WoeID = 2122265). Как видим, доступ к базе данных открыт просто через HTTP GET. В настоящее время лимит на максимальное количество запросов к базе данных составляет 50 000 в сутки.

Сервис WoeID — это лишь часть фундаментальной географической платформы Yahoo Internet Location Platform, которая сейчас проходит тестирование.