Googlebot умеет понимать Javascript

Как известно, Google индексирует миллиарды веб-страниц с молниеносной скоростью, используя Googlebot — сканер, который собирает ссылки и документы из веб-страниц и превращает их в содержимое, по которому можно искать с помощью Google Search.

Изначально предполагалось, что Googlebot умеет только читать ссылки и парсить некоторый код, но, как на днях рассказал представитель Google редактору Forbes Тейлору Бэли, Google в настоящее время умеет более глубоко взаимодействовать с JavaScript, и боты могут даже понимать некоторый JavaScript.

Google can parse and understand some JavaScript.


gray пишет в своём блоге:
Не секрет, что неспособность поисковиков интерпретировать скрипты зачастую использовалась для различных оптимизаторских целей, устройства редиректов и так далее. Будет очень интересно посмотреть на поистине тектонические изменения на рынке SEO, которые последуют теперь и позже, по мере того, как подобными возможностями обзаведутся и другие поисковики, а не только Google.


По мнению Тейлора Бэли, вполне возможно, что понимание JavaScript стало частью изменений, связанных с Google Caffeine.
+13
28 июня 2010, 05:59
11

комментарии (31)

0
donnerjack13589 #
Еще он использует парсер для анализа скорости загрузки скриптов на странице
+3
postdig #
а все таки, что именно он понимает, а что нет?
0
grcool #
Если бы это сообщили — уничтожили бы фичу)
0
Imenem #
Сомневаюсь, что гугл это раскроет, в частности из-за
Не секрет, что неспособность поисковиков интерпретировать скрипты зачастую использовалась для различных оптимизаторских целей, устройства редиректов и так далее.
впрочем поживем — увидим, может какие-то рекомендации по поводу скриптов, которые теперь можно использовать, не боясь сделать недоступной для бота часть контента.
+3
akzhan #
Вообще-то очень давно ребята из Google сообщали об этом. Пруфлинка не найду сейчас.

Совершенно точно распознаёт конструкции вида $('selector').load(url).
+6
lany #
Слишком умный бот может быть опасен для самого гугла. Кто первым напишет для него эксплойт? :-)
+9
AHDPEu #
Уже создал страничку с разными методами вставки текста в страницу. Посмотрим, что же он понимает.

ссылку в location.href по событие онклик пока не один поисковик не проиндексировал. Ждём :)
0
Stepler #
хороший контр-аргумент.
+1
Meliborn #
так и до аякса недалеко :)
0
Terion #
я думаю, что уже.
сами методы индексации аякса в гугле обсуждаются очень давно, так что если научились яваскрипт парсить, то аякс, скорее всего, уже тоже
0
maghamed #
ну Аякс уже как-то индексируется. Например сайт www.coldfusionbloggers.org/

У них pagination через AJAX сделан

И эти страницы есть в кеше гугла:
www.google.com.ua/search?hl=uk&q=site:http://www.coldfusionbloggers.org+CPU&aq=f&aqi=&aql=&oq=&gs_rfai=
0
maghamed #
Cache

Сорри, такая ссылка
0
Powerz #
Есть вот такой интересный способ индексации аякса гуглом. Мы у себя используем — индексирует в лучшем виде.
+5
bolk #
www.seoweblog.ru/archives/54 2006-й год. Уже 4 года назад поисковики кое-что понимали в Javascript.
0
Setti #
И вот еще результаты экспериментов: www.greenlaneseo.com/blog/2010/02/google-and-javascript/
Представителю Google не обязательно было себя утруждуть.
0
maghamed #
на прошлогоднем Google I/O тоже много говорили об индексировании джаваскрипта searchengineland.com/google-io-new-advances-in-the-searchability-of-javascript-and-flash-but-is-it-enough-19881
0
aleksandrit #
Это же совсем простой, только ссылки. Сейчас же говорится о более глубоком взаимодействии.
+2
mente #
Гугл уже давно понимает javascript. Иначе зачем бы они писали предложения, как использовать аякс, чтоб гуглобот его понял.
0
antanubis #
Ну, этот пример скорее говорит об отсутствии необходимого уровня понимания гуглоботом javascript.

В своих предложениях по стандартизации навигации через хеши они предлагают конкретный универсальный способ делать из hash-location'а обычный query-location, чтобы их бот, безо всякой интерпретации javascript, увидев ссылку

http://example.com/page?query#!state

мог обратится по ссылке

http://example.com/page?query&_escaped_fragment_=state

и проиндексировать содержимое страницы, а в результатах поиска показывать все тот же http://example.com/page?query#!state.
+1
variable #
а бот его не понимает, для бота отдается статичная версия странички
+4
SegaZero #
интересное словосочетание.
тектонические усилия
сеошники земную кору наверное двигать будут ^__^
0
Adelante #
Такая себе новость. Массу экспериментов на предмет взаимодействия поисковиков с JS проводили, например, Devaka в июне 2009-го. Общий вывод — да, парсят, просто тут солидный человек из самого Google подтвердил это официально.

Хотя взгляд сразу цепляется за слово «some» в ответе. Т.е. не всякий JS, так следует понимать?
0
Mear #
> Devaka в июне 2009-го
404 Not Found
0
HangGlider #
Хабразащита съела в ссылке в слове script. ручками URL поправьте.
0
HangGlider #
букву съела :)
0
Adelante #
Не виноватый я, это habr. Когда пытаюсь вставить URL между тегами — habr коверкает в адресе ссылки слово «sсript» и посылает на 404. Вставлю без тегов, должно заработать — devaka.ru/articles/javascript-links-experiment
0
Dimox #
Вместо нативного Javascript можно использовать фреймворки, тогда, я думаю, бот ничего не поймет.
0
Zibx #
Зависит от того что они таки сделали. Может они сэндбокс на основе V8 замутили, хотя тогда some звучит как-то странно.
–2
ravist #
Google уже flash сносно распознает. По крайней мере текст и ссылки. По ссылкам даже вес передает. Доказательство передачи веса — PR10 у страниц get.adobe.com/flashplayer/ и get.adobe.com/reader/, вшитых во все flash-баннеры (ссылки показываются пользователю, когда не установлен flashplayer).
0
egorinsk #
Гугл (возможно, не всегда) исполняет яваскрипт на движке вебкита, по крайней мере у меня в логах были яваскрипт-ошибки из браузера на вебките с гугловского IP. При этом загружаются и стили, и картинки.
0
StrangeAttractor #
Было бы классно иметь возожность не волнуясь за находимость делать «сайты из одной страницы», т.е., так сказать, 100%-AJAX-сайты, где весь контент загружается с web-сервисов и презентуется javascript-ом в живом режиме.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.