Оценка с точки зрения SEO: готов ли сайт к продвижению?
Условия оценки
Компании, занимающиеся раскруткой сайтов, ежедневно сталкиваются с задачей «оценить ресурс». Фактически это означает необходимость выяснить, насколько велики риски и есть ли «подводные камни», связанные с предстоящей оптимизацией. Сайт может оказаться как полностью готовым к продвижению, так и требовать серьезных финансовых и трудовых вливаний — иначе результата не добиться. Чаще всего результатом выполнения оценки становится список рекомендаций владельцам сайта.
Необходимо учитывать, что на этапе первого знакомства с сайтом эксперты обычно сильно ограничены в информации о сайте: нет доступа к CMS, нет доступа к серверу и его логам, к статистике. Нет сведений, работали ли с ним оптимизаторы ранее или нет, что конкретно они делали, какие методы продвижения были использованы. Владельцы сайта, конечно, в идеале должны обладать всеми этими данными, однако в реальности они чаще всего «у программиста, а программист в IT-отделе, а IT-отдел в яйце, а яйцо в утке, а утка улетела в другую фирму».Для клиента, мало осведомленного в SEO (поисковой оптимизации), манипуляции, проводимые с сайтом его создателями или подрядчиками по раскрутке, зачастую остаются не видны. Вплоть до того, что клиент не знает о размещении каталога ссылок на сайте, или (что вообще неприемлемо!) продаже ссылок с его сайта. Клиент может и сам допустить ошибки при создании сайта: обычно это заимствованный контент (взятые с других сайтов «без разрешения» тексты и прочие материалы). В понимании многих сайтовладельцев все просто: чем больше информации по теме ресурс предложит пользователям, тем больше популярности получит. Но почти никто не имеет представления о юридических моментах воровства материалов, а также технической стороне «пессимизации» поисковыми машинами сайтов с украденным контентом.Сами поисковые системы, регулярно внося изменения в алгоритмы ранжирования, явно указывают на определенные факторы, которые в силах побороть только время.Основываясь на этом, построим классификацию характеристик оценки сайта, которые оптимизатор в силах получить и проанализировать с такими входными данными.
Набор характеристик сайта
Доменное имя
Не секрет, что продвижение сайта на домене третьего уровня связано с большими усилиями и с финансовыми затратами. Есть взаимосвязь с родительским доменом — чем он авторитетней, тем легче работать с поддоменом. Имеется и определенная специфика работы с доменами третьего уровня. Однако их количество невелико по сравнению с общей массой заинтересованных клиентов, выбирающих классическое и единственно возможное для серьезных организаций имя второго уровня, поэтому заострять внимание на таких сайтах не будем. В конечном итоге, общие принципы подойдут всем.Итак, сначала стоит проанализировать whois данного домена. И Яндекс, и Google предпочитают домены «со стажем», зарегистрированные как можно раньше. По «мнению» поисковиков, у сайта была возможность заработать авторитет, получить отзывы. На данный момент в ТОП-10 Яндекса в высококонкурентных тематиках нечасто можно встретить домен 2007 года: большинство топовых мест занято авторитетными «старичками». Оптимизатор не в силах повлиять на данный фактор, поэтому его задачей является предупреждение клиента о возможных трудностях в продвижении и предложение оптимального варианта — как с финансовой стороны, так и с этической (нельзя обещать того, что сделать не возможно). Возможные варианты предложения таковы: либо НЧ (низкочастотные запросы), по которым сайт сможет получать целевую аудиторию, либо завышенный бюджет на ссылочные факторы и огромный риск.
Присутствие в индексе поисковых машин
Всегда есть возможность увидеть, какие страницы сайта уже «знает» тот или иной поисковик. В Яндексе конструкция запроса вида url= «domen*» предоставит возможность ознакомиться с проиндексированными страницами. Ту же операцию можно проделать с помощью webmaster.yandex.ru. Если сайт не проиндексирован, а домену уже несколько месяцев, то необходимо узнать причину, по которой Яндекс до сих пор не нашёл данный ресурс. Например, велась длительная разработка, и сайт был закрыт от индексации. Или же домен зарегистрировали, а сайт удалось сделать только сейчас. Наряду с такими безобидными случаями бывают трудности, которые можно выявить сразу, например сайт забанен (исключен поисковиком из результатов поиска) из-за ссылочного спама на его страницах или из-за немодерируемого каталога ссылок. Также сайт может быть под фильтром «ты последний» (находится на последних местах выдачи по любым запросам) по причине ворованного или продублированного контента. В некоторых случаях бывает, что из-за сбоев в работе хостинга сайт выпал из поиска или «поймал» фильтр аффилиата (накладывается поисковиком на сайты одной фирмы в одной тематике). Возможно, поисковик счел его зеркалом (сайтом, полностью дублирующим контент) другого сайта. Если сайт отсутствует в поиске, то дальнейший анализ вести нельзя. Необходимо дождаться его индексации поисковой системой. Стоит предоставить клиенту рекомендации по ускорению индексации: например, добавить все страницы сайта в webmaster.yandex.ru, проверить работу сервера, исключить дублированный контент.Если же сайт присутствует в индексе, то для дальнейшей работы необходимо проверить, определено ли поисковиком основное зеркало сайта с префиксом www или без оного. Нередко случается, что ссылочный бюджет тратится неэффективно, так как неверно решен вопрос о передаче веса всех ссылок с одного зеркала на другое. Бывает, что неправильно поступают именно разработчики сайта, указав в файле robots.txt, содержащем рекомендации для роботов-пауков поисковых машин, основное зеркало с префиксом www, а все меню на сайте сделав без него. Известно также, что и алгоритм-зеркальщик Яндекса неидеален — об этом не раз упоминали известные в данной области специалисты. Склейка «не в ту сторону» может доставить значительные трудности. Стоит сразу проверить навигацию: если есть sitemap (карта сайта), то проверить стоит и ее. Обязательно нужно проверить файл robots.txt и сформулировать раз и навсегда правильную версию, сократив до минимума вероятность ошибки со стороны поисковика.Знакомясь с сайтом в результатах поиска, следует обратить внимание на общее количество страниц сайта. Последнее время наблюдается «болезнь» 10 или 50 страниц — отчасти ее можно обосновать прюнингом (отбрасыванием стопроцентно нерелевантных страниц) на этапе формирования результатов поискового запроса, но нередки случаи, когда сайт имеет достаточно большое количество страниц по ошибке. Самые распространенные — дублирование «страниц для печати» и неправильно написанный htaccess, который позволяет роботам по нескольким вариациям URL попадать на одну и туже страницу. Особое внимание стоит обращать на страницы с xss-хаками. На данный момент ссылки с подобных страниц не могут принести пользу акцепторам (сайтам и страницам, на которые ссылаются), но вред донорам добавить, вероятно, могут.Далее стоит проверить хотя бы визуально, одинаковы ли титлы (метатеги, Title) у страниц. Одинаковые титлы значительно усложняют поисковикам возможность правильно ранжировать документы. Следует сразу рекомендовать клиентам обратиться к разработчикам сайта с целью внесения изменений и создания уникальных метатегов с нужными ключевыми словами на всех страницах сайта.
Содержание страниц сайта
Для успешного продвижения очень важен фактор контента. Именно поэтому следует выявить, заимствован ли где-то контент, или же это именно авторская разработка клиента. Важно найти контент, заимствованный с других ресурсов, так как рекомендации по запрещению к индексации страниц для печати можно предоставить клиенту и позднее, это не так важно. Если дубль-контент найден, то стоит обязательно проверить сайт еще раз — не наложен ли на него фильтр «ты последний». Стоит внимательно разобраться, кто является первоисточником: если ваш подопечный настолько популярен, что его публикуют, то стоит поставить в известность клиентов. Они должны сделать запросы авторских ссылок на публикацию или добиться снятия своего контента с чужих сайтов. Если контента нет вовсе — например, в наличии только flash-версия сайта, либо весь сайт представляет собой Ajax-интерфейс, либо, что сейчас большая редкость, он весь во фреймах. Тут, конечно же, стоит сразу ставить клиента в известность, что продвигать в поисковиках на данный момент легче именно текст, и если он не желает ждать результата работ три года, то следует внести изменения в сайт. А именно — сделать полноценные текстовые страницы для пользователей и для поисковиков именно на сервере.Нередки случаи, когда первая страница сайта вовсе таковой не является, а используется 302- или 301-редирект на дополнительную страницу или javascript-редирект. Это совершенно неприемлемо. Этот изъян, связанный обычно с использованием CMS (системы управления контентом), необходимо исправлять сразу же. Первая страница — лицо всего сайта, и если кто-то сейчас еще думает, что чем там больше будет всего крутиться и вертеться, тем «круче», тем печальнее. Первая страница должна быть читабельным, подготовленным, удобным лицом сайта, которое в силах в целом охарактеризовать компанию, в ряде случаев раздел «О нас» при этом будет посещаться весьма редко. В наследие от времен десятилетней давности, в головах у некоторых горе-разработчиков остались первые страницы типа «Вход», где предлагается нажать на единственную ссылку или кнопку — «Вход». Это очень сильно мешает поисковой оптимизации и раздражает большую часть интернет-аудитории.
Навигация
Если на каждой странице сайта есть ссылки на ВСЕ остальные разделы — это плохо. Мало того, что робот поисковика постоянно натыкается на одинаковый код, вы еще и утяжеляете свой сайт. В текстовое меню должны быть вынесены основные разделы сайта, из которых любой пользователь сможет перейти на внутренние подразделы (это уже предмет юзабилити), но для поисковика грамотное представление этого элемента тоже играет очень большую роль. Не надо делать меню из 5000 ссылок, это не поможет поиску.
Код страниц
Надо понимать, что чем «легче» страница, тем быстрее поисковик ее заберет. Если страницы сайта весят по нескольку мегабайт, то не каждый поисковик сможет их забрать с первого захода. Следовательно, часть страницы не будет индексирована. Часто можно увидеть сайты с красивой flash-анимацией, но они весьма много «весят». Поэтому следует сразу предупредить клиента о возможной необходимости убрать флешку — хотя бы с самой продвигаемой первой страницы. Она не улучшает позиций при ранжировании документов и может доставить массу проблем пользователям с маломощными компьютерами и медленным интернетом. Далее следует смотреть, как написан сам код. Использование табличной или блочной верстки принципиального значения не имеет, хоть предпочтительнее блочная. Зачастую дополнительным функционалом HTML код портится так, что его вообще тяжело понять. К примеру, на сайте есть Ajax (где-то внутри на форме, закрыт от индексации), но для чего подключать эту библиотеку в загрузку на первую страницу, на которой он не используется вовсе? Также бывают старые варианты верстки где стили и JavaScript прописаны в head. Во-первых, в данном варианте «напрягается» поисковик — он качает больше, а во-вторых, страдают клиенты — на каждой странице им придется закачать кучу одинаковой информации (кода), а ведь можно просто сделать включение, которое будет успешно закэшировано браузером пользователя и снизит нагрузку на сервер. Да и пользователь будет ждать загрузки меньше, а поисковики получат только нужную информацию. Сейчас очень популярно использовать CMS с WYSIWYG-редакторами, практически как Google Docs для сайта, но почти никто не проверяет, какой код этот редактор вставляет в страницу. Обычно он вставляет кучу ненужных тегов font style=«» или span style=«», которые не только затрудняют работу с кодом, но и утяжеляют страницу.Не стоит забывать о скрытом коде — иногда разработчики половину страницы отмечают тегом «комментарий» на потом, а все это остается и в конечном варианте. Нужно помнить о свойстве элемента display=non, которое зачастую может сыграть злую шутку: в этом блоке может быть не только скрытый «спамный» текст, но и ссылки на внешние сайты!Следует сразу проверить теги Title и дополнительные метатеги. Очень легко проверить и изменить их через СMS, но на данном этапе по обозначенным в начале статьи причинам это бывает невозможно, поэтому следует хотя бы часть просмотреть вручную. Есть сервисы, позволяющие получить исчерпывающую информацию о валидации и оптимизации кода, и ими следует пользоваться.
Велась ли ранее работа по оптимизации?
Чтобы выяснить это, следует определить косвенные показатели: PR и тИЦ ресурса, количество внешних ссылок — например, через Yahoo, а заодно и качество ссылок на сайт. Зачастую проверка дает понять, насколько реально популярен сайт. Большое количество естественных ссылок с авторитетных ресурсов значительно поможет при дальнейшей работе, а большое количество спам-ссылок может подпортить сайту репутацию, что выражается в трудностях с продвижением.Сервисы MSN (хоть иногда и неточно) дадут возможность посмотреть исходящие ссылки с данного домена. Важно проверить это, ведь если на сайте есть каталог ссылок, либо ведется продажа ссылок через брокеров или вручную, это может существенно повлиять на степень видимости сайта в поисковых системах.Наличие ссылок с блогов тоже является косвенным показателем популярности сайта.Присутствие сайта в Яндекс.Каталоге, в DMOZ или, например, в справочнике Yellow Pages говорит о том, что он уже проходил проверку модераторами каталогов и представляет интерес в своей тематике для пользователя.
Вывод
В статье мы не перечислили все признаки, по которым можно охарактеризовать сайт, но постарались заострить внимание на наиболее важных. Экономьте бюджеты, не вводите клиента в заблуждение, старайтесь выполнять свою работу на «отлично»!P.S. Мы говорили о количественных характеристиках, поэтому попробуем все свести в диаграмму.


Представленный пример количественной оценки характеристик позволяет ознакомиться с сайтом и подвести общий итог степени риска или сложности продвижения того или иного ресурса. Если сайт набирает максимальные 50 баллов, то с ним не должно быть никаких сложностей, и его продвижение будет стабильным. Если сайт набирает 0 или меньше баллов, то велик риск работы с данным проектом, и необходимо по возможности устранить недочеты и только потом браться за работу по его продвижению (например, если хостинг не выдерживает нагрузки, то нет смысла привлекать на сайт больше людей, необходимо сначала сменить хостера).
Сергей Карпович, инженер по поисковым технологиям интернет-агентства Матик



комментарии (7)