Какие бывают META теги и зачем они нужны

    META-теги


    В продолжении первого поста про DOCTYPE, я, как и обещал, продолжу про META теги. 
    META-теги — это необязательные атрибуты, размещенные в заголовке страницы, которые могут содержать ее описание, ключевые слова к ней, информацию об авторе, управляющие команды для броузера и поисковых роботов, и прочую служебную информацию, не предназначенную для посетителей.
     

    META-теги имеют два возможных атрибута


    — <META HTTP-EQUIV="имя" CONTENT="содержимое">
    — <META NAME="имя" CONTENT="содержимое">
    META-теги должны находиться в заголовке HTML-документа между <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы).

    Стандартом HTML 4.01 значения и имена мета-тегов НЕ оговариваются, поэтому мы будем рассматривать те значения, которые уже устоялись в интернете и используются чаще других.

     Пруфлинк: http://www.w3.org/TR/html401/struct/global.html#h-7.4.4.1
    (The META element can be used to identify properties of a document (e.g., author, expiration date, a list of key words, etc.) and assign values to those properties. This specification does not define a normative set of properties.)


     

    Атрибут HTTP-EQUIV


    META-теги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Теги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки.
    Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тегов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов.
     

    Значения  поля content  для Аттрибута   HTTP-EQUIV


    Значение Описание Пример использования Эффект
    Expires Дата устаревания. Управление кэшированием в HTTP/1.0. Если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять — изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Дата должна быть задана в формате, описываемом в RFC850,
    <META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 2008 08:21:57 GMT">
    что эквивалентно HTTP-заголовку
    Expires: Wed, 26 Feb 2008 08:21:57 GMT
    Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его.
    Pragma Эта директива показывает, что кешированная информация не должна использоваться и вместо этого запросы должны посылаться на сервер. Это директива имеет тоже самое значение что и CACHE-CONTROL:NO-CACHE и представлена для обратной совместимости с HTTP/1.0.

    Клиенты должны использовать оба значения PRAGMA:NO-CACHE и CACHE-CONTROL:NO-CACHE когда нужно послать некешируемый запрос к серверу, про который неизвестно – совместим ли он с HTTP/1.1.
    Если известно, что сервер совместим с
    HTTP/1.1 клиент НЕ должен посылать PRAGMA заголовок.
     HTTP/1.1 кэш должен понимать "PRAGMA:NO-CACHE" точно также, как будто клиент послал "CACHE-CONTROL:NO-CACHE".
    <META HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE">  
    Content-Type Указание типа документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тега, то некоторые браузеры выводят такую страницу уже в заданном charset. <META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-2022-JP">  Используют браузеры и поисковые системы
    Content-language Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка. <META HTTP-EQUIV="Content-language" CONTENT="en-GB">
    что эквивалентно HTTP-заголовку 
    Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания
    Для русского языка – ru-RU
    Используется некоторыми поисковиками
    Refresh Определение задержки в секундах, после которой броузер автоматически обновляет документ. Дополнительная возможность — автоматическая загрузка другого документа. <META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html">
    что эквивалентно HTTP-заголовку
    Refresh: 3; URL=http://www.name.com/page.html
    W3C не рекомендует использовать этот тег.
    Google страницы с таким тегом игнорирует. Другие поисковые системы, возможно, тоже.
    Cache-Control Определяет действия кэша по отношению к данному документу. Возможные значения:
    Public — документ кэшируется в доступных для всех кэшах
    Private — только в частном кэше
    no-cache — не может быть кэширован
    no-store — может быть кэширован, но не сохраняется
    <META http-equiv="Cache-Control" content="public"> Используется некоторыми браузерами



    Атрибут NAME



    Robots
    Тег <meta name="Robots" content="..."> управляет индексацией конкретной web-страницы. При этом роботам можно запретить не только индексацию самого документа, но и проход по имеющимся в нем ссылкам.
    Инструкции по индексации записываются в поле content. Возможны следующие инструкции:
    NOINDEX — запрещает индексирование документа;
    NOFOLLOW — запрещает проход по ссылкам, имеющимся в документе;
    INDEX — разрешает индексирование документа;
    FOLLOW — разрешает проход по ссылкам.
    ALL — равносильно INDEX, FOLLOW
    NONE — равносильно NOINDEX, NOFOLLOW
    Значение по умолчанию: <meta name="Robots" content="INDEX, FOLLOW">.
    В следующем примере робот может индексировать документ, но не должен выделять из него ссылки для поиска дальнейших документов:
    <META name="ROBOTS" content="index, nofollow">
    Имя тега, названия и значения полей нечувствительны к регистру.
    В поле content дублирование инструкций, наличие противоречивых инструкций и т.п. не допускается; в частности, значение поле content не может иметь вид "none, nofollow".
    Google поддерживает дополнительное значение NOARCHIVE, которое запрещает помещать страницу в архив google
    <META NAME="Robots" CONTENT="NOINDEX,FOLLOW"> Используется большинством поисковиков
    Description Значение атрибута CONTENT — строка, которая определяет текстовое описание (краткую аннотацию) конкретной страницы Вашего сайта. Не стоит создавать слишком длинное и подробное описание Вашего сайта в данном теге, рекомендуется ограничиться текстом до 100 символов, поскольку поисковые машины, в большинстве случаев, имеют ограничение на количество индексируемых символов. Этот тег может сильно помочь в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. <META NAME="description" CONTENT="Данный сайт содержит информацию для любителей старинных автомобилей, на нем Вы можете найти описание с фотографиями редких и эксклюзивных автомобилей"> Самый широко используемый тег. Практически все поисковые системы учитывают его при индексации.
    Значение этого тега очень важно для раскрутки сайта, практически все поисковые системы опираются на этот
     тег, а некоторые выводят содержимое этого тега в результатах поиска (Google), поэтому желательно не просто указывать краткое описание документа, но сделать его содержание привлекательным рекламным сообщением.
    Keywords Значение атрибута CONTENT — список ключевых слов, как правило, через запятую, соответствующих содержимому Вашего сайта. Это те слова, в запрос на которые, Вы хотели бы, появления Вашего сайиа в списке результатов поиска. Здесь также рекомендуется ограничиться списком до 30 слов. Можно поместить и наиболее частые опечатки ключевых слов. Также Вы можете здесь записать и английские слова, соответствующие содержимому Вашего сайта. Ну, а какие конкретно нужно писать слова — это уже тема отдельной статьи. Некоторые поисковые системы не индексируют сайты, в которых в данном теге повторяется одно и то же слово для увеличения позиции в списке результатов. <META NAME="keywords" CONTENT="реклама, дизайн, полиграфия"> Учитывается большинством поисковых систем. Точно известно, что НЕ учитывает  Google и Rambler
    document-state Управление индексацией страницы для поисковых роботов. Определяет частоту индексации — или один раз индексировать (значение Static), или реиндексировать документ регулярно (значение Dynamic). <META NAME="Document-state" CONTENT="Static"> Используется редко
    GOOGLEBOT Google поддерживает специальный тег Googlebot с помощью которого вы можете указать Google что он не должен индексировать и архивировать вашу страницу, другие поисковые системы этот тег проигнорируют. <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">  
    Author Автор, создатель сайта. Вряд ли используется поисковыми системами, и нужен скорее всего чтобы можно было показать что сайт сделан именно определенной персоной или фирмой. <META NAME="AUTHOR" CONTENT="www.neo-systems.ru">  
    Revisit Значение этого тега указывает — как часто обновляется информация на вашем сайте, и как часто поисковая система должна на него заходить чтобы увидеть обновления. В силу сложившихся условий — поисковые системы сейчас самостоятельно определяют частоту сканирования сайта, поэтому, возможно, наличие этого тега ничего вам не даст. <meta name="revisit-after" content="15 days">  

     

    Источники информации:


    http://www.citforum.ru/internet/search/metatags.shtml
    http://web-support.ru/adv/ps_meta_2.shtml
    http://www.shtogrin.com/library/web/meta/
    http://vancouver-webpages.com/META/metatags.detail.html
    http://www.mattcutts.com/blog/keywords-meta-tag-in-web-search/
    http://www.webotdel.ru/notes/metatags/
    Очень хорошо и понятно написано http://www.w3schools.com/tags/tag_meta.asp
    Какие мета-теги понимает Google  http://www.google.com/support/webmasters/bin/answer.py?answer=79812
    Какие мета-теги понимает Bing
    http://www.bing.com/community/blogs/webmaster/archive/2009/07/18/head-s-up-on-lt-head-gt-tag-optimization-sem-101.aspx
    Google  не использует мета-тег keywords
    http://googlewebmastercentral.blogspot.com/2009/09/google-does-not-use-keywords-meta-tag.html
     
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама
    Комментарии 47
    • 0
      Google не использует мета-тег keywords!?!?
      • +3
        Об этом уже давноооо говорили большевики…
        • +3
          Гугл учитывает все, в том числе и keywords, просто вес его — проценты по сравнению с текстом самой страницы, например.
          • +1
            Matt Cutts сообщает, что keywords полностью игнорируются:

            www.mattcutts.com/blog/keywords-meta-tag-in-web-search/
            • 0
              Летом делали исследование и получили что слова из keywords имеют вес где-то пол процента от суммы всех остальных, в отличии от description c 11%. При этом ключевые слова из meta могут быть проигнорированы если они противоречат тексту.

              Может быть в сентябре они поменяли, может быть недоговаривают что-то. То что было сказано в видео по сути верно было и раньше.
              • 0
                Пол-процента можно списать на статистическую погрешность.
                В любом случае эффективность близка к нулю. :)
        • 0
          ну ежели Google сам так говорит… Хотя может быть они и лукавят… Только тогда не понятно с какой целью?
          • НЛО прилетело и опубликовало эту надпись здесь
            • НЛО прилетело и опубликовало эту надпись здесь
            • –3
              его почти никто не использует… (MSN?..)

              вообще пора бы им всем сдохнуть… это рудимент… их всё равно заспамили все кому не лень… поисковики контент читают, а мета-теги если кто-то и учитывает — то скорее как штраф — если много туда напихали…
              • НЛО прилетело и опубликовало эту надпись здесь
                • НЛО прилетело и опубликовало эту надпись здесь
                  • 0
                    по каким правилам? :-)

                    спорить по данному вопросу не буду, да, и глупо это (ведь точных доказательств у нас нет)

                    Яндекс вообще плохо относится к любым способам воздействия на себя… Лично мне кажется, что он тоже не учитывает… А на другие поисковики по сути наплевать — их доля мала и, наверное, не стоит ради них заполнять… На своих сайтах я перестал заполнять этот тег… Впрочем, никого ни к чему не призываю, каждый выбирает для себя :-)

                    P.S. Кстати, в статью стоит добавить, что в html 5 появился еще атрибут charset (для тех, кому лень писать Content-Type)

                    пример:
              • 0
                Намного важнее тег title ну и сам контент, естественно
              • –4
                в закладки
                • +1
                  Вы забали написать что то типа *иронически*
                  но я раскусил Вас :)
                  • +1
                    позно уже заминусовали…
                • +3
                  Мета для раскрутки уже давно смысла особого не имеет.
                  Мета для управления кешем и ренью, скорее всего, всё равно перебьётся сервер-сайдом.
                  Хотя что-то ещё имеет смысл.
                  • +1
                    К meta тегам можно добавить еще и geo теги, такие как geo.position, geo.placename и geo.region.
                    Это гео-инфомация, которую можно встраивать и в изображения (EXIF) и в RSS, что бы поисковикам было удобней привязывать материал (картинка, страница сайта) географически. Яндексу, вроде бы, плевать на эти теги, а вот yahoo и google их адекватно воспринимают.
                    • 0
                      три аттрибута: name, http-equiv, content
                      • +1
                        Смысл есть только если мета дуюлируются в тексте на странице, в других случаях не вижу в них смысла.
                        Хотя если только для придания эстетики например:

                        • 0
                          Только ради лулзов:
                          META name=«copyright» content=«dream design»
                          META NAME=«DREAM DESIGN» CONTENT=«DREAM»

                          Ковычки <> убрал, с ними не постица.
                        • 0
                          Я бы добавил, что мета-«Content-Type» лучше ставить сразу же после открывающегося head, иначе некоторые браузеры перековеркают title, если не правильно определят кодировку.
                          • +1
                            Они не перековеркают title, они начнут рендер страницы заново, что вызовет небольшую задержку по времени.
                            • НЛО прилетело и опубликовало эту надпись здесь
                          • 0
                            статья не о мета тегах а о http-заголовках :(
                            • 0
                              name="robots" content="noarchive" для запрета помещать страницу в архив поисковика, используется почти всеми поисковыми системами.
                              • +6
                                всё хорошо, но табличка не очень юзабельная :(
                                • 0
                                  <meta ... />

                                  Хочется добавить, что мета-тег не должен забывать закрывать сам себя обратным слешем, чтобы бдительный валидатор на нас не ругался :)
                                  • 0
                                    Это уже зависит от предпочтений: HTML или XHTML.
                                    • НЛО прилетело и опубликовало эту надпись здесь
                                    • +4
                                      Есть еще секретный метатег Яндекса:

                                      [meta content=«Top-10» name=«Yandex»/]
                                      • +1
                                        Блин, ну вот кто учит этих людей писать теги капсом?

                                        А по сути: вместо абсолютно ненужного <meta name=«author»… /> лучше использовать <link rel=«author»… />, не намного более нужный, зато куда более семантичный.
                                        • НЛО прилетело и опубликовало эту надпись здесь
                                          • 0
                                            Спецификация учит, что имена тегов регистронезависимы, от неё больше ничего не требуется. А вот на практике написание тегов строчными — стандарт де-факто. Учитывая, что автор приводит конкретные примеры тегов, а не SGML-описание, строчные были бы уместнее.
                                            • НЛО прилетело и опубликовало эту надпись здесь
                                              • 0
                                                Чувствую, мы об одном и том же, но разными словами.
                                                Собственно, когда большинство выбирает какой-то вариант, а фактически это ни на что не влияет, то лучше придерживаться того же стиля.
                                                А в XHTML´е нужен и синтаксис соответствующий, не только Content-Type: application/xhtml+xml. Последний, кстати, прекрасно отдаётся правильным браузерам на основании проверки HTTP_ACCEPT.
                                        • +7
                                          ждём продолжения — какими тегами делается bold и italic.

                                          где meta name=«viewport»?
                                          где X-UA-Compatible?
                                          где про скорые помощи?...
                                          • –1
                                            в статье я указал на наиболее распространенные теги… X-UA… нужны по-моему только для IE, да и если этот IE захочет — просто проигнорирует их…
                                            • 0
                                              … нужны по-моему только для IE...
                                              а как же Chrome Frame?

                                              да и если этот IE захочет — просто проигнорирует их…
                                              не знал что IE можно научить игнорировать X-UA-Compatible, расскажите поподробней плиз!
                                              • НЛО прилетело и опубликовало эту надпись здесь
                                            • +4
                                              Нечитабельная статья-перепечатка для публики из яслей.
                                              Продолжайте в том же духе!
                                              • +2
                                                Вспомнился метатег на сайте студии дизайнера веб страниц:
                                                <!-- meta name=«GENERATOR» content=«Microsoft FrontPage 1.0» -->
                                                • 0
                                                  www.artlebedev.ru
                                                  Первая и последняя строка из соответственно самого кода страницы.
                                                  • 0
                                                    ага, как обычно выпендривается :-)
                                                • 0
                                                  >Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов.

                                                  Если заголовок заданные в META непонятен, то приоритета быть не может, т.к. такого HTPP заголовка просто нет.

                                                  И такой вопрос. Из предложения следует, что если META понятен, то он превалируют над HTTP заголовком. Да?

                                                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.