WikiDer > Noindex

Noindex

В noindex ценность HTML-роботов метатег запросы, которые автоматизированы Интернет-боты избегать индексация веб-страницу.^[1]^[2] Причины, по которым можно использовать этот метатег, включают в себя совет роботам не индексировать очень большую базу данных, веб-страницы, которые являются очень временными, веб-страницы, которые находятся в стадии разработки, веб-страницы, которые нужно сохранить немного более конфиденциальными, или принтер и мобильные версии страниц. Поскольку ответственность за соблюдение тега noindex веб-сайта лежит на авторе поискового робота, иногда эти теги игнорируются. Кроме того, интерпретация тега noindex иногда немного отличается от одной поисковой компании к другой.

Нет индексации целых страниц

1 <html>2 <голова>3   <мета имя="роботы" содержание="ноиндекс">4   <заглавие>Не индексируйте эту страницу</заглавие>5 </голова>

Возможные значения для содержимого метатега: «none», «all», «index», «noindex», «nofollow» и «follow». Также возможна комбинация значений,^[1] Например:

<мета имя="роботы" содержание="noindex, следовать">

Директивы, специфичные для ботов

Директива noindex может быть ограничена только определенными ботами, указав другое значение «name» в метатеге.

Например, чтобы заблокировать бота Google,^[3] указывать:

<мета имя="googlebot" содержание="ноиндекс">

Или, чтобы заблокировать бота Bing, укажите:

<мета имя="бингбот" содержание="ноиндекс">

Или, чтобы заблокировать бота BaidUu, укажите:

<мета имя="байдуспайдер" содержание="ноиндекс">

файл robots.txt

А robots.txt файл можно использовать для блокировки сканирования.

Нет индексации части страницы

Также можно исключить из индексации часть веб-страницы, например текст навигации, а не всю страницу. Для этого есть разные техники; можно использовать несколько в комбинации. Главный паук индексирования Google, Googlebot, не известно, распознает какой-либо из этих методов.

тег

Российская поисковая система Яндекс представил новый тег , который предотвращает индексацию содержимого между тегами. Чтобы разрешить проверку исходного кода, можно также использовать :^[4]

<п>Проиндексируйте этот текст.<noindex>Не индексируйте этот текст.</noindex><!--noindex-->Не индексируйте этот текст.<!--/noindex--></п>

Другой индексирующие пауки также распознают тег , включая Атомз.^[5]

микроформат

Есть проект 2005 г. микроформаты спецификация с той же функциональностью. Профиль исключения роботов ищет атрибут и значение class = "robots-noindex" в тегах HTML:^[6]

<п>Проиндексируйте этот текст.</п><div класс="роботы-ноиндекс">Не индексируйте этот текст.</div><размах класс="роботы-ноиндекс">Не индексируйте этот текст.</размах><п класс="роботы-ноиндекс">Не индексируйте этот текст.</п>

Возможна также комбинация значений,^[6] Например:

<div класс="роботы-noindex-роботы-следовать">Текст.</div>

Yahoo!

В 2007, Yahoo! ввел аналогичные функции микроформата в свой паук. Однако паук Yahoo! Несовместим в том смысле, что он ищет ценность class = "robots-nocontent" и только это значение:^[7]

<п>Проиндексируйте этот текст.</п><div класс="роботы-неконтент">Не индексируйте этот текст.</div><размах класс="роботы-неконтент">Не индексируйте этот текст.</размах><п класс="роботы-неконтент">Не индексируйте этот текст.</п>

SharePoint

SharePoint IFilter 2010 исключает содержимое внутри тега

с атрибутом и значением class = "noindex". Внутренние

изначально не исключались, но это могло измениться. Также неизвестно, можно ли применить этот атрибут к тегам, отличным от

.^[8]

<п>Проиндексируйте этот текст.</п><div класс="ноиндекс">Не индексируйте этот текст.</div>

Структурированные комментарии

В Google Search Appliance использует структурированные комментарии:^[9]

<п>Проиндексируйте этот текст.<!--googleoff: all-->Не индексируйте этот текст.<!--googleon: all--></п>

Другие пауки индексации используют свои собственные структурированные комментарии.

Смотрите также

Не следует атрибут ссылки
Стандарт исключения роботов

использованная литература

^ ^а ^б Роботы и элемент МЕТА, Официальная спецификация W3
^ О теге роботов
^ Использование метатегов для блокировки доступа к вашему сайту, Справка Инструментов Google для веб-мастеров
^ «Использование HTML-тегов». вебмастер → помощь. Яндекс. Раздел: тег . Получено 25 марта, 2013.
^ "Общие вопросы по поиску". Помогите. Атомз. 2013. Раздел: Как мне исключить части моего сайта из поиска?. Получено 23 марта, 2013. Необходимо предотвратить поиск по частям отдельных страниц? Если вы хотите исключить части страницы из индексации, окружите текст тегами и . Это полезно, например, если вы хотите исключить навигационный текст из поиска.(требуется регистрация)
^ ^а ^б Джейн, Питер (18 июня 2005 г.). «Профиль исключения роботов». Микроформаты. Получено 24 марта, 2013.
^ Гарг, Приянк (2 мая 2007 г.). «Представляем роботов-неконтент для разделов страниц». Yahoo! Искать в блоге. Yahoo!. Архивировано из оригинал 20 августа 2014 г.. Получено 23 марта, 2013.
^ «Управление индексированием поиска (сканирование) на странице с помощью Noindex». Разработчик Microsoft. Microsoft. 7 июня 2010 г. В архиве с оригинала 4 ноября 2017 г.. Получено 4 ноября, 2017.
^ «Администрирование сканирования: подготовка к сканированию». Google Search Appliance. Google Inc. 23 августа 2012 г. Раздел: Исключение нежелательного текста из индекса. Архивировано из оригинал 23 ноября 2012 г.. Получено 23 марта, 2013.

[W3spec-1] а ^б Роботы и элемент МЕТА, Официальная спецификация W3

[2] О теге роботов

[google_noindex-3] Использование метатегов для блокировки доступа к вашему сайту, Справка Инструментов Google для веб-мастеров

[4] «Использование HTML-тегов». вебмастер → помощь. Яндекс. Раздел: тег . Получено 25 марта, 2013.

[5] "Общие вопросы по поиску". Помогите. Атомз. 2013. Раздел: Как мне исключить части моего сайта из поиска?. Получено 23 марта, 2013. Необходимо предотвратить поиск по частям отдельных страниц? Если вы хотите исключить части страницы из индексации, окружите текст тегами и . Это полезно, например, если вы хотите исключить навигационный текст из поиска.(требуется регистрация)

[microformat-6] а ^б Джейн, Питер (18 июня 2005 г.). «Профиль исключения роботов». Микроформаты. Получено 24 марта, 2013.

[7] Гарг, Приянк (2 мая 2007 г.). «Представляем роботов-неконтент для разделов страниц». Yahoo! Искать в блоге. Yahoo!. Архивировано из оригинал 20 августа 2014 г.. Получено 23 марта, 2013.

[8] «Управление индексированием поиска (сканирование) на странице с помощью Noindex». Разработчик Microsoft. Microsoft. 7 июня 2010 г. В архиве с оригинала 4 ноября 2017 г.. Получено 4 ноября, 2017.

[9] «Администрирование сканирования: подготовка к сканированию». Google Search Appliance. Google Inc. 23 августа 2012 г. Раздел: Исключение нежелательного текста из индекса. Архивировано из оригинал 23 ноября 2012 г.. Получено 23 марта, 2013.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Navigation