Мета-тег, используемый для того, чтобы интернет-боты не индексировали веб-страницу.
В noindex ценность HTML-роботов метатег запросы, которые автоматизированы Интернет-боты избегать индексация веб-страницу.[1][2] Причины, по которым можно использовать этот метатег, включают в себя совет роботам не индексировать очень большую базу данных, веб-страницы, которые являются очень временными, веб-страницы, которые находятся в стадии разработки, веб-страницы, которые нужно сохранить немного более конфиденциальными, или принтер и мобильные версии страниц. Поскольку ответственность за соблюдение тега noindex веб-сайта лежит на авторе поискового робота, иногда эти теги игнорируются. Кроме того, интерпретация тега noindex иногда немного отличается от одной поисковой компании к другой.
1 <html>2 <голова>3 <метаимя="роботы"содержание="ноиндекс">4 <заглавие>Не индексируйте эту страницу</заглавие>5 </голова>
Возможные значения для содержимого метатега: «none», «all», «index», «noindex», «nofollow» и «follow». Также возможна комбинация значений,[1] Например:
<метаимя="роботы"содержание="noindex, следовать">
Директивы, специфичные для ботов
Директива noindex может быть ограничена только определенными ботами, указав другое значение «name» в метатеге.
Например, чтобы заблокировать бота Google,[3] указывать:
<метаимя="googlebot"содержание="ноиндекс">
Или, чтобы заблокировать бота Bing, укажите:
<метаимя="бингбот"содержание="ноиндекс">
Или, чтобы заблокировать бота BaidUu, укажите:
<метаимя="байдуспайдер"содержание="ноиндекс">
файл robots.txt
А robots.txt файл можно использовать для блокировки сканирования.
Нет индексации части страницы
Также можно исключить из индексации часть веб-страницы, например текст навигации, а не всю страницу. Для этого есть разные техники; можно использовать несколько в комбинации. Главный паук индексирования Google, Googlebot, не известно, распознает какой-либо из этих методов.
тег
Российская поисковая система Яндекс представил новый тег , который предотвращает индексацию содержимого между тегами. Чтобы разрешить проверку исходного кода, можно также использовать :[4]
<п>Проиндексируйте этот текст.<noindex>Не индексируйте этот текст.</noindex><!--noindex-->Не индексируйте этот текст.<!--/noindex--></п>
Есть проект 2005 г. микроформаты спецификация с той же функциональностью. Профиль исключения роботов ищет атрибут и значение class = "robots-noindex" в тегах HTML:[6]
<п>Проиндексируйте этот текст.</п><divкласс="роботы-ноиндекс">Не индексируйте этот текст.</div><размахкласс="роботы-ноиндекс">Не индексируйте этот текст.</размах><пкласс="роботы-ноиндекс">Не индексируйте этот текст.</п>
В 2007, Yahoo! ввел аналогичные функции микроформата в свой паук. Однако паук Yahoo! Несовместим в том смысле, что он ищет ценность class = "robots-nocontent" и только это значение:[7]
<п>Проиндексируйте этот текст.</п><divкласс="роботы-неконтент">Не индексируйте этот текст.</div><размахкласс="роботы-неконтент">Не индексируйте этот текст.</размах><пкласс="роботы-неконтент">Не индексируйте этот текст.</п>
SharePoint
SharePoint IFilter 2010 исключает содержимое внутри тега
с атрибутом и значением class = "noindex". Внутренние
изначально не исключались, но это могло измениться. Также неизвестно, можно ли применить этот атрибут к тегам, отличным от
^"Общие вопросы по поиску". Помогите. Атомз. 2013. Раздел: Как мне исключить части моего сайта из поиска?. Получено 23 марта, 2013. Необходимо предотвратить поиск по частям отдельных страниц? Если вы хотите исключить части страницы из индексации, окружите текст тегами и . Это полезно, например, если вы хотите исключить навигационный текст из поиска.(требуется регистрация)