WikiDer > Noindex
В noindex ценность HTML-роботов метатег запросы, которые автоматизированы Интернет-боты избегать индексация веб-страницу.[1][2] Причины, по которым можно использовать этот метатег, включают в себя совет роботам не индексировать очень большую базу данных, веб-страницы, которые являются очень временными, веб-страницы, которые находятся в стадии разработки, веб-страницы, которые нужно сохранить немного более конфиденциальными, или принтер и мобильные версии страниц. Поскольку ответственность за соблюдение тега noindex веб-сайта лежит на авторе поискового робота, иногда эти теги игнорируются. Кроме того, интерпретация тега noindex иногда немного отличается от одной поисковой компании к другой.
Нет индексации целых страниц
1 <html>2 <голова>3 <мета имя="роботы" содержание="ноиндекс">4 <заглавие>Не индексируйте эту страницу</заглавие>5 </голова>Возможные значения для содержимого метатега: «none», «all», «index», «noindex», «nofollow» и «follow». Также возможна комбинация значений,[1] Например:
<мета имя="роботы" содержание="noindex, следовать">Директивы, специфичные для ботов
Директива noindex может быть ограничена только определенными ботами, указав другое значение «name» в метатеге.
Например, чтобы заблокировать бота Google,[3] указывать:
<мета имя="googlebot" содержание="ноиндекс">Или, чтобы заблокировать бота Bing, укажите:
<мета имя="бингбот" содержание="ноиндекс">Или, чтобы заблокировать бота BaidUu, укажите:
<мета имя="байдуспайдер" содержание="ноиндекс">файл robots.txt
А robots.txt файл можно использовать для блокировки сканирования.
Нет индексации части страницы
Также можно исключить из индексации часть веб-страницы, например текст навигации, а не всю страницу. Для этого есть разные техники; можно использовать несколько в комбинации. Главный паук индексирования Google, Googlebot, не известно, распознает какой-либо из этих методов.
тег
Российская поисковая система Яндекс представил новый тег
<п>Проиндексируйте этот текст.<noindex>Не индексируйте этот текст.</noindex><!--noindex-->Не индексируйте этот текст.<!--/noindex--></п>Другой индексирующие пауки также распознают тег
микроформат
Есть проект 2005 г. микроформаты спецификация с той же функциональностью. Профиль исключения роботов ищет атрибут и значение class = "robots-noindex" в тегах HTML:[6]
<п>Проиндексируйте этот текст.</п><div класс="роботы-ноиндекс">Не индексируйте этот текст.</div><размах класс="роботы-ноиндекс">Не индексируйте этот текст.</размах><п класс="роботы-ноиндекс">Не индексируйте этот текст.</п>Возможна также комбинация значений,[6] Например:
<div класс="роботы-noindex-роботы-следовать">Текст.</div>Yahoo!
В 2007, Yahoo! ввел аналогичные функции микроформата в свой паук. Однако паук Yahoo! Несовместим в том смысле, что он ищет ценность class = "robots-nocontent" и только это значение:[7]
<п>Проиндексируйте этот текст.</п><div класс="роботы-неконтент">Не индексируйте этот текст.</div><размах класс="роботы-неконтент">Не индексируйте этот текст.</размах><п класс="роботы-неконтент">Не индексируйте этот текст.</п>SharePoint IFilter 2010 исключает содержимое внутри тега
<п>Проиндексируйте этот текст.</п><div класс="ноиндекс">Не индексируйте этот текст.</div>Структурированные комментарии
В Google Search Appliance использует структурированные комментарии:[9]
<п>Проиндексируйте этот текст.<!--googleoff: all-->Не индексируйте этот текст.<!--googleon: all--></п>Другие пауки индексации используют свои собственные структурированные комментарии.
Смотрите также
- Не следует атрибут ссылки
- Стандарт исключения роботов
использованная литература
- ^ а б Роботы и элемент МЕТА, Официальная спецификация W3
- ^ О теге роботов
- ^ Использование метатегов для блокировки доступа к вашему сайту, Справка Инструментов Google для веб-мастеров
- ^ «Использование HTML-тегов». вебмастер → помощь. Яндекс. Раздел: тег
- ^ "Общие вопросы по поиску". Помогите. Атомз. 2013. Раздел: Как мне исключить части моего сайта из поиска?. Получено 23 марта, 2013.
Необходимо предотвратить поиск по частям отдельных страниц? Если вы хотите исключить части страницы из индексации, окружите текст тегами . Это полезно, например, если вы хотите исключить навигационный текст из поиска.
(требуется регистрация) - ^ а б Джейн, Питер (18 июня 2005 г.). «Профиль исключения роботов». Микроформаты. Получено 24 марта, 2013.
- ^ Гарг, Приянк (2 мая 2007 г.). «Представляем роботов-неконтент для разделов страниц». Yahoo! Искать в блоге. Yahoo!. Архивировано из оригинал 20 августа 2014 г.. Получено 23 марта, 2013.
- ^ «Управление индексированием поиска (сканирование) на странице с помощью Noindex». Разработчик Microsoft. Microsoft. 7 июня 2010 г. В архиве с оригинала 4 ноября 2017 г.. Получено 4 ноября, 2017.
- ^ «Администрирование сканирования: подготовка к сканированию». Google Search Appliance. Google Inc. 23 августа 2012 г. Раздел: Исключение нежелательного текста из индекса. Архивировано из оригинал 23 ноября 2012 г.. Получено 23 марта, 2013.