Кэш поисковой системы

Ссылка на кэшированную версию веб-страницы в результатах поиска Google (вверху), Bing (посередине) и Яндекс (внизу)

Кэш поисковой системы — это кэш веб -страниц , который показывает страницу такой, какой она была, когда была проиндексирована веб-сканером . Кэшированные версии веб-страниц могут использоваться для просмотра содержимого страницы, когда текущая версия недоступна , была изменена или удалена . [1]

Веб-краулер собирает содержимое веб-страницы, которое затем индексируется поисковой системой . Поисковая система может сделать копию доступной для пользователей. Веб-краулеры, которые подчиняются ограничениям в robots.txt [2] или метатегах [3] веб-мастера сайта, могут не сделать кэшированную копию доступной для пользователей поисковой системы, если им дано такое указание.

Кэш поисковой системы может использоваться для расследования преступлений , [4] судебных разбирательств [5] и журналистики . [6] [1] Примерами поисковых систем, которые предлагают своим пользователям кэшированные версии веб-страниц, являются Bing , Yandex Search и Baidu .

Кэш поисковой системы может быть не полностью защищен обычными законами, которые защищают поставщиков технологий от исков о нарушении авторских прав. [7]

Кэш Google

Google прекратил работу своей службы веб-кэширования в 2024 году. [8] Служба была разработана для веб-сайтов, которые могут отображаться в результатах поиска Google, но временно находятся в автономном режиме. Как « кэш », она не была разработана для архивных целей, у кеша был срок действия. Google заявила, что Интернет по состоянию на 2024 год стал намного надежнее, чем «давным-давно» в прежние времена, и поэтому ее служба кэширования больше не является важной для обслуживания. [8]

Google указал на Wayback Machine как на лучшую альтернативу и предположил, что Google может сотрудничать с ними в будущем. [8] В сентябре 2024 года Google и Internet Archive объявили о сотрудничестве, предоставляющем ссылки на Wayback Machine из Google Search . [9]

Бинг

Поиск Bing , следуя примеру Google Cache, также прекратил свою службу веб-кэширования в 2024 году. Microsoft объяснила: «Интернет эволюционировал в сторону большей надежности, и многие страницы не оптимизированы для просмотра кэша». [10] [11]

Ссылки

  1. ^ ab Wilfried Ruetten (2012). Справочник по журналистике данных. O'Reilly Media, Inc. ISBN 9781449330064. Когда страница становится спорной, издатели могут удалить ее или изменить без подтверждения. Если вы подозреваете, что столкнулись с проблемой, первое место, куда следует обратиться, — это кэш страницы Google, какой она была при последнем сканировании.
  2. ^ «Спецификации метатега Robots, data-nosnippet и X-Robots-Tag». noarchive: Не показывать кэшированную ссылку в результатах поиска.
  3. ^ «Специальные теги, которые понимает Google — Справка Search Console». noarchive — Не показывать кэшированную ссылку на страницу в результатах поиска.
  4. ^ Тодд Г. Шипли, Арт Боукер (2013). Расследование интернет-преступлений: Введение в раскрытие преступлений в киберпространстве. Newnes. ISBN 9780124079298. Для исследователя это может быть ценной информацией. В зависимости от того, когда Google сканировал сайт, последняя страница может содержать информацию, отличную от текущей страницы. Поэтому документирование и захват кэшированной страницы Google веб-страницы может быть важным шагом для обеспечения сохранности этого снимка времени.
  5. ^ Стивен Марк Леви (2011). Регулирование ценных бумаг: SEC Answer Book. Aspen Publishers Online. ISBN 9781454805434. Всемирная паутина не так эфемерна, как можно было бы подумать. Все больше старых веб-страниц доступны онлайн через такие сервисы, как Wayback Machine, Yahoo Cache или Bing Cache. Некоторые адвокаты истцов и корпоративные оводы используют эти сервисы как обычно.
  6. ^ Клеланд Том (2014-10-23). ​​«Кэши Google и поисковая система .com предоставляют решения для «права быть забытым». Press Gazette . Журналисты также могут получить доступ к исключенному контенту через кэш Google.
  7. ^ Герман Де Бау, Валери Ванденвеге (июнь 2011 г.). «Апелляционный суд Брюсселя поддерживает решение против Google News и Google Cache». Архивировано из оригинала 2015-04-26. Для функции кэширования суд отклонил исключение «технически необходимой копии». Это исключение исключает временное воспроизведение, которое является необходимой частью технического процесса, применяемого посредником для передачи в сети между третьими лицами. По мнению суда, копия кэша, которую Google хранит на своем сервере, не является технически необходимой для эффективной передачи.
  8. ^ abc «Ссылки на кэш поиска Google официально удаляются». 2 февраля 2024 г.
  9. ^ Фриленд, Крис (11 сентября 2024 г.). «Оповещение о новой функции: прямой доступ к архивным веб-страницам через поиск Google». Архив Интернета . Получено 11 сентября 2024 г.
  10. ^ Шварц, Барри (11 декабря 2024 г.). «Bing официально удаляет ссылку на кэш из результатов поиска». Search Engine Land . Получено 20.12.2024 .
  11. ^ Бхавсар, Сагар Нареш (12 сентября 2024 г.). «Microsoft следует по стопам Google, удаляя ссылки на кэш из результатов поиска Bing». Neowin . Получено 14.01.2025 .
Получено с "https://en.wikipedia.org/w/index.php?title=Search_engine_cache&oldid=1269433903"