Кэш поисковой системы — это кэш веб -страниц , который показывает страницу такой, какой она была, когда была проиндексирована веб-сканером . Кэшированные версии веб-страниц могут использоваться для просмотра содержимого страницы, когда текущая версия недоступна , была изменена или удалена . [1]
Веб-краулер собирает содержимое веб-страницы, которое затем индексируется поисковой системой . Поисковая система может сделать копию доступной для пользователей. Веб-краулеры, которые подчиняются ограничениям в robots.txt [2] или метатегах [3] веб-мастера сайта, могут не сделать кэшированную копию доступной для пользователей поисковой системы, если им дано такое указание.
Кэш поисковой системы может использоваться для расследования преступлений , [4] судебных разбирательств [5] и журналистики . [6] [1] Примерами поисковых систем, которые предлагают своим пользователям кэшированные версии веб-страниц, являются Bing , Yandex Search и Baidu .
Кэш поисковой системы может быть не полностью защищен обычными законами, которые защищают поставщиков технологий от исков о нарушении авторских прав. [7]
Google прекратил работу своей службы веб-кэширования в 2024 году. [8] Служба была разработана для веб-сайтов, которые могут отображаться в результатах поиска Google, но временно находятся в автономном режиме. Как « кэш », она не была разработана для архивных целей, у кеша был срок действия. Google заявила, что Интернет по состоянию на 2024 год стал намного надежнее, чем «давным-давно» в прежние времена, и поэтому ее служба кэширования больше не является важной для обслуживания. [8]
Google указал на Wayback Machine как на лучшую альтернативу и предположил, что Google может сотрудничать с ними в будущем. [8] В сентябре 2024 года Google и Internet Archive объявили о сотрудничестве, предоставляющем ссылки на Wayback Machine из Google Search . [9]
Поиск Bing , следуя примеру Google Cache, также прекратил свою службу веб-кэширования в 2024 году. Microsoft объяснила: «Интернет эволюционировал в сторону большей надежности, и многие страницы не оптимизированы для просмотра кэша». [10] [11]
Когда страница становится спорной, издатели могут удалить ее или изменить без подтверждения. Если вы подозреваете, что столкнулись с проблемой, первое место, куда следует обратиться, — это кэш страницы Google, какой она была при последнем сканировании.
noarchive: Не показывать кэшированную ссылку в результатах поиска.
noarchive — Не показывать кэшированную ссылку на страницу в результатах поиска.
Для исследователя это может быть ценной информацией. В зависимости от того, когда Google сканировал сайт, последняя страница может содержать информацию, отличную от текущей страницы. Поэтому документирование и захват кэшированной страницы Google веб-страницы может быть важным шагом для обеспечения сохранности этого снимка времени.
Всемирная паутина не так эфемерна, как можно было бы подумать. Все больше старых веб-страниц доступны онлайн через такие сервисы, как Wayback Machine, Yahoo Cache или Bing Cache. Некоторые адвокаты истцов и корпоративные оводы используют эти сервисы как обычно.
Журналисты также могут получить доступ к исключенному контенту через кэш Google.
Для функции кэширования суд отклонил исключение «технически необходимой копии». Это исключение исключает временное воспроизведение, которое является необходимой частью технического процесса, применяемого посредником для передачи в сети между третьими лицами. По мнению суда, копия кэша, которую Google хранит на своем сервере, не является технически необходимой для эффективной передачи.