Архив сайта

Сайт, хранящий информацию о веб-страницах из прошлого

В веб-архивировании архивный сайт — это веб-сайт , на котором хранится информация о веб-страницах из прошлого, доступная для просмотра любым желающим.

Общие методы

Два распространенных метода архивирования веб-сайтов — использование веб-сканера или сбор данных от пользователей:

  1. Использование веб-краулера : Используя веб-краулер (например, Internet Archive ), сервис не будет зависеть от активного сообщества для своего контента, и, таким образом, может быстрее построить большую базу данных. Однако веб-краулеры могут индексировать и архивировать только информацию, которую общественность решила разместить в Интернете, или которая доступна для сканирования, поскольку разработчики веб-сайтов и системные администраторы имеют возможность блокировать веб-краулеры от доступа к [определенным] веб-страницам (используя robots.txt ).
  2. Представления пользователей : хотя может быть сложно запустить службы представления пользователей из-за потенциально низких показателей представлений пользователей, эта система может дать одни из лучших результатов. Сканируя веб-страницы, можно получить только ту информацию, которую общественность решила разместить в сети; однако потенциальные поставщики контента могут не беспокоиться о размещении определенной информации, предполагая, что она никому не будет интересна, из-за отсутствия надлежащего места для ее размещения или из-за проблем с авторскими правами. [1] Однако пользователи, которые видят, что кто-то хочет получить их информацию, могут быть более склонны ее разместить.

Примеры

Группы Google

12 февраля 2001 года Google приобрела архивы дискуссионных групп Usenet у Deja.com и превратила их в свой сервис Google Groups . [2] Они позволяют пользователям искать старые обсуждения с помощью поисковой технологии Google, при этом по-прежнему разрешая пользователям публиковать сообщения в списках рассылки .

Интернет-архив

Архив Интернета создает сборник веб-сайтов и цифровых медиа . Начиная с 1996 года Архив использует веб-краулер для создания своей базы данных. Это один из самых известных архивных сайтов.

Архивы NBCUniversal

Архивы NBCUniversal предлагают доступ к эксклюзивному контенту от NBCUniversal и его дочерних компаний. Их веб-сайт архивов NBCUniversal обеспечивает легкий просмотр прошлых и недавних новостных клипов, и это яркий пример архива новостей. [3]

Nextpoint

Nextpoint предлагает автоматизированное облачное SaaS-решение для нужд, связанных с маркетингом, соблюдением требований и судебными разбирательствами, включая электронное раскрытие информации.

Архив ПАНДОРА

PANDORA ( Архив Pandora ), основанный в 1996 году Национальной библиотекой Австралии , означает Сохранение и Доступ к Сетевым Документальным Ресурсам Австралии, что инкапсулирует их миссию. Они предоставляют долгосрочный каталог избранных онлайн-публикаций и веб-сайтов, созданных австралийцами или посвященных австралийской тематике. Они используют свою PANDAS (Система Цифрового Архивирования PANDORA) при создании своего каталога.

textfiles.com

textfiles.com — большая библиотека старых текстовых файлов, поддерживаемая Джейсоном Скоттом Садофски . Ее миссия — архивировать старые документы, которые циркулировали в системах электронных досок объявлений (BBS) его юности, а также документировать опыт других людей в системах электронных досок объявлений.

Смотрите также

Ссылки

  1. Jinfang Niu (март–апрель 2012 г.). «Обзор веб-архивирования». Журнал D-Lib . Том 18, № 3/4. doi : 10.1045/march2012-niu1 .
  2. ^ «Google приобретает службу обсуждений Usenet и значительные активы Deja.com». 12 февраля 2001 г.
  3. ^ Архивы NBCUniversal
Retrieved from "https://en.wikipedia.org/w/index.php?title=Archive_site&oldid=1215594469"