В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Инструменты поиска на рабочем столе выполняют поиск в файлах на компьютере пользователя, а не в Интернете. Эти инструменты предназначены для поиска информации на компьютере пользователя, включая историю веб-браузера, архивы электронной почты, текстовые документы, звуковые файлы, изображения и видео. Сейчас доступны разнообразные программы поиска на рабочем столе; см. этот список для примеров. Большинство программ поиска на рабочем столе являются автономными приложениями. Продукты поиска на рабочем столе являются программными альтернативами поисковому программному обеспечению, включенному в операционную систему , помогающими пользователям просматривать файлы на рабочем столе, электронные письма, вложения и многое другое. [1] [2] [3]
Поиск на рабочем столе стал проблемой для крупных фирм по двум основным причинам: неиспользованная производительность и безопасность. По данным аналитической компании Gartner, до 80% данных некоторых компаний заперты внутри неструктурированных данных — информации, хранящейся на ПК пользователя, каталогах (папках) и файлах, которые они создали в сети , документах, хранящихся в репозиториях, таких как корпоративные интрасети , и множестве других мест. [4] Более того, многие компании имеют структурированную или неструктурированную информацию, хранящуюся в старых форматах файлов , к которым у них нет свободного доступа.
Сектор привлек значительное внимание в период с конца 2004 по начало 2005 года из-за борьбы между Microsoft и Google. [5] [6] [7] По мнению аналитиков рынка, обе компании пытались использовать свои монополии ( веб-браузеров и поисковых систем соответственно) для укрепления своего доминирования. Из-за жалобы Google на то, что пользователи Windows Vista не могут выбрать какую-либо программу поиска на рабочем столе конкурента вместо встроенной, было достигнуто соглашение между Министерством юстиции США и Microsoft о том, что Windows Vista Service Pack 1 позволит пользователям выбирать между встроенной и другими программами поиска на рабочем столе, а также выбирать, какая из них будет использоваться по умолчанию. [8] По состоянию на сентябрь 2011 года Google прекратила поддержку Google Desktop .
Большинство поисковых систем для настольных компьютеров создают и поддерживают базу данных индекса для повышения производительности при поиске больших объемов данных . Индексирование обычно происходит, когда компьютер простаивает, и большинство поисковых приложений можно настроить на приостановку индексирования, если портативный компьютер работает от батарей, чтобы экономить электроэнергию. Однако есть заметные исключения: Everything Search Engine от Voidtools , [9] которая выполняет поиск только по именам файлов, а не по содержимому, способна построить свой индекс с нуля всего за несколько секунд. Другим исключением является Vegnos Desktop Search Engine, [10] которая выполняет поиск по именам файлов и содержимому файлов без создания каких-либо индексов. Индекс также может быть неактуальным, когда выполняется запрос. В этом случае возвращаемые результаты не будут точными (то есть попадание может отображаться, когда его больше нет, и файл может не отображаться, когда на самом деле это попадание). Некоторые продукты пытались устранить этот недостаток, встраивая в программное обеспечение функцию индексирования в реальном времени. Есть недостатки в отсутствии индексации. А именно, время выполнения запроса может быть значительным, а отправленный запрос также может быть ресурсоемким.
Инструменты поиска на компьютере обычно собирают три типа информации о файлах:
Долгосрочные цели поиска на компьютере включают возможность поиска содержимого файлов изображений , звуковых файлов и видео по контексту. [11] [12]
Служба индексирования , «базовая служба, которая извлекает содержимое из файлов и создает индексированный каталог для обеспечения эффективного и быстрого поиска», [13] была первоначально выпущена в августе 1996 года. Она была создана для ускорения ручного поиска файлов на персональных компьютерах и в корпоративной компьютерной сети. Служба индексирования помогла, используя веб-серверы Microsoft для индексации файлов на нужных жестких дисках. Индексирование выполнялось по формату файла. Используя термины, предоставленные пользователями, проводился поиск, который сопоставлял термины с данными в форматах файлов. Самая большая проблема, с которой столкнулась служба индексирования, заключалась в том, что каждый раз, когда добавлялся файл, его приходилось индексировать. Это в сочетании с тем фактом, что индексирование кэшировало весь индекс в оперативной памяти, делало оборудование огромным ограничением. [14] Это делало индексирование больших объемов файлов требующим чрезвычайно мощного оборудования и очень длительного времени ожидания.
В 2003 году Windows Desktop Search (WDS) заменила Microsoft Indexing Service. Вместо того, чтобы только сопоставлять термины с подробностями формата файла и имен файлов, WDS вводит индексацию контента для всех файлов Microsoft и текстовых форматов, таких как электронная почта и текстовые файлы. Это означает, что WDS просматривает файлы и индексирует контент. Таким образом, когда пользователь ищет термин, WDS больше не сопоставляет только информацию, такую как типы форматов файлов и имена файлов, но и термины и значения, хранящиеся в этих файлах. WDS также вводит «мгновенный поиск», что означает, что пользователь может ввести символ, и запрос мгновенно начнет поиск и обновление запроса по мере того, как пользователь вводит больше символов. [15] Windows Search, по-видимому, потребляет много вычислительной мощности, так как Windows Desktop Search работает только в том случае, если он запрашивается напрямую или когда ПК находится в режиме ожидания. Даже работая только во время прямого запроса или когда компьютер находится в режиме ожидания, индексация всего жесткого диска все равно занимает часы. Индекс будет составлять около 10% от размера всех проиндексированных файлов, например, если размер проиндексированных файлов составляет около 100 ГБ, размер индекса составит 10 ГБ.
С выпуском Windows Vista появился Windows Search 3.1. В отличие от своих предшественников WDS и Windows Search 3.0, 3.1 мог осуществлять поиск как по индексированным, так и по неиндексированным расположениям без проблем. Кроме того, требования к оперативной памяти и процессору были значительно снижены, что значительно сократило время индексации. Windows Search 4.0 в настоящее время работает на всех ПК с Windows 7 и выше.
В 1994 году была представлена поисковая система AppleSearch , позволяющая пользователям полностью искать все документы на своем компьютере Macintosh, включая типы форматов файлов, метаданные этих файлов и содержимое внутри файлов. AppleSearch был клиент-серверным приложением , и, как таковое, для работы требовал сервер, отдельный от основного устройства. Самой большой проблемой AppleSearch были его большие требования к ресурсам: «AppleSearch требует как минимум процессор 68040 и 5 МБ оперативной памяти». [16] В то время компьютер Macintosh с такими характеристиками стоил примерно 1400 долларов США, что эквивалентно 2050 долларам США в 2015 году. [17] Вдобавок к этому, само программное обеспечение стоило дополнительно 1400 долларов США за одну лицензию.
В 1997 году Sherlock был выпущен вместе с Mac OS 8.5. Sherlock (названный в честь известного вымышленного детектива Шерлока Холмса ) был интегрирован в файловый браузер Mac OS — Finder . Sherlock расширил функцию поиска на рабочем столе до Всемирной паутины, позволяя пользователям выполнять поиск как локально, так и внешне. Добавление дополнительных функций, таких как доступ в Интернет, к Sherlock было относительно простым, поскольку это делалось с помощью плагинов, написанных в виде простых текстовых файлов. Sherlock был включен в каждый выпуск Mac OS, начиная с Mac OS 8 , прежде чем был объявлен устаревшим и заменен Spotlight и Dashboard в Mac OS X 10.4 Tiger . Он был официально удален в Mac OS X 10.5 Leopard
Spotlight был выпущен в 2005 году как часть Mac OS X 10.4 Tiger . Это поисковый инструмент на основе выбора, что означает, что пользователь вызывает запрос, используя только мышь. Spotlight позволяет пользователю искать в Интернете дополнительную информацию о любом ключевом слове или фразе, содержащейся в документе или веб-странице, и использует встроенный калькулятор и Оксфордский американский словарь для предоставления быстрого доступа к небольшим расчетам и определениям слов. [18] Хотя Spotlight изначально имеет долгое время запуска, оно уменьшается по мере индексации жесткого диска. По мере добавления файлов пользователем индекс постоянно обновляется в фоновом режиме, используя минимальные ресурсы ЦП и ОЗУ.
Для пользователей Linux существует широкий спектр вариантов поиска на рабочем столе, в зависимости от уровня навыков пользователя, его предпочтений в использовании инструментов рабочего стола, которые тесно интегрируются в его среду рабочего стола, функциональности командной оболочки (часто с расширенными возможностями сценариев) или интерфейсов пользователя на основе браузера для локально запущенного программного обеспечения. Кроме того, многие пользователи создают собственную индексацию из различных пакетов индексации (например, один, который хорошо извлекает и индексирует документы PDF/DOC/DOCX/ ODT , другой поисковый движок, который работает с/vcard, LDAP и другими базами данных каталогов/контактов, а также обычные find
и locate
команды.
Ubuntu Linux не имел поиска на рабочем столе до выпуска Feisty Fawn 7.04 . Используя поиск на рабочем столе Tracker [19] , функция поиска на рабочем столе была очень похожа на AppleSearch и Sherlock в Mac OS. Он не только обладал базовыми функциями сортировки форматов файлов и сопоставления метаданных, но и была добавлена поддержка поиска по электронной почте и мгновенным сообщениям. В 2014 году Recoll [20] был добавлен в дистрибутивы Linux, работая с другими поисковыми программами, такими как Tracker и Beagle, для обеспечения эффективного полнотекстового поиска. Это значительно увеличило типы запросов и типов файлов, которые мог обрабатывать поиск на рабочем столе Linux. Главным преимуществом Recoll является то, что он позволяет лучше настраивать то, что индексируется; Recoll будет индексировать весь жесткий диск по умолчанию, но может быть настроен на индексацию только выбранных каталогов, пропуская каталоги, которые никогда не понадобятся для поиска. [21]
Начиная с KDE4 , был представлен NEPOMUK . Он предоставлял возможность индексировать широкий спектр контента рабочего стола, электронной почты и использовать технологии семантической сети (например, RDF ) для аннотирования базы данных. Введение столкнулось с несколькими сбоями, многие из которых, по-видимому, были основаны на triplestore . Производительность улучшилась (по крайней мере, для запросов) за счет переключения бэкэнда на урезанную версию Virtuoso Open Source Edition, однако индексация оставалась распространенной жалобой пользователей. На основе отзывов пользователей индексация и поиск Nepomuk были заменены фреймворком Baloo [22] на основе Xapian . [23]