Поиск на рабочем столе - Desktop search

Программное обеспечение OSL для настольных поисковых систем Aduna AutoFocus 5

Инструменты поиска на рабочем столе выполняют поиск в файлах собственного компьютера пользователя, а не в Интернете. Эти инструменты предназначены для поиска информации на ПК пользователя, включая историю веб-браузера, архивы электронной почты, текстовые документы, звуковые файлы, изображения и видео. Теперь доступны различные настольные программы поиска; см. этот список для примеров. Большинство программ поиска на рабочем столе представляют собой автономные приложения. Продукты для поиска на рабочем столе - это программные альтернативы программному обеспечению для поиска, включенному в операционную систему , которые помогают пользователям просматривать файлы на рабочем столе, электронные письма, вложения и многое другое.

Поиск на компьютере стал проблемой для крупных компаний по двум основным причинам: невыполненная производительность и безопасность. По данным аналитической компании Gartner, до 80% данных некоторых компаний заблокировано внутри неструктурированных данных - информации, хранящейся на ПК пользователя, каталогов (папок) и файлов, которые они создали в сети , документов, хранящихся в репозиториях, таких как в корпоративных интрасетях и во множестве других мест. Более того, многие компании хранят структурированную или неструктурированную информацию в старых форматах файлов, к которым у них нет свободного доступа.

В период с конца 2004 г. до начала 2005 г. этот сектор привлек значительное внимание из-за борьбы между Microsoft и Google. По мнению рыночных аналитиков, обе компании пытались использовать свои монополии ( веб-браузеров и поисковых систем соответственно) для усиления своего господства. Из-за жалобы Google на то, что пользователи Windows Vista не могут выбрать программу поиска конкурентов на рабочем столе вместо встроенной, между Министерством юстиции США и Microsoft было достигнуто соглашение о том, что Windows Vista Service Pack 1 позволит пользователям выбирать между встроенной программой поиска. in и другие программы поиска на рабочем столе и выберите, какая из них будет по умолчанию. В сентябре 2011 года Google прекратил использование Google Desktop .

Технологии

Большинство настольных поисковых систем создают и поддерживают базу данных индекса для повышения производительности при поиске больших объемов данных . Индексирование обычно происходит, когда компьютер бездействует, и для большинства поисковых приложений можно настроить приостановку индексации, если портативный компьютер работает от батарей, в целях экономии энергии. Однако есть заметные исключения: поисковая система Voidtools Everything Search Engine , которая выполняет поиск только по именам файлов, а не по содержимому, может создать свой индекс с нуля всего за несколько секунд. Другим исключением является Vegnos Desktop Search Engine, который выполняет поиск по именам файлов и их содержимому без создания каких-либо индексов. Индекс также может быть устаревшим при выполнении запроса. В этом случае возвращенные результаты не будут точными (то есть попадание может отображаться, когда его больше нет, и файл может не отображаться, когда на самом деле это попадание). Некоторые продукты пытались исправить этот недостаток, встроив в программное обеспечение функцию индексации в реальном времени. Отсутствие индексации имеет недостатки. А именно, время выполнения запроса может быть значительным, а выданный запрос также может быть ресурсоемким.

Инструменты поиска на рабочем столе обычно собирают информацию о файлах трех типов:

  • имена файлов и папок
  • метаданные , такие как заголовки, авторы, комментарии в типах файлов, таких как MP3 , PDF и JPEG
  • содержимое файла для типов документов, поддерживаемых инструментом

Долгосрочные цели поиска на рабочем столе включают возможность поиска содержимого файлов изображений , звуковых файлов и видео по контексту.

Платформы и их история

Окна

Поиск на рабочем столе Lookeen в Windows

Служба индексирования «базовая служба, которая извлекает содержимое из файлов и создает индексированный каталог для облегчения эффективного и быстрого поиска» была первоначально выпущена в августе 1996 года, она была создана для ускорения ручного поиска файлов на персональных компьютерах и в корпоративной компьютерной сети. . Служба индексирования помогла с помощью веб-серверов Microsoft индексировать файлы на желаемых жестких дисках. Индексирование производилось по формату файла. Используя термины, предоставленные пользователями, был проведен поиск, который сопоставил термины с данными в форматах файлов. Самая большая проблема, с которой столкнулась служба индексирования, заключалась в том, что каждый раз, когда файл добавлялся, его приходилось индексировать. Это вкупе с тем фактом, что индексирование кешировало весь индекс в ОЗУ, сделало оборудование огромным ограничением. Из-за этого для индексации больших объемов файлов требовалось чрезвычайно мощное оборудование и очень долгое время ожидания.

В 2003 году Windows Desktop Search (WDS) заменила Microsoft Indexing Service. Вместо сопоставления терминов с деталями формата файла и имен файлов, WDS обеспечивает индексацию содержимого для всех файлов Microsoft и текстовых форматов, таких как электронная почта и текстовые файлы. Это означает, что WDS просмотрел файлы и проиндексировал их содержимое. Таким образом, когда пользователь искал термин, WDS больше не совпадал только с информацией, такой как типы форматов файлов и имена файлов, но с терминами и значениями, хранящимися в этих файлах. В WDS также реализован «Мгновенный поиск», означающий, что пользователь может ввести символ, и запрос немедленно начнет поиск и обновление запроса по мере того, как пользователь вводит больше символов. Windows Search, по-видимому, потреблял много вычислительной мощности, поскольку Windows Desktop Search запускался только при прямом запросе или во время простоя ПК. Индексирование всего жесткого диска продолжалось часами, даже если он выполнялся только при прямом запросе или когда компьютер находился в режиме ожидания. Индекс будет составлять около 10% от размера всех индексируемых файлов, например, если размер проиндексированных файлов составляет около 100 ГБ, размер индекса будет 10 ГБ.

С выпуском Windows Vista появилась Windows Search 3.1. В отличие от своих предшественников WDS и Windows Search 3.0, версия 3.1 могла беспрепятственно выполнять поиск как в индексированных, так и в неиндексированных местах. Кроме того, были значительно снижены требования к оперативной памяти и процессору, что значительно сократило время индексирования. Windows Search 4.0 в настоящее время работает на всех ПК с Windows 7 и более поздних версий.

Mac OS

В 1994 году была представлена ​​поисковая система AppleSearch , позволяющая пользователям выполнять полный поиск по всем документам на своих компьютерах Macintosh, включая типы форматов файлов, метаданные этих файлов и содержимое файлов. AppleSearch был клиент-серверным приложением , и поэтому для его работы требовался сервер, отдельный от основного устройства. Самой большой проблемой AppleSearch были большие требования к ресурсам: «AppleSearch требует как минимум процессор 68040 и 5 МБ ОЗУ». В то время компьютер Macintosh с этими характеристиками стоил примерно 1400 долларов; что эквивалентно 2050 долларам в 2015 году. Кроме того, само программное обеспечение стоило дополнительно 1400 долларов за одну лицензию.

В 1997 году вместе с Mac OS 8.5 был выпущен Sherlock . Шерлок (названный в честь известного вымышленного детектива Шерлока Холмса ) был интегрирован в файловый браузер Mac OS - Finder . Шерлок распространил функцию поиска на рабочем столе на всемирную паутину, позволив пользователям искать как локально, так и извне. Добавление дополнительных функций, таких как доступ в Интернет, к Шерлоку было относительно простым, поскольку это было сделано с помощью плагинов, написанных в виде простых текстовых файлов. Шерлок был включен в каждый выпуск Mac OS из Mac OS 8 , прежде чем был объявлен устаревшим и заменен на Spotlight и Dashboard в Mac OS X 10.4 Tiger . Он был официально удален в Mac OS X 10.5 Leopard.

Spotlight был выпущен в 2005 году как часть Mac OS X 10.4 Tiger . Это инструмент поиска на основе выбора, что означает, что пользователь вызывает запрос, используя только мышь. Spotlight позволяет пользователю искать в Интернете дополнительную информацию о любом ключевом слове или фразе, содержащихся в документе или веб-странице, и использует встроенный калькулятор и Оксфордский американский словарь для быстрого доступа к небольшим вычислениям и определениям слов. Хотя изначально Spotlight имеет длительное время запуска, оно уменьшается по мере индексации жесткого диска. По мере добавления файлов пользователем индекс постоянно обновляется в фоновом режиме с использованием минимальных ресурсов ЦП и ОЗУ.

Linux

Для пользователей Linux существует широкий спектр вариантов поиска на рабочем столе, в зависимости от уровня навыков пользователя, его предпочтения использовать настольные инструменты, которые тесно интегрированы в их среду рабочего стола, функциональность командной оболочки (часто с расширенными параметрами сценариев) или браузера. -пользователи взаимодействуют с локально работающим программным обеспечением. Кроме того, многие пользователи создают свою собственную индексацию из различных пакетов индексирования (например, тот, который хорошо извлекает и индексирует документы PDF / DOC / DOCX / ODT , другой поисковый движок, который работает с vcard, LDAP и другими каталогами / контактами. базы данных, а также обычные findи locateкоманды.

Ubuntu

Инструмент поиска Unity Dash в Ubuntu 16.04

В Ubuntu Linux не было поиска на рабочем столе до выпуска Feisty Fawn 7.04 . При использовании поиска на рабочем столе Tracker функция поиска на рабочем столе была очень похожа на AppleSearch и Sherlock в Mac OS. В нем не только представлены основные функции сортировки форматов файлов и сопоставления метаданных, но и добавлена ​​поддержка поиска по электронной почте и мгновенным сообщениям. В 2014 году Recoll был добавлен в дистрибутивы Linux, работая с другими программами поиска, такими как Tracker и Beagle, для обеспечения эффективного полнотекстового поиска. Это значительно увеличило количество типов запросов и типов файлов, которые может обрабатывать поиск на рабочем столе Linux. Основным преимуществом Recoll является то, что он позволяет более точно настраивать индексируемые элементы; Recoll будет индексировать весь жесткий диск по умолчанию, но его можно заставить индексировать только выбранные каталоги, исключая каталоги, в которых никогда не будет необходимости искать.

openSUSE

Начиная с KDE4 , был представлен НЕПОМУК . Он предоставил возможность индексировать широкий спектр содержимого рабочего стола, электронной почты и использовать семантические веб-технологии (например, RDF ) для аннотирования базы данных. Введение столкнулось с несколькими сбоями, большая часть которых, казалось, была связана с тройным хранилищем . Производительность улучшилась (по крайней мере, для запросов) за счет переключения серверной части на урезанную версию Virtuoso Open Source Edition, однако индексация оставалась частой жалобой пользователей. На основании отзывов пользователей индексирование и поиск Nepomuk были заменены фреймворком Baloo на основе Xapian .

Смотрите также

Рекомендации