Человеко-компьютерный поиск информации - Human–computer information retrieval

Человеко-компьютерный поиск информации ( HCIR ) - это исследование и разработка методов поиска информации , которые привносят человеческий интеллект в процесс поиска . Он сочетает в себе области взаимодействия человека с компьютером (HCI) и поиска информации (IR) и создает системы, которые улучшают поиск, принимая во внимание человеческий контекст или посредством многоэтапного процесса поиска, который предоставляет возможность обратной связи с людьми.

История

Этот термин « человеко-компьютерный поиск информации» был введен Гэри Маркионини в серии лекций, прочитанных между 2004 и 2006 годами. Главный тезис Маркионини заключается в том, что «HCIR стремится дать людям возможность исследовать крупномасштабные информационные базы, но требует, чтобы люди также брали на себя ответственность контроль, расходуя познавательную и физическую энергию ».

В 1996 и 1998 годах пара семинаров в Университете Глазго по поиску информации и взаимодействию человека с компьютером была направлена ​​на устранение дублирования между этими двумя областями. Маркионини отмечает влияние Всемирной паутины и внезапный рост информационной грамотности - изменения, которые были только зарождающимися в конце 1990-х годов.

Несколько семинаров были посвящены пересечению IR и HCI. Семинар по исследовательскому поиску, инициированный лабораторией взаимодействия человека и компьютера Университета Мэриленда в 2005 году, чередуется между конференциями Специальной группы по поиску информации Ассоциации вычислительной техники (SIGIR) и Специальной группы по взаимодействию между компьютером и человеком (CHI). Также в 2005 году Европейский научный фонд провел исследовательский семинар по поиску информации в контексте. Затем в 2007 году в Массачусетском технологическом институте был проведен первый семинар по поиску информации с помощью компьютера .

Описание

HCIR включает в себя различные аспекты IR и HCI. К ним относятся исследовательский поиск , в котором пользователи обычно сочетают стратегии запросов и просмотра, чтобы способствовать обучению и исследованию; поиск информации в контексте (т. е. с учетом аспектов пользователя или среды, которые обычно не отражаются в запросе); и интерактивный поиск информации, который Питер Ингверсен определяет как «интерактивные коммуникационные процессы, которые происходят во время поиска информации с участием всех основных участников поиска информации (IR), то есть пользователя, посредника и IR-системы».

Основная задача HCIR заключается в том, чтобы системы IR, предназначенные для пользователей-людей, внедрялись и оценивались таким образом, чтобы отражать потребности этих пользователей.

Большинство современных IR-систем используют модель ранжированного поиска, в которой документы оцениваются на основе вероятности релевантности документа запросу. В этой модели система представляет пользователю только документы с самым высоким рейтингом. Эти системы обычно оцениваются на основе их средней средней точности по набору эталонных запросов от таких организаций, как Text Retrieval Conference (TREC).

Из-за того, что в HCIR делается упор на использование человеческого интеллекта в процессе поиска информации, требуются разные модели оценки - та, которая сочетает в себе оценку компонентов IR и HCI системы. Ключевой областью исследований HCIR является оценка этих систем. Ранние работы по интерактивному поиску информации, такие как исследование Юргена Кёнеманна и Николаса Белкина 1996 г., посвященное различным уровням взаимодействия для автоматического переформулирования запросов, использовали стандартные IR-меры точности и отзыва, но применяли их к результатам нескольких итераций пользователя. взаимодействие, а не один ответ на запрос. В других исследованиях HCIR, таких как модель оценки IIR Пиа Борлунд, применяется методология, более напоминающая HCI, с упором на характеристики пользователей, детали экспериментального плана и т. Д.

Цели

Исследователи HCIR поставили следующие цели в отношении системы, в которой пользователь имеет больший контроль при определении соответствующих результатов.

Системы должны

  • больше не только доставлять соответствующие документы, но также должен предоставлять семантическую информацию вместе с этими документами
  • повысить ответственность пользователей, а также контроль; то есть информационные системы требуют интеллектуальных усилий человека
  • иметь гибкую архитектуру, чтобы они могли развиваться и адаптироваться к все более требовательным и осведомленным базам пользователей
  • стремиться быть частью информационной экологии личных и общих воспоминаний и инструментов, а не отдельных отдельных сервисов
  • поддерживать весь жизненный цикл информации (от создания до сохранения), а не только этап распространения или использования
  • поддержка настройки конечными пользователями и особенно специалистами в области информации, которые повышают ценность информационных ресурсов
  • быть увлекательным и забавным в использовании

Короче говоря, ожидается, что системы поиска информации будут работать так же, как и хорошие библиотеки. Системы должны помогать пользователям преодолевать разрыв между данными или информацией (в очень узком, детализированном смысле этих терминов) и знаниями (обработанными данными или информацией, которые обеспечивают контекст, необходимый для информирования следующей итерации процесса поиска информации). То есть хорошие библиотеки предоставляют как информацию, в которой нуждается патрон, так и партнер в процессе обучения - профессионал в области информации - для навигации по этой информации, понимания ее, сохранения и превращения в знания (что, в свою очередь, создает новые , более информированная информация).

Методы

Методы, связанные с HCIR, подчеркивают представление информации, использующей человеческий интеллект, чтобы привести пользователя к соответствующим результатам. Эти методы также направлены на то, чтобы позволить пользователям исследовать и переваривать набор данных без штрафных санкций, т. Е. Без ненужных затрат времени, щелчков мышью или сдвига контекста.

Многие поисковые системы имеют функции, в которых используются методы HCIR. Предложения по правописанию и автоматическое переформулирование запросов предоставляют механизмы для предложения потенциальных путей поиска, которые могут привести пользователя к релевантным результатам. Эти предложения представляются пользователю, передавая ему контроль над выбором и интерпретацией.

Фасетный поиск позволяет пользователям перемещаться по информации иерархически , переходя от категории к ее подкатегориям, но выбирая порядок, в котором категории представлены. Это контрастирует с традиционными таксономиями, в которых иерархия категорий фиксирована и неизменна. Фасетная навигация , как и таксономическая навигация, направляет пользователей, показывая им доступные категории (или фасеты), но не требует от них просмотра иерархии, которая может не точно соответствовать их потребностям или образу мышления.

Lookahead предлагает общий подход к исследованию без штрафных санкций. Например, различные веб-приложения используют AJAX для автоматического заполнения условий запроса и предложения популярных поисковых запросов. Другим распространенным примером упреждающего просмотра является способ, которым поисковые системы аннотируют результаты сводной информацией об этих результатах, включая как статическую информацию (например, метаданные об объектах), так и «фрагменты» текста документа, наиболее подходящие для слов в поиске. запрос.

Обратная связь по релевантности позволяет пользователям направлять IR-систему, указывая, являются ли конкретные результаты более или менее актуальными.

Обобщение и аналитика помогают пользователям усваивать результаты, полученные по запросу. Обобщение здесь предназначено для охвата любых средств агрегирования или сжатия результатов запроса в более удобную для человека форму. Фасетный поиск, описанный выше, является одной из таких форм резюмирования. Другой - кластеризация , которая анализирует набор документов, группируя похожие или совпадающие документы или термины. Кластеризация позволяет разделить результаты на группы связанных документов. Например, поиск по запросу «java» может вернуть кластеры для Java (язык программирования) , Java (остров) или Java (кофе) .

Визуальное представление данных также считается ключевым аспектом HCIR. Представление обобщения или аналитики может отображаться в виде таблиц, диаграмм или сводок агрегированных данных. К другим видам визуализации информации, которые позволяют пользователям получать доступ к сводным представлениям результатов поиска, относятся облака тегов и отображение дерева .

Связанные области

Ссылки

  1. ^ a b Маркионини, Г. (2006). К бюллетеню по поиску информации между человеком и компьютером, июнь / июль 2006 г. Бюллетень Американского общества информационных наук.
  2. ^ "Ingwersen, P. (1992). Взаимодействие при поиске информации. Лондон: Тейлор Грэм" . Архивировано из оригинала на 2007-11-25 . Проверено 28 ноября 2007 .
  3. ^ "Рабочая группа Mira (1996). Рамки оценки для интерактивных приложений поиска мультимедийной информации" . Архивировано из оригинала на 2008-02-01.
  4. ^ Гроссман Д. и Фридер О. (2004). Алгоритмы поиска информации и эвристика.
  5. ^ Koenemann, Дж и Belkin, штат Нью - Джерси (1996). Случай для взаимодействия: исследование поведения и эффективности интерактивного поиска информации. В материалах конференции SIGCHI по человеческому фактору в вычислительных системах: точки соприкосновения (Ванкувер, Британская Колумбия, Канада, 13–18 апреля 1996 г.). MJ Tauber, Ed. ЧИ '96. ACM Press, Нью-Йорк, Нью-Йорк, 205-212
  6. ^ Borlund, P. (2003). Модель оценки IIR: основа для оценки интерактивных информационно-поисковых систем. Информационные исследования, 8 (3), документ 152
  7. ^ Уайт, Р., Капра, Р., Головчинский, Г., Кулес, Б., Смит, К., и Тункеланг, Д. (2013). Введение в специальный выпуск о человеко-компьютерном поиске информации. Журнал обработки информации и управления 49 (5), 1053-1057
  8. ^ Херст, М. (1999). Пользовательские интерфейсы и визуализация, глава 10 Баеза-Йейтс, Р. и Рибейро-Нето, Б., Современный поиск информации.
  9. ^ Rocchio, J. (1971). Актуальность обратной связи в поиске информации. В: Salton, G (ed), Система поиска SMART.

внешняя ссылка