Веб-архив Великобритании - UK Web Archive

UK Web Archive представляет собой консорциум из шести британских правовых депозитных библиотек, целью которого является собрать все веб - сайты в Великобритании , по крайней мере один раз в год.

Веб-архив Великобритании
Уква-2018-onwhite-close.svg
Учредил 2005 г.
Ссылка на юридический мандат Да, предусмотрено законом:
Веб-сайт Официальный веб-сайт Отредактируйте это в Викиданных
UK Web Archive находится в Соединенном Королевстве.
Мост Георга IV, Национальная библиотека Шотландии
Архив движущихся изображений
Рядом Бостон Спа
Сент-Панкрас, Лондон
Аберистуит
Читальный зал NLW в библиотеке Кардиффского университета
Библиотека Кембриджского университета
Библиотека Вестона
Библиотека Тринити-колледжа
Библиотеки, обеспечивающие доступ к архиву.

История

В 2005 году Британская библиотека , Национальный архив , Wellcome Trust , Национальная библиотека Шотландии , Национальная библиотека Уэльса и JISC сформировали UK Web Archiving Consortium, проект по архивированию веб-сайтов.

UKWAC заархивировал выбранные веб-сайты по лицензии или с разрешения, используя программное обеспечение PANDAS, разработанное Национальной библиотекой Австралии . В ходе проекта его участники собрали интересующие их сайты; Библиотека Wellcome собрала медицинские сайты , сайты национальных библиотек, отражающие жизнь современного Уэльса или Шотландии. Британская библиотека проводила широкую политику сбора объектов, имеющих культурное, историческое и политическое значение для Великобритании.

Консорциум был ликвидирован в 2010 году. Рабочая группа по архивированию и сохранению взяла на себя координирующую роль UKWAC в веб-архивировании в Великобритании. Digital Сохранность коалиция принимает рабочую группу.

Веб-архивирование

Архив ежегодно сканирует домен .uk и другие географические домены верхнего уровня Великобритании, такие как .scot , .cymru или .london .

График, показывающий небольшую часть сканирования веб-сайта UK Web Archive.  Каждый круг - это отдельный веб-сайт, а каждая линия представляет собой ссылку, по которой переходили между веб-сайтами.  Размер круга показывает, сколько страниц было посещено с этого сайта, а ширина линии представляет количество переходов по ссылкам.
График, показывающий небольшую часть сканирования . Каждый круг - это отдельный веб-сайт, а каждая линия представляет собой ссылку, по которой переходили между веб-сайтами. Размер круга показывает, сколько страниц было посещено с этого сайта, а ширина линии представляет количество переходов по ссылкам. UKWA Crawls: один час за одну минуту

Сканирование архивируется в общей инфраструктуре, называемой системой цифровой библиотеки . Представители общественности могут номинировать сайты для сохранения через веб-сайт UKWA . Весь веб-архив доступен зарегистрированным читателям в помещениях библиотеки; и если разрешение было получено или условия лицензии могут быть выполнены, копии также доступны через веб-сайт.

В архиве собраны сайты, посвященные событиям, построение коллекций - в них сохранились письменные материалы и изображения, записывающие стихийные бедствия , избирательные кампании с 2005 года, блогосфера Великобритании для исследований, а также более сотни других.

СВЕТИТЬ

График, показывающий процентную долю набора данных, в котором встречаются фразы «ошибка тысячелетия» или «проблема 2000 года», в период с 1996 по 2013 год. Обе тенденции достигают максимума в 1999 году, после чего следует снижение, сохраняющее почти ту же форму .
График SHINE, показывающий, как часто различные фразы для " проблемы 2000 года " появляются в период с 1996 по 2013 год на заархивированных веб-страницах .uk.

Британский веб-архив содержит коллекцию всех веб-сайтов .uk, которые были заархивированы Интернет-архивом до конца марта 2013 года. SHINE - это веб-интерфейс, который можно использовать для создания повторяемых списков результатов исторических страниц .uk. Тенденции или появления ключевых слов в наборе данных на страницах с расширением .uk за это время используют согласование для отображения ключевых слов в контексте.

Сувениры

Memento - это название предыдущих версий веб-страниц, созданных Memento Project . Интерфейс Memento веб-архива Великобритании позволяет находить сувениры в веб-архивах . Интерфейс можно использовать для поиска Memento по дате в таблице снимков или для просмотра того, как часто сайт появляется в общедоступных веб-архивах.

Изучение архива

Исследования Интернета как отражения общества помогли расширить доступ к архиву. Библиотеки разработали руководства по исследовательским навыкам, необходимым для использования веб-архивов. К ним относятся использование больших данных для выявления закономерностей или тенденций или написание ссылок на архивные копии веб-сайтов.

GLAM Workbench

GLAM Workbench - это проект, который исследует, как исследователи могут использовать данные, хранящиеся в галереях, библиотеках, архивах и музеях. Он включает в себя коллекцию записных книжек Jupyter, в которых используются Mementos и индексные данные. В записных книжках сочетаются описание и редактируемый код, чтобы помочь исследователям находить доказательства в веб-архивах.

Доступ ко всему архиву через Библиотеку.
Бодлеанские библиотеки Британская библиотека Библиотеки Кембриджского университета Национальная библиотека Шотландии Национальная библиотека Уэльса Тринити-колледж Дублина

Смотрите также

Рекомендации

Внешние ссылки