Проект Гутенберг - Project Gutenberg

Проект Гутенберг
Project Gutenberg logo.svg
Учредил Декабрь 1971 г . ; 49 лет назад (опубликован первый документ) ( 1971-12 )
Коллекция
Размер Более 60 000 документов
Веб-сайт Домашняя страница Project Gutenberg

Project Gutenberg ( PG ) - это добровольная попытка оцифровывать и архивировать произведения культуры , а также «поощрять создание и распространение электронных книг ». Она была основана в 1971 году американским писателем Майклом С. Хартом и является старейшей цифровой библиотекой . Большинство предметов в его коллекции - это полные тексты книг, находящихся в свободном доступе . Проект пытается сделать их как можно более бесплатными в долговременных открытых форматах, которые можно использовать практически на любом компьютере. По состоянию на 22 мая 2021 года коллекция бесплатных электронных книг Project Gutenberg достигла 65 405 единиц.

Релизы доступны в виде обычного текста , но по возможности включены другие форматы, такие как HTML , PDF , EPUB , MOBI и Plucker . Большинство релизов на английском языке , но доступно и множество других работ. Есть несколько аффилированных проектов, которые предоставляют дополнительный контент, в том числе работы для конкретных регионов и языков. Project Gutenberg тесно связан с Distributed Proofreaders , интернет-сообществом для корректуры отсканированных текстов.

История

Майкл С. Харт (слева) и Грегори Ньюби (справа) из Project Gutenberg, 2006

Майкл С. Харт начал проект Gutenberg в 1971 году с оцифровки Декларации независимости Соединенных Штатов . Харт, студент Университета Иллинойса , получил доступ к мэйнфрейму Xerox Sigma V в лаборатории исследования материалов университета. Через дружелюбных операторов он получил аккаунт с практически неограниченным количеством компьютерного времени; его стоимость в то время оценивалась по разным оценкам в 100 000 или 100 000 000 долларов. Харт объяснил, что хотел «вернуть» этот подарок, сделав что-то, что можно было бы считать очень ценным. Его первоначальная цель заключалась в том, чтобы к концу 20 века сделать 10 000 наиболее популярных книг доступными для широкой публики за небольшую плату или бесплатно.

Этот конкретный компьютер был один из 15 узлов на ARPANET , компьютерной сети , которая стала бы Интернет . Харт полагал, что однажды широкая публика сможет получить доступ к компьютерам, и решил сделать литературные произведения доступными в электронной форме бесплатно. Он использовал копию Декларации независимости Соединенных Штатов в своем рюкзаке, и это стало первым электронным текстом проекта Гутенберг . Он назвал проект в честь Иоганна Гутенберга , немецкого печатника пятнадцатого века, который произвел революцию в печатной машине с подвижным шрифтом .

К середине 1990-х Харт руководил проектом Gutenberg из Бенедиктинского колледжа Иллинойса . К усилиям присоединились другие добровольцы. Он вручную вводил весь текст до 1989 года, когда сканеры изображений и программное обеспечение для оптического распознавания символов улучшились и стали более доступными, что сделало сканирование книг более осуществимым. Позже Харт пришел к соглашению с Университетом Карнеги-Меллона , который согласился управлять финансами проекта Гутенберг. По мере того, как объем электронных текстов увеличивался, добровольцы начали брать на себя повседневные операции проекта, которыми руководил Харт.

Начиная с 2004 года, улучшенный онлайн-каталог сделал содержание Project Gutenberg более простым для просмотра, доступа и гиперссылки . Проект Гутенберг сейчас находится в ведении ibiblio в Университете Северной Каролины в Чапел-Хилл .

Итальянский волонтер Пьетро Ди Мичели разработал и администрировал первый веб-сайт проекта Gutenberg и начал разработку онлайн-каталога проекта. За десять лет его работы в этой должности (1994–2004) веб-страницы проекта завоевали ряд наград, часто попадая в списки «лучших в Интернете» и способствуя популярности проекта.

Харт умер 6 сентября 2011 года в своем доме в Урбане, штат Иллинойс, в возрасте 64 лет.

Дочерние организации

В 2000 году некоммерческая корпорация Project Gutenberg Literary Archive Foundation, Inc. была учреждена в штате Миссисипи , США , для удовлетворения юридических потребностей проекта. Пожертвования на него не облагаются налогом . Первым генеральным директором фонда стал давний волонтер проекта Гутенберг Грегори Ньюби .

Также в 2000 году Чарльз Фрэнкс основал распределенную корректуру (DP), которая позволила распространять корректуру отсканированных текстов среди множества добровольцев через Интернет. Благодаря этим усилиям количество и разнообразие текстов, добавляемых в Project Gutenberg, увеличилось, а новым добровольцам стало проще начать вносить свой вклад. DP официально присоединилась к Project Gutenberg в 2002 году. По состоянию на 2018 год более 36 000 книг, предоставленных DP, составляли почти две трети из почти 60 000 книг в Project Gutenberg.

CD и DVD проект

В августе 2003 года Project Gutenberg выпустил компакт-диск, содержащий около 600 «лучших» электронных книг из коллекции. Компакт-диск доступен для загрузки в виде ISO-образа . Когда пользователи не могут загрузить компакт-диск, они могут запросить бесплатную отправку копии.

В декабре 2003 года был выпущен DVD, содержащий почти 10 000 наименований. В то время это была почти вся коллекция. В начале 2004 года DVD также стал доступен по почте.

В июле 2007 года было выпущено новое издание DVD, содержащее более 17 000 книг, а в апреле 2010 года был выпущен двухслойный DVD, содержащий почти 30 000 единиц.

Большинство DVD-дисков и все компакт-диски, отправленные по почте в рамках проекта, были записаны на записываемые носители добровольцами. Однако были изготовлены новые двухслойные DVD-диски, так как они оказались более экономичными, чем их записывать добровольцы. По состоянию на октябрь 2010 года проект разослал по почте около 40 000 дисков. По состоянию на 2017 год доставка бесплатных компакт-дисков была прекращена, хотя образ ISO все еще доступен для загрузки.

Объем сбора

Рост публикаций Project Gutenberg с 1994 по 2015 гг.

По состоянию на август 2015 года в коллекции Project Gutenberg было более 60 000 единиц хранения, при этом каждую неделю добавлялось в среднем более 50 новых электронных книг . Это , прежде всего , произведения литературы от западной культурной традиции . Помимо литературы, такой как романы, стихи, рассказы и драмы, в Project Gutenberg также есть поваренные книги , справочники и выпуски периодических изданий. В коллекции Project Gutenberg также есть несколько нетекстовых элементов, таких как аудиофайлы и файлы нотной записи.

Большинство выпусков на английском языке, но есть также значительное количество выпусков на многих других языках. По состоянию на апрель 2016 года наиболее широко представлены неанглоязычные языки: французский, немецкий, финский, голландский, итальянский и португальский.

По возможности выпуски Gutenberg доступны в виде обычного текста , в основном с использованием кодировки символов US-ASCII, но часто расширенного до ISO-8859-1 (например, для представления акцентированных символов на французском языке и Scharfes на немецком языке). Помимо отсутствия авторских прав, требование наличия латинской ( набор символов ) текстовой версии релиза было критерием Майкла Харта с момента основания Project Gutenberg, поскольку он считает, что это формат, который, скорее всего, будет читаться в расширенном будущем. . По необходимости этот критерий пришлось расширить для значительной коллекции текстов на восточноазиатских языках, таких как китайский и японский, которые теперь находятся в коллекции, где вместо этого используется UTF-8 .

Другие форматы также могут быть выпущены по запросу добровольцев. Наиболее распространенным форматом, отличным от ASCII, является HTML , который позволяет включать разметку и иллюстрации. Некоторые участники и пользователи проекта запросили более продвинутые форматы, полагая, что их легче читать. Но некоторые форматы, которые нелегко редактировать, например PDF , обычно не соответствуют целям Project Gutenberg. Также в Project Gutenberg есть два варианта основных форматов, которые могут быть отправлены (из которых создаются все остальные файлы): настраиваемые версии стандарта Text Encoding Initiative (с 2005 г.) и reStructuredText (с 2011 г.).

Начиная с 2009 года, каталог Project Gutenberg начал предлагать автоматически генерируемые альтернативные форматы файлов, включая HTML (если он еще не предоставлен), EPUB и plucker .

Идеалы

Майкл Харт сказал в 2004 году: «Миссия Project Gutenberg проста:« Поощрять создание и распространение электронных книг »». Его целью было «предоставить как можно больше электронных книг в как можно большем количестве форматов, чтобы весь мир мог читать на как можно большем количестве языков». Точно так же девиз проекта - «сломать прутья невежества и неграмотности», потому что его волонтеры стремятся и дальше распространять общественную грамотность и признание литературного наследия, как это начали делать публичные библиотеки в конце 19 века.

Проект Gutenberg намеренно децентрализован; не существует политики выбора, определяющей, какие тексты добавлять. Вместо этого отдельные волонтеры работают над тем, что им интересно, или над тем, что им доступно. Коллекция Project Gutenberg предназначена для длительного хранения предметов, поэтому они не могут быть потеряны в результате какой-либо локальной аварии. Чтобы обеспечить это, вся коллекция регулярно копируется и зеркалируется на серверах во многих разных местах.

авторское право

Project Gutenberg тщательно проверяет статус своих электронных книг в соответствии с законом США об авторском праве . Материал добавляется в архив Project Gutenberg только после получения разрешения на авторские права, и записи этих разрешений сохраняются для использования в будущем. Project Gutenberg не претендует на новые авторские права на публикации, которые он публикует. Вместо этого он поощряет их бесплатное воспроизведение и распространение.

Большинство книг из коллекции Project Gutenberg распространяются как общественное достояние в соответствии с законом США об авторском праве. Есть также несколько защищенных авторским правом тексты, такие как те , научной фантастики автора Кори Доктороу , что Проект Гутенберг распределяет с разрешения. На них распространяются дополнительные ограничения, указанные правообладателем, хотя, как правило, они предоставляются по лицензии Creative Commons .

«Project Gutenberg» является товарным знаком организации, и этот знак нельзя использовать в коммерческих или модифицированных распространениях текстов, являющихся общественным достоянием проекта. Если все ссылки на Project Gutenberg удалены, нет никаких юридических препятствий для перепродажи работ, находящихся в свободном доступе, но участники Gutenberg сомневаются в целесообразности прямого и коммерческого повторного использования контента, отформатированного добровольцами. Были случаи, когда книги лишались авторства проекта и продавались с целью получения прибыли в магазине Kindle и у других книготорговцев, одним из которых была книга 1906 года « Ловушка лисы» .

Веб-сайт недоступен в Германии из-за постановления суда S. Fischer Verlag в отношении произведений Генриха Манна , Томаса Манна и Альфреда Дёблина . Хотя они находились в открытом доступе в Соединенных Штатах, немецкий суд (региональный суд Франкфурта-на-Майне) признал нарушение авторских прав, все еще действующих в Германии, и заявил, что веб-сайт Project Gutenberg находится под юрисдикцией Германии, поскольку на нем размещается контент на немецком языке. язык и доступен в Германии. Это решение было подтверждено Апелляционным судом Франкфурта 30 апреля 2019 г. (11 U 27/18, доступно по ссылке). Апелляционный суд Франкфурта не дал разрешения на дальнейшую апелляцию в Федеральный суд (Bundesgerichtshof), однако заявление о разрешении на апелляцию было подано в Федеральный суд. По состоянию на 4 октября 2020 года это заявление все еще находилось на рассмотрении (Федеральный суд I ZR 97/19).

Веб-сайт также недоступен в Италии с мая 2020 года.

Критика

Текстовые файлы используют формат обычного текста в кодировке UTF-8 и обычно содержат 65–70 символов, а абзацы разделяются двойным разрывом строки. В последние десятилетия возникший в результате относительно мягкий внешний вид и отсутствие возможности разметки часто воспринимались как недостаток этого формата. Project Gutenberg пытается решить эту проблему, делая многие тексты доступными в версиях HTML, ePub и PDF. HTML-версии старых текстов создаются автоматически. Другой некоммерческий проект, Standard Ebooks , направлен на решение этих проблем с помощью своей коллекции отформатированных и стилизованных названий общественного достояния. Исправляет проблемы, связанные с дизайном и типографикой.

В декабре 1994 года Project Gutenberg подвергся критике со стороны организации Text Encoding Initiative за то, что не включил документацию или обсуждение решений, неизбежных при подготовке текста, или, в некоторых случаях, не задокументировал, какая из нескольких (конфликтующих) версий текста была единственной. оцифрованный.

Выбор доступных произведений (и изданий) определялся популярностью, простотой сканирования, нарушением авторских прав и другими факторами; Этого было бы трудно избежать в любом краудсорсинговом проекте.

В марте 2004 г. Майкл Харт и Джон С. Гуальярдо начали инициативу по предоставлению недорогой интеллектуальной собственности. Первоначальное название этого проекта было Project Gutenberg 2 (PG II), что вызвало разногласия среди добровольцев PG из-за повторного использования товарного знака проекта для коммерческого предприятия.

Аффилированные проекты

Все дочерние проекты являются независимыми организациями, которые разделяют одни и те же идеалы и получили разрешение на использование товарного знака Project Gutenberg . У них часто есть определенная национальная или языковая направленность.

Список аффилированных проектов

  • Project Gutenberg Australia размещает множество текстов, которые являются общественным достоянием в соответствии с австралийским законодательством об авторском праве , но все еще защищены авторским правом (или имеют неопределенный статус) в Соединенных Штатах, с акцентом на австралийских писателей и книги об Австралии.
  • Проект Гутенберг Канада .
  • Консорциумный центр Project Gutenberg специализируется на коллекциях коллекций. Они не имеют редакторского надзора или единообразного форматирования, как в основном Project Gutenberg. Представлены тематические коллекции, а также множество языков.
  • Projekt Gutenberg-DE заявляет об авторских правах на свой продукт и ограничивает доступ к просматриваемым веб-версиям своих текстов.
  • Project Gutenberg Europe находится в ведении Project Rastko в Сербии . Он нацелен на то, чтобы стать проектом Gutenberg для всей Европы, и начал публиковать проекты в 2005 году. Он использует программное обеспечение распределенных корректоров для быстрого создания электронных текстов.
  • Project Gutenberg Luxembourg издает в основном, но не исключительно, книги, написанные на люксембургском языке .
  • Проект Projekti Lönnrot, созданный волонтерами финского проекта Gutenberg, получил свое название от финского филолога Элиаса Лённрота (1802–1884).
  • Проект Gutenberg из Филиппин направлен на «сделать как можно больше книг доступным как можно большему количеству людей, с особым акцентом на филиппинском и филиппинском языках».
  • Проект Gutenberg Russia (Рутенберг) направлен на сбор книг в общественном достоянии на славянских языках, в частности на русском. Обсуждение проекта и его юридической стороны началось в апреле 2012 года. Слово Рутенберг - это сочетание слов «Россия» и «Гутенберг».
  • Самопубликационная пресса проекта Gutenberg, также известная как Консорциумный центр Project Gutenberg. В отличие от самого проекта Gutenberg, Project Gutenberg Self-Publishing позволяет отправлять тексты, никогда ранее не публиковавшиеся, включая самостоятельно изданные электронные книги. Запущенная в 2012 году, также владеет доменом gutenberg.us.
  • Проект Gutenberg из Тайваня направлен на архивирование книг, свободных от авторских прав, с особым упором на Тайвань на английском, китайском и тайваньских языках. Это специальный проект Forumosa.com.

Смотрите также

использованная литература

внешние ссылки

Послушайте эту статью ( 17 минут )
Разговорный значок Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 23 июля 2007 г. и не отражает последующих правок. ( 2007-07-23 )