Архив Интернета

Архив Интернета


Архи́в Интерне́та ([англ.] Internet Archive) — некоммерческая организация, основанная в 1996 году в [Сан-Франциско] [Брюстером Кейлом]. Архив [собирает копии] [веб-страниц], графические материалы, видео- и аудиозаписи и [программное обеспечение]. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка [электронной библиотеки]. По состоянию на октябрь 2012 года, размер Архива — 10 петабайт[4], а на октябрь 2016 года — 15 петабайт[5]. По состоянию на август 2016 года, содержит 502 млрд копий веб-страниц. [Сервер] Архива расположен в [Сан-Франциско], [зеркала] — в [Новой Александрийской библиотеке] и в [Амстердаме]. С 2007 года Архив имеет юридический статус библиотеки[6].

История

Архив был создан [Брюстером Кейлом] в 1996 году примерно в то же время, когда он основал компанию [Alexa Internet], занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[7]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время помимо копий веб-сайтов включает тексты, видео, звукозаписи, программное обеспечение и изображения.

Проекты

Wayback Machine

Логотип Wayback Machine

The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью [бота] или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.

Легальность

На сервис не раз подавались судебные иски в связи с тем, что публикация контента может быть нелегальной. Поэтому сервис удаляет материалы из публичного доступа по требованию их правообладателей или, если доступ к страницам сайтов не разрешён в файле [robots.txt] владельцами этих сайтов.

Книга, изготовленная в течение 20 минут в рамках проекта Book-on-demand, на основе электронной книги из Архива

В 2002 году часть архивных копий веб-страниц, содержащих критику [саентологии], была удалена из архива[8] с пояснением, что это было сделано по «просьбе владельцев сайта»[9]. В дальнейшем выяснилось, что этого потребовали юристы [Церкви саентологии], тогда как настоящие владельцы сайта не желали удаления своих материалов[10]. Некоторые пользователи сочли это проявлением [интернет-цензуры].

Сервис веб-архива может использоваться в качестве меры борьбы с блокировками доступа к Интернет-сайтам: как и сервис кэшированных копий страниц от поисковых систем, архив Интернета позволяет ознакомиться с более ранними копиями популярных страниц. Однако использование архива и кэшей в таких целях требует специальных усилий от пользователя и позволяет получить доступ не ко всем сайтам[11].

Open Library

Книжный сканер Архива

Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год, Архиву принадлежат 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 [петабайта], включая изображения и документы в формате [PDF][12]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.

Scan-on-demand — бесплатная [оцифровка] желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».

Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или распространяются под лицензией [Creative Commons].

Награды

23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии [Free Software Awards], организованной некоммерческим фондом [Free Software Foundation] (FSF)[13][14].

Блокировка Архива Интернета

В России

В октябре 2014 года [Роскомнадзор] заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «[Звон мечей]» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «[Исламское государство]»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[15][16][17].

16 июня 2015 года на основании статьи 15.3 закона «[Об информации, информационных технологиях и о защите информации]» [генпрокуратура РФ] приняла решение о блокировке страницы «Одиночный джихад в России», содержащей, по её мнению, «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[17][18][19], в действительности на территории России был заблокирован доступ ко всему сайту, кроме [The Wayback Machine].

С апреля 2016 года [Роскомнадзор] решил убрать сайт из блокировок, и он доступен в России.

В других странах СНГ

Архив блокировался на территории Казахстана в 2015 году[20].

Также в 2017 году сообщалось о блокировках архива в [Кыргызстане][21].

В Индии

В Индии Архив был частично заблокирован судебным решением в августе 2017 года. Решение Madras High Court перечисляло 2,6 тыс. адресов в сети Интернет, которые способствовали пиратскому распространению ряда фильмов двух [местных] кинокомпаний[22][23]. Представители проекта безуспешно пытались связаться с министерствами[24][25].

См. также

  • Архивирование веб-сайтов
  • Archive.today
  • WebCite

Примечания

Литература

Ссылки

Зеркала


Report Page