Wayback Machine находит сайты, которых уже нет
Общественная организация Internet Archive и компания Alexa Internet презентовали интернет-сообществу поисковую машину Wayback Machine, которая позволяет путешествовать в прошлое интернета и отыскивать сайты, которых уже не существует.
В качестве базы для поиска Wayback Machine использует не сам интернет, а Архив интернета, основанный в 1996 году Брюстером Кейлом в сотрудничестве с Библиотекой Конгресса США. Архив обновляется каждые два месяца (это чуть меньше, чем средний срок жизни страницы). Сейчас объем архива – более 100 терабайт, и каждое обновление приносит по 12 терабайт. В архиве уже собрано более 10 миллиардов сайтов, созданных с 1996 по 2001 год, сообщает «Нетоскоп».
Архив интернета и его поисковая машина Wayback Machine уже используются специалистами самых разных профессий. Например, исследователи из Xerox PARC используют его для изучения истории развития пользовательских интерфейсов.
В рамках проекта можно также посмотреть некоторые специальные коллекции - например, архив сетевых материалов о трагедии 11 сентября.
"В этом архиве собраны записи того, что в противном случае просто исчезает, - говорит Поль Грабович из Университета Калифорнии в Беркли. - Подобные исчезновения - одна из проблем Интернета".
По его словам, Wayback Machine очень полезна для журналистов, поскольку сохраняет "снимки" электронных газет так же, как микрофильмы сохраняют старые бумажные издания. Особенно это актуально в случае электронных изданий, которые не имеют собственного архива, как, например, знаменитый Drudge Report.
Правда, на момент написания данной заметки система Wayback Machine почему-то отказывалась демонстрировать сайты, заархивированные ранее сентября 2001 года. Да и российские ресурсы представлены в архиве очень выборочно.