Как оцифровывают книги
лера в библиотекеПогулять по несуществующим музеям, почитать дореволюционный отчет о работе кондитерской фабрики, заглянуть в альбом едва открытого Ленинградского метрополитена или найти прапрадедушку в адресной книге — электронная библиотека дает доступ к самым редким и старым книгам.
Но как они там оказываются?
Каждый год на две недели библиотеки, а иногда и музеи Петербурга погружаются в таинство оцифровки: в библиотеку имени Маяковского привозят оборудование и ценные книги — и процесс начинается.
При этом само сканирование — лишь вершина айсберга, потому что и до, и после него работы хватает.
Первый этап — подбор изданий
В Маяковке оцифровывают не только свой фонд, книгами делятся коллеги из других библиотек, архивов и музеев. В этом году, например, среди них был Музей истории религии и Музей истории Санкт-Петербурга.
Увы, возможности сканирования ограничены, а оцифровать хочется много — приходится идти на компромиссы и устраивать литературе жесткий отбор.
Второй этап — пересчет
За две недели можно оцифровать 190 тысяч страниц, а потому библиографы кропотливо подбирают книги по объему, чтобы не превысить максимум. В этом году получилось отсканировать 400 изданий.
Страницы приходится пересчитывать даже вручную — ведь печатная нумерация не всегда совпадает с действительностью.
Третий — само сканирование
Пять сканеров и специалисты по оцифровке начинают работу. Видео об этом есть в инстаграме библиотек Петербурга.
А как в электронной библиотеке работает поиск по тексту? Спойлер: вручную уже никто не набирает (хотя раньше так и было!), текстовый слой автоматически считывают чуткие аппараты прямо во время сканирования.
Четвертый этап — проверка
Какими бы чувствительными ни были сканеры, их нужно всегда проверять. Чтобы страницы были не засвечены, без заломов, а текст на них был четким и правильным.
Но дело не всегда в простейших технических ошибках: во время оцифровки старых книг приходится иметь дело с дореволюционным письмом или зарубежными художественными шрифтами, и тут машины не всесильны.
Проверяют книги дважды: сначала компания, которая оцифровывает, а потом снова библиографы. И опять, можно сказать, вручную.
Пятый этап — каталогизация
Самый долгий и трудоемкий во всем процессе оцифровки.
К каждой книге библиографы подбирают ключевые слова, пишут аннотации, распределяют по коллекциям и загружают в свою электронную библиотеку и к партнерам (ЛитРес, Национальная электронная библиотека, ЭБС «Лань» и другие).
И ради чего все эти сложности? Ну, например, чтобы мы могли скачать книгу 1921 года о стульях.
Фото — Полина Назарова.