Российская Информационная Сеть
English   Контакты
Политика  Общество  Экономика  Деловые  Наука  Hi-Tech  Культура  Шоу-бизнес  Спорт  Происшествия  Криминал  Скандалы  Пикантные  Зарубежные  ИноСМИ
ТОП-дайджест  Хроника  Эксклюзив  Фоторепортажи  Личное мнение  Погода  Комментарии  Поиск  RSS  Интернет-радио  
 Топ 20 сегодня Топ 20 сегодня 
В Новом Орлеане мужчина врезался на пикапе в толпуВ Новом Орлеане мужчина врезался на пикапе в толпу
В пригороде Канзас мужчина расстрелял 3 человекВ пригороде Канзас мужчина расстрелял 3 человек
На 61-м году жизни скончался актер Билл ПэкстонНа 61-м году жизни скончался актер Билл Пэкстон
В Башкирии водители маршруток устроили перестрелкуВ Башкирии водители маршруток устроили перестрелку
В Белгородской области врачи забыли в теле пациентки бинтВ Белгородской области врачи забыли в теле пациентки бинт
"Прогресс" успешно стартовал с космодрома Байконур"Прогресс" успешно стартовал с космодрома Байконур
На пляже во Флориде был найден труп недоеденной акулыНа пляже во Флориде был найден труп недоеденной акулы
Украина заблокировала заявление СБ ООН, посвященное Виталию ЧуркинуУкраина заблокировала заявление СБ ООН, посвященное Виталию Чуркину
Осужден бывший глава Гонконга Дональд ЦангОсужден бывший глава Гонконга Дональд Цанг
Появились новые подробности вокруг расследования убийства Ким Чен НамаПоявились новые подробности вокруг расследования убийства Ким Чен Нама
далее топ дня...
 Фотожурнал: фото-топ за месяц, галерея всех фото Фотожурнал 
 Новости партнеров
 Топ новости разделов сегодня Топ новости разделов 
Украина заблокировала заявление СБ ООН, посвященное Виталию ЧуркинуУкраина заблокировала заявление СБ ООН, посвященное Виталию Чуркину
Китай прекращает импорт угля из Северной КореиКитай прекращает импорт угля из Северной Кореи
В Белгородской области врачи забыли в теле пациентки бинтВ Белгородской области врачи забыли в теле пациентки бинт
"Прогресс" успешно стартовал с космодрома Байконур"Прогресс" успешно стартовал с космодрома Байконур
СМИ: популярные мессенджеры будут работать под закономСМИ: популярные мессенджеры будут работать под законом
На 61-м году жизни скончался актер Билл ПэкстонНа 61-м году жизни скончался актер Билл Пэкстон
В Новом Орлеане мужчина врезался на пикапе в толпуВ Новом Орлеане мужчина врезался на пикапе в толпу
В Новом Орлеане мужчина врезался на пикапе в толпуВ Новом Орлеане мужчина врезался на пикапе в толпу
Дружба с экс-возлюбленными вызывает психические расстройстваДружба с экс-возлюбленными вызывает психические расстройства
На 61-м году жизни скончался актер Билл ПэкстонНа 61-м году жизни скончался актер Билл Пэкстон
далее...
 Личное мнение Личное мнение 

 Новости о знаменитостях Знаменитости 
Новость: 9 июля 23:36: VIA-Летта (Дядюра Виолетта) feat. Пьер Нарцис - Лето (видео)VIA-Летта (Дядюра Виолетта) feat. Пьер Нарцис - Лето (видео)

Новость: 14 июля 20:16: A?STUDIO едут в Юрмалу с популярной песней, исполнявшейся Аллы ПугачевойA?STUDIO едут в Юрмалу с популярной песней, исполнявшейся Аллы Пугачевой


 Заплатим за ваше мнение!
Получайте до 1,5 долларов за каждую заполненную анкету!



 Новости общества Новости общества 
10 апреля, 00:45

Книга в  цифре: нужна  ли России единая электронная библиотека


В  конце января в  Фундаментальной библиотеке ИНИОН РАН в  Москве возник пожар, в  результате было утрачено до  трети библиотечных фондов. Это событие подняло волну дискуссий о  значимости оцифровки библиотечных и  архивных фондов.

Вопросы сохранности и  доступности культурного наследия и  ранее выносились на  уровень правительства и  профильных министерств. Впрочем подавляющее число обсуждений носили весьма общий характер. Их  участники часто не  понимают, что  Это означает  — оцифровать целую библиотеку. У  нас в  ABBYY есть реальный опыт участия в  таких проектах: мы  принимали активное участие в  оцифровке отдельных российских и  иностранных библиотек и  были технологическими партнерами масштабных иностранных проектов по  сохранению культурного наследия  — Gutenberg и  META-e.

Я  постараюсь объяснить определенные только технические и  ценностные  — во  всех смыслах  — аспекты оцифровки библиотек и  закромов, которые раскроют реальный масштаб и  сложность проблемы.

Зачем необходима Оцифровка

Первая задача  — Это сохранить книги, отсканировав  их. Само собой, старинные фолианты, библиографические редкости невозможно полноценно сохранить в  виде цифровой копии, она не  передаст фактуры бумаги, художественной ценности иллюстраций, переливов света на  пергаменте и  Т. П. Но  в  других случаях книга  — Это, в  1-ю очередь, источник знаний, информации.

Вторая задача  — создать книги доступными для  широкого круга читателей. А  для  этого надо не  только отсканировать текст, но  и  распознать его. Потому что  людям, Как правило, нужны не  фотографии страниц, А  именно сама информация, которую при  оцифровке можно скачать в  нужном электронном формате, к тому же в  существенно меньшем объеме, нежели в  виде сканов.

В  российских библиотеках огромнейшие и  ценнейшие архивы, и  процесс по  их  оцифровке  уже начался. К примеру, РГБ  уже отсканировала около  миллиона изданий и  документов (всего в  ней хранится около  45, 5  млн единиц). Темпы медленные, но  начало положено.

Как оцифровывают книги

Перед  сканированием надо Решить, что  именно Будем оцифровывать. Если выяснится, что  какие-то  книги находятся в  плохом состоянии и  при  сканировании имеют возможность просто рассыпаться, надо позаботиться об  этом и  по  возможности восстановить, отреставрировать их.

Если мы  сканируем или фотографируем древние и  ветхие книги, даже отреставрированные, этот этап требует специальных условий работы и  особого оборудования  — надо применять « волшебные» устройства с  V-образным ложем для  книг и  системой перелистывания страниц, в  том числе с  помощью воздуха. Цена подобных сканеров может превышать € 100  000.

само собой, не  все документы требуют столь бережного и  дорогого обращения.

подавляющее число документов XIX— XXI вв. Еков можно сканировать более привычным методом. Но  в  любом случае все оборудование для  сканирования книг медленное, Потому что  документы не  протягиваются через  сканер, А  перелистываются автоматически или вручную страница за  страницей. Так что  Сканирование книг не  идет в  сравнение со  сканированием пачки договоров. Это весьма трудоемкий и  дорогостоящий процесс.

Сканирование закончено, мы  получили изображения страниц в  виде папки с  pdf-файлами, А  более часто всего  — с  фотографиями. Заместо трехсотстраничной книги у  нас триста довольно « тяжелых» изображений, из  которых нельзя скопировать текст, не  говоря  уже о  поиске информации. На  каких серверах хранить все эти фото, кто  готов скачать гигабайты картинок? Вероятнее всего, такая электронная книга будет лежать на  диске в  электронном архиве Так  же, Как оригинал прежде лежал на  полке. Библиотека потратит много денег на  профессиональный сканер, но  отсканированные книги прочтут единицы. В  то  время Как задача библиотеки создать книгу доступной: дать читателю возможность обнаружить нужный документ, открыть его, скачать на  собственный планшет, смартфон или читать прямо с  интернет представительства. А  Это означает надобно распознать отсканированные тексты с  помощью специальных программ, После чего отдать их  на  проверку верификаторам.

Проверка результатов распознавания  — Это довольно длительная и  трудоемкая работа, которую Однако можно исполнить с  помощью краудсорсинга, доверив ее  широкой общественности. Так, к примеру, при  оцифровке 90-томника Льва Толстого силами 3000 волонтеров нам за  полтора года получилось оцифровать более 45  000 страниц.

Как сделать общегосударственную электронную библиотеку

Программа оцифровки библиотечных и  архивных фондов в  масштабах страны требует системного подхода и  проработанного плана.

к примеру, Как определиться, какие материалы оцифровывать в  1-ю очередь? С  одной стороны, правильно переводить в  электронный вид то, что  читают и  берут более часто всего  — самых распространенные книги и  документы. С  другой  — понятно, что  сохранять надо уникальные и  ценные книги, существующие в  единственном экземпляре.

Как уменьшить риск дублирования работы в  разных библиотеках  — ведь оцифровать книгу недешево?

Мне кажется, что  на  первом этапе подобного проекта надо сделать единый каталог или реестр всех объектов складирования. И  реализовывать Это лучше « снизу». к примеру, Так: библиотеки и  архивы сформулируют свои потребности в  оцифровке, на  основе которых будет собран некоторый пул заявок. После выверки, решения вопросов с  дублированием и  систематизацией наименований, этот пул и  станет нашим каталогом.

На  этом этапе, кстати, можно учесть и  уже проделанную библиотеками работу: они ведь в  1-ю очередь сканируют свои каталоги, Чтобы читатели могли удаленно ознакомиться со  списком книг. По этой причине определенные части нашего единого каталога  уже готовы.

потом на  основе единого реестра будет возможно создать подробный план по  оцифровке, который обязан быть цельным и  единым для  всех государственных закромов и  библиотек.

Результаты создания общегосударственной электронной библиотеки сложно переоценить. Обычные читатели, не  выходя из  дома, смогут прочитать книги, которые ранее просто не  были им  доступны. А, к примеру, исследователь будет иметь возможность обнаружить на  интернет-сайте библиотеки или даже просто в  поисковике интересующий его документ, будет иметь возможность его прочитать, провести изыскания, походить по  сноскам, просмотреть источники, связанные с  документом, и  при  необходимости узнать, где размещается оригинал.

Сколько потребуется денег

Не  Так давно статс-секретарь министерства культуры Григорий Ивлиев сказал, что  в  2015 году на  оцифровку библиотечных фондов будет нацелено более 100  миллиона руб.. Сумма внушительная, но, Сколько Это будет в  книгах?

Если вы когда-нибудь сталкивались с  потоковым сканированием, то  знаете, насколько Это просто. В  мощный сканер кладется пачка документов, Сканирование и  распознавание происходят почти полностью автоматически, А  вы в  итоге получаете полностью оцифрованный офисный архив. Дальше его надо Еще верифицировать, то  есть сверить распознанные данные, Это можно делать автоматически или вручную. В  любом случае, при  этом способе Цена оцифровки составит несколько рублей за  страницу.

Книги  — тем более редкие и  древние экземпляры  — Так сканировать нельзя, мы  произносили об  этом выше. Из-за  более сложных сканеров, особенностей распознавания (диковиных шрифтов, сложных фонов и  пр.) и  более кропотливой работы людей Стоимость оцифровки страницы повышается до  десятков и  даже сотен рублей.

Чтобы не  усложнять расчеты, давайте возьмем сумму в  50 рублей  — столько в  среднем может стоить работа по  оцифровке одной страницы условного исторического библиотечного фонда. Предположим, что  среднестатистическая книга в  библиотеке содержит пятьсот страниц. На  что  хватит 100  миллиона руб.? Предположительно на  4000 книг средней трудности. Повторюсь, повествование ведется о  « сферических книгах в  вакууме», то  есть для  каждой библиотеки Это будет своя Сумма. Но  ориентировочный порядок цифр, думаю, понятен.

Для  ясности скажу, что  в  пострадавшей от  пожара Фундаментальной библиотеке ИНИОН РАН, по  официальным данным, находится 14, 7  млн книг, из  которых в  хранилище на  Нахимовском проспекте находилось 10, 2  млн. Отличие, Как видим, на  3 порядка.

Оцифровка в  остальных странах

Один из  наиболее известных иностранных проектов по  оцифровке книг и  документов  — Это Gutenberg, запущенный в  1971 году. В  его рамках волонтеры оцифровывают и  сохраняют в  текстовом формате разные произведения мировой литературы, находящиеся в  свободном доступе. В настоящее время на  интернет представительстве проекта можно бесплатно скачать 45  000 книг во  всех популярных форматах. И  собственный счетчик проекта показывает 4, 5  млн скачиваний только за  последний месяц.

Также в  Европе с  2007 года существует исследовательский проект IMPACT. Он  был создан Евросоюзом, Чтобы сохранить европейское культурное наследие и  открыть читателям широкий доступ к  историческим текстам. В  проекте участвуют больше десяти национальных библиотек европейских стран, исследовательские институты и  технологические партнеры, в  том числе ABBYY.

Еще Один проект по  оцифровке старинных книг, заслуживающий упоминания  — META-e. Он  Также был задуман и  осуществлен странами  ЕС. В  рамках этого проекта деньги были выделены на  разработку системы программ для компьютеров для  распознавания любых европейских текстов, напечатанных в  период XVI— XIX вв. Еков с  использованием почти не  встречающихся ныне готических шрифтов.

покуда европейские библиотеки оцифрованы гораздо в  большей степени, чем  российские.

к примеру, на  интернет представительстве Национальной библиотеки Франции, которая обладает сопоставимым с  ИНИОНом фондом, доступны более 3  млн книг и  документов. Будем надеяться, что  и  наши библиотеки в  ближайшее время смогут похвастать такими цифрами.
[Читать все комментарии] [Напечатать новость]
  Комментарии к новости 
[Добавить комментарий]

Комментариев к этой новости пока нет. Добавьте первым свой комментарий!
[Добавить комментарий]
 Хроника новостей: Новости общества Хроника новостей 
Мощные циклоны обрушились на несколько регионов России

21 февраля 15:36
В Ростовской области набирает обороты скандал с жильем для детей сирот

20 февраля 15:37
Ученые: Содержание кислорода в океане падает

16 февраля 16:52
Саратовские ученые изобрели новый способ очистки воды

16 февраля 15:52
Сегодня день вывода советских войск из Афганистана

15 февраля 16:51
В Самаре семья держит в квартире волка

15 февраля 15:38
В Белгородской области птицы облюбовали поле рядом с аэропортом

13 февраля 16:48
В Новой Зеландии погибли сотни китов

10 февраля 12:28
Экологической катастрофы в Хабаровском крае удастся избежать

9 февраля 16:01
Найдены новые свитки Мертвого моря

9 февраля 10:51
Аномальные холода сковали города Урала, Приволжья и Сибири

8 февраля 15:41
В Москве проведена уникальная операция по аутотрансплантации почки

7 февраля 15:23
Ученые изобрели новый способ лечение рака

3 февраля 16:56
Институт им. Джанелидзе отмечает 85-летие со дня основания клиники

1 февраля 17:08
В России стартовал 3 этап раздачи "дальневосточных гектаров"

1 февраля 15:38
Колыму сковали сильные морозы

31 января 15:23
В Петербурге отмечают 73-ю годовщину снятия блокады Ленинграда

27 января 14:38
Ученые научились выращивать человеческие органы в телах животных

27 января 13:11
Испанские врачи спасают 8-летнюю российскую девочку

19 января 15:53
Тысячи паломников прибыли на берега Иордана

19 января 14:48
Православный мир готовится отмечать Крещение Господне

18 января 15:36
Петербург остался без грифонов

17 января 15:48
В Китае нашли 600-летнюю статую Будды

17 января 12:32
В Красноярске малышей закаляют на морозе

13 января 16:53
Ученые создали долговечные солнечные батареи

13 января 15:38
Экологов беспокоит стремительное загрязнение воздуха в Юго-Восточной Азии

13 января 12:35
В Великобритании мужчина готовится родить ребенка

12 января 16:58
На Камчатке водитель иномарки не пропустил машину скорой помощи

12 января 14:44
В Москве готовятся ко 2 волне эпидемии гриппа

11 января 16:13
30 поселений для экологического туризма открыли в Красноярском крае

9 января 16:52
 1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25 >> 1857
 Главная новость дня Главная новость дня 
На 61-м году жизни скончался актер Билл Пэкстон На 61-м году жизни скончался актер Билл Пэкстон
 
 Эксклюзив Эксклюзив 
Пора ли продавать акции Apple? Пора ли продавать акции Apple?
 
  Топ новостей Опросы 
 Фоторепортажи: новости с подборкой фотографий Фоторепортажи 
Камирен и Задойнов покинули Дом-2
Марго Робби стала лицом журнала Vanity Fair
Скончался лидер группы Eagles Гленн Фрей
Кенни Уэст выпустил новый альбом
Фанаток накажут за концерт Энрике Иглесиаса
 Новости партнеров
 Новости дня Новости дня 
 
Новость: В пригороде Канзас мужчина расстрелял 3 человекВ пригороде Канзас мужчина расстрелял 3 человек
 
Новость: На 61-м году жизни скончался актер Билл ПэкстонНа 61-м году жизни скончался актер Билл Пэкстон
 
  Copyright © RIN 2000-
* Обратная связь
Контактная информация  
Политика  Общество  Экономика  Деловые  Наука  Hi-Tech  Культура  Шоу-бизнес  Спорт  Происшествия  Криминал  Скандалы  Пикантные  Зарубежные  ИноСМИ