Русская Википедия:Open Content Alliance

Open Content Alliance (OCA) — консорциум коммерческих и некоммерческих организаций, занимающийся оцифровкой печатных изданий для свободного распространения в интернете. Создан в октябре 2005 года в качестве альтернативы проекту Google Books. Главными партнёрами-сооснователями стали Архива Интернета, Yahoo, библиотеки Университета Торонто и Калифорнийского университета, а также Шаблон:Iw. Спустя несколько недель к проекту присоединился Microsoft, Шаблон:Iw, Biodiversity Heritage Library, Шаблон:Iw. К 2008 году в OCA входило около 80 организаций. К 2010 году работа OCA окончательно остановилась из-за выхода из консорциума Microsoft и Yahoo. На 2023 год OCA больше не занимается оцифровкой материалов.

В рамках проекта библиотеки предоставляли OCA свои коллекции для оцифровки, в то время как корпоративные спонсоры и Архив Интернета занимались техническими и финансовыми вопросами. В отличие от Google Books, OCA сканировал только те работы, на которые было получено разрешение владельцев авторских прав, или которые уже находились в общественном достоянии. В рамках OCA было оцифровано более 3 млн печатных изданий из коллекций партнёрских библиотек, из которых около 300 тысяч были опубликованы на сайте Open Library.

История

Файл:Brewster Kahle 2009.jpg

Основатель Open Content Alliance Брюс Кейл в 2009 году

Open Content Alliance (OCA) был создан в 2005 году в качестве альтернативы Google Print (сейчас — Google Books) — крупнейшему проекту по массовой оцифровке печатных изданий^[1]. Инициатором создания консорциума был основатель Архива Интернета Брюстер Кейл. Интернет-активист открыто высказывал опасения, что проект от Google противоречит принципам открытой науки. Более того, решение компании публиковать все материалы исключительно на портале Google Books может привести к монополизации научного знания. Поэтому Кейл решил создать альтернативный консорциум коммерческих и некоммерческих организаций, выступающих за открытое распространение оцифрованных работ. В отличие от Google, OCA занимался оцифровкой только тех материалов, на которые было получено разрешение владельцев авторских прав. При этом все книги были бы доступны для просмотра и скачивания для всех пользователей через портал Архива ИнтернетаШаблон:Sfn.

Cо-основателями OCA также были Yahoo!, библиотеки Университета Торонто и Калифорнийского университета, а также Шаблон:Iw. Спустя несколько недель к проекту присоединились Microsoft, Шаблон:Iw, Biodiversity Heritage Library, Шаблон:Iw, Колумбийский университет, Университет Эмори, Университет Джонса Хопкинса, Макмастерский университет, Университет Райса, Йоркский университет, Университет Британской Колумбии, Оттавский университет, Питтсбургский университет^[1]Шаблон:Sfn^[2]^[3]^[4]. В 2007 году в консорциум вступили библиотеки Иллинойского университета^[5]^[6]. К 2008 году более 80 организаций, включая крупнейшие библиотеки, научно-исследовательские учреждения и коммерческие организации, стали частью OCA^[5].

За три года работы OCA отсканировал более 3 млн книг из коллекций партнёрских организаций. Однако в 2008 году один из крупнейших спонсоров проекта Microsoft принял решение покинуть консорциум. Компания заявила, что намеревается изменить стратегию интеграции печатных материалов в свои алгоритмы поиска и запустит поисковых роботов, чтобы «захватывать» уже собранную информацию из других репозиториевШаблон:Sfn. При этом Microsoft сняла все контрактные ограничения на уже оцифрованный контент и передала оборудование партнёрским организациям консорциума^[7]. Спустя несколько лет проект покинула Yahoo!, заявив о нежизнеспособности подобной бизнес-модели^[8]. Точная дата прекращения работы OCA неизвестнаШаблон:Sfn, однако на 2023 год партнёрские организации больше не занимаются оцифровкой.

Принцип работы

OCA оцифровывал только работы, которые относились к общественному достоянию или для которых было получено разрешение на копирование от правообладателей^[7]. В 2005 году Кейл объявил о планах OCA оцифровать 80 % книг, изданных между 1923 и 1964 годами, а также расширить эту коллекцию, включив произведения с недоступным правообладателем^[4]^[9]. В течение нескольких лет консорциум планировал выложить в открытый доступ сотни тысяч книг. Все оцифрованные работы планировалось хранить на серверах Архива ИнтернетаШаблон:Sfn.

Участники консорциума были ответственны за различные аспекты проекта. Так, Hewlett Packard Enterprise и Adobe предоставили оборудование для оцифровки, Архив Интернета отвечал за организационный процесс. Yahoo! индексировала содержание и финансировала оцифровку первоначального корпуса американской литературы из коллекции Калифорнийского университета. Общий вклад Yahoo! оценивался в сумму от $300 000 до $500 000 за первый год. Хотя проект не приносил компании прямой выгоды, индексация полученного контента существенно улучшила поисковую систему Yahoo!^[2]. Библиотеки Калифорнийского университета вложили $500 000 за оцифровку 5000 томов художественной литературы^[2]Шаблон:Sfn. Национальные архивы Великобритании предоставляли коллекцию фильмов и других медиаматериалов^[4]^[1]. Research Libraries Group планировала предоставить библиографическое описание для всех оцифрованных работ^[4]. Microsoft сделала наибольший вклад в развитие проекта, вложив около $5 млн для оцифровки более 150 000 книг. Однако компания имела свои коммерческие интересы в проекте — оцифрованные работы планировалось выкладывать на специализированный книжный портал MSN. Microsoft планировала открыть бесплатный доступ к работам, не защищённым авторским правом, и взимать плату за доступ к защищенным материалам.^[3]^[10]Шаблон:Sfn.

Оплачивали оцифровку коллекций сами библиотеки, однако на практике многие из них получили гранты от таких организаций, как Фонд Альфреда Слоуна^[5]^[11]. Также в начале проекта большую часть затрат по оцифровке оплатила Microsoft, компанию особенно интересовала американская литература и она самостоятельно выбирала тематический охват для оцифровки из доступных коллекций партнёрских библиотек. Библиотеки, которые самостоятельно платили за собственное сканирование с помощью OCA, выбирали материалы для оцифровки по своему усмотрениюШаблон:Sfn. Например, библиотеки Бостонского университета выделили $845 000 долларов на оцифровку своей коллекции^[5].

Оцифровка

Оцифрованные материалы доступны через портал Open Library Архива Интернета. Поисковые системы, включая Google, могут свободно направлять пользователей к материалам^[5]. Процесс оцифровки работал аналогично системе Google Books: каждая библиотека согласовывала список произведений с OCA, после чего консорциум предоставлял оборудование и персонал для сканирования. После этого сотрудники библиотеки доставляли материалы в местное отделение OCA, где происходил процесс оцифровки. Персоналу, не относящемуся к OCA, не разрешалось пользоваться оборудованием, но, в отличие от Google, консорциум пускал людей на объекты сканирования^[9].

Оцифровка каждой книги обходилась консорциуму примерно в $30^[5]. OCA разработал специальную систему оптического распознавания символов под названием Scribe. Устройство имело схожую конструкцию с линейкой Kirtas Technology APT BookScan и использовала цифровые камеры Canon EOS-1Ds Mark II. Как и в проекте Google Books, для переворачивания страниц были наняты операторы. Они также нажимали на специальную педаль, автоматически опускающую V-образную стеклянную пластину на книгу для сглаживания страниц. Качество каждой отсканированной работы проверялось отдельно и при необходимости оцифровка проводилась повторно. В среднем оператор Scribe оцифровывал 350 страниц в час или одну страницу в 10 секунд^[9]. Полученные изображения в формате JPEG загружали на локальный компьютер и передавали на основные сервера OCA для дальнейшей обработки^[9].

Доступ к материалам OCA осуществлялся через портал OCA и сайт Архива Интернета. Однако политика использования материалов и доступ к тем или иным работам зависят от параметров и устанавливаются содействующими учреждениями. Например, коллекция американской литературы Калифорнийского университета не имеет ограничений и может быть загружена и повторно использована для любых целей^[4]^[2]^[1]^[12].

Критика

Проект консорциума по масштабной оцифровке печатных изданий уступает по известности лишь Google Books. Благодаря заявленным принципам прозрачности и публичной приверженности идеалам открытой науки многие активисты и библиотекари рассматривали работу OCA как «окончательную ступень в демократизации мирового знания»^[9]. Основатели проекта рассчитывали собрать крупную сеть университетских библиотек, многие из которых не заключали контракт с Google Books из-за опасений работы с коммерческим гигантомШаблон:Sfn.

Однако многие библиотечные системы и некоммерческие организации начали критиковать консорциум, говоря о том, что по своей сути организация не отличается от Google Books, а вовлечённый в процесс Microsoft имеет такие же коммерческие интересы, как и GoogleШаблон:Sfn. Отдельные исследования показали, что несмотря на заявленную прозрачность, OCA являлся достаточно закрытой организацией в плане подхода к оцифровке данных^[9]. Так, консорциум опубликовал даже меньше технической информации о своей работе, чем Google Print. Техническая документация Scribe была недоступна для широкого круга, хотя сама программа была выпущена с открытым исходным кодом^[9].

В результате проект не достиг масштабов и популярности Google Books. Считается, что одной из главных причин неудачи проекта — общее нежелание библиотек доверять коллекции частным корпорациямШаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

↑ ^1,0 ^1,1 ^1,2 ^1,3 Шаблон:Cite web
↑ ^2,0 ^2,1 ^2,2 ^2,3 Шаблон:Cite web
↑ ^3,0 ^3,1 Шаблон:Cite web
↑ ^4,0 ^4,1 ^4,2 ^4,3 ^4,4 Шаблон:Cite web
↑ ^5,0 ^5,1 ^5,2 ^5,3 ^5,4 ^5,5 Шаблон:Cite web
↑ Шаблон:Cite web
↑ ^7,0 ^7,1 Шаблон:Cite web
↑ Шаблон:Cite web
↑ ^9,0 ^9,1 ^9,2 ^9,3 ^9,4 ^9,5 ^9,6 Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web

[SPARC-1] 1,0 ^1,1 ^1,2 ^1,3 Шаблон:Cite web

[Hafner-2] 2,0 ^2,1 ^2,2 ^2,3 Шаблон:Cite web

[NYT-3] 3,0 ^3,1 Шаблон:Cite web

[Maidenberg-4] 4,0 ^4,1 ^4,2 ^4,3 ^4,4 Шаблон:Cite web

[NYT1-5] 5,0 ^5,1 ^5,2 ^5,3 ^5,4 ^5,5 Шаблон:Cite web

[NI-6] Шаблон:Cite web

[CTV-7] 7,0 ^7,1 Шаблон:Cite web

[8] Шаблон:Cite web

[Leetaru-9] 9,0 ^9,1 ^9,2 ^9,3 ^9,4 ^9,5 ^9,6 Шаблон:Cite web

[10] Шаблон:Cite web

[11] Шаблон:Cite web

[12] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Open Content Alliance

Содержание

История

Принцип работы

Оцифровка

Критика

Примечания

Литература

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты