Создание электронной библиотеки научных трудов на...

Post on 11-Jan-2017

251 Views

Category:

Education

15 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Создание электронной библиотеки научных трудов на

платформе Dspace

Дедёнок Юрий Леонидович, зав. сектором формирования репозитория и развития интернет-технологий НБ БНТУ

E-mail: dedenok@gmail.com

Skype: dedenok69

DSpace – бесплатное программное обеспечение, находящееся в открытом доступе, адресованное как правило научным и образовательным организациям и предназначенное для создания архива электронных ресурсов (электронной библиотеки, цифрового репозитория).

Dspace является самым распространенным программным продуктом среди аналогов.

Появление такого класса ПО позволило научным и образовательным организациям существенно минимизировать затраты связанные с созданием собственных ЭБ и аналогичных ресурсов.

http://www.dspace.org/

Адрес в Интернете: http://rep.bntu.by

С электронными библиотеками (необязательно на Dspace) тесно связано понятие метаданных.

Метаданные - структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими.

В общем смысле метаданные – это данные о данных, информация об информации, описание контента.В качестве базового средства формирования метаданных для описания широкого класса цифровых объектов DSPACE использует стандарт метаданных Dublin Core.

Стандарт метаданных Dublin Core является форматом

описания практически любых ресурсов Интернет.

Преимуществом использования Dublin Core является

возможность создания такого механизма, который при

минимальных затратах на описание позволяет искать и

находить данные вне зависимости от языковой

принадлежности, тематики и места их нахождения.

Для описания электронных ресурсов Интернет можно

использовать например формат MARC. Этот формат позволяет

очень детально каталогизировать электронный документ

аналогично традиционной книге. Однако подобная детализация

затрудняет использование MARC без соответствующего обучения

и недоступно широкому кругу пользователей, создающих

информационные ресурсы в Интернет.

В связи с этим были выработаны рекомендации по набору

полей и методам каталогизации, доступным без

предварительного обучения. В этот набор, названный по

имени семинара где он был выработан, Dublin Core Metadata

Set (DC) (http://purl.oclc.org/metadata/dublin_core), входит 15

полей, в которых описываются основные характеристики

информационного ресурса. Поля могут повторяться и кроме

этого поле может разбиваться на подполя.

При описании поля вводятся понятия схемы и подполей.

Схема - это наименование правил, в соответствии с

которыми приводится содержание данного поля. Так

например, для поля "Предмет" указывается какая схема

классификации используется, для поля "Дата" указывается

какой используется стандарт представления даты и т.д.

Подполе - это информация уточняющая содержание поля.

В каждом поле, имеющем подполя, выделяется одно

подполе, называемое "подполе по умолчанию". Если

информация не разделена на подполя, считается что она

занесена в подполе по умолчанию.

Формат Dublin Core версии 1.1 включает в себя 15 основных

элементов и 3 дополнительных для описания электронного

ресурса.

Формат описания можно разделить на два уровня:

1. неквалифицированный (Simple), 15 элементов.

2. квалифицированный (Qualified) плюс три дополнительных

элемента.

Оригинал Перевод Описание

Title Заголовок Название, присвоенное ресурсу создателем или издателем.

Author/Creator Автор Автор (создатель). Человек или организация, изначально ответственная за интеллектуальное содержание ресурса (в случае рукописного документа это авторы; исполнители, фотографы или иллюстраторы в случае визуальных ресурсов).

Subject/Keywords Предмет Тема/предмет/ключевые слова ресурса. Обычно предмет выражается в ключевых словах или фразе, описывающей предмет или содержание ресурса. Приветствуется использование контролируемых словарей и формальных схем классификации.

Description Описание Текстовое описание содержания ресурса, включая аннотацию, реферат в случае документов или описание содержания в случае визуального ресурса.

Оригинал Перевод Описание

Publisher Издатель Организация, ответственная за создание ресурса в его нынешней форме -

например, издательство, университет и т.д.

Contributor Соисполнитель Человек или организация, которые не являются авторами (не

обозначены в элементе "автор"), но внесли значительный

интеллектуальный вклад в ресурс - например, редактор, переводчик,

иллюстратор.

Date Дата Дата, указывающая на создание или появление (в доступном виде)

ресурса.

Type Тип тип ресурса - например, учебник, учебно-методическое пособие, статья,

препринт, технический отчет, доклад и т.д. Существует список возможных

типов ресурса.

Оригинал Перевод Описание

Format Формат Формат представления данных ресурса (обычно указывается тип

программного обеспечения и - возможно - тип компьютера, которые

могут быть необходимы для отображения и работы с ресурсом). Он

может использоваться для определения программного и технического

обеспечения, необходимого для использования содержимого ресурса.

Identifier Идентификатор Набор букв или цифр, который обычно используется для уникальной

идентификации ресурса. В случае сетевых ресурсов примерами являются

URL (по умолчанию), ISBN, ISSN.

Source Источник Информация о вторичном источнике, из которого был получен

настоящий ресурс.

Оригинал Перевод Описание

Language Язык Язык, на котором изложено интеллектуальное содержание ресурса. Содержание этого поля должно соответствовать стандарту RFC 1766.

Relation Связь Идентификатор вторичного ресурса и его связь с настоящим ресурсом. Этот элемент позволяет связывать между собой близкие ресурсы, а также описания ресурса, которые необходимо показать. Примеры - издание книги и глава книги.

Coverage Охват Характеристики местонахождения и временной продолжительности ресурса.

Rights Права Утверждение об авторских правах и управление ими; идентификатор, связанный с таким утверждением; идентификатор, связанный с сервисом, представляющим информацию об управлении правами на данный ресурс.

Оригинал Перевод Описание

Audience Аудитория Группа лиц, для которых ресурс предназначен или полезен.

Примеры: Аудитория = "ученики начальной школы" Аудитория = «студенты технических вузов"

Provenance Происхождение Информация о любых изменениях в собственности и хранение ресурсов с момента его создания, которая является существенной для подлинности.

Примеры: Происхождение = "Эта копия когда-то принадлежала Бенджамину Споку". Происхождение = "Недвижимость Хантера Томпсона".

RightsHolder Правообладатель Лицо или организация, обладающее правами на ресурс. Рекомендуется использовать URI или имя правообладателя, названием организации.

Примеры: Владелец прав = "Стюарт Адамс" Владелец прав = "Университета Бата"

Убеждение руководства –какие можно использовать аргументы?

1. Позиция организации в международных рейтингах.

Webometrics

http://www.webometrics.info/en

Webometrics–рейтинг университетов, репозиториев, бизнес-школ, научно-

исследовательских центров, учреждений здравоохраненияWebometrics (создан в 2004 г., испанской исследовательскойгруппой Cybermetrics) считается одним из самых авторитетныхв мире. Рейтинг публикуется дважды в год. Используетсяметодология оценки и ранжирования, которая для каждого изразделов имеет свою специфику.

–основан на анализе представления ресурса в Интернет-пространстве.

–основная задача Webometrics — мотивировать оцениваемыев нем организации к публикации качественныхвысокоцитируемых работ в ресурсах (ЭБ, репозиториях)открытого доступа.

К участию в рейтинге репозиториев допускаются все ресурсы при соблюдении следующих условий:

- Ресурс должен располагаться на автономном веб-домене или субдомене:

• repository.xxx.zz (ДА)

• www.xxx.zz/repository (НЕТ)

- Содержание ресурса должны составлять главным образом научные труды.

Место в рейтинге рассчитывается по 4-м критериям, каждый из которых имеет свой вес:

Критерий Что анализирует Вес

Влияние Число уникальных внешних ссылок на записи ресурса

50%

Присутствие Число страниц ресурса, проиндексированных поисковой системой Google

17%

Открытость Число файлов в формате pdf, doc/docx, ppt,/pptx, eps/ps по данным поисковой системы Google

17%

Превосходство Доля статей, попавших в 10% самых цитируемых в мире за последние 5 лет

17%

2-е полугодие 2015 года

1-е полугодие 2016 года

2. Смена парадигмы информационной поддержки

научной и учебной деятельности.

Что мы наблюдаем последние 15 лет?

РАЗВИТИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

ИЗМЕНЕНИЕ ПРИОРИТЕТОВ БИБЛИОТЕЧНОЙ ДЕЯТЕЛЬНОСТИ

СОВЕРШЕНСТВОВАНИЕ УСЛОВИЙ ИНФОРМАЦИОННО-БИБЛИОТЕЧНОГО ОБСЛУЖИВАНИЯ

Все эти изменения и преобразования проходят на фоне:

- ограниченных финансовых ресурсов;

- роста объёмов производимой информации и ее стоимости;

- растущего уровня подготовки пользователей в области ИТ и

растущих ожиданий пользователей относительно способов

доставки информации;

- постоянного развития информационных технологий.

Без электронной библиотеки

С электронной библиотекой

Внедрение и использование ЭБ позволяет решить множество проблем, например:- Постепенное освобождение площадей библиотеки,

человеческих и временных ресурсов, которые можно будет задействовать на другие направления деятельности;

- Снижение финансовых затрат на издательскую деятельность и комплектование;

- Сохранность неопубликованной или «серой» литературы;- Уход от проблем с плохим переплетом и впоследствии

ремонтом внутривузовских изданий;- Снимается проблема экземплярности;- У пользователей появляется возможность выбора.

3. Повышение информационной грамотности пользователей и развитие информационных

технологий.

4. Наличие бесплатного программного обеспечения

для создания ЭБ.

Greenstone

DSPACE

ResCarta

EPrintsCERN Document Server Software

ArchimedeGNUTECA

Почему мы используем DSpace?

• открытый программный код;

• бесплатный;

• популярный;

• кроссплатформенный (Windows, Linux);

• ориентирован на использование в учебных заведениях;

• авторитетные разработчики – компания Hewlett-Packard и Массачусетский технологический институт (Massachusetts Instituteof Technology);

• на момент выбора данный программный продукт уже эксплуатировался в Фундаментальной библиотеке Белгосуниверситета (http://elib.bsu.by).

1. United States (2083)2. India (181)3. Japan (102)4. Brazil (94)5. Turkey (91)6. Spain (79)7. Taiwan (66)8. United Kingdom (65)9. Ukraine (63)10.Norway (49)

…37.Belarus (14)

Какие возможны затраты?

1. Техническое обеспечение.2. Программное обеспечение – если планировать сервер на ОС от Microsoft, то придется покупать лицензию. Если нет – тогда остаётся бесплатный Linux. 3. Персонал – наименее затратная часть.

Вы убедили руководство –

что дальше?

Подготовка приказа руководителя организации о создании рабочей группы

для разработки плана мероприятий по созданию и внедрению ЭБ.

Примерный состав рабочей группы:- проректор, курирующий ИТ;- начальник ВЦ вуза либо сотрудник им назначенный;- зам. директора библиотеки курирующий ИТ;- зав. отдела автоматизации библиотеки;- сисадмин библиотеки или инженер-программист;- зав. отдела библиотеки который будет ответственен за ведение ЭБ;- сотрудник библиотеки который будет непосредственно заниматься ведением ЭБ.

Примерный план мероприятий:• Информационное наполнение: что будет в ЭБ?

• Разработка организационной структуры: какие будут разделы и подразделы?

• Разработка функциональной структуры: кто осуществляет ввод, редактирование?

• Взаимодействие с издательством и авторами.

• Разработка нормативно-технологической документации.

• Подготовка технической базы.

• Выбор и адаптация программного обеспечения.

• Кадровое обеспечение.

• Ввод в эксплуатацию.

Информационное наполнение

В открытом доступе: монографии, учебники и

учебные пособия, журналы (постатейно),

методические указания и методические пособия,

материалы конференций, учебные планы.

В ограниченном доступе: отчеты о НИР, диссертации,

авторефераты диссертаций.

Организационная структура

- Редактирование структуры осуществляется на уровне разделов, подразделов и коллекций;

- Переносы осуществляются на уровне коллекций и отдельных документов;

- При любых изменениях URL отдельного документа остаётся неизменным;

- Документ можно привязывать к двум и более коллекциям.

Организационная структура

РАЗДЕЛ

ПОДРАЗДЕЛ

РЕПОЗИТОРИЙ

РАЗДЕЛ РАЗДЕЛ

ПОДРАЗДЕЛ ПОДРАЗДЕЛ ПОДРАЗДЕЛ

КОЛЛЕКЦИЯ

КОЛЛЕКЦИЯ

КОЛЛЕКЦИЯКОЛЛЕКЦИЯ КОЛЛЕКЦИЯ

ДОКУМЕНТЫ ДОКУМЕНТЫ

ДОКУМЕНТЫ

КОЛЛЕКЦИЯ КОЛЛЕКЦИЯ

ДОКУМЕНТЫ

ДОКУМЕНТЫ ДОКУМЕНТЫ ДОКУМЕНТЫ

Функциональная структура

Подготовка документов к вводу;Ввод.

Администрирование ЭБ

Контроль введенного контента

Первичный ввод

Системное администрирование

Программная и техническая поддержка

Ведение структуры: Создание и удаление разделов, подразделов;Создание, перенос и удаление коллекций;Перенос или удаление отдельных записей.

Проверка и редактирование введенных записей.

Основные поставщики контента для ЭБ.

Вариант А:- свое издательство;- сотрудники организации.

Вариант В:- сотрудники организации.

Файловый формат для хранения данных.

Оптимальный вариант – PDF.

Нежелательный вариант – RTF, DOC, DOCX.

Каким образом или на основании чего в ЭБ будут размещаться материалы?

- Приказ руководителя организации;- Заключение договора с каждым автором.

Юридический аспект.

Нормативно-технологическая документация

- Приказ о создании ЭБ;- Положение об ЭБ;- Технологические инструкции на процессы (создание и редактирование структуры и документов, порядок передачи электронных копий и оригиналов документов в библиотеку).

Техническое обеспечение:

- сервер, оснащенный источником бесперебойного питания, системой резервного копирования и хранения данных;- ПК сотрудника, работающего с ЭБ. ТХ компьютера следует рассчитывать исходя из требований ПО которое будет установлено на нем. Общие рекомендации такие: 4-ядерный процессор и выше, 4 гигабайта RAM и выше, 500 гигабайт HDD и выше, монитор 22 дюйма и выше;- Планшетный сканер.

Программное обеспечение:- Сервер – ОС Windows или Linux; Dspace и дополнительное ПО.- ПК: основную нагрузку на ресурсы компьютера будут создавать программные продукты, обеспечивающие решение таких задач как:- сканирование и распознавание документов, которые могут содержать текст, таблицы и различные виды графических изображений. ABBYY FineReader;- редактирование распознанных документов в форматах: doc, docx, rtf и сохранение в формате pdf. Microsoft Word, PowerPoint и Excelне ниже 2003 версии;- редактирование документов в формате pdf. Adobe Acrobat XI Professional или Adobe Acrobat Professional DC.

ОС: Ubuntu 11.10 (GNU/Linux 3.0.0-12-server x86_64)

СУБД: PostgreSQL

Веб-cервер: Tomcat

Java: Java Development Kit

ПО: Apache Maven, Apache Ant, Dspace.

http://www.dspace.org/latest-release/

https://wiki.duraspace.org/display/DSDOC5x/DSpace+5.x+Documentation

https://github.com/DSpace/DSpace/releases

Сотрудники работающие с ЭБ должны знать и уметь:- Основы работы с используемой ОС;- Текстовый редактор MS Word в части редактирования и форматирования

документов (в т.ч. со сложной структурой);- Табличный редактор MS Excel и редактор презентаций MS PowerPoint в части

редактирования и форматирования документов (если у вас предполагаются соответствующие документы);

- Графический редактор Adobe Acrobat в части редактирования и форматирования документов. Формат pdf – основной формат для хранения документов;

- Графический редактор начального уровня для работы с графикой –обязательно. Adobe Photoshop или CorelDraw – желательно;

- Программу для сканирования и распознавания документов. ABBYY FineReader(сканирование, распознавание, редактирование, сохранение в различных форматах).

top related