ИВМ СО РАН Поиск 
Отчеты ИВМ СО РАН

Отчет ИВМ СО РАН за 2015 год

Научно-организационная деятельность

Научно-информационная деятельность


Разработаны и отлажены методы заимствования данных наукометрических систем (Web of Science, Scopus, РИНЦ) и интеграции их в корпоративный репозиторий, построенный на базе системы автоматизации библиотеки (САБ). Развернуто программное обеспечение, реализующее корпоративный репозиторий как архив открытого доступа на основе технологий OAI-PMH. Спроектирована структура и начата организация архива открытого доступа сети библиотек Красноярского научного центра Сибирского отделения Российской академии наук. Определены схемы обмена данными между репозиториями.

Обмен данными между наукометрическими системами и корпоративными репозиториями

Репозитории научных публикаций организации (IR — institutional repositories) получили повсеместное распространение в России и активное развитие в связи с необходимостью учета публикационной активности сотрудников, инициированной процессом ранжирования научных и образовательных организаций. Для обмена данными между репозиториями различных организаций используется российский коммуникативный формат RUSMARC, или другие форматы семейства MARC, взаимная совместимость которых обеспечивается общими структурами данных и правилами заполнения полей. Однако потребность в данных репозиториев не ограничивается только библиографическими данными и полными текстами публикаций. Для обеспечения необходимой информативности записи данных обогащаются дополнительными полями, такими, как поле идентификаторов публикации в индексах научного цитирования (WoS, Scopus, РИНЦ и т.д.), поле текущего импакт-фактора источника публикации, поле списка библиографии, показатель текущего цитирования. Богатый набор полей MARC-форматов позволяет найти для каждого из дополнительных атрибутов подходящее по смыслу поле. Наличие коммуникативных форматов позволяет организовать обмен данными между различными IR-системами с помощью простейших конверторов данных с взаимно однозначным соответствием полей.

Данные IR-систем зачастую используют также в составе массивов данных иных информационных систем. В библиотеках академических институтов, в частности, это могут быть региональные и корпоративные информационные системы текущих исследований (CRIS — Current Research Information System). К системам этого вида можно отнести как локальные базы наукометрических данных организации, например, АРМ Ученого секретаря, так и международные индексы научного цитирования. Данные CRIS-систем формально должны соответствовать стандарту CERIF, определяющему как структуры данных, так и связи между этими структурами. Однако в силу сравнительно недавнего принятия указанного стандарта отмечается плохая совместимость данных различных CRIS-систем, осложняющая взаимообмен данными.

На фоне указанных особенностей обмена данными даже внутри различных CRIS-систем, проблемы обмена данными между IR- и CRIS-системами обсуждаются достаточно давно и отражены в целом ряде публикаций. Крупнейшими разработчиками CRIS-систем предпринимаются усилия для их решения. Так, набор сервисов Web of Science и Scopus позволяет заимствовать данные этих индексов в текстовой или табличной форме. Интеграция их в САБ требует поэлементного преобразования полученных данных, а также последующего динамического извлечения данных о цитировании и переноса их в имеющиеся записи. Для исключения дублирования записей требуется детальная проработка процедуры слияния извлеченных данных. Российский индекс научного цитирования (РИНЦ) предоставляет пользователям сервиса Science Index возможность извлечения данных в xml-виде. Различия правил заполнения полей создают дополнительные трудности импорта и приводят к частичной потере данных.

Архив открытого доступа ИВМ СО РАН

Существенно повысить рейтинговые показатели публикационной активности организации позволяют архивы открытого доступа (Open Access), создаваемые на базе Интернет-протоколов OAI-PMH. Программное обеспечение, реализующее концепцию архивов открытого доступа, свободно распространяется и широко используется в развитых странах. Распространение в России сдерживалось лицензионными ограничениями владельцев информационных ресурсов и отсутствием специалистов-проектировщиков. Однако изменения в законодательстве и образовательные нужды привели к переменам в этой области, которые подталкивают также исследования, выявившие прямую зависимость показателей цитирования от открытости доступа к публикациям. В отчетном периоде проведена работа по установке и настройке программного обеспечения для реализации архива открытого доступа Института, а также определена структура сообществ, коллекций и пользователей. Открытые архивы используют иные структуры данных, чем САБ. Для их описания используются конструкции в синтаксисе RDF/XML. Использование форматов DC и MODS упрощает задачу обмена данными и позволило определить алгоритм заимствования метаданных публикаций из репозитория, основанного на САБ.

К началу 2015 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000