3 Глава 1 Теоретическая часть - YashinaS/statisticswebirbis GitHub Wiki

Глава 1. Теоретическая часть

1.1 Анализ деятельности системы ИРБИС

Автоматизация библиотечного дела призвана дать сотрудникам библиотек удобный инструмент для работы с библиотечным фондом и избавить их от рутинной работы, а читателям — предоставить эффективный и комфортный сервис в поиске и получении книг и изданий. Система автоматизации библиотек ИРБИС64 - это комплекс программных средств, обеспечивающих автоматизацию современных библиотечных технологических процессов. Система автоматизации библиотек отвечает всем международным требованиям, предъявляемым к современным библиотечным системам и позволяет описывать все виды изданий. Интерфейсы максимально приближены к потребностям пользователя и легко осваиваются. Разработчиками системы являются: Государственная Публичная научно-техническая библиотека России (ГПНТБ России) и Международная ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий (Ассоциация ЭБНИТ). Система ИРБИС успешно функционирует в библиотеках России, Украины, Белоруссии, Казахстана, Узбекистана, Таджикистана, Киргизии, Америки ИРБИС позволяет осуществлять работу в локальных вычислительных сетях любого типа без ограничения количества пользователей. В системе осуществляется поддержка произвольного количества баз данных, составляющих Электронный каталог или представляющих собой проблемно-ориентированные библиографические базы данных. Система предлагает:

• Технологию автоматического формирования словарей, на основе которых реализуется быстрый поиск по любым элементам описания и их сочетаниям.

• Средства для заимствования готовых библиографических описаний из корпоративных ресурсов через Интернет.

• Средства для ведения и использования Авторитетных файлов, баз данных УДК, ББК, ГРНТИ и Тезауруса.

• Средства для перевода пользовательских интерфейсов на другие языки.

• Большой набор сервисных средств, обеспечивающих удобство и наглядность пользовательских интерфейсов, упрощающих процесс ввода, исключающих ошибки и дублирование информации.

Специальные решения для различных видов и типов библиотек:

• для публичных общедоступных библиотек: возможность централизованной каталогизации и хостинга каталогов библиотек региональной, городской или филиальной сети, использование единого читальского билета; автоматизированная индивидуальная и/или сводная отчетность по форме 6-НК; возможности для ведения краеведческих баз данных, календаря знаменательных дат.

• для учебных библиотек (библиотек высших, средних профессиональных и общеобразовательных учебных заведений): автоматизированная карта обеспеченности дисциплины; учет книгообеспеченнности по специальностям, циклам, параллелям, предметам и дисциплинам; организация электронной библиотеки выпускных квалификационных работ с возможностью самопубликации их студентами.

• для научно-технических библиотек, технических архивов: настройки для описания научно-технической документации, возможность ведения электронных архивов специализированных цифровых документов.

• для технических архивов проектных организаций: учет, хранение и предоставление удаленного доступа к описаниям документов и их электронным копиям, внесение изменений в описания рабочей документации (проектная, конструкторская, сметная документация, каталоги оборудования, типовые проекты, стандарты, патенты и др.). Специальные настройки позволят сотрудникам организации, в частности, осуществляющим авторский надзор, вносить изменения в описания документов и работать с их электронной копией.

• для музейных библиотек, отделов редких книг, музеев при библиотеках организаций: специальные настройки для ведения баз данных редких книг, книжных памятников, экспонируемых выставочных предметов.

• для специальных библиотек, работающих с незрячими и слабовидящими категориями граждан: настройки для описания специальных изданий для незрячих и слабовидящих. Система включает:

• Технологии, ориентированные на использование штрих-кодов и радиометок на экземплярах изданий и читательских билетах.

• Средства, которые позволяют использовать в качестве иллюстративного материала любые внешние по отношению к библиографическому документу объекты, такие как полные тексты, графика, таблицы, аудио- и видеоматериалы, а также ресурсы Интернет.

Система поддерживает:

• Традиционные "бумажные" технологии, предоставляя возможности для получения широкого спектра выходных форм: начиная с листов заказа и книги суммарного учета и кончая указателями и всеми видами каталожных карточек

• Многоязычие (т.е. ввод данных на любых языках) на основе UNICODE. Открытость позволяет пользователю самостоятельно вносить изменения в широких пределах: от изменения входных и выходных форм до разработки оригинальных приложений. В системе реализованы все типовые библиотечные технологии, включая технологии комплектования, систематизации, каталогизации, читательского поиска, книговыдачи и администрирования, на основе взаимосвязанного функционирования автоматизированных рабочих мест (АРМ) - рабочее место специалиста, оснащенное персональным компьютером, программным обеспечением и совокупностью информационных ресурсов индивидуального или коллективного пользования, которые позволяют ему вести обработку данных. В состав системы ИРБИС входят следующие модули и автоматизированные рабочие места:

• АРМ "Комплектатор"

• АРМ "Каталогизатор"

• АРМ "Читатель"

• АРМ "Книговыдача"

• АРМ "Администратор"

• АРМ "КНИГООБЕСПЕЧЕННОСТЬ"

• Web-ИРБИС

1.1.1 АРМ "Комплектатор"

Данное автоматизированное рабочее место позволяет осуществить:

• предварительное описание и оформление документов заказа на книги и другие издания с возможностью использования машиночитаемых планов издательств; контроль выполнения заказов;

• Регистрацию поступления литературы, ввод первичных данных для книги суммарного учета (КСУ);

• Передачу описаний на каталогизацию и сведений о докомплектовании в электронный каталог;

• Подписку периодических изданий (абонементные карточки и листы заказа) с возможностью использования машиночитаемых подписных каталогов; пролонгирование подписки;

• Передачу описаний периодических изданий в электронный каталог с последующей регистрацией очередных поступлений;

• Списание литературы - включая процессы выбытия литературы из фонда и перемещения ее из одного подразделения в другое;

• Типовые выходные формы - инвентарные списки, листы КСУ, итоговые данные о поступлении литературы в фонд, акты списания литературы и др.

Рисунок 1.1.1.1 - АРМ "Комплектатор"

1.1.2 АРМ "Каталогизатор"

Данный АРМ ведет:

• Обработку любых видов изданий, включая аудио- и видеоматериалы, электронные ресурсы, картографические материалы, ноты и т.д., любая полнота описания, включая оглавление журналов и содержание сборников.

• Описание периодических изданий может быть получено на сводном уровне и на уровне отдельных номеров и "подшивок" с учетом сведений о входящих в них статьях.

В "Каталогизаторе" технология индексирования изданий (систематизация, предметизация), включает автоматическое формирование авторского знака и аппарат навигации по рубрикатору ГРНТИ, алфавитно-предметному указателю УДК/ББК, авторитетному файлу предметных рубрик и тезаурусу. Технология копирования данных исключает повторный ввод при создании аналогичных и связанных библиографических описаний, в частности, при создании аналитических описаний. Программе есть система формально-логического контроля данных, как на уровне отдельных библиографических элементов, так и на уровне описания в целом и оригинальная технология автоматической сверки на дублетность, исключающая повторный ввод в электронный каталог. С помощью "Каталогизатора" может быть решена задача книгообеспеченности и безинвентарный учет многоэкземплярной литературы для вузовских библиотек. В качестве выходных форм используются - указатели, инвентарные списки, списки непоступивших номеров журналов и др.

Рисунок 1.1.2.1 - АРМ "Каталогизатор" 1.1.3 АРМ "Администратор"

Представляет собой рабочее место специалиста, выполняющего системные операции над базами данных в целом, направленные на поддержание их актуальности, целостности и сохранности.

Рисунок 1.1.3.1 - АРМ "Администратор"

1.1.4 АРМ "Книговыдача"

В автоматизированном рабочем месте АРМ "Книговыдача" реализована технология формирования и ведения очереди электронных заказов на выдачу литературы и фиксирования их исполнения, а также технология фиксирования возврата литературы. С помощью программы можно получить оперативную информацию свободных экземплярах заказанной литературы, о выданной литературе и читателях, имеющих ее на руках. Учет сведений о выдаче/возврате литературы осуществляется в индивидуальных карточках (документах) читателей. Программа позволяет получить статистику о задолженностях и востребуемости литературы. Также реализована специальная технология книговыдачи на основе штрих-кодирования экземпляров и читательских билетов.

Рисунок 1.1.4.1 - АРМ "Книговыдача"

1.1.5 АРМ "Читатель"

Для АРМ "Читатель" характерен дружественный интерфейс, рассчитанный на пользователя, не обладающего никакими специальными знаниями. В программе учтены различные уровни подготовки пользователя. Несомненным достоинством системы является широкий спектр поисковых средств, обеспечивающих быстрый (путем прямого доступа через словари) поиск в базах данных электронного каталога по любым элементам описания и их сочетаниям. Возможна работа с несколькими базами данных, составляющими электронный каталог. Пользователь имеет возможность воспользоваться безбумажной технологией формирования заказа на выдачу литературы.

Рисунок 1.1.5.1 - АРМ "Читатель"

1.1.6 АРМ "КНИГООБЕСПЕЧЕННОСТЬ"

АРМ "КНИГООБЕСПЕЧЕННОСТЬ" предназначено для ведения базы данных учебных дисциплин, связанных с базами данных читателей (студентов) и каталогов. Дружественный интерфейс отображает все варианты связей между учебными дисциплинами, студентами и литературой. Вычисление коэффициентов книгообеспеченности осуществляется с учетом следующих положений:

• Определение числа студентов и числа экземпляров в интерактивном режиме,

• Учет возможности использования студентами одного учебника для нескольких дисциплин,

• Учет наличия экземпляров, предназначенных для отдельных категорий студентов ("выделенные фонды"),

• Учет возможности многократного использования учебника последовательно разными группами студентов в течение одного семестра; В программе предусмотрено формирование таблиц коэффициентов книгообеспеченности для любого подмножества литературы на заданный семестр и Формирование различных выходных форм, в том числе "Обеспеченность обучающихся литературой из фонда ВУЗа" в соответствии с требованиями Министерства образования.

Рисунок 1.1.6.1 - АРМ "КНИГООБЕСПЕЧЕННОСТЬ"

1.1.7 WEB – ИРБИС

Программное обеспечение Web-ИРБИС предназначено для обеспечения доступа пользователей Интернет к электронным каталогам и другим библиографическим базам данных ИРБИС. Web-ИРБИС используется в качестве одной из основных компонент библиотечных Интернет-серверов и Интернет-комплексов. Все функции полностью управляются администратором, включая настройку поисковых форм, добавление и удаление поисковых полей, настройку их атрибутов, включение рубрикаторов и статических словарей. Введены элементы поддержки сервисов электронной доставки документов и прямого доступа к полным текстам (если они имеются) по результатам поиска. Технология авторизированного доступа построена не на уровне стандартных методов веб-серверов, а на базе оригинальных решений с использованием динамически формируемых страниц и библиотек форм-файлов. Это было впервые реализовано с целью расширения возможностей адаптации к конкретным условиям и повышению устойчивости к несанкционированному доступу. Web-ИРБИС имеет встроенную поддержку включения в электронный каталог ссылок на полные тексты документов. При этом реализована свободная технология формирования ссылок в виде URL, что позволяет использовать это не только для формирования собственной коллекции полных текстов, но и для каталогизации и включения в базу данных ресурсов Интернет, что крайне важно в современных условиях. Таким образом, Web-ИРБИС может использоваться в качестве базовой технологии при создании виртуальных и электронных библиотек. Процесс создания ссылок достаточно прост и полностью интегрирован с технологией ИРБИС. Web-ИРБИС обеспечивает высокую скорость выполнения запросов различной степени сложности. Web-ИРБИС осуществляет поддержку расширенных форматов, установку параметров выдачи; допускает возможность использования расширенных средств формирования запросов, использования нескольких терминов в одном поле; имеет расширенные функции сервиса. Web-ИРБИС базируется на следующей совокупности основных компонент:

  1. Модуль обеспечения связи между веб-сервером и БД, созданного на основе CGI-технологии для веб-серверов Apache, WebSite. Кроме того, он обеспечивает работу программного обеспечения с любыми другими серверами, поддерживающими данную технологию, которая является стандартом для выполнения приложений в Интернет.
  2. Модули поиска и форматирования результатов являются общими для Web-ИРБИС и ИРБИС и выполнены в виде динамических библиотек. Управляются модулем связи и обеспечивают поиск и вывод предварительно форматированных результатов в соответствии с переданными параметрами. Окончательное форматирование и конвертирование в HTML осуществляется модулем связи.
  3. Библиотека форм-файлов – основа технологии безопасного авторизированного доступа. Разработанный алгоритм позволят не хранить постоянно поисковые страницы и страницы вывода результатов – они создаются при получении запроса на выполнение операции и удаляются после завершения процесса. Поэтому, невозможно осуществить несанкционированный доступ ко всем режимам из Интернет.
  4. Технологические базы данных. Содержат информацию о регистрации удаленных пользователей и поступивших заказах.
  5. Дерево статических страниц. Используется для первоначального изучения и в качестве примеров для оформления своего сервера. Основными системными характеристиками Web – ИРБИС являются следующие:

• Полная совместимость со всеми компонентами семейства ИРБИС;

• Единая технология обслуживания локальных и удаленных пользователей;

• Единая технология обслуживания запросов, поступающих в режиме онлайн и по электронной почте;

• Полная совместимость описаний рабочих листов ввода для обеспечения процесса каталогизации с сетевой версией системы;

• Возможность использования единого библиографического массива как для технологических операций, так и для обслуживания локальных и удаленных пользователей;

• Наличие функций поддержки электронных библиотек, электронной доставки документов и МБА;

• Наличие функций поддержки распределенных корпоративных систем и многофилиальных сетей;

• Наличие простой и удобной системы биллинга и авторизации пользователей;

• Возможность работы с любым количеством библиографических баз данных, в том числе и одновременно;

• Возможность формирования запроса в фиксированной и свободной формах с использованием большинства операций информационного поиска;

• Возможность использования любых форматов вывода, определяемых пользователем, в том числе RUSMARC, UNIMARC, MARC21. Пользователь системы Web-ИРБИС может выполнять ряд базовых операций:

  1. Поиск в произвольной базе данных, имеющей структуру ИРБИС, по неограниченному числу полей, по любым элементам описания и их комбинаций, с возможностями определения префиксов и квалификаторов поисковых терминов, нормализации слов и применения аппарата усечений
  2. Использование при поиске статических словарей и рубрикаторов, включенных в поисковые формы или подключаемых извне, с возможностью комбинирования элементов словарей с любыми другими поисковыми предписаниями;
  3. Использование динамических словарей баз данных, с возможностью получения списка терминов словаря с последующим поиском по выбранным терминам; навигация по словарям, включая задание начала сканирования по первым символам, и в терминах «следующие», «предыдущие»;
  4. Показ записей из произвольной базы данных во всех типах стандартных форматов, включая информационный, в виде каталожной карточки, в метках и расшифрованных RUSMARC, UNIMARC, MARC21. Возможно применение любых форматов, определяемых пользователем в нотации ИРБИС;
  5. Квантование выводимых записей в формате, определяемым пользователем, с последующей навигацией в терминах «следующие», «предыдущие»;
  6. Выбор записей из числа найденных, с последующей их обработкой, включая выгрузку выбранных записей в стандартных форматах RUSMARC, UNIMARC, MARC21;
  7. Каталогизация в трех режимах: каталогизация новых или прочитанных по номеру документов; каталогизация найденной порции документов; каталогизация импортируемых документов;
  8. Удаленное авторизированное внесение изменений в базу данных, включая редактирование существующих записей, добавление новых, удаление без актуализации. Web-ИРБИС является надежной и удобной платформой для реализации библиотечных Интернет-приложений и их последующей интеграции в единый библиотечный Интернет-комплекс. Web-ИРБИС – постоянно совершенствуется и модифицируется, идет добавление новых функций и фозможностей, углубляется интеграция с другими подистемами семейства ИРБИС. На его базе построена аутсорсинговая сервисная служба ИРБИСхост. Обеспечивается поддержка пользователей как традиционным способом, так и через систему Интернет-конференций.

Рисунок 1.1.7.1 WEB - ИРБИС

1.1.8 ИРБИС64

В настоящее время в ГПНТБ России создана подсистема ИРБИС64 для создания полнотекстовых баз данных. Документами этих баз данных могут быть тексты в форматах TXT, DOC, RTF, PDF, HTM, HTML. В данной подсистеме реализован смысловой анализ текстов. Подходы к решению задачи смысловой обработки текстов могут быть сформулированы в виде следующих этапов:

  1. Создание полнотекстовой базы данных из массива текстов.
  2. Естественно-тематическая классификация текстов на основе выделения значимых терминов предметной области. Тематическая классификация позволяет сравнивать тексты между собой на предмет близости их по смыслу. Тематический классификатор — это набор тематических словарей, в который входят термины, значимые в данной предметной области. Подсистема полнотекстовых баз данных ИРБИС64 включает в себя:
  3. Расширенный АРМ “Администратор”, который помимо стандартных функций включает в себя дополнительные режимы для работы с полнотекстовыми базами данных.
  4. АРМ конечного пользователя (читателя) для поиска и просмотра в полнотекстовых баз данных. В этом АРМе реализованы специальные поисковые алгоритмы:

• Поиск по запросу на естественном языке.

• Поиск схожих текстов к тексту из полнотекстовой базы данных в заданном пользователем тематическом контексте.

• Поиск схожих текстов к внешнему (по отношению полнотекстовой базе данных) тексту в заданном пользователем тематическом контексте. Помимо конечного пользователя (читателя) система ориентирована на пользователя-эксперта, в задачу которого входит предварительная работа по созданию полнотекстовой базы данных и естественно-тематическая классификация текстов. Кроме того, система позволит экспертам и специалистам-классификаторам работать с полнотекстовыми коллекциями библиотеки в режиме интеллектуального смыслового анализа текстов. (Все эти функции реализованы в расширенном АРМе “Администратор”).

1.2 Внедрение автоматизированной информационной библиотечной системы "ИРБИС"

Научная библиотека Сибирского государственного технологического университета (НБ СибГТУ) - одна из крупнейших университетских библиотек Красноярского края и Восточной Сибири, обладает обширной многопрофильной коллекцией отечественных и зарубежных документов, включая документы на машиночитаемых носителях; развитым справочно-поисковым аппаратом, базами данных, электронными библиотечными и справочно-поисковыми системами, другими видами информационных ресурсов, к которым организует доступ пользователей. В Научной библиотеке СибГТУ успешно внедрена автоматизированная информационная библиотечная система "ИРБИС", автоматизированы процессы комплектования и обработки фондов, книговыдачи читателям, осуществляется удаленный заказ литературы через электронный каталог на сайте библиотеки. Ведутся и поддерживаются различные базы данных, в том числе Электронный каталог объемом более 360 тыс. библиографических записей. C 2004 года в научно-технической библиотеке Лесосибирского филиала "СибГУ науки и технологий имени академика М.Ф. Решетнева" внедрена и действует Система автоматизации библиотек «ИРБИС». К основным характеристикам системы можно отнести единую технологию обслуживания локальных и удаленных пользователей, возможность авторизированного обслуживания пользователей и заказа литературы, просмотр состояния читательского формуляра в реальном времени. Доступ к системе открыт с компьютеров вуза и домашних компьютеров. Доступ к полным текстам предоставляется только авторизованным пользователям. Для авторизации в электронном каталоге необходимо заполнить два поля (в правом верхнем углу): «Фамилия» (на русском языке, с большой буквы, без пробелов) и «Пароль» (состоит из 12 цифровых знаков, выдается в библиотеке). Для просмотра библиографических описаний авторизация не требуется.

1.3 Проблемы системы Web – ИРБИС

Система Web – ИРБИС обладая существенным функционалом имеет ряд проблем, связанных с ведением оперативной статистики. При работе с системой библиотек в ЛфСибГУ используется различная статистика посещаемости, которая фиксируется заведующей библиотекой. Система WEB ИРБИС не предполагает наличие инструмента для оперативного подсчета статистических данных. Обработка этой информации, содержащейся в текстовом файле веб-сайта, занимает длительный период времени. Автоматизация системы статистического учета пользователей очень выгодна, так как сокращает время на обработку информации и составление отчетов. В связи с этим была поставлена цель, заключающаяся в создании программного обеспечения, позволяющего вести оперативную статистику посещений системы автоматизации библиотек «ИРБИС».

1.4 Пути решения

1 метод(узнать) не оптимален

Оптимальным решением является создание программного обеспечения для статистического учета пользователей системы автоматизации библиотек «ИРБИС» учитывая требования конечного пользователя, так как данный способ уменьшает время на обработку информации, увеличивает достоверность получаемых статистических данных, конечному пользователю необходимо затрачивать меньше усилий для получения желаемого результата. Программное обеспечение на основе исходных данных должно позволять пользователю формировать статистику за определенный период, количество виртуальных обращений через адрес ПЭВМ (персональной электронной вычислительной машины) и выданных электронных документов. Главными задачами работы являются:

• Формирование базы данных на основе файлов «ИРБИС».

• Проектирование программного обеспечения.

• Создание программного обеспечения.

• Тестирование программного обеспечения.

• Внедрение программного обеспечения.

• Сопровождение программного обеспечения.

1.5 Описание используемых инструментов в процессе создания ПО

Для формирования базы данных используется реляционная система управления базами данных MySQL. MySQL - это самая распространенная полноценная серверная СУБД. MySQL очень функциональная, свободно распространяемая СУБД, которая успешно работает с различными сайтами и веб приложениями. Преимущества MySQL

• Простота в работе;

• Богатый функционал - MySQL поддерживает большинство функционала SQL.

• Безопасность - большое количество функций обеспечивающих безопасность, которые поддерживается по умолчанию

• Масштабируемость - MySQL легко работает с большими объемами данных и легко масштабируется

• Скорость - упрощение некоторых стандартов позволяет MySQL значительно увеличить производительность.

Для создания программного обеспечения статистического учета пользователей системы автоматизации библиотек «ИРБИС» использовалась интегрированная среда разработки Embarcadero RAD Studio XE2 с применением императивного структурированного объектно-ориентированного языка программирования Delphi (Object Pascal). Входные данные включают информацию о времени запроса, удаленном адресе ПЭВМ, URL запросе, коде ответа и объеме в Кб. Данная информация содержится в текстовом файле веб-сайта, в котором регистрируются все запросы, а также все ошибки, связанные с этими запросами. (Как Ирбис формирует этот файл, используется ли для этого Apache) (Excel?)