Научно-методическая конференция
«ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»

ВОПРОСЫ РАЗРАБОТКИ СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОЙ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ ПОЛЬЗОВАТЕЛЕЙ ЦИФРОВОЙ БИБЛИОТЕКИ

Л.Р. Черняховская, А.П. Ефремов

Уфимский государственный авиационный технический университет
Уфа

Темпы роста информации в электронной форме в последние годы значительно - в десятки раз - опережают соответствующие показатели выпуска традиционной печатной продукции. Если такая тенденция сохранится в ближайшие пять лет, то имеются все основания полагать, что электронная форма информации станет превалирующим видом информационной продукции.

Таким образом, все более актуальной становится проблема организации цифровой библиотеки, как наиболее эффективного средства хранения больших объемов электронных документов. Цифровая библиотека позволяет хранить как текстовую информацию, так и файлы мультимедиа, что значительно повышает ее информационную ценность.

В данном докладе рассматриваются вопросы интеллектуальной информационной поддержки пользователей цифровой библиотеки. Самой важной функцией, от которой зависит эффективность работы с цифровой библиотекой, является функция поиска. В процессе информационного поиска система поиска в цифровой библиотеке способна оказывать интеллектуальную поддержку за счет использования тезауруса предметной области. Тезаурус представляет собой автоматизированный словарь, отражающий наряду с синтаксическими также и семантические элементы в отношениях между статьями словаря. Дело в том, что пользователь не всегда знает, какие именно слова являются ключевыми для идентификации того или иного документа. Использование тезауруса позволяет предоставить ему на выбор множество терминов, связанных с теми, которые он ввел для формулирования первоначального запроса. В результате он получает возможность более точно формулировать запрос, что, безусловно, повышает вероятность того, что он найдет именно тот документ, который искал. Кроме того, использование словаря предметной области гарантирует то, что все введенные слова запроса окажутся «ключевыми» и будут задействованы в процессе поиска.

Разработан новый метод разработки предметно-ориентированного тезауруса цифровой библиотеки на основе объектно-ориентированного моделирования с помощью средств языка UML (Unified Modeling Language). Автоматизированная разработка тезауруса ПО проводится на основе семантического анализа результатов моделирования. Альтернативным методом формирования тезауруса является лингвистический анализ документов цифровой библиотеки. Такой интегрированный тезаурус призван улучшить эффективность поиска в цифровой библиотеке и, соответственно, эффективность самой цифровой библиотеки.

Наиболее эффективным является представление документов в виде XML документов. Использование языка разметки позволяет создать электронный документ с полностью определенной логической структурой. Такое представление документа позволяет эффективно работать как с полным текстом документа, так и с отдельными его частями. Кроме того, применение XML позволяет достичь полного отделения содержания документа от его представления, что дает возможность использовать один и тот же документ многократно, не изменяя его, а только лишь применяя другие правила отображения.

По результатам данных исследований было получено свидетельство № 50200200179 о регистрации программы интеллектуального поиска в электронном архиве регламентирующих документов предприятия во Всероссийском научно-техническом информационном центре.

[Аннотация на английском языке]

Опубликовано: Черняховская Л.Р., Ефремов А.П. Вопросы разработки системы интеллектуальной информационной поддержки пользователей цифровой библиотеки // Технологии информационного общества - Интернет и современное общество: труды V Всероссийской объединенной конференции. СПб., 25 - 29 ноября 2002 г. СПб.: Изд-во С.-Петерб. ун-та, 2002. С. 246-247.

Ориг. URL — http://ims2002.nw.ru/02-r4f13.html