exam06 4 - stankin/design-part-1 GitHub Wiki

Понятия онтологии и семантической сети. Применение онтологий в проектировании информационных систем.

Реферат к лекции 5-6. Методологии проектирования программных и информационных средств.

Выполнила: Трунина Полина ИДБ-18-08

Проверил: Щепетильников Даниил ИДБ-18-08

Онтология

Онтология - это точная cпецификация некоторой области, которая включает в себя словарь терминов предметной облаcти и множество логических связей (типа «элемент-класс», «часть-целое»), которые опиcывают, как эти термины cоотносятся между собой. Фактически это иерархический понятийный скелет предметной области.

Понимание термина «онтология» зависит от контекста и целей его использования. В целом онтология, или концептуальная модель предметной области, состоит из иерархии понятий предметной области, связей между ними и законов, которые действуют в рамках этой модели.Онтология строится как сеть, состоящая из концептов и связей между ними. Связи могут быть различного типа (например, «является», «состоит из», «является исполнителем» и т. п.). Для выполнения роли общего языка будет включать в себя словарь, описывающий предметную область и набор эксплицитных (явных) интенсиональных определений, задающих смысл элементов словаря на языке логической теории.

Онтологии в значительной степени можно ассоциировать с семантическими сетями, как инструментом моделирования и структуризации знаний. Многие понятия и принципы реализации, а также графическая форма представления на начальном этапе структуризации, являются в онтологиях сходными с семантическими сетями. Многое в онтологиях сильно пересекается с уже давно принятым в информатике и лингвистике понятием тезауруса.

В инженерии знаний под онтологией понимается детальное описание некоторой предметной или проблемной области, которая иcпользуется для формального и декларативного определения её концептуализации. Онтологии позволяют представить понятия в таком виде, что они cтановятся пригодными для машинной обработки.

В центре большинства онтологий находятcя классы, которые описывают понятия предметной облаcти. Cлоты (атрибуты или параметры) описывают свойства классов и экземпляров. Здесь прослеживаются аналогии с фреймовым подходом к формализации знаний.

На формальном уровне онтология – это cистема, состоящая из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. Практически все модели онтологии cодержат определённые концепты (понятия, классы), свойства концептов (атрибуты, роли), отношения между концептами (зависимости, функции) и дополнительные ограничения, которые определяются аксиомами. Концептом может быть опиcание задачи, функции, действия, cтратегии, процесса и т.д.

Классификация онтологических систем.

  • метаонтология – содержит общие понятия и отношения, не зависящие от предметной области («объект», «свойство», «значение» и т.п.);
  • предметная онтология – содержит понятия, описывающие конкретную предметную область и отношения, семантически значимые для данной предметной области;
  • онтология задач (и методов) – содержит в качестве понятий типы решаемых задач, а отношения специфицируют декомпозицию задач на подзадачи;
  • прикладная онтология (онтология приложения) – описывает концепты, зависящие как от предметной области, так и от задач
  • сетевая онтология – используется для описания конечных результатов действий, выполняемых объектами предметной области или задачи.

Семантическая сеть

Семантическая сеть - структура для представления знаний в виде узлов, соединенных дугами. Самые первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода, а многие современные версии до сих пор сходны по своим характеристикам с естественным языком. Однако последние версии семантических сетей стали более мощными и гибкими и составляют конкуренцию фреймовым системам, логическому программированию и другим языкам представления знаний.

Начиная с конца 50-ых годов прошлого века были созданы и применены на практике десятки вариантов семантических сетей. Несмотря на то, что терминология и их структура различаются, существуют сходства, присущие практически всем семантическим сетям:

  1. Узлы семантических сетей представляют собой концепты предметов, событий, состояний.
  2. Различные узлы одного концепта относятся к различным значениям, если для них не помечено, что они относятся к одному концепту.
  3. Дуги семантических сетей создают отношения между узлами-концептами (пометки над дугами указывают на тип отношения).
  4. Некоторые отношения между концептами представляют собой лингвистические падежи, такие как агент, объект, реципиент и инструмент (другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями).
  5. Концепты организованы по уровням в соответствии со степенью обобщенности. Как пример, сущность, живое существо, животное, плотоядное.

Представление

Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникли как попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись, и что обе эти формы являются не конкурирующими, а взаимодополняющими.

  • Графическое представление

Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами. Это наиболее удобно воспринимаемая человеком форма. Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка.

  • Математическая запись

В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга — предикату.

  • Лингвистическая запись

В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно- поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем.

Классификация семантических сетей

По количеству типов отношений:

  • Однородные
  • Неоднородные

По арности:

  • Бинарные
  • N-арные

По размеру:

  • Для решения конкретных задач
  • Отраслевые семантические сети
  • Глобальная семантическая сеть

Семантические отношения

  • функциональные связи (определяемые обычно глаголами «производит», «влияет»…);
  • количественные (больше, меньше, равно…);
  • пространственные (далеко от, близко от, за, под, над…);
  • временные (раньше, позже, в течение…);
  • атрибутивные (иметь свойство, иметь значение);
  • логические (И, ИЛИ, НЕ);
  • лингвистические.

Применение онтологий

Семантика изучает законы смысла. Центральным понятием семантики является понятие значения. Обычно для разъяснения структуры языкового значения используется «семантический треугольник» или «треугольник Фреге».

I. Вещь, предмет, явление действительности и т. д. Иное название – денотат.

II. 3нак: в лингвистике, например, фонетическое слово или написанное слово; в математике – математический символ; иное название, принятое особенно в философии и математической логике, – имя.

III. Понятие о предмете, вещи. Иные названия: в лингвистике – сигнификат, десигнат, в математике – смысл имени, или концепт денотата.

Можно выделить 9 наиболее популярных типов примеров использования онтологий:

  1. Общий словарь (Common Vocabulary) - Онтология предоставляет общий словарь для описания информационных ресурсов, а также общения сотрудников. Общий словарь снижает неоднозначность соответствия между знаком, понятием и денотатом.
  2. Поиск (Search) - При использовании онтологий поисковая машина будет выдавать только такие ресурсы, где упоминается в точности искомое понятие, а не произвольные страницы, в тексте которых встретилось данное многозначное ключевое слово.
  3. Указатель (Systematized Index) - В данном применении онтологии используются в качестве структурированного указателя на ресурсы. Онтология предоставляет возможности для навигации, по аналогии с папками на домашнем компьютере или каталогом ресурсов. Часто пользователь не может точно сформулировать запрос, например, из-за новизны предметной области для него или нечеткости информационной потребности. В таком случае использование указателя (каталога) может быть более эффективной стратегией, нежели формирование запросов.
  4. Схема данных (Data Schema) - Онтология может использоваться для описания и спецификации схемы базы данных.
  5. Посредник для интеграции знаний (Media for Knowledge Sharing) - Онтологии позволяют интегрировать (обмениваться) знания, находящиеся в различных источниках, – документы, базы данных и знаний, сотрудники. Потребителями интегрированной информации могут быть как люди, так и программы (или программные агенты).
  6. Семантический анализ (Semantic Analysis) - К знаниям, представленным с помощью онтологий, могут быть применены автоматизированный логический вывод и семантическая обработка, которые позволяют проводить семантический анализ и создавать новые знания. Одним из распространенных примеров вывода является автоматическая классификация объектов с помощью инструментов логического вывода (inference engine).
  7. Извлечение информации (Information Extraction) - Данное применение онтологии позволяет выявлять экземпляры класса и отношения между ними в тексте на естественном языке, а также записывать выявленные факты в семантическое хранилище (базу знаний).
  8. Спецификация структуры моделей знаний (Usage as a Rule Set for Knowledge Models) - Онтология используется для спецификации структуры моделей знаний, то есть баз знаний.
  9. Систематизация знаний (Systematizing Knowledge) - Структурировать знания об окружающем пространстве – для отдела персонала это может быть каталог компетенций сотрудников, для службы техобслуживания и ремонта – справочник оборудования и инструментов, для маркетологов – сегменты рынка, для бизнес-аналитика – справочник бизнес-процессов. Ориентиром в этой области применения онтологий на предприятии является комплексное структурированное описание архитектуры предприятия (enterprise architecture).

Применение онтологий в проектировании информационных систем.

В явном виде онтологии используются как источники данных для многих компьютерных приложений (для информационного поиска, анализа текстов, извлечения знаний и в других информационных технологиях), позволяя более эффективно обрабатывать сложную и разнообразную информацию. Этот способ представления знаний позволяет приложениям распознавать те семантические отличия, которые являются само собой разумеющимися для людей, но не известны компьютеру.

Онтологии широко используются во всех областях, занимающихся обработкой данных на естественном языке. В связи с использованием онтологий в различных приложениях возникла необходимость создания стандартизированных способов их представления. Началось развитие разнообразных языков, которые могли бы применяться повсеместно во всех системах. Самыми известными на сегодня языками являются RDF и OWL. Возникло также большое количество редакторов для создания, пополнения и изменения онтологий. Каждое из этих средств обычно направлено на работу с определенным форматом данных и обладает своими особенностями.

Онтологии разрабатываются и могут быть использованы при решении различных задач, в том числе для совместного применения людьми или программными агентами, для возможности накопления и повторного использования знаний в предметной области, для создания моделей и программ, оперирующих онтологиями, а не жестко заданными структурами данных, для анализа знаний в предметной области. Для обобщения и «осмысления» разделов информации необходимо определить свою онтологию, которая должна описывать терминологию.

RDF предоставляет простой, но мощный язык описания ресурсов, основанный на триплетах (triple-based) «СубъектПредикат-Объект» и спецификации URI. В 1999 году RDF получает статус рекомендации. Этот шаг в направлении улучшения функциональности и обеспечения интероперабельности (т. е. возможности обмениваться данными, несмотря на их разнородность) в Сети считается одним из важнейших. Концептуально RDF дает минимальный уровень для представления знаний в Сети. Спецификация RDF опирается на ранние стандарты, лежащие в основе Web:

• Unicode служит для представления символов алфавитов различных языков,

• URI используется для определения уникальных идентификаторов ресурсов,

• XML и XML Schema – для структурирования и обмена информацией и для хранения RDF (XML синтаксис RDF).

Ресурсом называют все, что описывается средствами RDF. Это может быть обыкновенная Web-страница или какая-то ее часть, например, отдельный элемент HTML или XML разметки, являющийся частью описываемого документа. Также ресурсом может быть целая коллекция страниц, например, отдельно взятый Web-сайт. И, наконец, в качестве ресурса может выступать нечто, не являющееся доступным непосредственно через Интернет, например, произвольный предмет из мира вещей. Одним словом, все, чему можно приписать некоторый URI (универсальный идентификатор) или URI с добавлением внутреннего имени объекта (имени якоря в HTML) может стать ресурсом и быть описано при помощи RDF.

Под свойством следует понимать некий аспект, характеристику, атрибут или отношение, используемое для описания ресурса. Каждое свойство имеет свой специфический смысл, допустимые значения, тип ресурсов, к которым оно может быть применено, а также отношения с другими свойствами.

Согласно спецификации, значение свойства может иметь один из двух типов. Первый – это ресурс, задаваемый некоторым URI. Второй тип – литерал – есть некоторое текстовое значение характеристики. Впрочем, литерал может выражать собой значение любого примитивного типа данных, присутствующего в XML. Его тест также может содержать в себе некую разметку, например, XML, но отличительной особенностью такой разметки является то, что она не обрабатывается RDF-процессором и воспринимается как обычная строка.

Источники:

Основные понятия

Классификация семантических сетей и семантические отношения

Применение онтологий в проектировании информационных систем

Применение онтологий