Модели представления знаний

Важное место в теории искусственного интеллекта занимает проблема представления знаний, являющаяся, по мнению многих исследователей, ключевой. В общем виде модели представления знаний могут быть условно разделены на следующие классы:

1. Концептуальные модели используют эвристический метод, что позволяет при распознавании проблемы уменьшать время для ее предварительного анализа. Концептуальное описание не дает гарантии того, что метод может быть применен во всех соответствующих практических ситуациях. Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую модель.

2. Эмпирические модели – это модели, как правило, описательного характера. Они могут варьировать от простого набора правил до полного описания.

3. Декларативные модели представления знаний основываются на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантические аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности. Эти модели представляют собой обычно множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния. Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

4. Процедурные модели представляют собой модели, в которых знания содержатся в процедурах небольших программ, которые определяют, как выполнять характерные действия. При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.

При процедурном представлении знаний семантика заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. Статическая база знаний содержит только утверждения, приемлемые в данный момент, которые могут быть изменены или удалены. Общие знания и правила вывода представлены в виде специальных целенаправленных процедур, активизирующихся по мере надобности. Для повышения эффективности генерации вывода в систему добавляются знания о том, каким образом использовать накопленные знания для решения конкретной задачи.

Преимущества процедурных моделей: имеют большую эффективность механизмов вывода за счет введения дополнительных знаний, способны смоделировать практически любую модель представления знаний, имеют большую выразительную силу, которая проявляется в расширенной системе выводов.

Представление знаний в экспертных системах производится с помощью специально разработанных моделей.

3.1. Логические модели.

Классическим механизмом представления знаний в системах является исчисление предикатов. Предикатом или логической функцией называется функция от любого числа аргументов, принимающая истинные значения 1 и 0. В исследованиях по искусственному интеллекту данная модель стала использоваться начиная с 50-х годов.

В системах, основанных на исчислении предикатов, знания представляются с помощью перевода утверждений об объектах некоторой предметной области в формулы логики предикатов и добавления их как аксиом в систему. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода. Однако действительность не укладывается в рамки классической логики, потому что человеческая логика, применяемая при работе с неструктурированными знаниями – это интеллектуальная модель с нечеткой структурой. При использовании нечеткой логики часто применяются два метода логического вывода: прямой и обратный метод.

Достоинство логических моделей:

– модель базируется на классическом аппарате математической логики, методы которой хорошо изучены и обоснованы;

– имеются достаточно эффективные процедуры вывода;

– база знаний предназначена для хранения большого количества аксиом, из которых по правилам вывода можно получать другие знания.

Основной недостаток: логики, адекватно отражающей человеческое мышление, еще не создано

Продукционные модели.

Впервые были предложены Постом[2] в 1943 г., применены в системах искусственного интеллекта в 1972 г. При исследовании процессов рассуждения и принятия решений человеком пришли к выводу, что человек в процессе работы использует продукционные правила. Правило продукций (англ. Production) – это правило вывода, порождающее правило.

Суть правила продукции для представления знаний состоит в том, что в левой части ставится в соответствие некоторое условие, а в правой части действие: если , то . Если это действие соответствует значению «истина», то выполняется действие, заданное в правой части продукции. В общем случае под условием понимается некоторое предложение, по которому осуществляется поиск в базе знаний, а под действием – действия, выполняемые при успешном исходе поиска.

Продукционные модели – это набор, правил вида «условия – действие», где условиями являются утверждения о содержимом некой базы данных, а действия представляют собой процедуры, которые могут изменять содержимое базы данных. Например: Если коэффициент соотношения заемных и собственных средств превышает единицу при низкой оборачиваемости, то финансовая автономность и устойчивость критическая.

Правила (в них выражены знания) и факты (их оценивают с помощью правил) являются основным структурным элементом систем искусственного интеллекта. Часто в практики управления правила выводятся эмпирически из совокупности фактов, а не путем математического анализа или алгоритмического решения. Такие правила называют эвристиками.

В продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил – машина вывода, связывает знание воедино и выводит из последовательности знаний заключение.

В процессе обработки информации часто применяются два метода: прямой и обратный. В случае прямого подхода – метода сопоставления для поиска решений образцом служит левая часть продукционного правила – условие и задача решается в направлении от исходного состояния к целевому. В случае обратного подхода обработка информации осуществляется по методу генерации или выдвижения гипотезы и ее проверки. Проверяются правые части продукционных правил с целью обнаружения в них искомого утверждения. Если такие продукционные правила существуют, то проверяется, удовлетворяет ли левая часть продукционного правила. Если да, то гипотеза подтверждается, если нет – отвергается.

В продукционных системах выделяют три основные компоненты:

– неструктурированная или структурированная БД;

– набор продукционных правил или продукций, каждая продукция состоит из двух частей:

a) условий (антецедент); в этой части определяются некоторые условия, которые должны выполняться в БД для того, чтобы были выполнены соответствующие действия;

b) действий (консеквент); эта часть содержит описание действий, которые должны быть совершены над БД в случае выполнения соответствующих условий. В простейших продукционных системах они только определяют, какие элементы следует добавить (или иногда удалить) в БД.

– интерпретатор, который последовательно определяет, какие продукции могут быть активированы в зависимости от условий, в них содержащихся; выбирает одно из применимых в данной ситуации правил продукций; выполняет действие из выбранной процедуры.

Продукционные модели близки к логическим моделям, но более наглядно отражают знания, поэтому являются наиболее распространенными средствами представления знаний. Чаще всего они применяются в промышленных экспертных системах, в качестве решателей или механизмов выводов.

Достоинства продукционных моделей:

– наглядность;

– высокая модульность – отдельные логические правила могут быть добавлены в базу знаний, удалены или изменены независимо от других, модульный принцип разработки систем позволяет автоматизировать их проектирование;

– легкость внесения дополнений и изменений;

– простота логического вывода.

Недостатки продукционных моделей:

– при большом количестве продукционных правил в базе знаний, изменение старого правила или добавления нового приводит к непредсказуемым побочным эффектам;

– затруднительна оценка целостного образа знаний, содержащего в системе.

Фреймовые модели.

Фреймы были впервые предложены в качестве аппарата для представления знаний М. Минским[3] в 1975 г. Фреймовые модели представляют собой систематизированную в виде единой теории технологическую модель памяти человека и его сознания. Под фреймом понимают минимальные структуры информации, необходимые для представления класса объектов, явлений или процессов.

Фрейм можно представить в виде сети, состоящей из вершин и дуг (отношений), в которых нижние уровни фрейма заканчиваются слотами (переменными), которые заполняются конкретной информацией при вызове фрейма. Значением слота может быть любая информация: текст, числа, математические соотношения, программы, ссылки на другие фреймы. На заполнение слотов могут быть наложены ограничения, например цена не может быть отрицательной. Ниже приведены основные свойства фреймов.

– Наследование свойств. Все фреймы взаимосвязаны и образуют единую фреймовую структуру, поэтому достаточно просто производить композицию и декомпозицию информационных структур. Например: слот более низкого уровня указывает на слот более высокого уровня иерархии, откуда неявно наследуются (переносятся) значения аналогичных слотов, причем наследование свойств может быть частичным.

– Базовый тип. При эффективном использовании фреймовой системы, можно добиться быстрого понимания сущности данного предмета и его состояния, однако для запоминания различных позиций в виде фреймов необходимы большие объемы памяти. Поэтому только наиболее важные объекты данного предмета запоминаются в виде базовых фреймов, на основании которых строятся фреймы для новых состояний. При этом каждый фрейм содержит слот, оснащенный указателем подструктуры, который позволяет различным фреймам совместно использовать одинаковые части.

– Процесс сопоставления – процесс, в ходе которого проверяется правильность выбора фрейма, осуществляется в соответствии с текущей целью и информацией, содержащийся в данном фрейме. Фрейм содержит условия, ограничивающие значения слота, а цель используется для определения, какое из этих условий, имея отношение к данной ситуации, является существенным.

– Иерархическая структура, особенность которой заключается в том, что информация об атрибутах, которую содержит фрейм верхнего уровня, совместно используются всеми связанными с ним фреймами нижних уровней.

– Сети фреймов. Поиск фрейма, подобного предыдущему, осуществляется с использованием указателей различия. Поиск возможен благодаря соединению фреймов, описывающих объекты с небольшими различиями, с данными указателями и образованию сети подобных фреймов.

– Отношения «абстрактное – конкретное» и «целое – часть». Иерархическая структура фреймов основывается на отношениях «абстрактное – конкретное». На верхних уровнях расположены абстрактные объекты, на нижних уровнях – конкретные объекты. Объекты нижних уровней наследуют атрибуты объектов верхних уровней. Отношение «целое – часть» касается структурированных объектов и показывает, что объект нижнего уровня является частью объекта верхнего уровня. Наибольшее практическое применение получили отношения «абстрактное – конкретное».

Схема фрейма приведена на рис. 4 Теория фреймов послужила толчком к разработке языков представления знаний. Например, концепция объектно-ориентированного программирования в традиционных языках программирования использует понятия, близкие к фрейму. Модели фреймов имеют следующие достоинства:

– способность отображать концептуальную основу организации памяти человека;

– естественность и наглядность представления, модульность;

– поддержку использования значений слотов по умолчанию.

– универсальность, так как позволяют отобразить все многообразие знаний.

Рисунок 4

В отличие от моделей других типов во фреймовых моделях более жесткая структура, которая называется протофреймом. Основной недостаток: отсутствие механизмов управления выводом, который частично устраняется при помощи присоединенных процедур, реализуемый силами пользователя системы.

В системах искусственного интеллекта могут использоваться одновременно несколько моделей представления знаний. Например, фрейм можно рассматривать как фрагмент семантической сети, предназначенной для описания объекта (ситуации) проблемной области со всей совокупностью присущих ему свойств. Значением некоторых слотов фрейма может быть продукция. В продукционных моделях используются некоторые элементы логических и сетевых моделей. Поэтому появляется возможность организовывать эффективные процедуры вывода и наглядное отображение знаний в виде сетей; отсутствие жестких ограничений позволяет изменять интерпретацию элементов продукции.

Семантические сети.

Способ представления знаний с помощью сетевых моделей наиболее близок к тому, как они представлены в текстах на естественном языке. В его основе лежит идея о том, что вся необходимая информация может быть описана как совокупность троек: объекты или понятия и бинарное отношение между ними.

Наиболее общей сетевой моделью представления знаний являются семантические сети, в которых узлы и связи представляют собой объекты или понятия и их отношения, таким образом, что можно выяснить их значение. Это связано с тем, что в данной модели имеются средства реализации всех характерных для знаний свойств: внутренней интерпретации, стуктурированности, семантической метрики и активности. Впервые понятие семантических сетей было введено в 60-х годах для представления семантических связей между концепциями слов.

Семантические сети применительно к задачам проектирования структуры баз данных экспертных систем используются в сравнительно узком диапазоне – для отражения структуры понятий и структуры событий. Они представляют собой модель, основой которой является формализация знаний в виде ориентированных графов с помеченными дугами, которая позволяют структурировать имеющуюся информацию и знания. Вершины графа соответствуют конкретным объектам, а дуги, их соединяющие, отражают имеющиеся между ними отношения. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации и т.п.

В семантических сетях, используются следующие отношения:

– лингвистические, включающие в себя отношения типа «объект», «агент», «условие», «место», «инструмент», «цель», «время» и др.;

– атрибутивные, к которым относят форму, размер, цвет и т.д.;

– характеризации глаголов, т. е. род, время, наклонение, залог, число;

– логические, обеспечивающие выполнение операций для исчисления высказываний (дизъюнкция, конъюнкция, импликация, отрицание);

– квантифицированные, т. е. использующие кванторы общности и существования;

– теоретико-множественные, включающие понятия «элемент множества», «подмножество», «супермножество» и др.

Различают:

– интенсиональную семантическую сеть, которая описывает предметную область на обобщенном, концептуальном уровне;

– экстенсиональную семантическую сеть, в которой производится конкретизация и наполнение фактическими данными.

Статические базы знаний, представленные с помощью семантических сетей, могут быть объектом действий, производимых активными процессами. Стандартные операции включают в себя процессы поиска и сопоставления, с помощью которых определяется, представлена ли в семантической модели (и где именно) специфическая информация.

Достоинство семантической сети:

– описание объектов и событий производится на уровне очень близком к естественному языку;

– обеспечивается возможность соединения различных фрагментов сети;

– отношения между понятиями и событиями образуют небольшое, хорошо организованное множество;

– для каждой операции над данными или знаниями можно выделить некоторый участок сети, который охватывает необходимые в данном запросе характеристики;

– обеспечивается наглядность системы знаний, представленной графически:

– близость структуры сети, представляющей знания, семантической структуре фраз на естественном языке;

– соответствие сети современным представлениям об организации долговременной памяти человека.

Недостатки семантической сети:

– сетевая модель не дает ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны;

– сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода и планирования.

Семантические сети нашли применение в основном в системах обработки естественного языка, частично в вопросно-ответных системах, а также в системах искусственного видения. В последних семантические сети используются для хранения знаний о структуре, форме и свойствах физических объектов. В области обработки естественного языка с помощью семантических сетей представляют семантические знания, знания о мире, эпизодические знания (т.е. знания о пространственно-временных событиях и состояниях).

Пример: Поставщик отгрузил товар из склада автотранспортом. На рис. 5. представлена интенсиональная семантическая модель, а на рис. 6. – экстенсиональная семантическая сеть. Факты обозначены овалом, понятия и объекты прямоугольником.

Рисунок 5

Рисунок 6

Методы, модели и алгоритмы формирования баз знаний

Похожие статьи.