Лекция №2-3 «Проблемная и предметная области»,..

2. Предметная и проблемная область
В нашей стране современное состояние разработок в области интеллектуальных систем можно охарактеризовать как стадию всевозрастающего интереса среди широких слоев экономистов, финансистов, преподавателей, инженеров, медиков, психологов, программистов, лингвистов.
К сожалению, этот интерес имеет пока достаточно слабое материальное подкрепление - явная нехватка учебников и специальной литературы, отсутствие символьных процессоров и рабочих станций искусственного интеллекта, ограниченное финансирование исследований в этой области, слабый отечественный рынок программных продуктов для разработки экспертных систем.
Процесс создания интеллектуальной системы, в том числе экспертной системы, требует участия высококвалифицированных специалистов в области искусственного интеллекта, которых пока выпускает небольшое количество высших учебных заведений страны.
Предметная область - некоторая совокупность реальных объектов и связей между ними. Каждый объект обладает определённым набором свойств (атрибутов).
Современные экспертные системы широко используются для тиражирования опытам знаний ведущих специалистов практически во всех сферах экономики. Традиционно знания существуют в двух видах - коллективный опыт и личный опыт.
Если большая часть знаний в предметной области представлена в виде коллективного опыта (например, высшая математика), эта предметная область не нуждается в экспертных системах .
Если в предметной области большая часть знаний является личным опытом специалистов высокого уровня (экспертов), если эти знания по каким-либо причинам слабо структурированы, такая предметная область скорее всего нуждается в экспертной системе.
[ Cкачайте файл, чтобы посмотреть картинку ]
Таким образом, можно выделить следующие примеры предметных областей:
Медицина
Образование
Строительство
Математика
Биология
И т.д.
Проблемная область может быть определена предметной областью и задачами, решаемыми в предметной области.
Существует три классификации проблем (задач):
С точки зрения пользователя.
С точки зрения разработчика (динамические и статистические).
По степени сложности.
В настоящее время в области искусственного интеллекта выделено шесть основных проблем (направлений развития).
Представление знаний.
В рамках этой проблемы решаются задачи, связанные с формализацией и представлением знаний в памяти ИнС. Для этого разрабатываются специальные модели представления знаний и языки для описания знаний, выделяются различные типы знаний. Изучаются источники, из которых ИнС может черпать знания, и создаются процедуры и приемы, с помощью которых возможно приобретение знаний для ИнС. Проблема представления знаний для ИнС чрезвычайно актуальна, так как ИнС это система, функционирование которой опирается на знания о проблемной области, которые хранятся в ее памяти (рис. 1.10).

Манипулирование знаниями.
Для того чтобы знаниями можно было пользоваться при решении задач, ИнС должна уметь:
оперировать знаниями;
пополнять знания (с помощью разрабатываемых способов на основе неполного описания знаний);
классифицировать хранящиеся в системе знания;
обобщать по тем или иным разработанным процедурам знания;
формировать на основе знаний абстрактные понятия;
осуществлять достоверный и правдоподобный вывод на основе имеющихся знаний с помощью создаваемых методов;
пользоваться моделями рассуждений, имитирующими особенности человеческих рассуждений.
Манипулирование знаниями и представление знаний эти два направления тесно связаны друг с другом. Создающаяся в настоящее время теория баз знаний включает исследования, относящиеся как к первому, так и ко второму направлению (рис. 1.11).

Общение.
В круг задач этого направления входят:
проблема понимания связных текстов
понимание речи и синтез речи;
теория моделей коммуникации между человеком и ИнС;
задачи формирования объяснений действий ИнС, которые она должна уметь порождать по просьбе человека;
комплекс задач, связанных с интеграцией в единый внутренний образ сообщений различной модальности (речевых, текстовых, зрительных и т.п.), полученных в процессе коммуникации.
На основе исследований в этом направлении формируются методы построения лингвистических процессоров (ЛП), вопросно-ответных систем (ВОС), диалоговых систем (ДС) и других ИнС, целью которых является обеспечение комфортных условий для общения человека с ИнС (рис. 1.12).

Восприятие.
Это направление включает (рис. 1.13):
проблемы анализа трехмерных сцен;
разработку методов представления информации о зрительных образах в базе знаний;
создание методов перехода от зрительских сцен к их текстовому описанию и методов обработки перехода;
разработку процедур когнитивной графики (КГ);
создание средств для порождения зрительских сцен на основе внутренних представлений в ИнС.
Существуют большие возможности в повышении уровня интеллектуальности ИнС за счет обработки зрительной (образной) информации и соотнесения ее с обработкой символьной (текстовой) информации.
Обучение.
Основная черта ИнС это способность к обучению, т.е. решение задач, с которыми они ранее не встречались.
Для этого необходимо:
создать методы формализации условий задачи по описанию проблемной ситуации или по наблюдению за этой ситуацией;
научиться переходу от известного решения частных задач (примеров) к решению общей задачи (синтез);
создать приемы декомпозиции исходной для ИнС задачи на более мелкие так, чтобы они для ИнС оказались известными (анализ);
разработать нормативные и декларативные модели самого процесса обучения;
создать теорию подражательного поведения.
И такой перечень задач можно продолжить.
Поведение.
Так как ИнС должны действовать в некоторой окружающей среде, то необходимо разработать специальные поведенческие процедуры (бихевиористические модели), которые позволили бы им адекватно взаимодействовать с окружающей средой, другими ИнС и людьми. Для достижения такого взаимодействия необходимо вести исследования в ряде направлений и создать модели целесообразного поведения, нормативного поведения, ситуационного поведения, специальные методы многоуровневого планирования и коррекции планов в динамических ситуациях. Как было отмечено выше, создание ИнС имеет существенные отличия от разработки обычного программного продукта, а слепое копирование методологий, принятых в традиционном программировании, чаще всего приводит к отрицательному результату. Самым первым вопросом, который необходимо решать всякий раз перед началом разработки конкретной ИнС, является вопрос: а следует ли вообще разрабатывать ИнС для данного приложения? Насколько оправдано будет использование методов и средств ИнС для данной задачи и даст ли это ощутимый эффект? Эти вопросы, возникающие перед заказчиком (конечным пользователем) и инженером по знаниям, необходимо решать на этапе предварительного системного анализа конкретной предметной области (ПО).
Лекция №3. Структура понятий и представление понятий
При построении описания выделенного фрагмента реальной действительности (предметной области ПО) одним из основных допущений является предположение о том, что мир состоит из независимых объектов (предметов, процессов, вещей или сущностей), которые могут быть уникально идентифицированы.
В дальнейшем при обозначении реальных объектов ПО для однозначности будем использовать термин сущность. Определение 2.1. Сущность это объект произвольной природы, принадлежащий реальному или воображаемому (виртуальному) миру.
На самом общем уровне сущности делятся на следующие категории (классы):
предмет,
свойство (атрибут),
состояние,
процесс,
событие,
оценка,
модификатор,
квантификатор,
модальность.
Любое понятие относится к одной из этих категорий. Сущность ПО необходимо адекватным образом представить в памяти вычислительной машины, чтобы с ее помощью обеспечить поиск, анализ, обработку и выдачу накопленной информации в форме, удобной для принятия решений.
Эта задача может быть решена путем использования соответствующих средств описания ПО, предоставляющих необходимые базовые понятия, инвариантные по отношению к любым ПО, и правила, позволяющие строить более сложные синтаксические конструкции на основе базовых.
Средства предоставления информации о ПО различные исследователи называют по-разному.
Под понятием (концептом) понимается класс сущностей, объединяемых на основе общности признанных (атрибутивных) структур. Следует отметить, что наиболее естественным для человека способом описания любых сущностей ПО является соотнесение с ними в собственной памяти совокупности определенных понятий (простых и сложных), образующих понятийную структуру предметной области, а в памяти ЭВМ как правило, некоторых объектов, состоящих из атрибутов со значениями (хотя это, безусловно, не единственный способ реализации описания понятий в памяти ЭВМ). В ряде случаев вообще не делается попыток различения понятийной структуры и объектов предметной области, а сразу отмечается, что предметную область можно характеризовать совокупностью объектов, характеристик объектов и отношений между объектами. Справедливость подобных утверждений будет вполне очевидна после рассмотрения некоторых приведенных ниже определений.
Определение 2.2. Под простым понятием понимается тройка, состоящая из имени, интенсионала и экстенсионала понятия. Имя понятия любой идентификатор;
интенсионал понятия множество атрибутов (свойств) понятия с областями их определения;
экстенсионал понятия совокупность кортежей значений, удовлетворяющих интенсионалу;
атрибуты первичные характеристики данной ПО, не подлежащие дальнейшей структуризации.
Определение 2.3. Сложные понятия это понятия, образованные из ранее определенных понятий применением некоторых правил.
Следует добавить, что простота или сложность понятий является явлением относительным и изменяющимся с развитием науки, причем изменение статуса понятия возможно и в процессе разработки конкретной ИнС. Отметим также, что для определения понятийной структуры области необходимо выявление отношений на множестве понятий, которые являются отражением объективных законов ПО или субъективных мнений специалистов. Напомним, что классические модели данных (иерархические и сетевые) базируются на таких понятиях, как запись, атрибут и связь. Современные модели данных (реляционные и семантические) используют математическое понятие отношение, которое задается на множествах, и понятие объекта для представления сущностей ПО в БД
В соответствии с данными определениями отметим следующее. Структура признаков это совокупность взаимосвязанных признаков (атрибутов), характеризующих понятие, выделяющих его среди других понятий. Признаки, входящие в совокупность, называются существенными. Их состав определяется исходя из множества понятий, в котором необходимо выделить рассматриваемое.
Совокупность существенных признаков, характеризующих понятие, называется его содержанием (интенсионалом). В силу ограниченного числа существенных признаков Al5...,Aj,...,Ak будем представлять содержание понятия А множеством A = {A1,...,Aj,...,Ak}.
При этом содержание понятия должно отвечать взаимнопротивоположным требованиям полноты и неизбыточности. Совокупность существенных признаков можно рассматривать как координаты k-мерного признакового пространства. Оно должно отличаться от признакового пространства, характеризующего другое понятие. Если отойти от двух градаций i-ro признака его наличия, либо отсутствия в анализируемом понятии и определить меру схожести, то можно решать задачу выявления аналогии понятий. Класс сущностей, объединяемых в понятие, называется его объемом (экстенсионалом).
Сущности, входящие в объем понятия и называемые экземплярами, вариантами или фактами, задаются перечислением. Объем понятия, в отличие от его содержания, может варьироваться заданием ограничений. По этой причине объем понятия, как правило, задается перечислением не экземпляров Ai, i= 1, 2, ..., а признаков, которым они удовлетворяют: А = {А{:VAj G A,j = 1,..., к}.
Знаковое представление понятий
Понятия именуются с помощью слов или словосочетаний естественного языка, которые играют роль знаков или имен. Таким образом, носителем знаковой формы представления знания является естественный язык. Он позволяет с применением символов (букв и цифр) зафиксировать любую информацию, в том числе и графическую. Такая специфическая форма информации, как музыкальная, записывается с помощью знаков специального вида (нотная запись). Для представления понятия в естественном языке используется слово или словосочетание, называемое именем. Оно играет роль идентификатора, выделяя понятие среди остальных. Имя или знак (sign) единица языка, отражающая семантически сущность отображаемого мира, а синтаксически субъект или объект высказывания.
В пропозициональной функции имя представляется предметной переменной или константой. Иными словами, знак это заменитель некоторого объекта, явления или процесса, используемый для накопления, хранения, переработки и передачи информации или знаний. Пара, состоящая из имени и обозначаемого, в семиотике называется знаковой ситуацией. Сущности ПО, на которые можно ссылаться с помощью имени или знака, как уже упоминалось, называются денотатами. Денотат знака это конкретная сущность или предмет, на которые указывает данный знак. Другими словами, денотат знака является способом интерпретации данного знака в рамках некоторой ситуации, рассматриваемой в ПО. Денотат знака это значение, которое может иметь знак в рамках данной знаковой ситуации [46]. Можно указать на следующие основные свойства знаковой ситуации: имена способны замещать денотаты. Например, имя понятия АВТОМОБИЛЬ может использоваться в качестве заместителя любого конкретного автомобиля; имя нетождественно денотату, оно не может полностью заменить денотат. Так, при алгебраических преобразованиях мы можем использовать буквенные обозначения чисел. Однако, если необходимо вычислить числовое значение выражения, то требуется подставить конкретные числа (денотаты) вместо букв; связь «имя денотат» многозначна, т. е. некоторое имя может обозначать множество денотатов омонимия, и наоборот, одному денотату можно поставить в соответствие несколько имен синонимия. Отношение, связывающее обозначаемую сущность (denotat), отражающее ее понятие (consept) и его имя (designat), графически выражается треугольником Фреге (рис. 2.1). Сплошными линиями изображен базовый треугольник Фреге, характеризующий однозначное отношение. Оно является желательным, но не всегда достижимым. Пунктирными линиями изображены два треугольника, представляющие два случая неоднозначности отношения. Треугольник «сущность 1, понятие 1, имя 2» в сочетании с базовым иллюстрирует случай синонимии. Сущности 1 и понятию 1 ставятся в соответствие два имени, называемые синонимами. Это слова или словосочетания, тождественные или близкие по своему значению, например булева алгебра и алгебра логики.
Источниками синонимии являются:
русское и иностранное происхождение {рынок и маркет);
полное и краткое обозначение (килограмм и кг);
фамильный и отражающий существенные признаки (метод Парето и метод недоминируемых альтернатив);
именование сущности по разным признакам (северный и холодный климат);
различное авторское именование на этапе формирования новой терминологии (рабочее и функциональное диагностирование).
Треугольник «сущность 2, понятие 2, имя 1» в сочетании с базовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и 2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что свидетельствует о его многозначности. В случае полисемии понятия 1 и 2 характеризуются общим происхождением (одна статья в толковом словаре), например сферы небесная и интересов. При омонимии понятия 1 и 2 имеют различное происхождение.
Например, в бытовом значении слово ключ характеризует предмет, связанный с безопасностью помещений, а в программировании под ключом понимают программный код, используемый для поиска данных. Смысл таких слов можно распознать только по контексту. К частному случаю омонимии можно отнести омографы слова, различающиеся звучанием и обозначающие разные понятия (замок и замок). Определения понятий являются результатом соглашения. Оно достигается, например, при разработке терминологических стандартов. Такие определения называются нормативными. Однако в реальной жизни могут использоваться и ненормативные определения. Наиболее подверженным изменению в определении является признак, характеризующий роль или назначение понятия, т.е. его прагматику.
В связи с этим ДА. Поспелов предложил дополнить треугольник Фреге 4-й вершиной, характеризующей прагматику понятия (четырехугольник Поспелова). Он изображен на рис. 2.2. Схема и формулы понятий. Как уже отмечалось, сущности, составляющие объем понятия, различаются с помощью признаков. Признаковые отношения предписывают одним понятиям выполнять роль некоторых качественных свойств по отношению к другим понятиям. Признаки понятий могут быть отнесены к одному объему понятия Р, может быть представлена в виде множества пар дифференциальных, характеристических и валентных признаков:
Дифференциальные признаки используются в качестве характеристики содержания понятия. Характеристические это признаки, которые позволяют отличить сущности, относящиеся к объему одного и того же понятия. Валентные это признаки, обеспечивающие связь между различными понятиями. Без потери общности можно считать такие связи бинарными.
Признак характеризуется именем и значением. Можно выделить несколько типов значений признаков:
логические,
числовые,
символьные и др.
Имя признака вместе с его значением образует полное наименование соответствующего признака. Например, признак ВОЗРАСТ вместе со значением «30 лет» образует наименование признака «возраст 30 лет». Имя признака позволяет указать ту семантическую роль, которую играет его значение в организации связи между сущностью и признаком, ее характеризующим. Так, в предыдущем примере имя признака ВОЗРАСТ характеризует определенную роль понятия «30 лет» по отношению к некоторой сущности, в качестве которой выступает конкретный человек. Совокупность имен дифференциальных, характеристических и валентных признаков составляет схему понятия, обозначаемую как shm P. Если учесть деление признаков понятия Р(Х) на дифференциальные, характеристические и валентные, то логическое выражение (2.6) можно представить в виде [ Cкачайте файл, чтобы посмотреть картинку ] Связи между различными категориями, используемыми для описания понятий в логике и семиотике, представлены на рис. 2.3.

В зависимости от характера деятельности внимание проектировщиков ИнС концентрируется на различных составляющих понятия: системные аналитики и администраторы задач приложений, создающие формальную модель ПО, больше должны опираться на интенсионал понятий ПО, а администраторы базы данных на их схему. Тем самым понятие становится чрезвычайно удобным средством, которое позволяет, с одной стороны, путем использования интенсионала выразить семантические отношения для некоторого фрагмента реального мира, а с другой стороны, с помощью схемы обеспечить возможность перехода к менее детальному описанию и представлению этой информации в базе знаний.

Заголовок 1 Заголовок 215

Приложенные файлы

  • doc 15808091
    Размер файла: 136 kB Загрузок: 0

Добавить комментарий