Интеллектуальные информационные системы

         

Понятие когнитивного конфигуратора


В исследованиях по когнитивной психологии изучается значительное количество различных операций, связанных с процессом познания. Однако, насколько известно из литературы, психологами не ставился вопрос о выделении из всего множества когнитивных операций такого минимального (базового) набора наиболее элементарных из них, из которых как составные могли бы строится другие операции. Ясно, что для выделения таких базовых когнитивных операций (БКО) необходимо построить их иерархическую систему, в фундаменте которой будут находится наиболее элементарные из них, на втором уровне – производные от них, обладающие более высоким уровнем интегративности, и т.д.

Таким образом, под когнитивным конфигуратором будем понимать минимальный полный набор базовых когнитивных операций, достаточный для представления различных процессов познания.


Определение понятия конфигуратора

Понятие конфигуратора, по-видимому, впервые предложено В.А.Лефевром [148], хотя безусловно это понятие использовалось и раньше, но, во-первых, оно не получало самостоятельного названия, а, во-вторых, использовалось в частных случаях и не получало обобщения. Под конфигуратором В.А.Лефевр понимал минимальный полный набор понятийных шкал или конструктов, достаточный для адекватного описания предметной области. Примеры конфигураторов приведены в [148].

Понятие когнитивного конфигуратора

В исследованиях по когнитивной психологии изучается значительное количество различных операций, связанных с процессом познания [64]. Однако, насколько известно из литературы, психологами не ставился вопрос о выделении из всего множества когнитивных операций такого минимального (базового) набора наиболее элементарных из них, из которых как составные могли бы строится другие операции. Ясно, что для выделения таких базовых когнитивных операций (БКО) необходимо построить их иерархическую систему, в фундаменте которой будут находится наиболее элементарные из них, на втором уровне – производные от них, обладающие более высоким уровнем интегративности, и т.д.

Таким образом, под когнитивным конфигуратором будем понимать минимальный полный набор базовых когнитивных операций, достаточный для представления различных процессов познания.

Когнитивные концепции и операции

Проведенный анализ когнитивных концепций показал, что они разрабатывались ведущими психологами (Пиаже, Солсо, Найсер) [64] без учета требований, связанных с их дальнейшей формализацией и автоматизацией. Поэтому имеющиеся концепции когнитивной психологии слабо подходят для этой цели; в когнитивной психологии не ставилась и не решалась задача конструирования когнитивного конфигуратора и, соответственно, не сформулировано понятие базовой когнитивной операции.



Понятие шкалы и градации. Типы шкал


Формализация предметной области это процесс, состоящий из двух основных этапов:

1. Конструирование шкал и градаций для описания и кодирования состояний объекта управления и факторов, влияющих на его поведение.

2. Отнесение состояний объекта управления и факторов к определенным градациям соответствующих шкал.

В данной работе предлагается следующие определения.

Шкала – это способ классификации объектов по наименованиям или степени выраженности некоторого свойства.

Градация – это положение на шкале (или интервал, диапазон), соответствующее наименованию или определенной степени выраженности свойства.

Понятие шкалы тесно связано с ключевым понятием когнитивной психологии: понятием конструкта, более того, практически является синонимом или формальным аналогом этого понятия.



Конструктом называется понятие, имеющее полюса, противоположные по смыслу, и ряд промежуточных градаций, отражающих различную степень выраженности некоторого качества. Познание состоит в создании (генерировании) новых конструктов и их использовании для ориентации в предметной области. Таким образом, формализация предметной области по сути дела представляет собой ее познание, т.е. когнитивную структуризацию. В приведенной таблице 27 дана характеристика измерительных шкал согласно[64]. Конечно, наименования могут быть присвоены градациям всех видов измерительных шкал.

Таблица 27 – ХАРАКТЕРИСТИКА И ПРИМЕРЫ ИЗМЕРИТЕЛЬНЫХ ШКАЛ



Понятие: "Система искусственного


Существует много различных подходов к классификации информационных систем. Сразу вполне закономерно возникают вопросы о том:

1. Чем обусловлено различие этих классификаций?

2. Какова классификация этих классификаций?

3. Каким образом выбрать ту классификацию, которая нам больше всего подходит в данном случае?

Попробуем ответить на эти вопросы.

Различия между этими классификациями определяются теми критериями, по которым производится классификация, например:

– по степени структурированности решаемых задач;

– по автоматизируемым функциям;

– по степени автоматизации реализуемых функций;

– по сфере применения и характеру использования информации, в частности, по уровням управления.

Изветсно, что при обучении людей существуют различные уровни предметной обученности: воспроизведение (память); решение стандартных задач (умения, навыки); решение нестандартных, творческих задач (знания, активное интеллектуальное понимание).

Интеллект может проявляется в различных областях, но мы рассмотрим его возможности  в решении задач, т.к. эта область проявления является типичной для интеллекта. Задачи бывают стандартные и нестандартные. Для стандартных задач известны алгоритмы решения. Для нестандартных они неизвестны. Поэтому решение нестандартной задачи представляет собой проблему.

Само понятие "стандартности" задачи относительно, относительна сама "неизвестность": т.е. алгоритм может быть известен одним и неизвестен другим, или информация о нем может быть недоступной в определенный момент или период времени, и доступной – в другой. Поэтому для одних задача может быть стандартной, а для других нет. Нахождение или разработка алгоритма решения переводит задачу из разряда нестандартных в стандартные.

В математике и кибернетике задача считается решенной, если известен алгоритм ее решения. Тогда процесс ее фактического решения превращается в рутинную работу, которую могут в точности выполнить человек, вычислительная машина или робот, под управлением программы реализующей данный алгоритм, не имеющие ни малейшего представления о смысле самой задачи.


Разработка алгоритма решения задачи связано с тонкими и сложными рассуждениями, требующими изобретательности, опыта, высокой квалификации. Считается, что эта работа является творческой, существенно неформализуемой и требует участия человека с его "естественным" опытом и интеллектом.

Здесь необходимо отметить, что существует технология решения изобретательских задач (ТРИЗ), в которой сделана попытка, по мнению многих специалистов, довольно успешная, позволяющая в какой-то степени формализовать процедуру решения творческих задач.

Интеллектуальными считаются задачи, связанные с разработкой алгоритмов решения ранее нерешенных задач определенного типа.

Отличительной особенностью и одним из основных источников эффективности алгоритмов является то, что они сводят решение сложной задачи к определенной последовательности достаточно простых или даже элементарных для решения задач. В результате нерешаемая задача становится решаемой. Исходная информация поступает на вход алгоритма, на каждом шаге она преобразуется и в таком виде передается на следующий шаг, в результате чего на выходе алгоритма получается информация, представляющая собой решение задачи.

Алгоритм может быть исполнен такой системой, которая способна реализовать элементарные операции на различных шагах этого алгоритма.

Существует ряд задач, таких, как распознавание образов и идентификация, прогнозирование, принятие решений по управлению, для которых разбиение процесса поиска решения на отдельные элементарные шаги, а значит и разработка алгоритма, весьма затруднительны.

Из этих рассуждений вытекает следующее определение интеллекта: интеллект представляет собой универсальный алгоритма, способный разрабатывать алгоритмы решения конкретных задач.

С этой точки зрения профессия программиста является одной из самых творческих и интеллектуальных, т.к. продуктом деятельности программиста являются алгоритмы реализованные на некотором языке программирования (программы).

Исходя из вышесказанного можно сделать вывод о том, что в нашем случае наиболее подходит классификацией ИС, основанная на критерии, позволяющем оценить "степень интеллектуальности ИС", т.е.


на критерии "степени структурированности решаемых задач" (рисунок 5).



Рисунок 5. Классификация информационных систем

по степени структурированности решаемых задач

Данная классификация не претендует на исчерпывающий характер.

Источники информации:

1. Сотник С.Л. Конспект лекций по курсу "Основы проектирования систем искусственного интеллекта": (1997-1998), http://neuroschool.narod.ru/books/sotnik.html.

2. Сайт: http://www.stu.ru/inform/glaves/glava3/gl_3_2.htm#klas_is.


Последовательность


Последовательные шаблоны аналогичны ассоциациям с той лишь разницей, что связывают события, разнесенные во времени. Например, последовательный шаблон может предсказывать, что человек, купивший посудомоечную машину с вероятностью 0.7 купит сушилку для одежды в течение следующих шести месяцев. Для увеличения этой вероятности магазин может предложить ему скидку в 10% на покупку сушильного аппарата в течение трех или четырех месяцев после покупки посудомоечной машины.



Постановка проблемы


Современный этап развития информационных технологий характеризуется быстрым ростом производительности компьютеров облегчением доступа к ним. С этим связан возрастающий интерес к использованию компьютерных технологий для организации мониторинга различных объектов, анализа данных, прогнозирования и управления в различных предметных областях. И у исследователей, и у руководителей, имеются определенные ожидания и надежды на повышение эффективности применения компьютерных технологий.

Однако на пути реализации этих ожиданий имеются определенные сложности, связанные с относительным отставанием в развитии математических методов и реализующего их программного инструментария.

И анализ, и прогнозирование, и управление самым непосредственным образом основываются на математическом моделировании объектов. Математическое моделирование в свою очередь предполагают возможность выполнения всех арифметических операций (сложение, вычитание, умножение и деление) над отображениями объектов в моделях и над их элементами.

В практике интеллектуального анализа данных в экономике, социологии, психологии, педагогике и других предметных областях все чаще встречаются ситуации, когда необходимо в рамках единой математической модели совместно обрабатывать числовые и нечисловые данные.

В свою очередь числовые данные могут быть различной природы и, соответственно, измеряться в самых различных единицах измерения. Ясно, что арифметические операции можно выполнять только над числовыми данными, измеряемыми в одних единицах измерения.

Данные нечисловой природы, т.е. различные факты и события, характеризуются тем, что с ними вообще нельзя выполнять арифметические операции.

Соответственно, возникает потребность в математических методах и программном инструментарии, обеспечивающих совместную сопоставимую обработку разнородных числовых данных и данных нечисловой природы.


При создании систем искусственного интеллекта разработчики оперируют такими основополагающими понятиями, как:

– данные, информация, знания;

– факт, смысл, мысль;

– мониторинг, анализ и управление.

От того, какое конкретное содержание вкладывается разработчиками в данные понятия, самым существенным образом зависят и подходы к созданию математических моделей, структур данных и алгоритмов функционирования СИИ.

Проблема состоит в том, что смысловое содержание этих понятий чаще всего не конкретизируется.

И это не случайно. Одной из основных причин этого положения дел, на наш взгляд, является то, что конкретизировать смысловое содержание данных понятий представляется возможным лишь на основе интуитивно-ясной и хорошо обоснованной концепции смысла.

Однако, как это ни удивительно и парадоксально, но реальные разработчики СИИ, обычно являющиеся математиками и программистами, чаще всего недостаточно знакомы с подобными концепциями.

Конечно, возникает вопрос о том, насколько вообще возможны, т.е. имеют смысл концепции смысла, не бессмысленны ли они? Может быть вопрос: "Какой смысл имеют концепции смысла?" – является одним из вариантов логического парадокса Рассела? Хотя эти вопросы имеют "несерьезный" оттенок, по сути, они сводятся к очень серьезному вопросу о том, насколько или в какой степени интеллект может познать сам себя, т.е. о том, является интеллектуальная форма познания адекватным инструментом для познания интеллекта? В более общем теоретическом плане этот вопрос может быть сформулирован и так: "Может ли часть системы адекватно отразить (отобразить) систему в целом?", или, другими словами, "Может ли система в целом в определенном смысле включать себя как составную часть?"

От ответа на эти вопросы самым непосредственным образом зависит и ответ на ключевой вопрос о том, может ли человек создать искусственный интеллект по своему образу и подобию.

Мы отвечаем на эти вопросы утвердительно. Более того, системы, содержащие информацию о системе в целом в каждой своей части определенного уровня структурной иерархии, широко известны, это:

– биологические системы в каждой клетке которых (кроме половых) содержится полный геном;

– фрактальные системы;

– высокоорганизованные системы  с большой взаимной информацией в своих частях, успешно противостоящие закону возрастания энтропии.

Выдающийся немецкий философ Георг Вильгельм Фридрих Гегель называл такие системы "Истинно бесконечными".



Постановка задачи и пути ее решения


Одним из важнейших направлений развития информационных систем является создание систем искусственного интеллекта (СИИ), в частности систем: с интеллектуальной обратной связью (биологическая обратная связь и семантический резонанс); распознавания образов; поддержки принятия решений; экспертных систем; нейронных сетей; генетических алгоритмов и машинной эволюции; когнитивного моделирования; выявления знаний из опыта (эмпирических фактов) и интеллектуального анализа данных (data mining), а также ряда других.

В связи с наличием многих альтернатив возникает необходимость оценки качества математических моделей и поддерживающих их систем искусственного интеллекта (ММ СИИ). Сопоставимое сравнение различных моделей актуально как для разработчиков моделей (адекватная самооценка

своей работы), так и для потребителей моделей (адекватная оценка моделей и обоснованный выбор оптимальной из них по заданным критериям). Сопоставимость

оценки может быть обеспечена, если модели будут протестированы на одних и тех же исходных данных по ряду типовых задач из области искусственного интеллекта.

Для этого необходимы:

1. Свободный доступ к тестовым исходным данным.

2. Методика, обеспечивающая преобразование исходных данных из формы, доступной через Internet, в форму, в которой они могут быть использованы в конкретной программной системе искусственного интеллекта, реализующей ту или иную математическую модель.

1-е условие выполнено сотрудниками Школы информации и компьютерных исследований Калифорнийского университета США (School of Information & Computer Science

University of California, Irvine, USA, http://www.ics.uci.edu), которыми создан и размещен в Internet по адресу: http://www.ics.uci.edu/~mlearn/MLSummary.html банк исходных данных по задачам искусственного интеллекта.

На момент написания настоящей работы этот банк включает базы исходных данных по следующим задачам: Abalone, Adult, Annealing, Anonymous Microsoft Web Data, Arrhythmia, Artificial Characters, Audiologys, Auto-Mpg, Automobile, Badges, Balance Scale, Balloons, Breast Cancer, Wisconsin Breast Cancers, Pittsburgh Bridges, Car Evaluation, Census Income, Chesss, Bach Chorales (time-series), Connect-4 Opening, Credit Screenings, Computer Hardware, Contraceptive Method Choice, Covertype data, Cylinder Bands, Dermatology, Diabetes Data, The Second Data Generation Program - DGP/2, Document Understanding, EBL Domain Theories and Examples, Echocardiogram, Ecoli, Flags,Function Findings, Glass Identification, Haberman's Survival Data, Hayes-Roth, Heart Diseases, Hepatitis, Horse Colic, Housing (Boston), ICU Data, Image segmentation, Internet Advertisements, Ionosphere, Iris Plant, Isolet Spoken Letter Recognition, Kinship, Labor relations, LED Display Domains, Lenses, Letter Recognition, Liver-disorders, Logic-theorist, Lung Cancer, Lymphography, Mechanical Analysis Data, Meta-data, Mobile Robots, Molecular Biologys, MONK's Problems, Moral Reasoner, Multiple Features, Mushrooms, MUSKs, Nursery, Othello Domain Theory, Page Blocks Classification, Pima Indians Diabetes, Optical Recognition of Handwritten Digits, Pen-Based Recognition of Handwritten Digits, Postoperative Patient, Primary Tumor, Qualitative Structure Activity Relationships (QSARs), Quadraped Animals Data Generator, Servo, Shuttle Landing Control, Solar Flares, Soybeans, Challenger USA Space Shuttle O-Rings, Low Resolution Spectrometer, Spambase, SPECT and SPECTF hearts, Sponge, Statlog Projects, Student Loan Relational, Teaching Assistant Evaluation, Tic-Tac-Toe Endgame, Thyroid Disease, Trains, University, Congressional Voting Records, Water Treatement Plant, Waveform Data Generator, Wine Recognition, Yeast, Zoo, Undocumenteds.


Поэтому остается выполнить 2-е условие, а именно: разработать типовую методику использования баз данных репозитария UCI для оценки качества математических моделей систем искусственного интеллекта, что и является основной задачей данного раздела.

На первый взгляд решение этой задачи является относительно несложным, т.к. требует в основном знания и умения использования стандартных возможностей Internet-броузера, Word и Excel. Однако как показывает опыт, это вполне может представлять определенную сложность из-за большого числа операций преобразования формы информации и принципиальной неполной формализуемости этого процесса. Поэтому предмет данной данного раздела достаточно актуален.

Сформулируем основные требования к методикам, предназначенным для этих целей, а также критерии их оценки и сравнения:

1. Высокая степень автоматизированности, т.е. минимизация затрат ручного труда.

2. Высокая скорость преобразования информации

и, как следствие, – несущественность ее объема.

3. Высокая достоверность преобразования, т.е. отсутствие ошибок.

Однако в литературе и в Internet не приводятся методики аналогичного назначения. Исходя из этого можно предположить, что в основном это преобразование осуществляется вручную, что не соответствует сформулированным требованиям ни по одному из приведенных критериев.

Поэтому предлагается методика, свободная от указанных ограничений. Основная идея этой методики состоит в том, что преобразование формы представления исходных данных из HTML-формата непосредственно в базы данных системы осуществляется в два основных этапа:

– на 1-м этапе с использованием стандартных возможностей Word и Excel осуществляется преобразование исходных данных из HTML-формата в промежуточные DBF-таблицы;

– на 2-м этапе с помощью специально разработанного программного интерфейса осуществляется преобразование исходных данных из промежуточных DBF-таблиц в стандарт баз данных используемой системы искусственного интеллекта.

Рассмотрим данную методику подробнее на примере преобразования баз данных репозитария UCI по примеру ZOO-database в стандарт баз данных универсальной когнитивной аналитической системы "Эйдос" [64].


Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).


Интегральная когнитивная модель отражает структуру детерминации нескольких состояний с указанием сходств и различий между состояниями по их системам детерминации, между факторами, по влиянию, которое они оказывают на поведение объекта управления, отображаются в 7-м режиме 6-й подсистемы системы "Эйдос" (рисунок 180).

Рисунок 180. Пример интегральной когнитивной карты



Построить классические когнитивные модели (отобразить в форме когнитивных карт).


Классическая когнитивная модель отражает структуру детерминации состояния с указанием сходств и различий между факторами и отображается в 7-м режиме 6-й подсистемы системы "Эйдос"  (рисунок 179).

Рисунок 179. Пример классической когнитивной карты



Построить нелокальные нейроны и интерпретируемые нейронные сети.


Нелокальные нейроны отражают систему детерминации состояний факторами т отображаются в 5-м режиме 6-й подсистемы системы "Эйдос", а нейронные сети представляют собой совокупность нейронов и отображаются в 6-м режиме той же подсистемы (рисунок 178).

Рисунок 178. Примеры нелокального нейрона

и Паретто-подмножества нейронной сети



ПРАКТИЧЕСКИЕ ЗАДАНИЯ


Описать этапы разработки приложения в системе "Эйдос", обеспечивающее прогнозирования продолжительности жизни пациентов, перенесших сердечный приступ, по данным эхокардиограммы на основе базы данных репозитория UCI и провести СК-анализ семантической информационной модели.

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее принятие решения о выборе очередного хода в игре "крестики-нолики" в зависимости от расположения крестиков и ноликов и провести СК-анализ семантической информационной модели.

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее классификацию животных по внешним признакам на основе базы данных репозитория UCI и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее диагностику фитопатологии по симптоматике и выработку рекомендаций по плану лечения на основе информации, содержащейся в учебнике, и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее идентификацию изображений различных мест на территории КубГАУ по вербальным описаниям их фотографий (взять с сайта КубГАУ: http://kubagro.ru) и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее прогнозирование успеваемости по ИИС на основе данных по социальному статусу их родителей и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее прогнозирование направления деятельности фирмы на основе данных о расположении и внешнем виде ее офиса и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее выбор автомобиля для приобретения по его признакам (обучающую выборку взять на автомобильном рынке) и провести СК-анализ семантической информационной модели


Описать этапы разработки приложения в системе "Эйдос", обеспечивающее выбор вариантов приобретения жилья по его признакам и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее идентификацию трехмерных тел (шар, куб, тетраэдр, конус, цилиндр, пирамида, призма и других) по их проекциям и провести СК-анализ семантической информационной модели

Описать этапы разработки приложения в системе "Эйдос", обеспечивающее оценку важности различных видов городского транспорта и различных маршрутов в разрезе по остановкам и провести СК-анализ семантической информационной модели

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Идентификация трехмерных тел по полным и частичным наборам их ортогональных проекций (шар, куб, тетраэдр, конус, цилиндр, пирамида, призма)".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Идентификация и классификация натуральных чисел по их свойствам (делимости на натуральные делители)".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Идентификация и классификация студентов по их имиджу.

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Прогнозирование пунктов назначения железнодорожных составов".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Прогнозирование количественных и качественных результатов выращивания зерновых колосовых".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Разработка обобщенных имеджевых фотороботов студентов по их успеваемости".



Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Идентификация изображений по их вербальным описаниям".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Атрибуция анонимных и псевдонимных текстов (определение вероятного авторства)".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Оценка рисков правонарушений по признакам подчерка (психографология)".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Оценка рисков страхования и кредитования предприятий по их описаниям".

Осуществить постановку задачи и формализацию предметной области, включая подготовку обучающей выборки, для решения задачи: "Оценка рисков совершения ДТП по данным о владельце и автомобиле".

Привести пример интегрального критерия.

Привести пример коллизии при двухэтапном групповом принятии решения.

Привести пример многокритеральной задачи принятия решений.

Привести пример, поясняющий различие между статистической и причинно-следственной связью.

Привести примеры критерия, параметра, фактора. Указать различия между ними.

Спланировать этапы исследования зависимости качества распознавания текста от разрешения сканирования в системах FineReader, Cunie Form и другие системах разных версий. Оценку качества производить по количеству ошибок распознавания. Составить рейтинг систем и версий, дать рекомендации. After Scan. Оценить тоже самое, после использования After Scan.

Спланировать этапы исследования качества переводов текстов в системах Stylus (Promt), Сократ, и других системах автоматизированного перевода разных версий. Сравнить качество автоматизированного перевода с русского языка на английский и обратно для текстов различной направленности (юридические, технические, художественные, стихи) и с различной длиной и сложностью предложений (статистика).


Составить рейтинг систем и версий, дать рекомендации. Оценку качества перевода осуществлять путем обобщения экспертных оценок экспертов с разным уровнем компетентности (студенты).

Спланировать этапы исследования реальной системы выявления знаний из опыта (эмпирических фактов) и интеллектуального анализа данных при решении реальных задач.

Спланировать этапы исследования реальной системы класса: "Нейронная сеть" при решении задач.

Спланировать этапы исследования реальной системы когнитивного моделирования при решении реальных задач.

Спланировать этапы исследования реальной системы поддержки принятия решений при решении реальных задач.

Спланировать этапы исследования реальной системы распознавание образов, идентификации и прогнозирования при решении реальных задач.

Спланировать этапы исследования реальной системы, реализующей генетические алгоритмы при решении реальных задач.

Спланировать этапы исследования реальной экспертной системы при решении реальных задач.


Вниманию читателей предлагается первое издание


Вниманию читателей предлагается первое издание учебного пособия по дисциплине: "Интеллектуальные информационные системы", которая читается для студентов 5 курса (9-й семестр) очной формы обучения, и студентов 6-го курса (10 семестр) заочной формы обучения, обучающихся по специальности: 351400 "Прикладная информатика (по отраслям), в частности:
– 351401 "Прикладная информатика (в экономике)";
– 351403 "Прикладная информатика (в юриспруденции)".
Учебное пособие состоит из трех частей:
1. Курса лекций.
2. Лабораторного практикума.
3. Программы самостоятельной работы студентов.
Количество и объем лекций и лабораторных работ соответствует утвержденным рабочим программам, образовательному стандарту по данным специальностям и рекомендациям УМО. При этом на лекции отводится 32 часа (16 лекций), на лабораторные занятия – 32 часа (8 лабораторных работ по 4 часа), и на самостоятельную работу студентов – 38 часов. С этим в определенной мере связаны ограниченный объем учебного пособия и краткость изложения материала, что во многом предопределило его обзорный характер.
Вместе с тем, автор ставил перед собой задачу не только дать студентам основы теоретических представлений по изучаемой дисциплине, насколько это возможно в обзорном курсе, но и предоставить им возможность приобретения определенных практических умений и навыков использования интеллектуальных информационных технологий для решения различных учебных задач по их специальностям.
Курс лекций включает 16 лекций, сгруппированных в 4 раздела:
1. Введение в интеллектуальные  информационные системы.
2. Теоретические основы и эксплуатация универсальной когнитивной аналитической системы "Эйдос".
3. Принципы построения интеллектуальных информационных систем.
4. Применение и перспективы систем искусственного интеллекта.
Практикум базируется на универсальной когнитивной аналитической системе "Эйдос", разработанной автором пособия, и включает 10 лабораторных работ.
Именно этим обусловлено размещение второго раздела, посвященного системе "Эйдос", раньше раздела о принципах построения интеллектуальных информационных систем.
Лабораторные работы однотипны по технологии и иллюстрируют возможности применения систем искусственного интеллекта в различных предметных областях. При этом в каждой лабораторной работе полностью изучается весь технологический цикл, но при этом основное внимание акцентируется на каком-либо из основных элементов технологии, который изучается более углубленно. Таким образом, студенты, пропустившие одну или даже несколько лабораторных работ, что, к сожалению, приходится учитывать, могут в определенной мере компенсировать последствия пропусков. В целом такой подход обеспечивает создание у студентов целостной и универсальной картины применения систем искусственного интеллекта.
Каждая лабораторная работа включает: краткую теорию;  одно или несколько заданий; примеры решения; контрольные вопросы; литературу, рекомендуемую для изучения.
Количество лабораторных работ соответствует утвержденным рабочим программам, образовательному стандарту по данным специальностям и рекомендациям УМО. Таким образом, преподаватель имеет возможность осуществлять выбор любых 8 из 10 вариантов разработанных лабораторных работ по своему усмотрению с учетом требования специальности. В последующем предполагается существенно увеличить количество предлагаемых для выбора вариантов лабораторных работ.
Учебное пособие включает также программу самостоятельной работы студентов по дисциплине, теоретические вопросы и практические задания, выносящиеся на экзамен, а также список основной и дополнительной литературы по дисциплине, включая Internet-сайты по проблематике искусственного интеллекта.
Хотелось бы отметить также, что системы искусственного интеллекта относятся к наиболее бурно развивающемуся направлению, буквально пронизывающему и революционизирующему практически все остальные направления развития современных информационных технологий.


Объем общедоступной информации по этой проблематике огромен и очень быстро возрастает.
Поэтому автор полностью осознает, что данное учебное пособие ни в коей мере не может претендовать на полноту изложения и является не более чем кратким введением в проблематику искусственного интеллекта, причем в авторской интерпретации. На это, в общем-то, и рассчитан обзорный курс, на который в учебном плане отведено лишь 68 часов.
При изложении материала не удалось избежать некоторых повторов, что, правда, может быть как-то оправдано с методической точки зрения ("Повторение – мать учения").
В то время необходимо отметить, что наука о системах искусственного интеллекта пока даже не имеет общепринятого названия, является одной из самых бурно развивающихся, новые результаты появляются в ней чуть ли не ежедневно, многие ее положения спорны и находятся в процессе обсуждения, и говорить о об этой науке, как об "устоявшейся" не приходится и еще, по-видимому, долго не придется. По мнению автора в этой ситуации полезнее для дела, т.е. для качества обучения, не загаживать проблемы науки, строя изложение так, как будто они все уже решены, а открыто показывать их, т.к. они являются "точками роста" науки. По этой же причине автор, сам являющийся активно работающим в области систем искусственного интеллекта исследователем и разработчиком, счел возможным в ряде случаев выразить в порядке научной дискуссии и свою точку зрения, даже если она ранее не публиковалась в научной печати. Поэтому данное "учебное пособие" в какой-то мере является и "научной работой". Кроме того авторское восприятие проблематики довольно сильно сказалось как на выборе материала, так и на характере его изложения.
Особенно хотелось бы выразить благодарность авторам web-публикаций и сайтов, по проблематике искусственного интеллекта, материалы которых были использованы при подготовке данного учебного пособия. Везде, где эти материалы использовались, на них сделаны ссылки:


– Васильев Л.Г. Три парадигмы понимания: анализ литературы вопроса.  http://newasp.omskreg.ru/intellect/f54.htm;
– Орлов А.И. "Высокие статистические технологии": http://antorlov.chat.ru;
– Максимов В.И., Корноушенко Е.К., Гребенюк Е.А., Григорян А.К. Качаев С.В., Кулинич А.А., Райков А.Н., Макаренко Д.И., Коврига С.В., специалисты сектора-51 ИПУ РАН и сотрудничающие с ними по комплексной теме: "Когнитивный анализ и моделирование ситуаций": http://www.ipu.ru/labs/lab51/projects.htm;
– Сотник С.Л. Конспект лекций по курсу "Основы проектирования систем искусственного интеллекта": (1997-1998), http://neuroschool.narod.ru/books/sotnik.html;
– Терехов С.А. Лекции по теории и приложениям искусственных нейронных сетей. Лаборатория Искусственных Нейронных Сетей НТО-2, ВНИИТФ, Снежинск (http://alife.narod.ru/lectures/neural/Neu_index.htm);
–Кива В. Данные, информация, знания. http://vlak.webzone.ru/rus/it/knowledge.html
Автор благодарен доктору экономических наук профессору Барановской Т.П., доктору технических наук профессору Лойко В.И., доктору технических наук профессору Ключко В. И, кандидату экономических наук профессору Курносову С.А. и кандидату технических наук доценту Лаптеву В.Н. за поддержку и многочисленные конкретные советы и предложения, высказанные при написании данного учебного пособия.
Для студентов, аспирантов, преподавателей и научных работников, интересующихся проблематикой систем искусственного интеллекта.

Предлагаемая когнитивная концепция


Автоматизировать процесс познания в целом безусловно значительно сложнее, чем отдельные операции процесса познания. Но для этого прежде всего необходимо выявить эти операции и найти  место каждой из них в системе или последовательности процесса познания.

Сделать это предлагается в форме когнитивной концепции, которая должна удовлетворять следующим требованиям:

– адекватность, т.е. точное отражение сущности процессов познания, характерных для человека, в частности описание процессов вербализации, семантической адаптации и семантического синтеза (уточнения смысла слов и понятий и включения в словарь новых слов и понятий);

– высокая степень детализации и структурированности до уровня достаточно простых базовых когнитивных операций;

– возможность математического описания, формализации и автоматизации.

Однако приходится констатировать, что даже концепции когнитивной психологии, значительно более конкретные, чем гносеологические, разрабатывались без учета необходимости построения реализующих их математических и алгоритмических моделей и программных систем. Более того, в когнитивной психологии из всего многообразия различных исследуемых когнитивных операций не выделены базовые, к суперпозиции и различным вариантам сочетаний которых сводятся различные процессы познания. Поэтому для достижения целей данного исследования концепции когнитивной психологии мало применимы.

В связи с этим в данном исследовании предлагается когнитивная концепция, удовлетворяющая сформулированным выше требованиям. Эта концепция достаточно проста, иначе было бы невозможно ее формализовать, многие ее положения интуитивно очевидны или хорошо известны, тем ни менее в целостном виде она сформулирована лишь в работе [64]. Положения когнитивной концепции приведены в определенном порядке, соответствующем реальному ходу процесса познания "от конкретных эмпирических исходных данных к содержательным информационным моделям, а затем к их верификации, адаптации и, в случае необходимости, к пересинтезу".


На базе выше сформулированных положений автором предложена целостная система взглядов на процесс познания, т.е. когнитивная концепция

[64] (рисунок 12).



Рисунок 12. Обобщенная схема предлагаемой когнитивной концепции

Суть предложенной когнитивной концепции состоит в том,  что процесс познания рассматривается как многоуровневая иерархическая система обработки информации, в которой каждый последующий уровень является результатом интеграции элементов предыдущего уровня. На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не является единственно-возможной.

Ключевым для когнитивной концепции является понятие факта, под которым понимается соответствие дискретного и интегрального элементов познания (т.е. элементов разных уровней интеграции-иерархии), обнаруженное на опыте. Факт рассматривается как квант смысла, что является основой для его формализации. Таким образом, происхождение смысла связывается со своего рода "разностью потенциалов", существующей между смежными уровнями интеграции-иерархии обработки информации в процессах познания.

1. Процесс познания начинается с чувственного восприятия. Различные органы восприятия дают качественно-различную чувственную информацию в форме дискретного потока элементов восприятия. Эти элементы формализуются с помощью описательных шкал и градаций.

2. В процессе накопления опыта выявляются взаимосвязи между элементами чувственного восприятия: одни элементы часто наблюдаются с другими (имеет место их пространственно-временная корреляция), другие же вместе встречаются достаточно редко.


Существование устойчивых связей между элементами восприятия говорит о том, что они отражают некую реальность, интегральную

по отношению к этим элементам. Эту реальность будем называть объектами восприятия. Рассматриваемые в единстве с объектами элементы восприятия будем называть признаками объектов. Таким образом, органы восприятия дают чувственную информацию о признаках наблюдаемых объектов, процессов и явлений окружающего мира (объектов). Чувственный образ конкретного объекта представляет собой систему, возникающую как результат процесса синтеза признаков этого объекта. В условиях усложненного восприятия синтез чувственного образа объекта может быть существенно замедленным и даже не завершаться в реальном времени.

3. Человек присваивает конкретным объектам названия (имена) и сравнивает объекты друг с другом. При сравнении выясняется, что одни объекты в различных степенях сходны по их признакам, а другие отличаются. Сходные объекты объединяются в обобщенные категории (классы), которым присваиваются имена, производные от имен входящих в категорию конкретных объектов. Классы формализуются с помощью классификационных шкал и градаций и обеспечивают интегральный способ описания действительности. Путем обобщения (синтеза, индукции) информации о признаках конкретных объектов, входящих в те или иные классы, формируются обобщенные образы классов. Накопление опыта и сравнение обобщенных образов классов друг с другом позволяет определить степень характерности признаков для классов, смысл признаков и ценность каждого признака для идентификации конкретных объектов с классами и сравнения классов, а также исключить наименее ценные признаки из дальнейшего анализа без существенного сокращения количества полезной информации о предметной области (абстрагирование). Абстрагирование позволяет существенно сократить затраты внутренних ресурсов системы на анализ информации. Идентификация представляет собой процесс узнавания, т.е. установление соответствия между чувственным описанием объекта, как совокупности дискретных признаков, и неделимым (целостным) именем класса, которое ассоциируется с местом и ролью воспринимаемого объекта в природе и обществе.


Дискретное и целостное восприятие действительности поддерживаются как правило различными полушариями мозга: соответственно, правым и левым (доминантность полушарий). Таким образом именно системное взаимодействие интегрального (целостного) и дискретного способов восприятия обеспечивает возможность установление содержательного смысла событий. При выполнении когнитивной операции "содержательное сравнение" двух классов определяется вклад каждого признака в их сходство или различие.

4. После идентификации уникальных объектов с классами возможна их классификация и присвоение обобщающих имен группам похожих классов. Для обозначения группы похожих классов используем понятие "кластер". Но и сами кластеры в результате выполнения когнитивной операции "генерация конструктов" могут быть классифицированы по степени сходства друг с другом. Для обозначения системы двух противоположных кластеров, с "спектром" промежуточных кластеров между ними, будем использовать термин "бинарный конструкт", при этом сами противоположные кластеры будем называть "полюса бинарного конструкта". Бинарные конструкты классов и атрибутов, т.е. конструкты с двумя полюсами, наиболее типичны для человека и представляет собой когнитивные структуры, играющие огромную роль в процессах познания. Достаточно сказать, что познание можно рассматривать как процесс генерации, совершенствования и применения конструктов. Качество конструкта тем выше, чем сильнее отличаются его полюса, т.е. чем больше диапазон его смысла.

Результаты идентификации и прогнозирования, осуществленные с помощью модели, путем выполнения когнитивной операции "верификация" сопоставляются с опытом, после чего определяется целесообразность выполнения когнитивной операции "обучение". При этом может возникнуть три основных варианта, которые на рисунке 13 обозначены цифрами:



Рисунок 13. К пояснению смысла понятий:

"Адаптация и синтез когнитивной модели предметной области",

"Внутренняя и внешняя валидность информационной модели",

1. Объект, входит в обучающую выборку и достоверно идентифицируется (внутренняя валидность, в адаптации нет необходимости).

2. Объект, не входит в обучающую выборку, но входит в исходную генеральную совокупность, по отношению к которой эта выборка репрезентативна, и достоверно идентифицируется (внешняя валидность, добавление объекта к обучающей выборке и адаптация модели приводит к количественному уточнению смысла признаков и образов классов).

3. Объект не входит в исходную генеральную совокупность и идентифицируется недостоверно (внешняя валидность, добавление объекта к обучающей выборке и синтез модели приводит к качественному уточнению смысла признаков и образов классов, исходная генеральная совокупность расширяется).


Предлагаемая концепция решения проблемы


Предлагается путь решения поставленной проблемы путем поэтапной постановки и решения следующих задач:

1. Формализация предметной области: проектирование иерархической информационной модели предметной области, обеспечивающей оптимальность формализованного представления фактографической информации. Выбор исследуемой системы факторов на основе системного подхода (основное требование: полнота и всесторонность описания объекта исследования).

2. Организация источников информации:

разработка формализованного паспорта для подготовки исходной информации, организация сбора и поступления информации для ввода в автоматизированную систему. Необходимо отметить, что получить исходную информацию из имеющихся в ведомственных организациях архивов практически не представляется возможным без поддержки данных исследований высших руководством этих организаций.

3. Мониторинг: накопление в электронной форме информации по условиям и результатам выращивания (прежде всего с использованием верифицированной ретроспективной информации).

4. Анализ: изучение силы и направленности влияния факторов; оптимизация, т.е. устранение избыточности системы факторов.

5. Прогнозирование:

– пространственная интерполяция метеопараметров для заданного пункта по их значениям в трех ближайших метеостанциях (с учетом высоты места и наклона поверхности);

– определение начала и окончания фаз для различных сортов в заданном пункте выращивания на основе ретроспективных данных;

– прогнозирование количественных и качественных результатов выращивания различных сортов в заданном пункте выращивания.

6. Управление: разработка научно-обоснованных рекомендаций по выбору:

– оптимальных пунктов для выращивания заданного сорта;

– оптимального сорта для выращивания в заданных пунктах.

7. Картографическая визуализация

результатов прогнозирования и рекомендаций по управлению, получение отчетов и графических выходных форм.

При решении поставленных задач необходимо разработать математическую модель, алгоритмы и структуры данных, программный инструментарий и технологию его применения, обеспечивающие накопление баз данных о фактических результатах выращивания (мониторинг), анализ этих данных с целью выявления причинно-следственных зависимостей между свойствами сортов, условиями и результатами выращивания, прогнозирование результатов выращивания заданного сорта для любой точки на карте, картографическую визуализацию результатов прогнозирования.



Предлагаемая методология и технология


В данной работе автор предлагает методологию и технологию, сочетающие глубину, содержательность и интерпретируемость фундаментального подхода с технологичностью технического подхода. Суть этой технологии состоит в том, что, как в техническом подходе, на основе анализа временных рядов определенных параметров, характеризующих как само предприятие, так и экономическую и правовую среду, в которой оно действует, выделяется информация о событиях в этих областях. После этого, как в фундаментальном подходе, анализируются причинно–следственные взаимосвязи между событиями, и на основе этого разрабатываются прогнозы и рекомендации по управлению.

В самом общем виде принцип решения сформулированной выше проблемы с помощью инструментальной программной системы состоит в следующем:

– классифицируются изучаемые типы предприятий (например, по четырем шкалам: форма собственности;

– направление деятельности; объем деятельности; оправданность инвестиций);

– классифицируются параметры как самих предприятий, так и окружения, в котором они действуют;

– выбираются и описываются предприятия, относящиеся к различным категориям;

– описанные предприятия представляются инструментальной системе в качестве образцов, т.е. конкретных реализаций, относящихся к тем или иным категориям;

– формируются обобщенные образы различных категорий предприятий и определяется ценность выбранных параметров описания для идентификации типа и прогнозирования развития предприятий и уровня РСК;

– исключаются наименее ценные параметры описания;

– выводятся в текстовом и графическом виде развернутые характеристики различных уровней РСК;

– осуществляется кластерно-конструктивный анализ сходства и различия предприятий  с разными уровнями РСК;

– проводится содержательный структурно–функциональный анализ сходства и различия всевозможных предприятий с отличающимися уровнями РСК по параметрам: дается их смысловая характеристика, анализируется сходство и различие по смыслу, проводится их содержательное сравнение;

– создается инфраструктура разработки, применения и развития методик, основанных на предложенных интеллектуальных технологиях.

Подробнее эти этапы рассмотрены в работе [64].



Предлагаемая обобщенная схема


Сопоставительный анализ приведенных в таблице 3 и рисунке 9 схем системного и когнитивного анализа, показывает, что они во многом взаимно дополняют друг друга. Это говорит о возможности

объединения различных схем системного анализа и когнитивного анализа в одной схеме " системного анализа, ориентированного на интеграцию с когнитивными технологиями". Предполагается, что это целесообразно, т.к. полученная схема системного анализа более пригодна для формализации и автоматизации, чем приведенные схемы детализированного системного анализа. С учетом этого, а также модели реагирования открытых систем на вызовы среды, предложенной в 1984 В.Н. Лаптевым (рисунок 10), нами предложена схема системного анализа, ориентированного на интеграцию с когнитивными технологиями,

представленная на рисунке 11.

Рисунок 10. Схема реагирования открытой системы

на вызовы среды по В.Н.Лаптеву

 
Рисунок 11. Схема системного анализа, ориентированного

на интеграцию с когнитивными технологиями



Применение классической теории информации К.Шеннона для расчета весовых коэффициентов и мер сходства


Формально, распознавание есть не что иное, как принятие решения о принадлежности распознаваемого объекта или его состояния к определенному классу (классам) [9, 92]. Из этого следует внутренняя и органичная связь методов распознавания образов и принятия решений. Аналитический обзор позволяет сделать вывод, что наиболее глубокая основа этой связи состоит в том, что и распознавание образов, и принятие решений есть прежде всего снятие неопределенности. Распознавание снимает неопределенность в вопросе о том, к какому классу относится распознаваемый объект. Если до распознавания существовала неопределенность в вопросе о том, к какому классу относится распознаваемый объект или его состояние, то в результате распознавания эта неопределенность уменьшается, причем возможно и до нуля (когда объект идентифицируется однозначно). Принятие решения (выбор) также снимает неопределенность в вопросе о том, какое из возможных решений будет принято, если существовало несколько альтернативных вариантов решений и принимается одно из них.

Для строгого исследования процессов снятия неопределенности оптимальным является применение аппарата теории информации, которая как бы специально создана для этой цели. Из этого непосредственно следует возможность применения методов теории информации для решения задач распознавания и принятия решений в АСУ. Таким образом, теория информации может рассматриваться как единая основа методов распознавания образов и принятия решений.



Применение распознавания образов


Термины "Распознавание образов" и "Идентификация" являются синонимами.

Идентификация и прогнозирование часто практически ничем друг от друга не отличаются по математическим моделям и алгоритмам. Основное различие между ними состоит в том, что при идентификации признаки и состояния объекта относятся к одному времени, тогда как при прогнозировании признаки (факторы) относятся к прошлому, а состояния объекта – к будущему.

Это означает, что системы распознавания образов с успехом могут применяться не только для решения задач идентификации, но и прогнозирования.



Применения систем виртуальной реальности


Системы виртуальной реальности уже в настоящее время широко применяется во многих сферах жизни.

Одними из первых технологии виртуальной реальности были применены НАСА США для тренировки пилотов космических челноков и военных самолетов, при отработке приемов посадки, дозаправки в воздухе и т.п.

Самолет-невидика "Стелс" вообще управляется пилотом, практически находящемся в виртуальной реальности.

Из виртуальной реальности человек управляет роботом, выполняющим опасную или тонкую работу.

Технология Motion Capture, позволяет дистанционно "снять" движения с человека и присвоить их его трехмерной модели, что  широко применяется для создания компьютерных игр и анимации рисованных персонажей в фильмах.

Особенно эффективно применение виртуальной реальности в рекламе, особенно в Интернет-рекламе на стадии информирования и убеждения.

С использованием виртуальной реальности можно показывать различные помещения, например, совершить виртуальную экскурсию по музею, учебному заведению, дому, коттеджу или местности (прогулка по Парижу от туристической фирмы).

Во всех этих приложениях важно, что в отличие от трехмерной графики, виртуальная реальность обеспечивает эффект присутствия и личного участия пользователя в наблюдаемых им событиях.



Пример работы простого генетического алгоритма


На рисунке 85 приведен пример простого генетического алгоритма.

Рисунок 85. Простой генетический алгоритм

Работа ГА представляет собой итерационный процесс, который продолжается до тех пор, пока поколения не перестанут существенно отличаться друг от друга, или не пройдет заданное количество поколений или заданное время. Для каждого поколения реализуются отбор, кроссовер (скрещивание) и мутация. Рассмотрим этот алгоритм.

Шаг 1: генерируется начальная популяция, состоящая из N особей со случайными наборами признаков.

Шаг 2 (борьба за существование):

вычисляется абсолютная приспособленность каждой особи популяции к условиям среды f(i) и суммарная приспособленность особей популяции, характеризующая приспособленность всей популяции. Затем при пропорциональном отборе

для каждой особи вычисляется ее относительный вклад в суммарную приспособленность популяции Ps(i), т.е. отношение ее абсолютной приспособленности f(i) к суммарной приспособленности всех особей популяции (3):

( 3 )

В выражении (3) сразу обращает на себя внимание возможность сравнения абсолютной приспособленности i-й особи f(i)

не с суммарной приспособленностью всех особей популяции, а со средней абсолютной приспособленностью особи популяции (4):

( 4 )

Тогда получим (5):

( 5 )

Если взять логарифм по основанию 2 от выражения (5), то получим количество информации, содержащееся в признаках особи о том, что она выживет и даст потомство (6).

( 6 )

Необходимо отметить, что эта формула совпадает с формулой для семантического количества информации Харкевича, если целью считать индивидуальное выживание и продолжение рода. Это значит, что даже чисто формально приспособленность особи представляет собой количество информации, содержащееся в ее фенотипе о продолжении ее генотипа в последующих поколениях.

Поскольку количество потомства особи пропорционально ее приспособленности, то естественно считать, что если это количество информации:

– положительно, то данная особь выживает и дает потомство, численность которого пропорциональна этому количеству информации;


– равно нулю, то особь доживает до половозрелого возраста, но потомства не дает (его численность равна нулю);
– меньше нуля, то особь погибает до достижения половозрелого возраста.
Таким образом, можно сделать фундаментальный вывод, имеющий даже мировоззренческое звучание, о том, что естественный отбор представляет собой процесс генерации и накопления информации о выживании и продолжении рода в ряде поколений популяции, как системы.
Это накопление информации происходит на различных уровнях иерархии популяции, как системы, включающей:
элементы системы: отдельные особи;
взаимосвязи между элементами: отношения между особями в популяции, обеспечивающие передачу последующим поколениям максимального количества информации об их выживании и продолжении рода (путем скрещивания наиболее приспособленных особей и наследования рациональных приобретений);
цель системы: сохранение и развитие популяции, реализуется через цели особей: индивидуальное выживание и продолжение рода.
Фенотип соответствует генотипу и представляет собой его внешнее проявление в признаках особи. Особь взаимодействует с окружающей средой и другими особями в соответствии со своим фенотипом. В случае, если это взаимодействие удачно, то особь передает генетическую информацию, определяющую фенотип, последующим поколениям.
Шаг 3: начало цикла смены поколений.
Шаг 4: начало цикла формирования нового поколения.
Шаг 5 (отбор): осуществляется пропорциональный отбор особей, которые могут участвовать в продолжении рода. Отбираются только те особи популяции, у которых количество информации в фенотипе и генотипе о выживании и продолжении рода положительно, причем вероятность выбора пропорциональна этому количеству информации.
Шаг 6 (кроссовер): отобранные для продолжения рода на предыдущем шаге особи с заданной вероятностью Pc
подвергаются скрещиванию или кроссоверу (рекомбинации).
Если кроссовер происходит, то потомки получают по половине случайным образом определенных признаков от каждого из родителей.


Численность потомства пропорциональна суммарной приспособленности родителей. В некоторых вариантах ГА потомки после своего появления заменяют собой родителей и переходят к мутации.
Если кроссовер не происходит, то исходные особи – несостоявшиеся родители, переходят на стадию мутации.
Шаг 7 (мутация): выполняются операторы мутации. При этом признаки потомков с вероятностью Pm
случайным образом изменяются на другие. Отметим, что использование механизма случайных мутаций роднит генетические алгоритмы с таким широко известным методом имитационного моделирования, как метод Монте-Карло.
Шаг 8 (борьба за существование):
оценивается приспособленность потомков (по тому же алгоритму, что и на шаге 2).
Шаг 9: проверяется, все ли отобранные особи дали потомство.
Если нет, то происходит переход на шаг 5 и продолжается формирование нового поколения, иначе – переход на следующий шаг 10.
Шаг 10: происходит смена поколений:
– потомки помещаются в новое поколение;
– наиболее приспособленные особи из старого поколения переносятся в новое, причем для каждой из них это возможно не более заданного количества раз;
– полученная новая популяция замещает собой старую.
Шаг 11: проверяется выполнение условия останова генетического алгоритма. Выход из генетического алгоритма происходит либо тогда, когда новые поколения перестают существенно отличаться от предыдущих, т.е., как говорят, "алгоритм сходится", либо когда пройдено заданное количество поколений или заданное время работы алгоритма (чтобы не было "зацикливания" и динамического зависания в случае, когда решение не может быть найдено в заданное время ).
Если ГА сошелся, то это означает, что решение найдено, т.е. получено поколение, идеально приспособленное к условиям данной фиксированной среды обитания.
Иначе – переход на шаг 4 – начало формирования нового поколения.
В реальной биологической эволюции этим дело не ограничивается, т.к. любая популяция кроме освоения некоторой экологической ниши пытается также выйти за ее пределы освоить и другие ниши, как правило "смежные". Именно за счет этих процессов жизнь вышла из моря на сушу, проникла в воздушное пространство и поверхностный слой почвы, а сейчас осваивает космическое пространство.


Конечно, реальные генетические алгоритмы, на которых проводятся научные исследования, чаще всего мало похожи на приведенный пример. Исследователи экспериментируют с различными параметрами генетических алгоритмов, например: способами отбора особей для скрещивания; критериями приспособленности и жесткостью влияния факторов среды; способами выбора признаков, передающихся от родителей потомкам (рецессивные и не рецессивные гены и т.д.); интенсивностью, видом случайного распределения и направленностью мутаций; различными подходами к воспроизводству и отбору.
Поэтому под термином "генетические алгоритмы" по сути дела надо понимать не одну модель, а довольно широкий класс алгоритмов, подчас мало похожих друг на друга.
В настоящее время рассматривается много различных операторов отбора, кроссовера и мутации: турнирный отбор (Brindle, 1981; Goldberg и Deb, 1991), реализует n турниров, чтобы выбрать n
особей, при этом каждый турнир построен на выборке k элементов из популяции, и выбора лучшей особи среди них (наиболее распространен турнирный отбор с k=2); элитный отбор (De Jong, 1975) гарантируют, что при отборе обязательно будут выживать лучший или лучшие члены популяции совокупности (наиболее распространена процедура обязательного сохранения только одной лучшей особи, если она не прошла как другие через процесс отбора, кроссовера и мутации); двухточечный кроссовер (Cavicchio, 1970; Goldberg, 1989c) и равномерный кроссовер (Syswerda, 1989) отличаются способами наследования потомками признаков родителей.
Не смотря на то, что модели биологической эволюции, реализуемые в ГА, обычно сильно упрощены по сравнению с природным оригиналом, тем ни менее ГА являются мощным средством, которое может с успехом применяться для решения широкого класса прикладных задач, включая те, которые трудно, а иногда и вовсе невозможно, решить другими методами.

Пример решения


При создании методики выполнялись следующие работы:

1. Формулировка целей методики и в соответствии с ними разработка перечня прогнозируемых хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", рисунок 186):

 

Рисунок 186. Будущие состояния объекта управления: количественные и качественные результаты выращивания сельхозкультуры (зерновые колосовые)

2. Разработка формализованного паспорта результатов выращивания сельхозкультур, позволяющего описать в пригодной для компьютерной обработки форме результаты выращивания конкретной сельхозкультуры на конкретном поле, по конкретной технологии при конкретных условиях окружающей среды.

Соответственно, формализованный паспорт результатов выращивания состоит из трех частей:

– первая содержит целевые и нежелательные количественные и качественные результаты выращивания (классы);

– вторая – технологические факторы, которые можно рассматривать как средство достижения желаемых хозяйственных результатов (рисунок 187).

– третья – описывает не зависящие от воли человека факторы окружающей среды, прежде всего метеорологические, а также виды и состояние почв;

Рисунок 187. Видеограмма с фрагментом справочника описательных шкал

(технологические факторы)

3. Использование бумажного архива по выращиванию сельхозкультур для заполнения формализованных паспортов и ввода в программную инструментальную систему в качестве примеров выращивания (обучающей выборки) (рисунок 188). Синтез семантической информационной модели. Размерность модели составила: 35 прогнозируемых результатов выращивания, 188 градаций факторов, 217 прецедентов в обучающей выборке, 18594 факта.

Рисунок 188. Интерфейс ввода обучающей выборки

4. Выявление (на основе предъявленных реальных примеров выращивания сельхозкультур) взаимосвязей между применяемыми технологиями и полученными результатами и формирование информационных портретов по каждому возможному результату выращивания.
Информационный портрет хозяйственной ситуации представляет собой перечень технологических факторов с количественным указанием того, какое влияние оказывает каждый из них на осуществление данной ситуации (рисунок 189):






Рисунок 189. Примеры информационных портретов результатов выращивания "Высокое качество" и "Высокое количество"

5. Каждый из технологических факторов на основе приведенных примеров характеризуется тем, какое влияние он оказывает на осуществление каждой (целевой или нежелательной) хозяйственной ситуации (рисунок 190):



Рисунок 190. Семантический портрет признака:

"Предшественники – бобовые многолетние травы"

6. Сравнение различных хозяйственных ситуаций и формирование групп наиболее сходных из них (кластеров), а также определение кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом на экспериментальной базе данных был выявлен конструкт "качество–количество", означающий, что для получения высокого качества и большого количества необходимы совершенно противоположные и несовместимые (т.е. невозможные одновременно) почвы: предшественники и агротехнологические приемы (рисунок 191):



Рисунок 191. Конструкт классов: "Качество – количество"

и семантическая сеть классов по шкалам: "Качество – количество"

7. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти факторы предложено использовать для замены друг друга в случае необходимости (рисунок 192):



Рисунок 192. Конструкт факторов: "Предшественники бобовые … – Ротация первая…" и семантической сети факторов: "Предшественники – Глубина обработки почвы"

8. Проверка способности созданного приложения правильно прогнозировать хозяйственные результаты на массиве уже введенных формализованных паспортов показала, что валидность оказалась недостаточно высокой для практического применения: на уровне  58%.


Причиной этого являются артефакты, из- за которых некоторые хозяйственные ситуации оказались слабо детерминированными (рисунок 193).
Удаление артефактов привело к повышению интегральной валидности до 80%, что достаточно для практического использования методики (рисунок 194)



Рисунок 193. Интегральная и дифференциальная валидность методики до исключения артефактов
Рисунок 194. Интегральная и дифференциальная валидность методики после исключения артефактов

Таким образом, были решены две основные задачи:


1. Прогнозирование того, какие хозяйственные результаты наиболее вероятны (а какие практически невозможны) на данном виде почв и с данными предшественниками, а также при условии применения имеющихся в распоряжении агротехнологий (рисунок 195). Указана мера сходства прогнозируемой ситуации с каждым будущим состоянием.
Рисунок 195. Пример карточки прогнозирования для конкретных условий выращивания

 
2. Разработка рекомендаций по управляющим воздействиям, т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии
должны быть, чтобы можно было рассчитывать с определенной уверенностью на заданный хозяйственный результат (рисунок 189).
Система позволяет оценивать степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не просто дает рекомендацию, но и количественно оценивает степень ее надежности. Кроме того, система дает характеристику влияния каждого технологического приема и рекомендации по замене желательных, но очень дорогих или не имеющихся в наличии технологических приемов, другими, более дешевыми и доступными, и, при этом, имеющими сходное влияние на хозяйственные результаты.
Таким образом, данная методика позволяет "просматривать" различные варианты технологии, прогнозировать последствия применения различных технологических приемов, и на этой основе вырабатывать научно обоснованные рекомендации по выбору возделываемой культуры и оптимальной для поставленных целей агротехнологии.
В данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные.

Пример решения задания "Формализовать


Для этих целей используем таблицу 43 и рисунок 93. В результате получим таблицы 43 и 44.

Таблица 43 – КЛАССИФИКАЦИОННЫЕ

И ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

КЛАССЫ

ПРИЗНАКИ

Таблица 44 – ОБУЧАЮЩАЯ ВЫБОРКА

Наименование состава

Коды классов

Коды признаков

1

Состав-1

1

3

3

5

5

5

5

9

9

10

10

11

11

11

12

13

13

13

13

15

15

15

17

19

29

27

23

2

Состав-2

1

4

2

5

4

7

9

9

9

2

2

2

13

13

13

15

15

18

20

24

27

3

Состав-3

1

5

2

5

6

5

10

9

9

12

11

11

13

13

13

18

18

15

28

27

19

4

Состав-4

1

6

3

5

8

5

4

9

9

9

9

13

13

13

14

15

15

15

18

22

29

27

27

11

11

11

11

5

Состав-5

1

7

2

5

5

5

9

9

10

11

11

12

13

13

14

18

18

15

19

26

27

6

Состав-6

2

8

1

5

5

9

10

11

11

13

13

15

18

27

21

7

Состав-7

2

9

2

5

5

7

10

9

9

11

11

11

13

13

14

16

15

15

31

27

19

8

Состав-8

2

10

1

7

5

9

10

11

12

19

26

15

18

13

13

9

Состав-9

2

11

3

4

4

5

5

9

9

9

10

11

11

11

11

13

13

13

13

15

15

15

16

19

24

26

19

10

Состав-10

2

12

1

5

7

9

10

11

11

13

13

15

15

25

24


2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 50 и 52) описать каждому самого себя и занести эту информацию в таблицу 53 на доске. При необходимости количество строк и столбцов в этой таблице можно увеличить.
В результате на доске появляется таблица вида 54. Видно, что по ряду студентов нет описательной информации, а классификационная – минимальна. Это связано с тем, что они отсутствовали
на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки. У этих студентов данная работа не была зачтена. При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы:
Object.txt
и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 50 и 51.
Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000 и Windowsxp)
3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки".
Таблица 54 – ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА

ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ

Код
Наименование
Классы
Признаки
1
2
3
4
5
6
1
2
3
4
5
6
7
8
9
10
11
1
Бабенко ПИ-51
1
4
10
12
13
15
1
5
10
18
27
31
2
Воробьева ПИ-51
2
5
10
12
13
16
3
7
12
13
18
20
25
26
27
32
3
Гура ПИ-51
1
13
17
4
Гловнев ПИ-51
1
13
18
5
Дыбова ПИ-51
2
13
19
6
Жеребятьев ПИ51
1
5
8
12
13
20
2
8
10
18
21
27
30
7
Заяц ПИ-51
2
4
10
12
13
21
3
6
12
15
18
21
26
27
31
8
Иванова ПИ-51
2
3
7
12
13
22
2
5
12
13
14
15
18
21
26
32
9
Котенко ПИ-51
2
4
7
12
13
23
1
6
11
13
15
18
21
26
27
32
10
Кузина О. ПИ-51
2
3
8
12
13
24
1
7
11
14
18
22
26
27
32
11
Кузина Я. ПИ-51
2
3
8
12
13
25
1
7
14
17
22
32
12
Лях ПИ-51
1
3
8
12
13
26
1
5
9
13
17
18
20
24
26
27
31
13
Мясников ПИ-51
1
3
9
12
13
27
1
5
10
13
16
18
20
24
27
32
0
14
Нагапетян ПИ-51
1
4
9
12
13
28
1
6
11
15
18
21
24
26
27
30
0
15
Полонская ПИ-51
2
13
29
16
Трунина ПИ-51
2
13
30
17
Черкашина ПИ-51
2
4
10
12
13
31
3
6
11
13
18
21
24
26
27
30
18
Чепурченко ПИ51
1
13
32
19
Чушкин ПИ-51
1
13
33
20
Шульгин ПИ-51
1
5
8
12
13
34
1
5
9
17
20
26
30
21
Арушунян ПИ-52
1
14
35
22
Быченок ПИ-52
1
14
36
23
Веревкина ПИ-52
2
3
9
12
14
37
1
8
9
15
18
21
28
33
24
Григорьева ПИ52
2
4
8
12
14
38
2
5
9
13
18
22
28
33
25
Давыдич ПИ-52
2
14
39
26
Дронова ПИ-52
2
14
40
27
Еременко ПИ-52
2
4
8
12
14
41
2
5
12
9
13
15
18
21
26
27
31
28
Жмурко ПИ-52
1
14
42
29
Иванова ПИ-52
2
3
9
12
14
43
2
4
10
14
15
17
18
20
28
33
30
Костенко ПИ-52
2
14
44
31
Крейс ПИ-52
2
4
8
12
14
45
1
5
9
15
19
21
28
32
32
Куркина ПИ-52
2
3
8
12
14
46
3
6
11
13
15
18
19
22
26
27
32
33
Люлик ПИ-52
2
5
8
12
14
47
2
7
12
15
18
22
24
26
32
34
Максимов ПИ-52
1
14
48
35
Мануйлов ПИ-52
1
3
7
12
14
49
1
5
9
14
18
20
24
25
26
27
30
36
Нарижний ПИ-52
1
3
7
12
14
50
1
5
9
14
18
20
24
25
26
27
31
37
Ольховская ПИ52
2
14
51
38
Паршакова ПИ-52
2
6
8
12
14
52
2
6
11
13
19
22
26
32
39
Силенко ПИ-52
1
3
7
12
14
53
1
6
12
13
18
20
28
32
40
Соколова ПИ-52
2
4
8
12
14
54
1
5
12
17
18
22
24
26
27
32
41
Турбин ПИ-52
1
14
55
42
Цисарь ПИ-52
2
5
9
12
14
56
2
7
11
13
18
22
27
33

Пример решения задания Формализовать задачу: создать классификационные и описательные шкалы


Один из вариантов классификационных шкал и градаций представлен в таблице 51, а описательных – в таблице 52:

Таблица 51 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ

Таблица 52 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ



Пример решения задания Как посещаемость


Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков – Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость – это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 – 10. В результате получим экранную форму, приведенную на рисунке 103:

Рисунок 103. Информационный портрет признака:

30 "Посещаемость плохая", фильтр по успеваемости.

Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 104.

Рисунок 104. Информационный портрет признака:

32 "Посещаемость хорошая", фильтр по успеваемости.

Из этих рисунков видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей – высокая,  как и можно было ожидать. НО теперь этот вывод получен непосредственно на основе анализа эмпирических данных и является количественным.

Эту же информацию можно получить и другим способом.

В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе.

Пример решения задания Как сказывается пол на посещаемости?


В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания – Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость – это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти признаки, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 29 – 33. В результате получим экранную форму, приведенную на рисунке 107.

Рисунок 107. Информационный портрет класса:

1 "ПОЛ - мужской", фильтр по посещаемости.

Аналогично получим информационный портрет класса: код 2, "ПОЛ – женский". Результат представлен на рисунке 108.

Рисунок 108. Информационный портрет класса:

код 2 "ПОЛ – женский", фильтр по посещаемости.

Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек – очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем.



Пример решения задания Как выглядят


Ответ на первые три вопроса дает анализ, который можно провести в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-14;

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок109), а также получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 56):

Рисунок 109. Конструкт: "Пол"

Таблица 56 – КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ РАСПОЗНАВАНИЯ

 

Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме F5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-33;

– исключаем кластеры с одним признаком;

– не исключаем кластеры с тождественным набором признаков.

Результаты кластерно-конструктивного анализа признаков  можно получить в виде TXT-файла с именем Klas_prp.txt в поддиректории TXT (таблица 57):

Таблица 57 – КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ"



Пример решения задания Какие студенты


Чтобы ответить на этот вопрос необходимо провести в подсистеме: F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов);

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно получить в виде TXT-файла с именем Klas_obj.txt

в поддиректории TXT (таблица 58):

Таблица 58 – КОНСТРУКТ: "УЧЕБНАЯ ГРУППА"

15-10-04  10:53:27  Фильтр кодов: 13-56

========================================

|  Код |     Наименование     | Сход-  |

|класса| класса распознавания | ство % |

|=======================================

|   13 | ГРУППА ПИ-51.........|  100.00|

|   27 | Мясников ПИ-51.......|   43.60|

|   31 | Черкашина ПИ-51......|   40.11|

|   28 | Нагапетян ПИ-51......|   27.38|

|   15 | Бабенко ПИ-51........|   24.17|

|   21 | Заяц ПИ-51...........|   21.70|

|   20 | Жеребятьев ПИ-51.....|   16.21|

|   23 | Котенко ПИ-51........|   13.90|

|   34 | Шульгин ПИ-51........|    3.78|

|   46 | Куркина ПИ-52........|    0.98|

==========================================

|   16 | Воробьева ПИ-51......|   -0.35|

|   53 | Силенко ПИ-52........|   -1.79|

|   43 | Иванова ПИ-52........|   -3.81|

|   26 | Лях ПИ-51............|   -3.83|

|   24 | Кузина О. ПИ-51......|   -4.22|

|   25 | Кузина Я. ПИ-51......|   -5.27|

|   37 | Веревкина ПИ-52......|  -13.84|

|   54 | Соколова ПИ-52.......|  -14.71|

|   49 | Мануйлов ПИ-52.......|  -16.14|

|   45 | Крейс ПИ-52..........|  -17.43|

|   56 | Цисарь ПИ-52.........|  -23.11|

|   22 | Иванова ПИ-51........|  -23.42|

|   50 | Нарижний ПИ-52.......|  -24.32|


|   52 | Паршакова ПИ-52......|  -26.13|
|   41 | Еременко ПИ-52.......|  -30.56|
|   47 | Люлик ПИ-52..........|  -36.87|
|   38 | Григорьева ПИ-52.....|  -52.30|
|   14 | ГРУППА ПИ-52.........|  -64.51|
==========================================
Из таблицы 58 видно, что:
– студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51;
– студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52;
– студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков).
Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 13.

Пример решения задания "Оценить


В подсистеме "Оптимизация" режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава (таблица 50).

Таблица 50 – ПРИЗНАКИ В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ

08-11-04            18:49:35                         г.Краснодар

================================================================

| N° | Код |    Н а и м е н о в а н и е    |Ценн.|Сумма| Сумма |

|п/п |п.пр.|       п р и з н а к о в       | Бит | Бит |   %   |

================================================================

|   1|  14 |груз_2_коротких_прямоугольника.|0.476|0.476|  4.888|

|   2|  17 |груз_3_маленьких_круга.........|0.476|0.953|  9.776|

|   3|   3 |Кол-во_вагонов=2...............|0.431|1.384| 14.201|

|   4|  18 |груза_нет......................|0.414|1.798| 18.448|

|   5|  10 |груз_1_перевернутый_треугольник|0.405|2.202| 22.599|

|   6|  15 |груз_2_маленьких_круга.........|0.405|2.607| 26.750|

|   7|  30 |форма_вагона_ромбовидная.......|0.405|3.011| 30.901|

|   8|  27 |форма_вагона_U-образная........|0.388|3.399| 34.885|

|   9|   7 |груз_1_длинный_прямоугольник...|0.372|3.772| 38.705|

|  10|   9 |груз_1_короткий_прямоугольник..|0.372|4.144| 42.526|

|  11|   8 |груз_1_квадрат.................|0.358|4.502| 46.203|

|  12|  11 |груз_1_ромб....................|0.358|4.861| 49.881|

|  13|  13 |груз_1_шестиугольник...........|0.358|5.219| 53.559|

|  14|  16 |груз_3_квадрата................|0.358|5.577| 57.236|

|  15|  22 |крыша_вагона_двухскатная.......|0.358|5.936| 60.914|

|  16|  31 |форма_вагона_эллипсоидная......|0.358|6.294| 64.591|

|  17|  21 |крыша_вагона_гофрированная.....|0.358|6.652| 68.266|

|  18|   2 |N_осей_вагона=3................|0.323|6.975| 71.577|

|  19|  25 |стенки_вагона_двойные..........|0.315|7.290| 74.807|

|  20|   4 |Кол-во_вагонов=3...............|0.304|7.594| 77.927|

|  21|  28 |форма_вагона_V-образная........|0.280|7.873| 80.797|

|  22|  24 |крыша_вагона_прямая............|0.266|8.139| 83.523|

|  23|   5 |Кол-во_вагонов=4...............|0.263|8.402| 86.224|

|  24|  29 |форма_вагона_прямоугольная.....|0.206|8.608| 88.340|

|  25|  23 |крыша_вагона_отсутствует.......|0.201|8.809| 90.403|

|  26|  12 |груз_1_треугольник.............|0.191|9.000| 92.358|

|  27|   6 |груз_1_большой_круг............|0.190|9.190| 94.307|

|  28|  19 |длина_вагона_длинный...........|0.160|9.350| 95.954|

|  29|  20 |длина_вагона_короткий..........|0.158|9.508| 97.573|

|  30|   1 |N_осей_вагона=2................|0.141|9.649| 99.015|

|  31|  26 |стенки_вагона_одинарные........|0.096|9.745|100.000|

================================================================

Универсальная когнитивная аналитическая система      НПП *ЭЙДОС*

Накопительная диаграмма селективной силы (Парето-диаграмма) приведена на рисунке 94.

Рисунок 94. Парето-диаграмма ценности признаков для решения задач

идентификации, прогнозирования и управления


В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 102:

Рисунок 102. Экранная форма "Селективная сила признаков"

Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.

Более подробно эта информация представлена в таблице 55:

Таблица 55 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)

В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)

10-10-04            16:15:55                                                  г.Краснодар

=========================================================================================

|N°|Код |Код | Наименование            | Наименование          |Интегр.|Сумм.инт|Сумм.ин|

|  |К.шк|град| классификационной шкалы | градации              |инф-ть |инф. Бит|  в %  |

=========================================================================================

| 1|  5 | 19 |ОДЕЖДА:.................. Юбка...................|  0.470|   0.470|  4.147|

| 2|  3 | 10 |ЦВЕТ ГЛАЗ:............... Голубые................|  0.467|   0.938|  8.271|

| 3|  8 | 30 |ПОСЕЩАЕМОСТЬ:............ Плохая.................|  0.456|   1.393| 12.290|

| 4|  8 | 33 |ПОСЕЩАЕМОСТЬ:............ Очень хорошая..........|  0.438|   1.831| 16.150|

| 5|  2 |  8 |ЦВЕТ ВОЛОС:.............. Очень светлые..........|  0.437|   2.268| 20.002|

| 6|  1 |  3 |ДЛИНА ВОЛОС:............. Длинные................|  0.429|   2.697| 23.788|

| 7|  2 |  7 |ЦВЕТ ВОЛОС:.............. Крашеные...............|  0.421|   3.118| 27.502|

| 8|  1 |  2 |ДЛИНА ВОЛОС:............. Средние................|  0.418|   3.536| 31.192|

| 9|  7 | 28 |ДОСТАТОК:................ Ничего нет.............|  0.413|   3.949| 34.836|

|10|  5 | 17 |ОДЕЖДА:.................. Пиджак.................|  0.408|   4.357| 38.432|

|11|  7 | 25 |ДОСТАТОК:................ Есть автомобиль........|  0.408|   4.765| 42.027|

|12|  4 | 16 |НАЛИЧИЕ УКРАШЕНИЙ:.......


Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.

Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления

Рисунок 138. Парето-диаграмма ценности букв для идентификации слов

Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились

в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.

Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ

Код

Буква

Ценность (бит)

Ценность (бит)

"нарастающим итогом"

Ценность (%)

"нарастающим итогом"

1

66

Э

0,76988

0,76988

4,841

2

56

У

0,74529

1,51517

9,526

3

49

М

0,71090

2,22607

13,996

4

46

Й

0,69728

2,92335

18,380

5

61

Ш

0,68748

3,61083

22,703

6

47

К

0,68569

4,29652

27,014

7

67

Ю

0,66376

4,96028

31,187

8

52

П

0,66014

5,62042

35,338

9

64

Ы

0,65157

6,27199

39,434

10

41

Д

0,64023

6,91222

43,460

11

68

Я

0,63612

7,54834

47,459

12

44

З

0,62131

8,16965

51,366

13

65

Ь

0,59697

8,76662

55,119

14

38

Б

0,59622

9,36284

58,868

15

53

Р

0,58610

9,94894

62,553

16

59

Ц

0,57201

10,52095

66,149

17

40

Г

0,56958

11,09053

69,730

18

39

В

0,55490

11,64543

73,219

19

62

Щ

0,52045

12,16588

76,492

20

37

А

0,51477

12,68065

79,728

21

48

Л

0,50010

13,18075

82,872

22

54

С

0,47977

13,66052

85,889

23

55

Т

0,47498

14,13550

88,875

24

51

О

0,46548

14,60098

91,802

25

50

Н

0,45089

15,05187

94,637

26

45

И

0,43046

15,48233

97,343

27

42

Е

0,42253

15,90486

100,000



Пример решения задания "Осуществить


Основная матрица семантической информационной модели приведена в таблице 47.

Таблица 47 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ

Атр

Коды классов

Сум.

Ср.

Отк.

1

2

3

4

5

6

7

8

9

10

11

12

1

-0,03

0,03

-0,08

0,09

-0,16

0,09

-0,16

0,07

0,09

-0,35

0,09

0,07

-0,23

-0,02

0,14

2

0,17

-0,34

0,39

 

0,55

 

0,55

 

 

0,78

 

 

2,11

0,18

0,32

3

 

0,5

 

 

 

 

 

0,96

 

0,96

 

0,96

3,37

0,28

0,43

4

0,17

-0,34

 

0,55

0,55

 

0,55

 

0,55

 

 

 

2,05

0,17

0,30

5

0,1

-0,16

0,56

 

 

0,56

 

 

 

 

0,56

 

1,62

0,14

0,26

6

-0,16

0,16

0,05

 

0,22

 

0,22

 

0,22

0,44

0,47

 

1,60

0,13

0,19

7

-0,32

0,26

 

 

 

 

0,73

 

 

0,96

0,56

 

2,18

0,18

0,37

8

0,35

 

 

 

 

1,22

 

 

 

 

 

 

1,57

0,13

0,36

9

-0,32

0,26

 

0,73

 

 

 

 

 

 

0,56

0,96

2,18

0,18

0,37

10

0,35

 

 

 

1,39

 

 

 

 

 

 

 

1,74

0,14

0,40

11

0,35

 

 

 

0

1,22

 

 

 

 

 

 

1,57

0,13

0,36

12

0,17

-0,34

-0,03

0,13

0,13

0,39

0,13

0,36

0,13

 

 

 

1,09

0,09

0,19

13

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

14

 

0,5

 

 

 

 

 

 

 

 

 

1,62

2,12

0,18

0,48

15

0,35

 

 

1,39

 

 

 

 

 

 

 

 

1,74

0,14

0,40

16

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

17

 

0,5

 

 

 

 

 

1,62

 

 

 

 

2,12

0,18

0,48

18

 

0,5

 

 

 

 

 

0

1,39

 

 

 

1,89

0,16

0,41

19

-0,14

0,15

0,32

 

0,06

 

0,06

0,29

0,06

0,29

-0,1

0,29

1,29

0,11

0,16

20

0,06

-0,08

-0,2

0,22

-0,03

0,22

-0,03

-0,22

-0,03

-0,22

0,05

-0,22

-0,48

-0,04

0,16

21

 

0,5

 

 

 

 

 

 

0,97

 

0,81

 

2,28

0,19

0,36

22

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

23

-0,04

0,05

0,11

0,03

-0,39

0,11

-0,39

-0,16

0,03

-0,16

0,11

0,26

-0,43

-0,04

0,20

24

0,17

-0,34

 

0,13

0,55

-0,03

0,55

0,36

 

0,36

 

 

1,77

0,15

0,27

25

0,1

-0,16

 

 

 

0,56

0,73

 

0,73

 

 

 

1,95

0,16

0,31

26

-0,01

0,01

0,07

0,06

0,06

-0,1

-0,18

0,05

-0,18

0,05

0,07

0,05

-0,05

0,00

0,10

27

-0,49

0,33

 

0,55

 

 

 

 

0,55

0,78

 

0,78

2,51

0,21

0,39

28

-0,07

0,08

 

0,55

 

0,39

 

 

 

 

0,81

0

1,76

0,15

0,28

29

0,04

-0,05

0,25

-0,42

 

-0,17

0,24

0,23

 

-0,19

-0,17

-0,19

-0,42

-0,03

0,21

30

0,35

 

 

 

1,39

 

 

 

 

 

 

 

1,74

0,14

0,40

31

0,35

 

 

 

 

1,22

 

 

 

 

 

 

1,57

0,13

0,36

Сум.

2,53

2,01

5,12

4,02

4,34

5,70

3,01

3,56

4,51

3,71

3,82

4,58

46,91

 

 

Ср.

0,08

0,06

0,17

0,13

0,14

0,18

0,10

0,12

0,15

0,12

0,12

0,15

 

0,13

 

Отк.

0,22

0,25

0,38

0,32

0,38

0,39

0,26

0,35

0,34

0,33

0,26

0,39

 

 

0,33



Пример решения задания Осуществить синтез и верификацию модели


Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.

Для этого студентам необходимо выполнить следующие действия:

1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД".

2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [64] корреляция".

3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".


Синтез модели осуществляется на основе обучающей выборки (таблица69) в соответствующем режиме (рисунок 123) после формирования классификационных и описательных шкал и градаций и обучающей выборки.

Рисунок 123. Режим "Синтез семантической информационной модели"

системы "Эйдос"

В результате синтеза семантической информационной модели рассчитываются две ее основные матрицы: матрица абсолютных частот (таблица 70) и матрица информативностей (таблица 71).

В матрице частот отражается суммарное количество встреч каждого признака у объектов каждого класса по данным обучающей выборки. Каждый элемент матрицы информативностей показывает, какое количество информации о переходе объекта управления в состояние, соответствующее классу, мы получаем, если узнаем, что действует некоторый признак.

Таблица 70 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ (ФРАГМЕНТ)

Коды

букв

Коды классов (слов)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

37

2

1

1

1

1

2

38

1

1

1

1

1

39

1

1

1

1

1

1

1

40

1

1

1

1

41

1

1

1

1

1

1

42

1

1

1

1

1

2

1

1

1

43

44

1

45

2

1

2

1

1

1

1

2

1

1

1

46

1

1

1

47

1

1

1

1

2

2

1

48

1

1

1

1

1

1

1

1

1

1

49

1

1

50

1

1

2

1

3

3

51

2

1

2

1

1

2

1

3

3

52

1

53

1

1

1

1

54

1

1

1

1

2

1

55

1

1

2

1

1

1

56

1

1

<


Таблица 71 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ (ФРАГМЕНТ)

Коды

букв
Коды классов (слов)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
37
1,0
1,1
0,6
1,1
1,7
1,0
38
1,2
0,9
1,8
1,8
1,6
39
1,1
1,6
1,4
1,3
1,3
0,7
1,4
40
1,0
1,7
1,2
1,0
41
1,0
1,9
1,7
1,7
1,1
2,1
42
0,4
0,9
0,6
0,9
0,7
0,9
0,7
1,1
0,2
43
44
4,1
45
1,0
1,3
0,3
0,2
1,1
0,2
1,4
0,9
0,7
46
1,8
2,0
1,6
47
0,8
1,0
1,2
1,2
2,5
1,9
1,2
48
0,8
0,4
1,0
0,7
1,2
0,6
1,4
1,2
1,2
0,4
49
2,8
2,7
50
0,4
0,9
0,2
1,2
1,1
51
0,4
0,7
-0,5
0,1
-0,6
1,1
0,3
52
1,3
53
0,6
1,7
1,5
1,3
54
0,6
0,2
1,0
1,0
1,1
0,4
55
0,1
1,0
0,9
1,2
0,8
0,8
56
2,0
1,3
<


Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую (рисунок 124), распознавания (рисунок 125, 126) и измерения дифференциальной и интегральной валидности (рисунок 127):


Рисунок 124. Режим "Ввод-корректировка обучающей выборки"

системы "Эйдос" (копирование ее в распознаваемую – F5)



Рисунок 125. Выбор режима "Пакетное распознавание"

системы "Эйдос"



Рисунок 126. Выполнение режима "Пакетное распознавание"

системы "Эйдос"



Рисунок 127. Выбор режима "Измерение адекватности модели"

системы "Эйдос"



Рисунок 128. Режим "Измерение адекватности модели"

системы "Эйдос"

Видим, что модель адекватна, т.к. интегральная валидность составляет 100%. Это означает, что при идентификации слов на основе знания входящих в них букв системой не было допущено ни одной ошибки, причем необходимо специально отметить, что при этом в модели не учитывались последовательность букв и их сочетаний.

Пример решения задания "Проверить


В примере, исследуемом в данной лабораторной работе, неполнота информации – это пропуск букв, а наличие шума – замена верных букв неверными.


С этой целью в текстовый файл специально включены такие слова, как: "око", "окорок", "молоко".

Результаты их идентификации приведены на рисунке 136:

Рисунок 136. Карточка результатов распознавания системы "Эйдос"

в случае идентификации классов, один из которых

является подмножеством других

Как видим, идентификация классов, один из которых является подмножеством других, осуществляется правильно. Это является важным достоинством семантической информационной модели системы "Эйдос", т.к. представляет собой проблему для многих типов нейронных сетей. Достаточно отметить, что возможность решения подобных задач считается одним из основных достоинств развитой модели нейронной сети, реализованной в неокогнитроне Фукушимы.



Пример решения задания "Провести


В подсистеме: "Типология", "Информационные портеры классов" системы "Эйдос" получаем следующие информационные портреты классов (таблицы 48 и49).

 ТАБЛИЦА 48 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА РАСПОЗНАВАНИЯ:

Код:    1   Наименование: Состав следует на ВОСТОК

08-11-04  18:48:42      Фильтр: All, Positive       г.Краснодар

===============================================================

| N |Код |    Н а и м е н о в а н и я   |Инфор-|Инфор-|Суммар |

|п/п|приз|       п р и з н а к о в      |мат-ть|мат-ть|инф-ть |

|   |нака|                              | Бит. |  %   |  %%   |

|=============================================================|

|  1    8 груз_1_квадрат................. 0.347   9.67    9.7 |

|  2   10 груз_1_перевернутый_треугольник 0.347   9.67   19.3 |

|  3   11 груз_1_ромб.................... 0.347   9.67   29.0 |

|  4   13 груз_1_шестиугольник........... 0.347   9.67   38.7 |

|  5   15 груз_2_маленьких_круга......... 0.347   9.67   48.4 |

|  6   16 груз_3_квадрата................ 0.347   9.67   58.0 |

|  7   22 крыша_вагона_двухскатная....... 0.347   9.67   67.7 |

|  8   30 форма_вагона_ромбовидная....... 0.347   9.67   77.4 |

|  9   31 форма_вагона_эллипсоидная...... 0.347   9.67   87.0 |

| 10    2 N_осей_вагона=3................ 0.173   4.82   91.8 |

| 11    4 Кол-во_вагонов=3............... 0.173   4.82   96.7 |

| 12   12 груз_1_треугольник............. 0.173   4.82  101.5 |

| 13   24 крыша_вагона_прямая............ 0.173   4.82  106.3 |

| 14    5 Кол-во_вагонов=4............... 0.102   2.84  109.2 |

| 15   25 стенки_вагона_двойные.......... 0.102   2.84  112.0 |

| 16   20 длина_вагона_короткий.......... 0.057   1.59  113.6 |

| 17   29 форма_вагона_прямоугольная..... 0.038   1.07  114.7 |

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

| 18   26 стенки_вагона_одинарные........-0.008  -0.23  114.9 |

| 19    1 N_осей_вагона=2................-0.027  -0.75  115.6 |

| 20   23 крыша_вагона_отсутствует.......-0.041  -1.14  116.8 |

| 21   28 форма_вагона_V-образная........-0.072  -2.00  118.8 |

| 22   19 длина_вагона_длинный...........-0.143  -3.99  122.8 |

| 23    6 груз_1_большой_круг............-0.165  -4.60  127.4 |

| 24    7 груз_1_длинный_прямоугольник...-0.316  -8.83  136.2 |

| 25    9 груз_1_короткий_прямоугольник..-0.316  -8.83  145.0 |

| 26   27 форма_вагона_U-образная........-0.490 -13.67  158.7 |

===============================================================

Универсальная когнитивная аналитическая система     НПП *ЭЙДОС*

<

 ТАБЛИЦА 49 – ВЛИЯНИЕ ПРИЗНАКОВ

НА РЕЗУЛЬТАТ ПРОГНОЗИРОВАНИЯ:

"НАПРАВЛЕНИЕ СЛЕДОВАНИЯ  – НА ЗАПАД"
ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА РАСПОЗНАВАНИЯ:
Код:    2   Наименование: Состав следует на ЗАПАД
08-11-04  18:49:04       Фильтр: All, Positive      г.Краснодар
===============================================================
| N |Код |    Н а и м е н о в а н и я   |Инфор-|Инфор-|Суммар |
|п/п|приз|       п р и з н а к о в      |мат-ть|мат-ть|инф-ть |
|   |нака|                              | Бит. |  %   |  %%   |
|=============================================================|
|  1    3 Кол-во_вагонов=2..............  0.500  13.94   13.9 |
|  2   14 груз_2_коротких_прямоугольника  0.500  13.94   27.9 |
|  3   17 груз_3_маленьких_круга........  0.500  13.94   41.8 |
|  4   18 груза_нет.....................  0.500  13.94   55.8 |
|  5   21 крыша_вагона_гофрированная....  0.500  13.94   69.7 |
|  6   27 форма_вагона_U-образная.......  0.326   9.10   78.8 |
|  7    7 груз_1_длинный_прямоугольник..  0.255   7.12   85.9 |
|  8    9 груз_1_короткий_прямоугольник.  0.255   7.12   93.0 |
|  9    6 груз_1_большой_круг...........  0.162   4.52   97.6 |
| 10   19 длина_вагона_длинный..........  0.145   4.05  101.6 |
| 11   28 форма_вагона_V-образная.......  0.082   2.27  103.9 |
| 12   23 крыша_вагона_отсутствует......  0.049   1.36  105.2 |
| 13    1 N_осей_вагона=2...............  0.033   0.93  106.2 |
| 14   26 стенки_вагона_одинарные.......  0.010   0.29  106.5 |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| 15   29 форма_вагона_прямоугольная.... -0.053  -1.48  107.9 |
| 16   20 длина_вагона_короткий......... -0.083  -2.30  110.2 |
| 17    5 Кол-во_вагонов=4.............. -0.163  -4.55  114.8 |
| 18   25 стенки_вагона_двойные......... -0.163  -4.55  119.3 |
| 19    2 N_осей_вагона=3............... -0.337  -9.40  128.7 |
| 20    4 Кол-во_вагонов=3.............. -0.337  -9.40  138.1 |
| 21   12 груз_1_треугольник............ -0.337  -9.40  147.5 |
| 22   24 крыша_вагона_прямая........... -0.337  -9.40  156.9 |
===============================================================
Универсальная когнитивная аналитическая система     НПП *ЭЙДОС*

Пример решения задания Провести анализ модели


Анализ модели позволяет дать обоснованные ответы, например, на следующие вопросы:

1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

2. Как сказывается пол на посещаемости?

3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?

Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.



Пример решения задания Результаты


Семантические сети классов отображаются на экране и записываются в форме PCX-файла в поддиректории: PCX/Klas-obj в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 110 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы).

Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: PCX/NeuroNet. На рисунке 111 приведен нелокальный нейрон: "Успеваемость: очень хорошая".

Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков – Кластерный и конструктивный анализ – Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде PCX-файла в поддиректории: PCX/Klas-att.

На рисунке 112 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке111 нейроне (показаны только те связи между признаками, которые оказались больше 30%):

Рисунок 110. Семантическая сеть классов

Рисунок 111. Нелокальный нейрон: "Успеваемость: очень хорошая"

Рисунок 112.  Семантическая сеть признаков, оказавшихся наиболее значимыми в нелокальном нейроне: "Успеваемость: очень хорошая"

Если дополнить графическое изображение нейрона на рисунке 111 связями между признаками, показанными в семантической сети на рисунке 112, то получим классическую когнитивную карту. Студентам это предлагается сделать самостоятельно в 7-м режиме 6-й подсистемы, также как и получить когнитивные карты для других уровней успеваемости.



Пример решения задания "Сгенерировать классификационные и описательные шкалы"


Для этого используем режим: "F1 Словари – Автоввод первичных признаков и TXT-файлов – F3 Признаки – слова".

Классы во втором задании те же самые, что и в первом. Признаки выглядят несколько иначе, т.к. формируются автоматически из текстовых описаний составов, но по смыслу они также совпадают (таблица 45).

Таблица 45 – КЛАССИФИКАЦИОННЫЕ И ОПИСАТЕЛЬНЫЕ

ШКАЛЫ И ГРАДАЦИИ

КЛАССЫ

=====================================

| Код  | Н а и м е н о в а н и е    |

|класса|   класса распознавания     |

|===================================|

|    1 | Состав следует на ВОСТОК   |

|    2 | Состав следует на ЗАПАД    |

|    3 | Состав-01                  |

|    4 | Состав-02                  |

|    5 | Состав-03                  |

|    6 | Состав-04                  |

|    7 | Состав-05                  |

|    8 | Состав-06                  |

|    9 | Состав-07                  |

|   10 | Состав-08                  |

|   11 | Состав-09                  |

|   12 | Состав-10                  |

=====================================

ПРИЗНАКИ

=======================================

|   1|N_осей_вагона=2                 |

|   2|N_осей_вагона=3                 |

|   3|Кол-во_вагонов=2                |

|   4|Кол-во_вагонов=3                |

|   5|Кол-во_вагонов=4                |

|   6|груз_1_большой_круг             |

|   7|груз_1_длинный_прямоугольник    |

|   8|груз_1_квадрат                  |

|   9|груз_1_короткий_прямоугольник   |

|  10|груз_1_перевернутый_треугольник |

|  11|груз_1_ромб                     |

|  12|груз_1_треугольник              |

|  13|груз_1_шестиугольник            |

|  14|груз_2_коротких_прямоугольника  |

|  15|груз_2_маленьких_круга          |

|  16|груз_3_квадрата                 |

|  17|груз_3_маленьких_круга          |

|  18|груза_нет                       |

|  19|длина_вагона_длинный            |

|  20|длина_вагона_короткий           |

|  21|крыша_вагона_гофрированная      |

|  22|крыша_вагона_двухскатная        |

|  23|крыша_вагона_отсутствует        |

|  24|крыша_вагона_прямая             |

|  25|стенки_вагона_двойные           |

|  26|стенки_вагона_одинарные         |

|  27|форма_вагона_U-образная         |

|  28|форма_вагона_V-образная         |

|  29|форма_вагона_прямоугольная      |

|  30|форма_вагона_ромбовидная        |

|  31|форма_вагона_эллипсоидная       |

=======================================


Используем режим: "F2 Обучение – Ввод – корректировка обучающей выборки – F7 InpTXT – F6 Ввод из всех файлов". Затем необходимо дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток". Обучающая выборка будет иметь вид, приведенный в таблице 46.

Таблица 46 – ОБУЧАЮЩАЯ ВЫБОРКА

Этапы синтеза модели, ее оптимизации, проверки адекватности (которая в данном случае равна 100 %) и анализа подробно описаны в работах [64, 92]. Поэтому в данной работе мы приведем лишь их результаты.



Пример решения задания "Создать


Создать стандартизированные (с использованием рисунка 1) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB с именами вида: ####-zap.txt и ####-vos.txt, где #### – номер анкеты (состава): 0001, 0002 и т.д., а остальные символы – произвольные, но выбираются таким образом, чтобы они отражали содержание анкеты.

0001-VOS.TXT

Кол-во_вагонов=4

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=3

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_двухскатная

груз_1_большой_круг

груз_1_шестиугольник

груз_1_треугольник

груз_3_квадрата

0002-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_V-образная

форма_вагона_U-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_2_маленьких_круга

груз_1_короткий_прямоугольник

груз_1_треугольник

0003-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_ромбовидная

длина_вагона_длинный

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=3

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_прямая

крыша_вагона_прямая

груз_1_большой_круг

груз_1_треугольник

груз_1_перевернутый_треугольник

0004-VOS.TXT

Кол-во_вагонов=4

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_эллипсоидная

форма_вагона_V-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_двойные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_1_квадрат

груз_1_треугольник

груз_1_треугольник

груз_1_ромб

0005-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=3

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_двойные

крыша_вагона_отсутствует

крыша_вагона_прямая

крыша_вагона_прямая

груз_1_большой_круг

груз_1_треугольник

груз_1_длинный_прямоугольник

0006-ZAP.TXT

Кол-во_вагонов=2

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_3_маленьких_круга

груз_1_треугольник

<

0007-ZAP.TXT
Кол-во_вагонов=3
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_двойные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_гофрированная
груза_нет
груз_1_большой_круг
груз_1_треугольник
0008-ZAP.TXT
Кол-во_вагонов=2
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=3
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_прямая
груз_1_большой_круг
груз_1_длинный_прямоугольник
0009-ZAP.TXT
Кол-во_вагонов=4
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_V-образная
форма_вагона_V-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_гофрированная
груз_1_большой_круг
груз_1_большой_круг
груз_1_длинный_прямоугольник
груз_1_короткий_прямоугольник
0010-ZAP.TXT
Кол-во_вагонов=2
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
груз_1_короткий_прямоугольник
груз_2_коротких_прямоугольника

Пример решения задания "Сравнить


Сравним составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). В подсистеме "Типология" режиме "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов" выводим конструкт: "Идущие на запад" и "Идущие на восток" (рисунки 95 и 96).

Рисунок 95. Подсистема "Типология", режим "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов"

Рисунок 96. Конструкт: "Идущие на запад" и "Идущие на восток"

Из рисунка 4 видно, что:

– составы 4-й, 1-й и 3-й являются типичными для "Идущих на восток", а 5-й и, особенно 2-й, – нетипичными;

– составы 10-й, 9-й и 8-й являются типичными для "Идущих на запад", а 7-й и, особенно 6-й, – нетипичными.

Выведем в графической форме семантические сети составов.

Семантические сети классов отображают результаты кластерно-конструктивного анализа в графической форме. Для этого используется режим: "Вывод 2d-семантических сетей классов" (рисунок 95). Результат приведен на рисунке 97.

Рисунок 97. Семантическая сеть классов

Построим классические когнитивные карты для составов, идущих на запад и на восток". В Системе "Эйдос" классическая когнитивная карта строится из двух графических диаграмм:

1. Неклассического нейрона (подсистема "Анализ", режим "Графическое отображение нелокальных нейронов" (рисунок 98)).

2. Семантической сети признаков (подсистема "Типология", режим "Кластерный и конструктивный анализ признаков – вывод 2d-семантических сетей признаков" (рисунок 99)).

Рисунок 98. Задание режима

отображения нелокальных

нейронов

Рисунок 99. Задание режима

отображения семантических

сетей признаков

Результаты, т.е. когнитивные карты для составов, идущих на восток и запад, приведены на рисунках 100 и 101.







Рисунок 100. Когнитивная карта

для составов, идущих на восток
Рисунок 101. Когнитивная карта

для составов, идущих на восток

Из этих рисунков видно, что классическая когнитивная карта может быть изображена в форме конуса, но для наглядности изображения большого объема информации его вершина и боковая поверхность показаны в форме нейрона, а основание – в форме семантической сети.

Пример решения задания "Вывести


Эти возможности реализуются в режимах, выход на которые показан на рисунке 140. Семантическая сеть классов отображает в графической форме результаты кластерно-конструктивного анализа слов (рисунок 146), а признаков – букв (рисунок 147). Красный цвет линии связи в семантических сетях означает сходство, а синяя – различие, толщина линии соответствует степени выраженности этого свойства. Детальную структуру любой линии связи на семантических сетях можно исследовать на когнитивных диаграммах классов (рисунок 148) и признаков (рисунок 149). Классическая когнитивная карта для слова "Останавливать" приведена на рисунке 150. Классическая когнитивная карта представляет собой графическую диаграмму, объединяющую изображение нейрона и семантической сети его рецепторов. Классическая когнитивная карта представляет собой подмножество "Интегральной когнитивной карты", в которой объединены семантический сети нейронов и рецепторов и фрагмент нейронной сети, соединяющей рецепторы с нейронами. Режим системы "Эйдос" "Классические и интегральные когнитивные карты" позволяет при соответствующих параметрах, задаваемых в диалоге, генерировать и выводить в графической форме как интегральные,  так и классические когнитивные карты, а также инвертированные когнитивные карты, представляющие собой семантическую сеть нейронов, соединенных фрагментов нейронной сети с одним рецептором.

Рисунок 146. Семантическая сеть классов (слов)

Рисунок 147. Семантическая сеть признаков (букв)

Рисунок 148. Детальная структура сходства слов "Молоко" и "Око"

Рисунок 149. Детальная структура сходства букв "Е" и "Н"

Рисунок 150. Классическая когнитивная карта для слова

"Останавливать", генерируемая системой "Эйдос" версии 10.7

Рисунок 151. Пример интегральной когнитивной карты,

генерируемой системой "Эйдос" версии 12.5



Примерная структура реферата


Результаты самостоятельной работы оформляются студентами в форме реферата, примерная структура которого приведена ниже. Реферат оформляется как научная работа.

Во введении кратко описывается основное содержание и структура работы.

В первой главе с условным наименованием: "Постановка задачи и пути ее решения":

– обосновывается актуальность проблемы или задачи, решению которой посвящена работа;

– формулируются и обосновываются требования к методу решения поставленной проблемы или задачи. Если требования имеют "разный вес" или "разную значимость", то для оценки относительной важности критериев можно использовать экспертные оценки в какой-либо количественной шкале;

– делается аналитический обзор (по литературе и материалам Internet) традиционных методов решения, причем каждый метод оценивается по обоснованным критериям;

– по результатам литературного обзора составляется рейтинг традиционных методов и делается вывод, что такой-то метод является наилучшим. Однако и он не полностью соответствует сформулированным требованиям. Поэтому в следующей главе Вы предлагаете и реализуете свою концепцию решения поставленной задачи, свободную от указанных ограничений.

Во второй главе с условным наименованием: "Предлагаемое решение задачи":

– предлагаемая концепция может заключаться в том, что Вы как-то развиваете или модифицируете наилучший из рассмотренных методов;

– затем Вы подробно описываете свое решение, конкретизирующее концепцию: описываете математическую модель; методику численных расчетов, т.е. структуры данных и алгоритмы, реализующие математическую модель; программную реализацию математического метода и методики численных расчетов;

– после этого описываете, как созданный Вами инструментарий позволил решить поставленную проблему или задачу, приводите образцы входных и выходных форм с численными расчетами, подтверждающими эффективность предложенного подхода.

В третьей главе с условным наименованием: "Эффективность и перспективы":

– анализируя причины эффективности предложенной технологии показываете и ее ограничения, а потом делаете вывод о ее более широкой применимости, чем только для решения сформулированной проблемы или задачи;

– описываете перспективы развития предложенной технологии, в частности, пути преодоления сформулированных ее ограничений.

В заключении делается вывод о том, что предложенный подход к решению поставленной задачи оказался успешным и преспективным.

В научной статье каждый из пунктов может быть представлен одним абзацем, кроме 6-го, который составляет основной объем статьи. Если описывать более подробно, может получиться соответственно, реферат, курсовая, дипломная, кандидатская (решена практически важная задача) или докторская (решена теоретически важная научная проблема и, на основе этого, ряд практически важных задач).



Примеры применения генетических алгоритмов


Данный раздел основан на статье Алексея Андреева "Электродарвин" (http://www.fuga.ru/articles/2004/03/genetic-pro.htm), к которой мы и отсылаем за очень интересными подробностями.

В 1994 году Эндрю Кин из университета Саутгемптона использовал генетический алгоритм в дизайне космических кораблей. За основу была взята модель опоры космической станции, спроектированной в NASA из которой после смены 15 поколений, включавших 4.500 вариантов дизайна, получилась модель, превосходящая по тестам тот вариант, что разработали люди.

Аналогичный генетический алгоритм был использован NASA при разработке антенны для спутника.

Джон Коза из Стэнфорда разработал технологию генетического программирования, в которой результатом эволюции становятся не отдельные числовые параметры "особей", а целые имитационные программы, которые являются виртуальными аналогами реальных устройств. Эта технология позволила компании Genetic Programming повторить 15 человеческих изобретений, 6 из которых были запатентованы после 2000 года, то есть представляют собой самые передовые достижения, а один из контроллеров, "выведенных" в GP, даже превосходит аналогичную человеческую разработку.

Сейчас плоды электронной эволюции можно найти в самых разных сферах: от двигателя самолета Boeing 777 до новых антибиотиков.

Генетические алгоритмы представляют собой компьютерное моделирование эволюции. Материальное воплощение сконструированных таким образом систем до сих пор была невозможна без участия человека. Однако интенсивно ведутся работы, результатом которых является уменьшение зависимости машинной эволюции от человека. Эти работы ведутся по двум основным направлениям:

1. Естественный отбор, моделируемый ГА, переносится из виртуального мира в реальный, например, проводятся эксперименты по реальным битвам роботов на выживание.

2. Интеллектуальные системы, основанные на ГА, конструируют роботов, которые в принципе могут быть изготовлены на автоматизированных заводах без участия человека.



Принципы эквивалентности (относительности) Галилея и Эйнштейна и критерии виртуальной реальности


Вспомним известные в физике принципы относительности Галилея и Эйнштейна:

1. Никакими экспериментами внутри замкнутой системы невозможно отличить состояние покоя от состояния равномерного и прямолинейного движения (Галилей). Следовательно, покоящаяся система отсчета физически эквивалентна системе отсчета, движущейся равномерно и прямолинейно под действием сил инерции.

2. Никакими экспериментами внутри ограниченной по размерам замкнутой системы невозможно установить, движется она под действием сил гравитации или по инерции (Эйнштейн). Следовательно, система отсчета, движущаяся в поле сил тяготения физически эквивалентна системе отсчета, движущейся под действием сил инерции.

Легко заметить, что формулировка 7-го пункта в определении системы виртуальной реальности весьма сходна с формулировками принципов относительности Галилея и Эйнштейна: никакими действиями внутри виртуальной реальности, осуществляемыми над ее объектами, в т.ч. объектами виртуального интерфейса, с помощью своего виртуального тела, невозможно установить, "истинная" эта реальность или виртуальная.

Следовательно, виртуальная система отсчета, локализованная в полнофункциональной виртуальной реальности полностью физически эквивалентна физической системе отсчета, локализованной в "истинной реальности". Учитывая эту аналогию, принцип, предложенный автором, назовем принципом относительности или принципом эквивалентности виртуальной и истинной реальности.



Принципы системного анализа


Анализ (дедукция) представляет собой метод познания "от общего к частному", "от целого к частям". Абдукция представляет собой обобщение дедукции на основе нечеткой логики. При анализе существует опасность за исследованием частей упустить из рассмотрения их взаимодействие, то общее, что их объединяет в целое (т.е. взаимодействие частей для достижения общей цели). Такой подход был характерен для метафизического (не диалектичного) стиля мышления. Системный анализ лишен этого недостатка, поэтому многие совершенно справедливо считают системный анализ "современным воплощением прикладной диалектики" [148].

В этом контексте развиваемая в данной работе модель развитии активных систем путем чередования детерминистских и бифуркационных состояний представляет собой ничто иное, как естественнонаучное трактовку закона диалектики "Перехода количественных изменений в качественные". Иначе говоря, детерминистские этапы – это этапы количественного, эволюционного изменения объекта управления, а бифуркационные – этапы его качественного, революционного преобразования. Поэтому системный анализ рассматривается в данной работе как теоретический метод познания детерминистско-бифуркационной динамики систем. Таким образом, логически системный анализ можно считать результатом выполнения программы естественнонаучного развития диалектики, хотя исторически он и возник иначе. Саму когнитивную психологию также в определенной мере можно рассматривать как результат выполнения программы естественнонаучного развития гносеологии.

"Системный анализ" – это такой анализ систем, при котором за исследованием частей не только теряется целое, но и весь процесс исследования структуры системы и взаимосвязей ее элементов осуществляется под углом зрения целей и функций системы (авт.).

Система – это совокупность элементов (частей), взаимодействующих друг с другом для достижения некоторой общей цели. Система обеспечивает преимущество в достижении цели, т.е. достижение цели разрозненными элементами вне системы менее вероятно или вообще невозможно.


Система – это всегда нечто большее, чем просто сумма частей, т.е. она обладает качественно новыми (эмерджентными) свойствами, которые отсутствуют у ее частей. По мнению автора, в конечном счете все свойства имеют эмерджентную природу, т.е. любое качество основано на уровне Реальности этим качеством не обладающим. Термин "Реальность" включает и бытие, и небытие.

Например, качество "быть соленым " основано на свойствах Na и Cl, этим качеством ни в коей мере не обладающими. Движение с различными скоростями в метрическом пространстве основано на нелокальном уровне Реальности, в котором нет локализации объектов в физическом пространстве-времени. Об этом догадался еще Зенон и отразил логически в своих знаменитых апориях из которых следует не невозможность движения, как некоторые почему-то думают, а лишь невозможность адекватного отражения движения средствами формальной логики.

Системный анализ используется в тех случаях, когда стремятся исследовать объект с разных сторон, ком­плексно. Термин "системный анализ" впервые появился в 1948 г. в работах корпорации RAND в связи с задачами внешнего управления, а в отечественной литературе ши­рокое распространение получил после перевода книги С. Оптнера. Дальнейшее развитие системный анализ получил в трудах зарубежных и отечественных ученых: Гэйна К., Сарсона Т., КлиландаД., Кинга В., Перегудова Ф.И., Тарасенко Ф.П. [148], Юдина Б. Г. Валуева С.А., Губанова В.А., Захарова В.В., Коваленко А.Н., Кафарова В.В., Дорохова И.Н., Маркова Е.П., Мисюра Я.С., Купрюхина А.И., Дубенчака Г.И., Джагарова Ю.А. Дубенчака В.Е.

Во многих работах системный анализ развивается применительно к программно-целевому планированию и управлению. Однако, при этом получили развитие формализованные методики анализа систем (декомпозиции). В работах ведущих ученых по программированию урожая: Денисова Е.П., Ермохина Ю.И., Каюмова М. К., Мухортова С.Я., Неклюдова А.Ф., Филина В.И., Царева А.П., связанных с проблематикой данного исследования, в явной форме не используется автоматизированный системный анализ.


Это, по-видимому, обусловлено тем, что формализованные средства системного анализа, обеспечивающие декомпозицию с сохранением целостности практически отсутствуют.

Системный анализ основывается на следующих принципах: единства – совместное рассмотрение системы как единого целого и как совокупности частей; развития – учет изменяемости системы, ее спо­собности к развитию, накапливанию информации с уче­том динамики окружающей среды; глобальной цели – ответственность за выбор гло­бальной цели (оптимум для подсистем вообще говоря не является оптиму­мом для всей системы); функциональности – совместное рассмотрение структуры системы и функций с приоритетом функций над структурой; децентрализации – сочетание децентрализации и централизации; иерархии – учет соподчинения и ранжирования частей; неопределенности – учет вероятностного наступле­ния события; организованности –

степень выполнения решений и выводов.

Сущность системного подхода формулировалась многими авторами. В развернутом виде она сформулиро­вана Афанасьевым В.Н., Колмановским В.Б. и Носовым В.Р., определившими ряд взаимосвя­занных аспектов, которые в совокупности и единстве составляют системный подход: системно-элементный, отвечающий на вопрос, из чего (каких компонентов) образована система; системно-структурный, раскрывающий внутрен­нюю организацию системы, способ взаимодействия об­разующих ее компонентов; системно-функциональный, показывающий, какие функции выполняет система и образующие ее компо­ненты; системно-коммуникационный, раскрывающий взаи­мосвязь данной системы с другими как по горизонтали, так и по вертикали; системно-интегративный, показывающий меха­низмы, факторы сохранения, совершенствования и раз­вития системы; системно-исторический, отвечающий на вопрос, как, каким образом возникла система, какие этапы в своем развитии проходила, каковы ее исторические пер­спективы.

Системный анализ используется для того, чтобы организовать процесс приня­тия решения в сложных проблемных ситуациях. При этом основным требованием системного анализа является полнота и всесторонность рассмотрения проблемы.


Основной особенностью системного анализа является сочетание формаль­ных методов и неформализованного (экспертного) зна­ния. Последнее помогает неформализованным путем найти новые пути решения проблемы, не содержащиеся в формальной модели, а затем учесть последствия решений в модели, т.е. формализовать их, за счет чего непрерывно развивать модель и методы поддержки принятия решений.

С учетом вышесказанного в определении системного анализа нужно подчеркнуть, что системный анализ:

– применяется для решения таких проблем, которые не могут быть поставлены и решены отдельными мето­дами математики, т.е. проблем с неопределенностью си­туации принятия решения, когда используют не только формальные методы, но и методы качественного анализа ("формализованный здравый смысл"), интуицию и опыт лиц, принимающих решения;

– объединяет разные методы на основе единой ме­тодики;

– опирается на научное мировоззрение;

– объединяет знания, суждения и интуицию специа­листов различных областей знаний и обязывает их к оп­ределенной дисциплине мышления;

– уделяет основное внимание целям и целеобразованию.

В частности, основными специфическими особенностями системного анализа, отличающими его от других системных направ­лений, являются:

1. Наличие в системном анализе средств для организации процессов целеобразования, структуризации и анализа целей (другие системные направления ставят задачу достижения целей, разработки вариантов пути их достижения и выбора наилучшего из этих вариантов, а системный анализ рас­сматривает объекты как активные системы, способные к целеобразованию и принятию решений, а за­тем уже и к достижению сформированных целей путем реализации принятых решений).

2. Разработка и использование методики, в которой определены этапы, подэтапы системного анализа и ме­тоды их выполнения, причем в методике сочетаются как формальные методы и модели, так и методы, основан­ные на интуиции специалистов, помогающие использо­вать их знания, что обусловливает особую привлекатель­ность системного анализа для решения экономических проблем, в том числе в такой сложно формализуемой области как АПК.


Принятие решений, как реализация цели


Определение: принятие решения есть действие над множеством альтернатив, в результате которого исходное множество альтернатив сужается. Это действие называется "выбор".

Выбор является действием, придающим всей деятельности целенаправленность. Именно через акты выбора реализуется подчиненность всей деятельности определенной цели или совокупности взаимосвязанных целей.

Таким образом, для того, чтобы стал возможен акт выбора, необходимо следующее:

Порождение или обнаружение множества альтернатив, на котором предстоит совершить выбор.

Определение целей, ради достижения которых осуществляется выбор.

Разработка и применение способа сравнения альтернатив между собой, т.е. определение рейтинга предпочтения для каждой альтернативы, согласно определенным критериям, позволяющим косвенно оценивать, насколько каждая альтернатива соответствует цели.

Современные работы в области поддержки принятия решений выявили характерную ситуацию, которая состоит в том, что полная формализация нахождения наилучшего (в определенном смысле) решения возможна только для хорошо изученных, относительно простых задач, тогда как на практике чаще встречаются слабо структурированные задачи для которых полностью формализованных алгоритмов не разработано (если не считать полного перебора и метода проб и ошибок). Вместе с тем, опытные, компетентные и способные специалисты, часто делают выбор, который оказывается достаточно хорошим. Поэтому современная тенденция практики принятия решений в естественных ситуациях состоит в сочетании способности человека решать неформализованные задачи с возможностями формальных методов и компьютерного моделирования: диалоговые системы поддержки принятия решений, экспертные системы, адаптивные человеко-машинные автоматизированные системы управления, нейронные сети и когнитивные системы.



Принятие решений, как снятие неопределенности (информационный подход)


Процесс получения информации можно рассматривать как уменьшение неопределенности в результате приема сигнала, а количество информации, как количественную меру степени снятия неопределенности.

Но в результате выбора некоторого подмножества альтернатив из множества, т.е. в результате  принятия решения, происходит тоже самое (уменьшение неопределенности).

Это значит, что каждый выбор, каждое решение порождает определенное количество информации, а значит может быть описано в терминах теории информации.



Признаки и обобщенные образы классов


Обобщенный образ класса формируется из нескольких образов конкретных объектов, относящихся к данному классу, т.е. одной градации некоторой классификационной шкалы.

Обобщенные образы классов формализуются (кодируются) путем использования классификационных шкал и градаций, которые могут быть тех же типов, что и описательные, т.е. номинальные, порядковые и отношений.

Сама принадлежность конкретных объектов к данному классу определятся либо человеком-учителем, после чего фиксируется в обучающей выборке, либо самой системой автоматически на основе кластерного анализа конкретных объектов.



Признаки и образы конкретных объектов, метафора фазового пространства


Признаками объектов будем называть конкретные результаты измерения значений их свойств.

Свойства объектов отличаются своим качеством и измеряются с помощью различных органов восприятия или измерительных приборов в различных единицах измерения.

Результатом измерения является снижение неопределенности в наших знаниях о значении свойств объекта. Значения свойств конкретизируются путем их сопоставления определенным градациям соответствующих измерительных шкал: номинальных, порядковых или отношений.

В номинальных шкалах отсутствуют отношения порядка, начало отсчета и единица измерения.

На порядковых шкалах определены отношения "больше – меньше", но отсутствуют начало отсчета и единица измерения.

На шкалах отношений определены отношения порядка, все арифметические операции, есть начало отсчета и единица измерения.

Можно представить себе, что шкалы образуют оси координат некоторого абстрактного многомерного пространства, которое будем называть "фазовым пространством".

В этом фазовом пространстве каждый конкретный объект представляется определенной точкой, имеющей координаты, соответствующие значениям его свойств по осям координат, т.е. градациям описательных шкал.

Оси координат фазового пространства в общем случае не являются взаимно-перпендикулярными шкалами отношений, т.е. в общем случае это пространство неортонормированное, более того – неметрическое. Следовательно, в нем в общем случае не применима Евклидова мера расстояний, т.е. не действует Евклидова метрика. Применение этой меры расстояний корректно, если одновременно выполняются два условия:

1. Все оси координат фазового пространства являются шкалами отношений.

2. Все оси координат взаимно-перпендикулярны или очень близки к этому.



Проблема


Основная проблема, которую необходимо решить для достижения поставленной цели, состоит в отсутствии инструментария и технологий, обеспечивающих выявление и изучение факторов, влияющих на успешность выращивания сельскохозяйственных культур.

Это связано с тем, что огромные объемы информации по условиям и результатам выращивания, наколенной за десятки лет, находятся в бумажной форме, и не преобразованы в электронную форму, допускающую автоматизированную количественную обработку. Не ясно также какие математические модели могут быть использованы для обработки этой информации, т.к. она характеризуется огромной размерностью (десятки тысяч градаций факторов и результатов выращивания), непараметричностью, неполнотой (фрагментарностью), неточностью. Кроме того, отсутствующие данные не могут быть восполнены в результате специально организованного эксперимента. Эффективность математической модели должна быть подтверждена, в соответствии с принятыми в науке стандартами, на новых данных, что требует многолетних исследований с уже существующим инструментарием. Однако разработка эффективных и работоспособных алгоритмов и структур данных, а также программной реализации математической модели, весьма трудоемка и требует высокой квалификации разработчиков. Кроме того, должна быть детально разработана технология применения созданного специального инструментария.



Проблема распознавания образов


Проблема распознавания образов сводится к двум задачам: обучения и распознавания. Поэтому, прежде чем сформулировать задачу обучения распознаванию образов уточним, в чем смысл их распознавания.

Простейшим вариантом распознавания является строгий запрос на поиск объекта в базе данных по его признакам, который реализуется в информационно-поисковых системах. При этом каждому полю соответствует признак (описательная шкала), а значению поля – значение признака (градация описательной шкалы). Если в базе данных есть записи, все

значения заданных полей которых точно совпадают со значениями, заданными в запросе на поиск, то эти записи извлекаются в отчет, иначе запись не извлекается.

Более сложными вариантами распознавания является нечеткий запрос с неполнотой информации, когда не все признаки искомых объектов задаются в запросе на поиск, т.к. не все они известны, и нечеткий запрос с шумом, когда не все признаки объекта известны, а некоторые считаются известными ошибочно. В этих случаях из базы данных извлекаются все объекты, у которых совпадает хотя бы один признак и в отчете объекты сортируются (ранжируются) в порядке убывания количества совпавших признаков. При этом при определении ранга объекта в отсортированном списке все признаки считаются имеющими одинаковый "вес" и учитывается только их количество.

Однако:

– во-первых, на самом деле признаки имеют разный вес, т.е. один и тот же признак в разной степени характерен для различных объектов;

– во-вторых, нас могут интересовать не столько сами объекты, извлекаемые из базы данных прецедентов по запросам, сколько классификация самого запроса, т.е. отнесение его к определенной категории, т.е. к тому или иному обобщенному образу класса.

Если реализация строгих и даже нечетких запросов не вызывает особых сложностей, то распознавание как идентификация с обобщенными

образами классов, причем с учетом различия весов признаков представляет собой определенную проблему.

Обучение осуществляется путем предъявления системе отдельных объектов, описанных на языке признаков, с указанием их принадлежности тому или другому классу. При этом сама принадлежность к классам сообщается системе человеком – Учителем (экспертом).

В результате обучения распознающая система должна приобрести способность:

1. Относить объекты к классам, к которым они принадлежат (идентифицировать объекты верно).

2. Не относить объекты к классам, к которым они не принадлежат (неидентифицировать объекты ошибочно).

Эта и есть проблема обучения распознаванию образов, и состоит она в следующем:

1. В разработке математической модели, обеспечивающей: обобщение образов конкретных объектов и формирование обобщенных образов классов; расчет весов признаков; определение степени сходства конкретных объектов с классами и ранжирование классов по степени сходства с конкретным объектом, включая и положительное, и отрицательное сходство.

2. В наполнении этой модели конкретной информацией, характеризующей определенную предметную область.



Проблемы и перспективы нейронных сетей


На наш взгляд к основным проблемам нейронных сетей можно отнести:

1. Сложность содержательной интерпретации смысла интенсивности входных сигналов и весовых коэффициентов ("проблема интерпретируемости весовых коэффициентов").

2. Сложность содержательной интерпретации и обоснования аддитивности аргумента и вида активационной (передаточной) функции нейрона ("проблема интерпретируемости передаточной функции").

3. "Комбинаторный взрыв", возникающий при определении структуры связей нейронов, подборе весовых коэффициентов и передаточных функций ("проблема размерности").

4. "Проблема линейной разделимости", возникающая потому, что возбуждение нейронов принимают лишь булевы значения 0 или 1.

Проблемы интерпретируемости приводят к снижению ценности полученных результатов работы сети, а проблема размерности – к очень жестким ограничениям на количество выходных нейронов в сети, на количество рецепторов и на сложность структуры взаимосвязей нейронов с сети. Достаточно сказать, что количество выходных нейронов в реальных нейронных сетях, реализуемых на базе известных программных пакетов, обычно не превышает несколько сотен, а чаще всего составляет единицы и десятки.

Проблема линейной разделимости приводит к необходимости применения многослойных нейронных сетей для реализации тех приложений, которые вполне могли бы поддерживаться сетями с значительно меньшим количеством слоев (вплоть до однослойных), если бы значения возбуждения нейронов были не дискретными булевыми значениями, а континуальными значениями, нормированными в определенном диапазоне.

Перечисленные проблемы предлагается решить путем использования модели нелокального нейрона, обеспечивающего построение нейронных сетей прямого счета.



Процессы труда и познания, как информационные процессы снятия неопределенности


Рассмотрим систему: "человек – объект" в точке бифуркации, т.е. в точке, после прохождения которой снимается (уменьшается) неопределенность в поведении этой системы (рисунок 1). Известно, что информация есть количественная мера снятия неопределенности, поэтому рассмотрим два основных направления информационных потоков, которые возможны в этой системе:

1. От человека к объекту: "Труд" (управление).

2. От объекта к человеку: "Познание" (идентификация, обобщение, абстрагирование, сравнение и классификация).

Рисунок 1. Направления потоков информации и локализация снятия неопределенности в процессах труда и познания

Труд представляет собой управляющее, по существу информационное, воздействие на предмет труда, при этом в результате осуществления процесса труда снимается неопределенность состояния предмета труда, в результате чего он трансформируется в продукт труда.

В результате познания снимается неопределенность наших представлений об объекте познания, т.е. снимается неопределенность в состоянии человека, в результате чего он трансформируется из "незнающего" в "знающего".

Если абстрагироваться от направления потока информации и, соответственно, от того, неопределенность в состоянии какой системы снимается (объекта или человека), то, очевидно,  что в обоих случаях количество переданной информации является количественной мерой степени снятия неопределенности.

С позиций информационно-функциональной теории развития техники труд представляет собой прежде всего информационный процесс, средства труда являются информационными системами, передающими и усиливающими информационные потоки между человеком и внешней средой.

Труд (процесс опредмечивания) предлагается рассматривать как процесс перезаписи информации из образа продукта труда в структуру физической среды (предмета труда). По мере осуществления этого процесса физическая форма продукта труда за счет записи в ней информации структурируется и выделяется из окружающей среды.

Тело человека и средства труда выступают при этом как канал передачи информации. При передаче по этому каналу информация неоднократно меняет свой носитель и языковую форму представления, т.е. транслируется.

Таким образом, сам процесс передачи информации по каналу связи и запись ее в носитель информации – это и есть тот процесс (труд), который преобразует носитель информации в заранее заданную форму, т.е. в продукт труда.



Профили слов


Профиль класса представляет собой гистограмму, в которой показан вклад каждого признака в общее количество информации, содержащееся в образе данного класса.

Профили классов и признаков отображаются в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 142). Для примера на рисунке 143 показан профиль того же слова "Достоинству".

Рисунок 142.  Выход на режим вывода профилей классов и признаков

Рисунок 143.  Профиль слова "Достоинству"