Кредитно-финансовый мониторинг
На основе непрерывно ведущихся баз данных по динамике цен на ценные бумаги, ставкам банковских кредитов, курсам валют и т.д. позволяет выявлять и изучать закономерности кредитно-финансового и фондового рынка, и на этой основе прогнозировать его развитие, разрабатывать обоснованные рекомендации по управлению им.
Критериальный язык
Название этого языка связано с основным предположением, состоящим в том, что каждую отдельно взятую альтернативу можно оценить некоторым конкретным (одним) числом, после чего сравнение альтернатив сводится к сравнению соответствующих им чисел.
Пусть, например, {X} - множество альтернатив, а x – некоторая определенная альтернатива, принадлежащая этому множеству: xÌX. Тогда считается, что для всех x может быть задана функция: q(x), которая называется критерием (критерием качества, целевой функцией, функцией предпочтения, функцией полезности и т.п.), обладающая тем свойством, что если альтернатива x1 предпочтительнее x2: (обозначается: x1 > x2),
то:
q(x1) > q(x2).
При этом выбор сводится к отысканию альтернативы с наибольшим значением критериальной функции.
Однако, на практике использование лишь одного критерия для сравнения степени предпочтительности альтернатив оказывается неоправданным упрощением, т.к. более подробное рассмотрение альтернатив приводит к необходимости оценивать их не по одному, а по многим критериям, которые могут иметь различную природу и качественно отличаться друг от друга.
Например, при выборе наиболее приемлемого для пассажиров и эксплуатирующей организации типа самолета на определенных видах трасс сравнение идет одновременно по многим группам критериев: техническим, технологическим, экономическим, социальным, эргономическим и др.
Многокритериальные задачи не имеют однозначного общего решения. Поэтому предлагается много способов придать многокритериальной задаче частный вид, допускающий единственное общее решение. Естественно, что для разных способов эти решения являются в общем случае различными. Поэтому едва ли не главное в решении многокритериальной задачи - обоснование данного вида ее постановки.
Используются различные варианты упрощения многокритериальной задачи выбора. Перечислим некоторые из них.
1. Условная максимизация (находится не глобальный экстремум суперкритерия, или, как его еще называют, интегрального
критерия, а локальный экстремум основного критерия).
2. Поиск альтернативы с заданными свойствами.
3. Нахождение множества Парето.
4. Сведение многокритериальной задачи к однокритериальной, путем ввода суперкритерия.
Рассмотрим подробнее формальную постановку метода сведения многокритериальной задачи к однокритериальной.
Введем суперкритерий q0(x), как скалярную функцию векторного аргумента:
q0(x)= q0((q1(x), q2(x),..., qn(x)).
Суперкритерий позволяет упорядочить альтернативы по величине q0, выделив тем самым наилучшую (в смысле этого критерия). Вид функции q0 определяется тем, как конкретно мы представляем себе вклад каждого критерия в суперкритерий. Обычно используют аддитивные и мультипликативные функции:
Коэффициенты si обеспечивают:
1. Безразмерность или единую размерность числа aiqi/si
(различные частные критерии могут иметь разную размерность, и тогда над ними нельзя производить арифметических операций и свести их в суперкритерий).
2. Нормировку, т.е. обеспечение условия: biqi/si<1.
Коэффициенты ai и bi отражают относительный вклад частных критериев qi в суперкритерий.
Итак, в многокритериальной постановке задача принятия решения о выборе одной из альтернатив сводится к максимизации суперкритерия.
Основная проблема в многокритериальной постановке задачи принятия решений состоит в том, что необходимо найти такой аналитический вид коэффициентов ai и bi, который бы обеспечил следующие свойства модели:
1. Высокую степень адекватности предметной области и точке зрения экспертов.
2. Минимальные вычислительные трудности максимизации суперкритерия, т.е. Его расчета для разных альтернатив.
3. Устойчивость результатов максимизации суперкритерия от малых возмущений исходных данных.
Устойчивость решения означает, что малое изменение исходных данных должно приводить к малому изменению величины суперкритерия, и, соответственно, к малому изменению принимаемого решения. То есть практически на тех же исходных данных должно приниматься или тоже самое, или очень близкое решение.
Критерии реальности при различных формах сознания и их применение в виртуальной реальности
В этой связи вспоминается ставший уже классическим первый фильм "Матрица", в котором Морфей, обращаясь к Нео, произносит свою знаменитую фразу: "Сейчас я покажу тебе, как выглядит окончательная истинная реальность". Эта фраза сразу вызвала у меня массу ассоциаций и вопросов, в частности:
1. А каковы критерии реальности?
2. А вдруг и эта реальность, которую Морфей назвал окончательной, истинной, в действительности является не более, чем симулятором следующего иерархического уровня, так сказать более фундаментальным симулятором?
Здесь возникает сложный мировоззренческий вопрос о том, возможно ли хотя бы в принципе находясь в виртуальной реальности не выходя за ее пределы установить, что ты находишься именно в виртуальной, а не истинной реальности, или это возможно сделать только задним числом, после выхода из виртуальной реальности и перехода в истинную реальность?
Итак, каковы же критерии реальности?
По нашему мнению, прежде всего это самосогласованность
реальности, т.е. получение одной и той же информации качественно различными способами и по различным каналом связи (принцип наблюдаемости):
– согласованность реальности самой с собой во времени;
– согласованность и взаимное подтверждение информации от различных органов восприятия, которые обычно реагируют на различные формы материи и часто являются парными (зрение, слух, обоняние) и расположенными в различных точках пространства.
Например, мы не только что-то видим, но и слышим, и осязаем, и можем попробовать его на вкус и ощутить запах и все эти восприятия ОТ РАЗЛИЧНЫХ ОРГАНОВ ЧУВСТВ соответствуют друг другу и означают, что перед нами некий определенный объект, а не галлюцинация или визуализация. Согласованная и взаимно подтверждающая информация с различных органов чувств, в соответствии с принципом наблюдаемости, также может рассматриваться как повышающая достоверность и адекватность восприятия.
В современных компьютерных играх мы не только видим довольно качественную визуализацию, но и соответствующее реалистичное звуковое сопровождение.
А в системах виртуальной реальности – визуализация стереоскопическая (то, что мы видим РАЗНЫМИ глазами как бы с разных точек в ПРОСТРАНСТВЕ также взаимно подтверждается), а также появляется тактильный канал с обратной связью, который позволяет ощутить даже твердость, вес и температуру моделируемого в виртуальной реальности объекта. Все это вместе уже создает на столько высокую степень реалистичности, что может возникнуть эффект присутствия в виртуальной реальности, деперсонализация и отождествление с измененным образом Я, моделируемым в виртуальной реальности (переход в измененную форму сознания).
Представим, что эти сформулированные критерии реальности не выполняются, т.е. нарушается ее самосогласованность. Как и в чем это может проявляться?
По-видимому, как своего рода "сбои" и различные "нарушения физических законов" и несогласованности в виртуальной реальности:
– "зацикливание" событий, как на заезженной пластинке, т.е. их многократное повторное осуществление без каких-либо изменений (пример: повторный проход черной кошки, с характерной остановкой и поворотом головы, в дверном проеме в "Матрице");
– прохождение сквозь стены;
– полеты и очень длинные прыжки, а также телепортация в своем "реальном" теле;
– действия в другом темпе времени, т.е. эффект замедления внешнего времени, соответствующий аналогичному ускорению внутреннего времени;
– действия в другом масштабе пространства, "увеличение" и "уменьшение" размеров, наблюдение мега и микроструктуры материи;
– видение сквозь стены, видение на больших расстояниях (в т.ч. с увеличением "как в телескоп"), видение прошлого и будущего;
– телекинез, пирокинез, психосинтез, левитация и т.п.;
– одновременное нахождение в нескольких местах.
Нетрудно заметить, что все эти проявления весьма напоминают так называемые "паранормальные явления", которые традиционно связывают с сверхвозможностями человека, т.е. с его возможностями при высших формах сознания.
Эти явления хотя и редко, но все же наблюдаются в нашем мире, что может указывать на то, что наша "истинная реальность" в определенной мере возможно является виртуальной, по крайней мере в большей степени, чем ранее предполагалось.
ЛЕКЦИЯ- Интеллектуальные информационные
"Системы искусственного интеллекта позволяют с успехом решать сложнейшие проблемы, которых до создания этих систем не возникало"
/Из компьютерного фольклора/
Линейная разделимость и персептронная представляемость
При прямоугольной передаточной функции (1) каждый нейрон представляет собой пороговый элемент, который может находиться только в одном из двух состояний:
– возбужденном (активном), если взвешенная сумма входных сигналов больше некоторого порогового значения;
– заторможенном (пассивном), если взвешенная сумма входных сигналов меньше некоторого порогового значения.
( 1 ) |
Следовательно, при заданных значениях весов и порогов, каждый нейрон имеет единственное определенное значение выходной активности для каждого возможного вектора входов. При этих условиях
множество входных векторов, при которых нейрон активен (Y=1), отделено от множества векторов, на которых нейрон пассивен (Y=0) гиперплоскостью (2).
( 2 ) |
Следовательно, нейрон способен отделить только такие два множества векторов входов, для которых существует гиперплоскость, отделяющая одно множество от другого. Такие множества называют линейно разделимыми.
Необходимо отметить, что линейно-разделимые множества являются составляют лишь очень незначительную часть всех множеств. Поэтому данное ограничение персептрона является принципиальным. Оно было преодолено лишь в 80-х годах путем введения нескольких слоев нейронов
в сетях Хопфилда и неокогнитроне Фукушимы.
В завершении остановимся на некоторых проблемах, которые остались нерешенными после работ Ф.Розенблатта:
1. Возможно ли обнаружить линейную разделимость классов до обучения сети?
2. Как определить скорость обучения, т.е. количество итераций, необходимых для достижения заданного качества обучения?
3. Как влияют на результаты обучения последовательность
предъявления образов и их количество?
4. Имеет ли алгоритм обратного распространения ошибки преимущества перед простым перебором весов?
5. Каким будет качество обучения, если обучающая выборка содержит не все возможные на практике пары векторов и какими будут ответы персептрона на новые вектора, отсутствующие в обучающей выборке?
Особенно важным представляется последний вопрос, т.к. индивидуальный опыт принципиально всегда не является полным.
Литература по лабораторной работе
1. Мичи Д., Джонстон Р. Компьютер – творец. – М.: Мир, 1987. –251с.
2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). – Краснодар: КЮИ МВД РФ, 1996. – 280 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. – 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
ЛР- "Идентификация слов по входящим в них буквам"
Первую лабораторную работу рассмотрим более подробно, чтобы студенты могли ознакомиться с базовой системой "Эйдос", на которой основан курс лекций и лабораторных работ.
В данной работе исследуется возможность идентификации слов по входящим в них буквам. При этом слова рассматриваются как классы распознавания, а буквы – как признаки. Подробно описана технология синтеза и анализа модели с применением инструментария СК-анализа – системы "Эйдос", приведены видеограммы, табличные и графические выходные формы, причем впервые – классическая и интегральная когнитивные карты, генерируемые в версии12.5. Продемонстрировано на численных примерах, что при идентификации слов главную роль играет информация о входящих в них буквах, а последовательность букв и их сочетаний не играет особой роли. Продемонстрирована устойчивость модели от неполноты и зашумленности информации.
ЛР- "Прогнозирование учебных
Данная лабораторная работа основана на данных, полученных в Кубанском государственном технологическом университете (КубГТУ) при преподавании дисциплин кафедры Информатики: "Новые информационные технологии в учебном процессе" и "Комплексные технологии в науке и образовании" для специальности: 020300 – Социология (Социально-гуманитарный факультет), в 2002 году (акт внедрения имеется).
Маркетинговые исследования
Маркетинговые исследования проводятся в целях получения полной и достоверной информации, необходимой для определения объема и номенклатуры закупаемых товаров и организации их адресной реализации конкретным группам потребителей.
Опросный лист разрабатывается таким образом, чтобы с помощью него можно было получить необходимую информацию о потребителях. В опросный лист могут входить фирменные товарные знаки и каталоги товаров как изготовленные типографским способом, так и с изображения товаров, снятые с их фотографий при помощи сканера и отпечатанные на цветном принтере. Опросный лист может служить одновременно и бланком для заполнения, но могут использоваться и специальные бланки для ответов (что более рационально).
Вопросы делятся на несколько групп:
– социальный и гражданский статус потребителя (пол, возраст, образование, состоит ли в браке, сколько имеет детей, форма занятости, если работает, то руководитель он или исполнитель и т.п.);
– уровень достатка в семье потребителя;
– товары, реально приобретенные потребителем за последнее время;
– товары, которые потребитель приобрел бы, если бы у него была финансовая возможность;
– частота приобретения товаров по их видам;
– какие потребительские и стоимостные характеристики товаров привлекают потребителя и какие его не устраивают;
– где потребитель реально приобретает товары: у частных лиц, в магазинах (каких), на рынках (каких);
– какие места приобретения товаров потребитель знает: наименования магазинов и рынков;
– какую роль в выборе товара играет сервис и способ обслуживания в магазине или на рынке.
В результате проведения маркетингового исследования выявляются потребительские предпочтения различных групп населения в определенном секторе рынка. Выясняется, "что, где, когда", кем и по каким причинам приобретается. Например, выясняется, что данная категория населения приобретает такие–то виды товаров в таких–то местах, а приобрела бы и такие, но если бы цена на них была более приемлемая. На основе этой информации может быть разработан план закупок или производства товаров, определена потенциальная емкость рынка на данный момент и перспективу, а также спрогнозирована его динамика, товар может поставляться адресно в те торговые точки, которые пользуются популярностью у конкретных категорий потребителей. Регулярное проведение маркетинговых исследований позволяет постоянно "держать руку на пульсе" и строить свою работу используя достоверное знание предпочтений возможностей и желаний своих потребителей. Имеется положительный опыт подобных исследований (по закрытой тематике).
Математическая модель
Математическая модель, обеспечивающая решение поставленной проблемы, относится к классу моделей распознавания образов и принятия решений, т.к. по системе факторов, характеризующих место выращивание (прежде всего характеристика почв и метеоусловий) определяются оптимальные сорта для выращивания или принимается решение о выборе оптимальных сортов для выращивания в данном пункте. (Распознавание есть не что иное, как принятие решения о принадлежности распознаваемого объекта или его состояния к определенному классу).
Планируется применить математические модели, основанные на методах распознавания образов и принятия решений, регрессионного и дискриминантного анализа, для решения следующих задач:
– оценка степени адекватности условий в нише или макронише выращивания для заданной номенклатуры плодовых культур;
– картографическая визуализация результатов решения поставленной задачи с применением технологий существующих геоинформационных систем;
– реализация этой технологии в непосредственно в создаваемой системе.
Для решения указанных задач имеется определенный научный и практический задел, реализация которого позволит приблизиться к управлению продуктивностью выращиваемых культур на основе создаваемой компьютерно-информационной системы, решению задачи научно-обоснованного размещения и районирования плодовых культур и сортов.
В качестве математической модели планируется использовать непараметрическую математическую модель, предложенную в [64], основанную на системном обобщении семантической теории информации. В этой модели решено две основные научные проблемы:
1. Получено выражение для весовых коэффициентов, удовлетворяющее поставленным требованиям, основанная на системном обобщении семантической теории информации и учитывающее понятие цели, а также уровень системности и степень детерминированности системы.
2. Предложена неметрическая мера сходства объекта с классом, класса с классом, фактора с фактором, основанная на предложенном выражении для весового коэффициента и лемме Неймана-Пирсона, применение которой корректно в неортонормированном семантическом пространстве (в отличие от меры Евклида) и отражает сходство двух объектов в отличие от меры Махаланобиса.
Математическая модель СК-анализа
Системное обобщение формулы Хартли
В выражении (3) приведено системное обобщение формулы Хартли для равновероятных состояний объекта управления.
(1) | (4) | ||||||
(2) | (5) | ||||||
(3) | с очень малой и быстро уменьшающейся погрешностью | (6) |
W – количество чистых (классических) состояний системы.
j – коэффициент эмерджентности Хартли (уровень системной организации объекта, имеющего W чистых состояний).
Гипотеза о Законе возрастания эмерджентности
Исследование математических выражений системной теории информации (7 – 12) позволило сформулировать гипотезу о существовании "Закона возрастания эмерджентности". Суть этой гипотезы в том, что в самих элементах системы содержится сравнительно небольшая доля всей содержащейся в ней информации, а основной ее объем составляет системная информация, содержащаяся в подсистемах различного уровня иерархии.
Различие между классическим и предложенным системным понятиями информации соответствует различию между понятиями МНОЖЕСТВА И СИСТЕМЫ, на основе которых они сформированы.
(7) | (8) | ||||||
(9) | (10) | ||||||
(11) | (12) |
Математическая формулировка:
Интерпретация
Системное обобщение формулы Харкевича
Ниже приведен вывод системного обобщения формулы Харкевича, а именно:
– классическая формула Харкевича через вероятности перехода системы в целевое состояние при условии сообщения ей определенной информации и самопроизвольно (13);
– выражение классической формулы Харкевича через частоты (14, 15);
– вывод коэффициента эмерджентности Харкевича на основе принципа соответствия с выражением Хартли в детерминистском случае (16 –19);
– вывод системного обобщения формулы Харкевича;
– окончательное выражение для системного обобщения формулы Харкевича (21).
Классическая формула Харкевича
(13) |
Pij – вероятность перехода объекта управления в j-е состояние в условиях действия i-го фактора;
Pj – вероятность самопроизвольного перехода объекта управления в j-е состояние, т.е.
в условиях отсутствия действия i-го фактора или всреднем.
Известно, что корреляция не является мерой причинно-следственных связей. Если корреляция между действием некоторого фактора и переходом объекта управления в определенное состояние высока, то это еще не значит, что данный фактор является причиной этого перехода. Для того чтобы по корреляции можно было судить о наличии причинно-следственной связи необходимо сравнить исследуемую группу с контрольной группой, т.е. с группой, в которой данный фактор не действовал.
Также и высокая вероятность перехода объекта управления в определенное состояние в условиях действия некоторого фактора сама по себе не говорит о наличии причинно-следственной связи между ними, т.е. о том, что данный фактор обусловил переход объекта в это состояние. Это связано с тем, что вероятность перехода объекта в это состояние может быть вообще очень высокой независимо от действия фактора. Поэтому в качестве меры силы причинной обусловленности определенного состояния объекта действием некоторого фактора Харкевич предложил логарифм отношения вероятностей перехода в объекта в это состояние в условиях действия фактора и при его отсутствии или в среднем (13).
Таким образом семантическая мера информации Харкевича является мерой наличия причинно-следственных связей между факторами и состояниями объекта управления.
Выражение классической формулы Харкевича через частоты фактов
|
(14) |
|
(15) |
Однако мера Харкевича (13) не удовлетворяет принципу соответствия мерой Хартли как мера Шеннона, т.е. не переходит в меру Хартли в детерминистском случае, т.е. когда каждому будущему состоянию объекта управления соответствует единственный уникальный фактор и между факторами и состояниями имеется взаимно однозначное соответствие (17).
|
(16) |
|
(17) |
|
(18) |
|
(19) |
|
(20) |
|
|
(21) |
Связь между выражениями для плотности информации в теориях Хартли, Шеннона и СТИ приведена на рисунке 41.
|
Рисунок 41. Связь между выражениями для плотности информации в теориях Хартли, Шеннона и СТИ |
Интерпретация коэффициентов эмерджентности, предложенных в рамках системной теории информации, приведена на рисунке 42.
|
Рисунок 42. Интерпретация коэффициентов эмерджентности СТИ |
Коэффициент эмерджентности Харкевича Y, изменяется от 0 до 1 и определяет степень детерминированности системы.
Таким образом, в предложенном системном обобщении формулы Харкевича (21) впервые непосредственно в аналитическом выражении для самого понятия "Информация" отражены такие фундаментальные свойства систем, как "Уровень системности" и "Степень детерминированности" системы.
Матрица абсолютных частот
Основной формой первичного обобщения эмпирической информации в модели является матрица абсолютных частот (таблица 23). В этой матрице строки соответствуют факторам, столбцы – будущим целевым и нежелательным состояниям объекта управления, а на их пересечении приведено количество наблюдения фактов (по данным обучающей выборки), когда действовал некоторый i-й фактор и объект управления перешел в некоторое j-е состояние.
Таблица 23 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ
|
Непосредственно на основе матрицы абсолютных частот с использованием системного обобщения формулы Харкевича (21) рассчитывается матрица информативностей (таблица 24).
Таблица 24 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ
|
Весовые коэффициенты матрицы информативностей непосредственно определяют, какое количество информации Iij система управления получает о наступлении события: "объект управления перейдет в j–е состояние", из сообщения: "на объект управления действует i–й фактор".
Когда количество информации Iij>0 – i–й фактор способствует переходу объекта управления в j–е состояние, когда Iij<0 – препятствует этому переходу, когда же Iij=0 – никак не влияет на это.
Таким образом, предлагаемая семантическая информационная модель позволяет непосредственно на основе эмпирических данных и независимо от предметной области рассчитать, какие количество информации содержится в любом событии о любом другом событии.
Этот вывод является ключевым для данной работы, т.к. конкретно показывает возможность числовой обработки в СК-анализе как числовой, так и нечисловой информации.
Матрица информативностей является также обобщенной (неклассической) таблицей решений, в которой входы (факторы) и выходы (будущие состояния объекта управления) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах
и принимающими значения от положительного теоретически-максимально-возможного, до теоретически неограниченного отрицательного. Некоторые неклассические высказывания, генерируемые на основе матрицы информативности, приведены на плакате.
Неметрический интегральный критерий сходства, основанный на лемме Неймана-Пирсона
В выражениях (22 – 24) приведен неметрический интегральный критерий сходства, основанный на фундаментальной лемме Неймана-Пирсона, обеспечивающий идентификацию и прогнозирование в предложенных неортонормированных
семантических пространствах с финитной метрикой, в которых в качестве координат векторов будущих состояний объекта управления и факторов выступает количество информации, рассчитанное в соответствии с системной теорией информации (21), а не Булевы координаты или частоты, как обычно.
|
(22) |
|
(23) |
|
(24) |
|
(25) |
– вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив–локатор), т.е.:
|
|
(26) |
|
(27) |
– среднее по вектору идентифицируемой ситуации (объекта).
– среднеквадратичное отклонение информативностей вектора класса;
– среднеквадратичное отклонение по вектору распознаваемого объекта.
Связь системной меры целесообразности информации с критерием c2
В (28 – 33) показана связь системной меры целесообразности информации с известным критерием c2, а также предложен новый критерий уровня системности предметной области, являющийся нормированным объемом семантического пространства (34, 35).
|
(28) |
|
(29) |
– t – ожидаемое количество встреч i-го признака у объектов j-го класса.
|
(30) |
|
(31) |
||
|
(32) |
|
(33) |
||
|
(34) |
|
(35) |
||
Абстрагирование (ортонормирование) существенно уменьшает размерность семантического пространства без существенного уменьшения его объема.
Оценка адекватности семантической информационной модели в СК-анализе и бутстрепные методы
Под адекватностью модели СК-анализа понимается ее внутренняя и внешняя дифференциальная и интегральная валидность. Понятие валидности является уточнением понятия адекватности, для которого определены процедуры количественного измерения, т.е. валидность – это количественная адекватность. Это понятие количественно отражает способность модели давать правильные результаты идентификации, прогнозирования и способность вырабатывать правильные рекомендации по управлению.
Под внутренней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов обучающей выборки.
Под внешней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов, не входящих в обучающую выборку.
Под дифференциальной валидностью модели понимается достоверность идентификации объектов в разрезе по классам.
Под интегральной валидностью средневзвешенная дифференциальная валидность.
Возможны все сочетания: внутренняя дифференциальная валидность, внешняя интегральная валидность и т.д.
Основная идея бутстрепа по Б.Эфрону [110] состоит в том, что методом Монте-Карло (статистических испытаний) многократно извлекаются выборки из эмпирического распределения. Эти выборки, естественно, являются вариантами исходной, напоминают ее.
Эта идея позволяет сконструировать алгоритм измерения адекватности модели, состоящий из двух этапов:
1. Синтез модели на одном случайном подмножестве обучающей выборки.
2. Измерение валидности модели на оставшемся подмножестве обучающей выборки, не использованном для синтеза модели.
Поскольку оба случайных подмножества имеют переменный состав по объектам обучающей выборки, то подобная процедура должна повторяться много раз, после чего могут быть рассчитаны статистические характеристики адекватности модели, например, такие как:
– средняя внешняя валидность;
– среднеквадратичное отклонение текущей внешней валидности от средней и другие.
Достоинство бутстрепного подхода к оценке адекватности модели состоит в том, что он позволяет измерить внешнюю валидность на уже имеющейся выборке и изучить статистические характеристики, характеризующие адекватность модели при изменении объема и состава выборки.
Непараметричность модели. Робастные процедуры и фильтры для исключения артефактов
Предложенная семантическая информационная модель является непараметрической, т.к. базируется на системной теории информации [64], которая никоим образом не основана на предположениях о нормальности распределений исследуемой выборки.
Под робастными понимаются процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. данными, выпадающими из общих статистических закономерностей, которым подчиняется исследуемая выборка.
Критерий выявления артефактов, реализованный в СК-анализе, основан на том, что при увеличении объема статистики частоты значимых атрибутов растут, как правило, пропорционально объему выборки, а частоты артефактов так и остаются чрезвычайно малыми, близкими к единице. Таким образом, выявление артефактов возможно только при достаточно большой статистике, т.к. в противном случае недостаточно информации о поведении частот атрибутов с увеличением объема выборки.
В модели реализована такая процедура удаления наиболее вероятных артефактов, и она, как показывает опыт, существенно повышает качество (адекватность) модели.
Математические методы распознавания клавиатурного почерка
В литературе описано четыре математических подхода к решению задачи распознавания клавиатурного почерка пользователя ЭВМ:
– статистический;
– вероятностно-статистический;
– на базе теории распознавания образов и нечеткой логики;
– на основе нейросетевых алгоритмов.
За более подробным анализом подходов к использованию компьютерного почерка для идентификации и аутентификации пользователей компьютеров отсылаем к в вышеназванной статье.
Математический аппарат
Основой систем data mining является выявление различных закономерностей в данных. При этом применяются следующие методы:
– деревья решений;
– алгоритмы кластеризации;
– регрессионный анализ;
– нейронные сети;
– временные ряды.
Материально-техническое обеспечение
Для проведения лабораторных работ по дисциплине "Интеллектуальные информационные системы" необходим компьютерный класс с учебной доской, оснащенный 30 рабочими местами в составе:
1. Стол.
2. Стул или кресло.
3. ИБМ-совместимый персональный компьютер класса Pentium IV с монитором не менее 17 дюймов, оперативной памятью не менее 256 Мб и вешней памятью не менее 80 Гб.
Все рабочие места должны быть объединены в локальную сеть не менее 100 Мбит/с с выходом в Internet.
Мера Шеннона, как обобщение меры Хартли для неравновероятных событий.
Представим себе, что имеются объекты различных видов, причем:
– всего имеется M видов объектов;
– объектов каждого i-го вида имеется Ni.
Тогда по Хартли, если мы извлекаем один из объектов i-го вида, то получаем Ii бит информации
В среднем по
на один объект i-го вида.Сумма этих средних будет равна:
(где: pi=1/Ni, – вероятность встречи объектов i-го вида).
Последнее выражение – это и есть формула Шеннона, которая, таким образом, позволяет рассчитать средневзвешенное количество информации, приходящееся на один объект, получаемое при предъявлении объектов различных видов.
Отметим, что идентификация объектов, как относящихся к тому или иному виду (i-му виду) осуществляется на основе признаков
этих объектов. В простейшем варианте это может быть и один признак, например номер вида на бильярдном шаре, но в реальных случаях признаков может быть очень много и их различные наборы сложным и неоднозначным образом могут быть связаны с принадлежностью объектов к тем или иным классам.
Но главный вывод от этого не изменяется: формула Шеннона дает средневзвешенное количество информации, приходящееся на один объект, получаемое при предъявлении объектов различных видов (классов), отличающихся своими наборами признаков. Мера Шеннона является обобщением меры Хартли для неравновероятных событий.
Место и роль СК-анализа в структуре управления
Управление в АПК рассматривается в данной работе в контексте использования автоматизированных систем управления в этой области. Поэтому в данном разделе предложена классификация функционально-структурных типов АСУ и показано место адаптивных АСУ сложными системами и рефлексивных АСУ активными объектами в этой классификации; показаны место и роль СК-анализа в рефлексивных АСУ активными объектами [64].
Место системы идентификации в системе управления
Распознавание образов есть не что иное, как идентификация состояния некоторого объекта. Автоматизированная система управления АСУ), построенная на традиционных принципах, может работать только на основе параметров, закономерности связей которых уже известны, изучены и отражены в математической модели. В итоге АСУ, основанные на традиционном подходе, практически не эффективны с активными многопараметрическими слабодетерминированными объектами управления, такими, например, как макро– и микро– социально-экономические системы в условиях динамичной экономики "переходного периода", иерархические элитные и этнические группы, социум и электорат, физиология и психика человека, природные и искусственные экосистемы и многие другие.
Поэтому, в состав перспективных АСУ, обеспечивающих устойчивое управление активными объектами в качестве существенных функциональных звеньев должны войти подсистемы идентификации и прогнозирования состояний среды и объекта управления, основанные на методах искусственного интеллекта (прежде всего распознавания образов), методах поддержки принятия решений и теории информации.
Метафора нейросетевого представления семантической информационной модели
В данной работе предлагается представление, согласно которому каждый нейрон отражает определенное будущее состояние активного объекта управления, а нейронная сеть в целом – систему будущих состояний, как желательных (целевых), так и нежелательных. Весовые коэффициенты на дендридах нейронов имеют смысл силы и направления влияния факторов на переход активного объекта управления в то или иное будущее состояние. Таким образом, предложенная в данной работе семантическая информационная модель в принципе допускает представление в терминах и понятиях нейронных сетей. Однако при более детальном рассмотрении выясняется, что семантическая информационная модель является более общей, чем нейросетевая и для полного их соответствия необходимо внести в нейросетевую модель ряд дополнений.
Метод K средних
В этом методе принадлежность объектов к кластерам определяется таким образом, чтобы:
– минимизировать изменчивость (различия) объектов внутри кластеров;
– максимизировать изменчивость объектов между кластерами.
Методика численных расчетов СК-анализа
Детальный список БКОСА и их алгоритмов
В таблице 25 приведен детальный список базовых когнитивных операций системного анализа, которым соответствует 24 алгоритма, которые здесь привести нет возможности из-за их объемности. Но они все приведены в полном виде в работе [64].
Таблица 25 – ДЕТАЛЬНЫЙ СПИСОК
БАЗОВЫХ КОГНИТИВНЫХ ОПЕРАЦИЙ СИСТЕМНОГО АНАЛИЗА (БКОСА)
№
алгоритма | Код БКОСА
по схеме СК-анализа | №
БКОСА | Наименование БКОСА | Полное наименование базовых когнитивных операций системного анализа (БКОСА) | |||||
1.1 | 1 | Присвоение имен | Присвоение имен классам (интенсиональная, интегральная репрезентация) | ||||||
1.2 | Присвоение имен атрибутам (экстенсиональная, дискретная репрезентация) | ||||||||
1 | 2.1. | 2 | Восприятие | Восприятие и запоминание исходной обучающей информации | |||||
2 | 2.2. | Репрезентация. Сопоставление индивидуального опыта с коллективным (общественным) |
Продолжение таблицы 25
№
алгоритма | Код БКОСА
по схеме СК-анализа | №
БКОСА | Наименование БКОСА | Полное наименование базовых когнитивных операций системного анализа (БКОСА) | |||||
3 | 3.1.1. | 3 | Обобщение
(синтез, индукция). | Накопление первичных данных | |||||
4 | 3.1.2. | Исключение артефактов | |||||||
5 | 3.1.3. | Расчет истинности смысловых связей между предпосылками и результатами (обобщенных таблиц решений) | |||||||
6 | 3.2. | Определение значимости шкал и градаций факторов, уровней Мерлина | |||||||
7 | 3.3. | Определение значимости шкал и градаций классов, уровней Мерлина | |||||||
8 | 4.1. | 4 | Абстраги-
рование | Абстрагирование факторов (снижение размерности семантического пространства факторов) | |||||
9 | 4.2. | Абстрагирование классов (снижение размерности семантического пространства классов) | |||||||
10 | 5. | 5 | Оценка адекватности | Оценка адекватности информационной модели предметной области | |||||
11 | 7. | 6 | Сравнение, идентификация и прогнозирование | Сравнение, идентификация и прогнозирование. Распознавание состояний конкретных объектов (объектный анализ) | |||||
12 | 9.1. | 7 | Анализ,
дедукция и абдукция | Анализ, дедукция и абдукция классов (семантический анализ обобщенных образов классов, решение обратной задачи прогнозирования) | |||||
13 | 9.2. | Анализ, дедукция и абдукция факторов (семантический анализ факторов) | |||||||
14 | 10.1.1. | 8 | Классификация и генерация конструктов | Классификация обобщенных образов классов | |||||
15 | 10.1.2. | Формирование бинарных конструктов классов | |||||||
16 | 10.1.3. | Визуализация семантических сетей классов | |||||||
17 | 10.2.1. | Классификация факторов | |||||||
18 | 10.2.2. | Формирование бинарных конструктов факторов | |||||||
19 | 10.2.3. | Визуализация семантических сетей факторов | |||||||
20 | 10.3.1. | 9 | Содержательное сравнение | Содержательное сравнение классов | |||||
21 | 10.3.2. | Расчет и отображение многомногозначных когнитивных диаграмм, в т.ч. диаграмм Мерлина | |||||||
22 | 10.4.1. | Содержательное сравнение факторов | |||||||
23 | 10.4.2. | Расчет и отображение многомногозначных когнитивных диаграмм, в т.ч. инвертированных диаграмм Мерлина | |||||||
24 | 11. | 10 | Планирование
и управление | Многовариантное планирование и принятие решения о применении системы управляющих факторов |
Иерархическая структура данных семантической информационной модели СК-анализа
На рисунке 43 приведена в обобщенном виде иерархическая структура баз данных семантической информационной модели системно-когнитивного анализа. На этой схеме базы данных обозначены прямоугольниками, а базовые когнитивные операции системного анализа, преобразующие одну базу в другую – стрелками с надписями. Имеются также базовые когнитивные операции, формирующие выходные графические формы. Из этой схемы видно, что одни базовые когнитивные операции готовят данные для других операций, относящихся к более высоким уровням иерархии системы процессов познания. Этим определяется возможная последовательность выполнения базовых когнитивных операций.
|
Рисунок 43. Иерархическая структура баз данных семантической информационной модели системно-когнитивного анализа |
Методика проведения работ
1. Формулирование целей методики и в соответствии с ними разработка перечня прогнозируемых, в т.ч. целевых и нежелательных хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", а также разработка шкал и градаций факторов для описания причин, которые привели к этим результатам. Предложен формализованный паспорт результатов выращивания сельхозкультуры, состоящий из трех частей: первая из их содержит шкалы и градации, позволяющие классифицировать хозяйственный результат; вторая содержит шкалы и градации, описывающие не зависящие от воли человека факторы (факторы среды, в т.ч. технологическая предыстория); третья – технологические факторы, которые можно рассматривать как средство достижения желаемых результатов.
2. Использование бумажного архива по выращиванию сельхозкультуры для заполнения формализованных паспортов выращивания и ввода
в программную инструментальную систему "Эйдос" в качестве примеров выращивания (обучающей выборки).
3. Синтез семантической информационной модели, т.е. выявление (на основе предъявленных реальных примеров выращивания сельхозкультур) причинно-следственных взаимосвязей между факторами окружающей среды, применяемыми технологиями и полученными результатами. Матрица абсолютных частот, является обобщением обучающей выборки, и матрица информативностей, представляет собой семантическую информационную модель предметной области.
4. Оценка достоверности модели, т.е. проверка способности созданного приложения правильно прогнозировать хозяйственные результаты на массиве уже введенных формализованных паспортов. Проведенная проверка показала, что валидность оказалась недостаточно высокой для практического применения: на уровне 58%. Причиной этого являются артефакты (неточные и зашумленные данные), из-за которых некоторые хозяйственные ситуации оказались слабо детерминированными.
Удаление артефактов (Парето-автоматизация) привело к повышению интегральной валидности до 80%, что достаточно для практического использования методики.
5. Формирование информационных портретов по каждому возможному результату выращивания. Информационный портрет хозяйственной ситуации представляет собой перечень технологических факторов с количественным указанием того, какое влияние оказывает каждый из них на осуществление данной ситуации. По сути дела информационный портрет хозяйственной ситуации является системой научно-обоснованных рекомендаций по выбору культуры для выращивания и применению тех или иных технологий.
6. Каждый из технологических факторов на основе приведенных примеров характеризуется тем, какое влияние он оказывает на осуществление каждой (целевой или нежелательной) хозяйственной ситуации. Эта информация содержится в семантических портретах факторов.
7. Сравнение различных хозяйственных ситуаций и формирование групп наиболее сходных из них (кластеров), а также определение кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом непосредственно на основе эмпирических данных путем их анализа был выявлен конструкт "качество–количество", означающий, что для получения высокого качества и большого количества продукции необходимы совершенно противоположные и несовместимые (т.е. невозможные одновременно) почвы, предшественники и агротехнологические приемы. Вместе с тем низкое качество и небольшое количество продукции вполне совместимы.
8. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти сходные по влиянию факторы предложено использовать для замены друг друга в случае необходимости. Так, например, однолетние и многолетние бобовые и ранние предшественники оказывают практически такое же влияние на результаты выращивания пшеницы, как вспашка 20-22 см, а поздние пропашные предшественники как поверхностная вспашка 8-10 см.
Таким образом, с применением математического метода и инструментария АСК-анализа решены две основные задачи:
1. Прогнозирование того, какие хозяйственные результаты наиболее вероятны (а какие практически невозможны) на данном виде почв, с данными предшественниками и при условии применения имеющихся конкретных имеющихся в распоряжении агротехнологий. Указана мера сходства прогнозируемой ситуации с каждым будущим состоянием.
2. Разработка рекомендаций по выбору управляющих воздействий, т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии должны быть, чтобы можно было рассчитывать с определенной уверенностью на желаемый хозяйственный результат. Необходимо отметить, что эта же задача позволяет также разрабатывать и совершенствовать агротехнологии.
Система "Эйдос" позволяет оценивать степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не просто дает рекомендацию, но и количественно оценивает степень ее надежности (как в самой карточке прогнозирования или информационном портрете, так в форме по валидности методики). Кроме того, система дает характеристику влияния каждого технологического приема и рекомендации по замене желательных, но очень дорогих или не имеющихся в наличии технологических приемов, другими, более дешевыми и доступными, и, при этом, имеющими сходное влияние на хозяйственные результаты. Таким образом, данная методика позволяет "просматривать" различные варианты технологии, прогнозировать последствия применения различных технологических приемов, и на этой основе вырабатывать научно обоснованные рекомендации по выбору возделываемой культуры и оптимальной для поставленных целей агротехнологии.
Необходимо отметить, что в данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные. В качестве второго можно привести пример, условно названный автором "бройлерным эффектом для растений". Суть его состоит в том, что применение технологий, дающих особо большие урожаи, приводит к росту зеленной массы в большей степени, чем к росту массы зерна (плодов).В результате себестоимость зерна (плодов) при применении таких технологий резко возрастает и рентабельность производства снижается.
Методы и этапы системного анализа
Основные методы, направленные на использование интуиции и опыта специалистов, а также методы формализованного представления систем, т.е. методы системного анализа, рассмотрены в работах [148]: метод "мозговой атаки"; метод экспертных оценок; метод "Делъфи"; метод "дерева целей"; морфологические методы.
Ведущие зарубежные Акофф Р., Бир С., Винер Р., Месарович М., Мако Д., Такахара И., Оптнер С.Л., Черчмен У., Эшби У.Р., Янг С., и отечественные ученые в области системного анализа Ф.И.Перегудов, Ф.П.Тарасенко [148], В.С.Симанков, Э.Х.Лийв [59], В.Н.Спицнадель, предлагают несколько отличающиеся друг от друга схемы основных этапов системного анализа.
Отечественные классики в области системного анализа Ф.И.Перегудов и Ф.П.Тарасенко считают [148], что системный анализ не может быть полностью формализован. Ими предложена следующая схема неформализованных этапов системного анализа (рисунок 8):
Рисунок 8. Неформализуемые этапы системного анализа по Ф.И.Перегудову и Ф.П.Тарасенко [148 ] |
1. Определение конфигуратора.
2. Постановка проблемы – отправной момент исследования. В исследовании системы ему предшествует работа по структурированию проблемы.
3. Расширение проблемы до проблематики, т.е. нахождение системы проблем или задач, существенно связанных с исследуемой проблемой, без учета которых она не может быть решена.
4. Выявление целей: цели указывают направление, в котором надо двигаться, чтобы поэтапно решить проблему.
5. Формирование критериев. Критерий – это количественное отражение степени достижения системой поставленных перед ней целей. Критерий –это правило выбора предпочтительного варианта решения из ряда альтернативных. Критериев может быть несколько. Многокритериальность является способом повышения адекватности описания цели. Критерии должны описать по возможности все важные аспекты цели, но при этом необходимо минимизировать число необходимых критериев.
6. Агрегирование критериев. Выявленные критерии могут быть объединены либо в группы, либо заменены обобщающим критерием.
7. Генерирование альтернатив и выбор с использованием критериев наилучшей из них. Формирование множества альтернатив является творческим этапом системного анализа.
8. Исследование ресурсных возможностей, включая информационные потоки и ресурсы.
9. Выбор формализации (построение и использование моделей и ограничений) для решения проблемы.
10. Оптимизация (для простых систем).
11. Декомпозиция.
12. Наблюдение и эксперименты над исследуемой системой.
13. Построение системы.
14. Использование результатов проведенного системного исследования.
Однако в утверждении этих авторов есть некоторый смысловой парадокс, состоящий в том, что предложенная ими схема сама может рассматриваться как первый шаг на пути формализации представленных на ней этапов системного анализа в форме алгоритма.
Как уже отмечалось, специфической особенностью системного анализа является сочетание качественных и формальных методов. Такое сочетание составляет основу любой используемой методики. Различные схемы системного анализа, предлагаемые ведущими учеными в этой области (Оптнер С.Л., Янг С., Федоренко Н.П., Никаноров С.П., Черняк Ю.И., Перегудов Ф.И., Тарасенко Ф.П., Симанков В.С., Казиев В.М., Лийв Э.Х.) сведены в таблице 3.
Наиболее детализированная на данный момент многоуровневая иерархическая структуризация системного анализа в виде IDEF0-диаграмм, насколько известно автору, предложена в докторской диссертации В.С.Симанкова (в данной работе не приводится из-за ее ограниченного объема, но она приведена в работе [64]).
Таблица 3 – ЭТАПЫ СИСТЕМНОГО АНАЛИЗА СОГЛАСНО РАЗЛИЧНЫМ АВТОРАМ |
|
различные мелкие этапы СА автоматизировались различными не связанными друг с другом группами ученых и разработчиков, которые исходили при этом из своих целей, научных интересов и возможностей.
В результате на данный момент сложилась следующая картина:
– не все этапы системного анализа автоматизированы;
– для автоматизации различных этапов системного анализа применяются различные математические модели и теории;
– эти модели реализуются с применением различных программных систем, не связанных друг с другом и не образующие единого инструментального комплекса;
– эти программные системы созданы с использованием различных инструментальных средств, на различных платформах и языках программирования;
– как правило, эти программные системы имеют специализированный характер, т.е. автоматизируют отдельные этапы системного анализа не в универсальной форме, а лишь в одной конкретной предметной области.
Поэтому автор считает, что "максимальная детализация системного анализа" – не самоцель, т.е. бессмысленна "детализация ради детализации". Безусловно, данное направление представляет интерес в научном плане, однако, по-видимому, оно не перспективно как путь автоматизации системного анализа, т.к. опыт показывает, что будучи изначально предназначено для облегчения процесса автоматизации на деле оно лишь фактически усложнило решение этой задачи.
Анализ приведенных детализированных схем этапов и процедур системного анализа показывает, что на всех этапах широко используются когнитивные операции, т.е. операции, связанные с познанием предметной области и объекта управления и с созданием их идеальной модели.
Поэтому в данной работе предлагается иной путь автоматизации системного анализа, основанный не на его максимальной детализации, а на интеграции с когнитивными технологиями путем структурирования по когнитивным операциям.
Методы кластерного анализа
Термин "Кластерный анализ" впервые ввел Tryon в 1939.
Кластеризация – это операция автоматической классификации, в ходе которой объекты объединяются в группы (кластеры) таким образом, что внутри групп различия между объектами минимальны, а между группами – максимальны. При этом в ходе кластеризации не только определяется состав кластеров, но и сам их набор и границы.
Поэтому вполне обоснованно считается, что методы кластерного анализа используются в большинстве случаев тогда, когда нет каких-либо априорных гипотез относительно классов, т.е. исследование находится на первой эмпирической стадии: описательной.
Существует большое количество различных алгоритмов кластеризации, которые обычно связаны с полным перебором объектов и весьма трудоемки в вычислительном отношении, здесь же мы упомянем лишь о трех из них:
– объединение (древовидная кластеризация);
– двухвходовое объединение;
– метод K средних.
Рассмотрим кратко эти алгоритмы (описание взято с сайта http://StatSoft.ru).
Многоагентные распределенные системы обнаружения, накопления и использования знаний в Internet
Является перспективным создание на базе предложенной технологии и методологии АСК-анализа новой многозадачной версии системы "Эйдос", обеспечивающей (после регистрации пользователей на сайте при выполнении ими заданных условий) доступ пользователей Internet к базам данных системы как в режиме синтеза новых моделей, так и в режиме их эксплуатации в адаптивном режиме по направлениям, которые определят сами пользователи и разработчики. Это позволит "интеллектуализировать" Internet, создать в нем активные сервисы, способные стать со временем накопителями, хранилищами и анализаторами знаний и опыта по самым различным направлениям деятельности человека (например, автоматизированные консалтинговые службы). Эти сервисы могли бы предоставлять услуги по интеллектуальной обработке данных пользователям независимо от их локализации, и, таким образом, стать реальной технической базой для интеграции знаний, что может стать еще одним шагом на пути развития ноосферы (В.И.Вернадский, Ле Руа, Тейяр де Шарден, 1923). В настоящее же время Internet используются, в основном, просто для получения или просмотра готовых, созданных кем-либо файлов, т.е. просто для обмена информацией.
Многослойный персептрон
Каким же образом в многослойных (иерархических) нейронных сетях преодолевается принципиальное ограничение однослойных нейронных сетей, связанное с требованием линейной разделимости классов?
Часто то, что не удается сделать сразу, вполне возможно сделать по частям. Для этого изменяются задачи, решаемые слоями нейронной сети. Оказывается в 1-м слое не следует пытаться на основе первичных признаков, фиксируемых рецепторами, сразу идентифицировать классы, а нужно лишь сформировать линейно-разделимую систему вторичных признаков, которую уже во 2-м слое связать с классами (рисунок 76).
Рисунок 76. Двух-слойный персептрон [187] |
В многослойной сети выходные сигналы нейронов предыдущего слоя играют роль входных сигналов для нейронов последующего слоя, т.е. нейроны предыдущего слоя выступают в качестве рецепторов для нейронов последующего слоя.
Связи между смежными слоями нейронов будем называть непосредственными, а связи между слоями, разделенными N промежуточных слоев, будем называть связями N-го уровня опосредованности. Непосредственные связи – это связи 0-го уровня опосредованности. Промежуточные слои нейронов в многослойных сетях называют скрытыми.
Персептрон переводит входной образ, определяющий степени возбуждения рецепторов, в выходной образ, определяемый нейронами самого верхнего уровня, которых обычно, не очень много. Состояния возбуждения нейронов на верхнем уровне иерархии сети характеризуют принадлежность входного образа к тем или иным классам.
Таким образом, многослойный персептрон – это обучаемая распознающая система, реализующая корректируемое в процессе обучения линейное решающее правило в пространстве вторичных признаков, которые обычно являются фиксированными случайно выбранными линейными пороговыми функциями от первичных признаков.
При обучении на вход персептрона поочередно подаются сигналы из обучающей выборки, а также указания о классе, к которому следует отнести данный сигнал. Обучение перцептрона заключается в коррекции весов при каждой ошибке распознавания, т.
е. при каждом случае несовпадения решения, выдаваемого персептроном, и истинного класса. Если персептрон ошибочно отнес сигнал, к некоторому классу, то веса функции, истинного класса увеличиваются, а ошибочного уменьшаются. В случае правильного решения все веса остаются неизменными.
Этот чрезвычайно простой алгоритм обучения обладает замечательным свойством: если существуют значения весов, при которых выборка может быть разделена безошибочно, то при определенных, легко выполнимых условиях эти значения будут найдены за конечное количество итераций.
При идентификации, распознавании, прогнозировании на вход многослойного персептрона поступает сигнал, представляющий собой набор первичных признаков, которые и фиксируются рецепторами. Сначала вычисляются вторичные признаки. Каждому такому вторичному признаку соответствует линейная от первичных признаков. Вторичный признак принимает значение 1, если соответствующая линейная функция превышает порог. В противном случае она принимает значение 0. Затем для каждого из классов вычисляется функция, линейная относительно вторичных признаков. Перцептрон вырабатывает решение о принадлежности входного сигнала к тому классу, которому соответствует функция от вторичных параметров, имеющая наибольшее значение.
Показано, что для представления произвольного нелинейного функционального отображения, задаваемого обучающей выборкой, достаточно всего двух слоев нейронов. Однако на практике, в случае сложных функций, использование более чем одного скрытого слоя может давать экономию полного числа нейронов.
Модель Хопфилда
В модели Хопфилда (J.J.Hopfield, 1982) впервые удалось установить связь между нелинейными динамическими системами и нейронными сетями.
Модель Хопфилда является обобщением модели многослойного персептрона путем добавления в нее следующих двух новых свойств:
1. В нейронной сети все нейроны непосредственно связаны друг с другом: силу связи i-го нейрона с j-м обозначим как Wij.
2. Связи между нейронами симметричны: Wij=Wji, сам с собой нейрон не связан Wii=0.
Каждый нейрон может принимать лишь два состояния, которые определяются по классической формуле (1). Изменение состояний возбуждения всех нейронов может происходить либо последовательно, либо одновременно (параллельно), но свойства сети Хопфилда не зависят от типа динамики.
Сеть Хопфилда способна распознавать объекты при неполных и зашумленных исходных данных, однако не может этого сделать, если изображение смещено или повернуто относительно его исходного состояния, представленного в обучающей выборке.
Модель рефлексивной АСУ активными объектами и понятие мета-управления
АСУ активными объектами (объектами) (РАСУ АО), является обобщением ААСУ СС на случай, когда сложная система является активной, т.е. имеет собственные цели, которые в общем случае не совпадают с целями управляющей системы. Из этого обстоятельства следует, что активный объект управления (АОУ) имеет собственную модель себя и своей окружающей среды, включая и управляющую систему, как один из ее элементов.
Классификация различных уровней рефлексивности приведена в таблице5.
Таблица 5 – УРОВНИ РЕФЛЕКСИВНОСТИ | |
Простейшая модель АОУ включает два уровня (рисунок 17) и предполагает возможность оказания управляющих воздействий на различных уровнях АОУ:
– уровне воздействия на систему поддержки системы управления;
– уровне системы управления.
Рисунок 17. Двухуровневая модель активной системы и различие в характере управляющего воздействия на АОУ в РАСУ ОУ и ААСУ СС |
Различия между ААСУ СС и РАСУ АО приведены в таблице 6:
Таблица 6 – РАЗЛИЧИЯ МЕЖДУ ААСУ СС И РАСУ АО
ААСУ СС | РАСУ АО | ||||
Модель
объекта управления | Объект управления рассматривается как физическая система, пассивно воспринимающая управляющая воздействия | Объект управления рассматривается как субъект, имеющий системы: целеполагания; моделирования себя (рефлективность) и окружающей среды (включая управляющую систему); принятия и реализации решений | |||
Характер
управляющего воздействия | Энергетическое
(физическое) воздействие | Информационное воздействие,
мета-управление |
Конечно, РАСУ АО не исключает возможности энергетического воздействия на физическую структуру АОУ, как в ААСУ СС, но это также может осуществляться с учетом характеристик его интеллектуальной информационной системы. Таким образом, в РАСУ АО управление АОУ осуществляется путем управления его системой управления, т.е. путем мета-управления: согласования целей системы управления и активного объекта управления; создания у активного объекта управления благоприятного для достижения целей управления и восприятия управляющих воздействий образа управляющей системы; создания у активного объекта управления мотивации, ориентирующей его на достижение целей управления. Таким образом, мета-управление представляет собой управление теми условиями, на основе которых активный объект управления формирует цели и принимает решения. Учитывая сказанное, получим структуру РАСУ АО как обобщение структуры ААСУ СС на случай активного объекта управления (рисунок 18).
Рисунок 18. Модель рефлексивной АСУ активными объектами (системами) |
Моделирование иерархических структур обработки информации
Рассмотрим иерархическую структуру информации на примере использования психологического теста для оценки психологических качеств сотрудников и влияния этих качеств на эффективность работы фирмы. В нейронной сети иерархическим уровням обработки информации соответствуют слои, поэтому далее будем использовать термины "слой нейронной сети" и "иерархический уровень обработки информации" как синонимы. Рецепторы дают информацию по ответам сотрудника на опросник, нейроны 1-го слоя дают оценку психологических качеств и сигнал с их аксонов является входным для нейронов 2-го слоя, дающих оценку качества работы фирмы. В семантической информационной модели существует три варианта моделирования подобных иерархических структур обработки информации:
1. Заменить все слои одним слоем и выявлять зависимости непосредственно между исходными данными с первичных рецепторов и интересующими итоговыми оценками, например, ответами сотрудников на вопросы и результатами работы фирмы. Этот подход эффективен с прагматической точки зрения, но дает мало информации для теоретических обобщений.
2. Каждый слой моделируется отдельной семантической информационной моделью, включающей свои классификационные и описательные шкалы и градации, обучающую выборку, матрицы абсолютных частот и информативностей. Вся система иерархической обработки информации моделируется системой этих моделей, взаимосвязанных друг с другом по входу-выходу: результаты классификации объектов обучающей выборки 1-й моделью рассматриваются как свойства этих объектов во 2-й модели, в которой они используются для классификации 2-го уровня. Например, психологические качества сотрудников, установленные в результате психологического тестирования, рассматриваются как свойства сотрудников, влияющие на эффективность работы фирмы. Данный подход эффективен и с прагматической, и с теоретической точек зрения, но является громоздким в программной реализации.
3. Моделирование каждого слоя соответствующими подматрицами матриц абсолютных частот и информативностей (таблица 22).
Рассмотрим иерархическую структуру информации на примере использования психологического теста для оценки психологических качеств сотрудников и влияния этих качеств на эффективность работы фирмы. В нейронной сети иерархическим уровням обработки информации соответствуют слои, поэтому далее будем использовать термины "слой нейронной сети" и "иерархический уровень обработки информации" как синонимы. Рецепторы дают информацию по ответам сотрудника на опросник, нейроны 1-го слоя дают оценку психологических качеств и сигнал с их аксонов является входным для нейронов 2-го слоя, дающих оценку качества работы фирмы. В семантической информационной модели существует три варианта моделирования подобных иерархических структур обработки информации:
1. Заменить все слои одним слоем и выявлять зависимости непосредственно между исходными данными с первичных рецепторов и интересующими итоговыми оценками, например, ответами сотрудников на вопросы и результатами работы фирмы. Этот подход эффективен с прагматической точки зрения, но дает мало информации для теоретических обобщений.
2. Каждый слой моделируется отдельной семантической информационной моделью, включающей свои классификационные и описательные шкалы и градации, обучающую выборку, матрицы абсолютных частот и информативностей. Вся система иерархической обработки информации моделируется системой этих моделей, взаимосвязанных друг с другом по входу-выходу: результаты классификации объектов обучающей выборки 1-й моделью рассматриваются как свойства этих объектов во 2-й модели, в которой они используются для классификации 2-го уровня. Например, психологические качества сотрудников, установленные в результате психологического тестирования, рассматриваются как свойства сотрудников, влияющие на эффективность работы фирмы. Данный подход эффективен и с прагматической, и с теоретической точек зрения, но является громоздким в программной реализации.
3. Моделирование каждого слоя соответствующими подматрицами матриц абсолютных частот и информативностей (таблица 34).
Таблица 22 – ЛОГИЧЕСКАЯ МОДЕЛЬ СТРУКТУРЫ ДАННЫХ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ, СООТВЕТСТВУЮЩАЯ ТРЕХСЛОЙНОЙ НЕЛОКАЛЬНОЙ НЕЙРОННОЙ СЕТИ
Рецепторы – факторы, влияющие на поведение объекта управления |
Нейроны - будущие состояния объекта управления |
Дифференцирующая способность входного сигнала |
||
Нейроны 1-го слоя: психологические качества сотрудников |
Нейроны 2-го слоя: успешность деятельности сотрудника |
Нейроны 3-го слоя: успешность деятельности фирмы |
||
Рецепторы 1-го слоя: ответы сотрудников на вопросы анкеты |
Весовые коэффициенты 1-го слоя |
– – – |
– – – |
|
Рецепторы 2-го слоя: психологические качества сотрудников |
– – – |
Весовые коэффициенты 2-го слоя |
– – – |
|
Рецепторы 3-го слоя: успешность деятельности сотрудника |
– – – |
– – – |
Весовые коэффициенты 3-го слоя |
|
Степень обученности нейрона |
Степень обученности нейронной сети |
Шаг n: расчет весовых коэффициентов n-го слоя, идентификация объектов обучающей выборки в нейронах n-го слоя, если слой (n+1) существует, то занесение в обучающую выборку в качестве свойств объектов (n+1)-го слоя результатов их идентификации в нейронах n-го слоя.
Примечание: в таблице 22 представлена именно логическая
структура данных, т.е. в реальных базах данных нет записей, содержащих информацию о влиянии рецепторов n-го слоя на нейроны слоев, номера которых не равны n.
Примечание: в таблице 34 представлена именно логическая
структура данных, т.е. в реальных базах данных нет записей, содержащих информацию о влиянии рецепторов n-го слоя на нейроны слоев, номера которых не равны n.
Этот вариант обладает преимуществами первых двух и преодолевает их недостатки. В нем применяется следующий итерационный алгоритм послойного расчета, где n={1, 2, …, N}, N – количество слоев нейронной сети:
Шаг n: расчет весовых коэффициентов n-го слоя, идентификация объектов обучающей выборки в нейронах n-го слоя, если слой (n+1) существует, то занесение в обучающую выборку в качестве свойств объектов (n+1)-го слоя результатов их идентификации в нейронах n-го слоя.
Таблица 34 – ЛОГИЧЕСКАЯ СТРУКТУРА ДАННЫХ, СООТВЕТСТВУЮЩАЯ ТРЕХСЛОЙНОЙ НЕЛОКАЛЬНОЙ НЕЙРОННОЙ СЕТИ
Рецепторы – факторы, влияющие на поведение объекта управления |
Нейроны - будущие состояния объекта управления |
Дифференцирующая способность входного сигнала |
||
Нейроны 1-го слоя: психологические качества сотрудников |
Нейроны 2-го слоя: успешность деятельности сотрудника |
Нейроны 3-го слоя: успешность деятельности фирмы |
||
Рецепторы 1-го слоя: ответы сотрудников на вопросы анкеты |
Весовые коэффициенты 1-го слоя |
– – – |
– – – |
|
Рецепторы 2-го слоя: психологические качества сотрудников |
– – – |
Весовые коэффициенты 2-го слоя |
– – – |
|
Рецепторы 3-го слоя: успешность деятельности сотрудника |
– – – |
– – – |
Весовые коэффициенты 3-го слоя |
|
Степень обученности нейрона |
Степень обученности нейронной сети |
Моделирование причинно-следственных
Факторы описывают причины, а классы – следствия. Но и следствия в свою очередь являются причинами более отдаленных последствий. Предлагаемая семантическая информационная модель позволяет рассматривать события, обнаружение которых осуществляется в режиме идентификации, как причины последующих событий, т.е. как факторы, их вызывающие. При этом факт наступления этих событий моделируется путем включения в модель факторов, соответствующих классам (событиям). В нейронных сетях этот процесс моделируется путем включения в сеть дополнительных нейронных слоев и создания обратных связей между слоями, обеспечивающих передачу в предыдущие слои результатов работы последующих слоев.
Моделирование причинно-следственных цепочек в нейронных сетях и семантической информационной модели
Факторы описывают причины, а классы – следствия. Но и следствия в свою очередь являются причинами более отдаленных последствий. Предлагаемая семантическая информационная модель позволяет рассматривать события, обнаружение которых осуществляется в режиме идентификации, как причины последующих событий, т.е. как факторы, их вызывающие. При этом факт наступления этих событий моделируется путем включения в модель факторов, соответствующих классам (событиям). В нейронных сетях этот процесс моделируется путем включения в сеть дополнительных нейронных слоев и создания обратных связей между слоями, обеспечивающих передачу в предыдущие слои результатов работы последующих слоев.
Модификация сознания и самосознания пользователя в виртуальной реальности
Сегодня уже для всех вполне очевидно, что виртуальная реальность может с успехом использоваться для развлечений, ведь она помогает представить себя в другой роли и в другом обличии. Однако в действительности этот эффект связан с модификацией "Образа Я", т.е. сознания и самосознания пользователя. Это значит, что последствия этого в действительности значительно серьезнее, чем обычно представляют, и далеко выходит за рамки собственно развлечений.
Как показано автором в ряде работ, приведенных на сайте http://Lc.kubagro.ru, форма сознания и самосознания человека определяются тем, как он осознает себя и окружающее, т.е. тем:
– что он осознает, как объективное, субъективное и несуществующее;
– с чем он отождествляет себя и что осознает как объекты окружающий среды.
Очевидно, что разработчики новейших компьютерных технологий совершенно неожиданно вторглись в абсолютно новую для себя сферу исследования измененных форм сознания, и далеко идущие системные последствия этого ими, как и вообще научным сообществом, пока еще очень мало осознаны.
Еще в 1079-1981 годах автором и Л.А.Бакурадзе были оформлены заявки на изобретение компьютерной системы, выполняющей все трудовые функции физического тела, обеспечивающую управление с использованием дистанционного мысленного воздействия, т.е. микротелекинеза. По мнению автора телекинез представляет собой управление физическими объектами путем воздействия на них непосредственно с высших планов без использования физического тела, т.е. тем же способом, с помощью которого любой человек, осознает он это или нет, управляет своим физическим телом. Были предложены технические и программные решения и инженерно – психологические методики. Система предлагалась адаптивной, т.е. автоматически настраивающейся на индивидуальные особенности, "почерк" оператора и его состояние сознания, с плавным переключением на дистанционные каналы при повышении их надежности (которая измерялась автоматически) и могла одновременно с выполнением основной работы выступать в качестве тренажера. Человек, начиная работу с системой в обычной форме сознания с использованием традиционных каналов (интерфейса), имея мгновенную адекватную по форме и содержанию обратную связь об эффективности своего телекинетического воздействия, должен быстро переходить в форму сознания, оптимальную для использования телекинеза в качестве управляющего воздействия.
Мониторинг хода экономической реформы
Существует ежеквартальная отчетность регионов края по ходу экономической реформы. Однако эта отчетность слабо стандартизирована и формализована, не накапливается в компьютерных базах данных, содержит лишь абсолютные значения экономических показателей, а не информацию об экономических событиях и их динамике. В результате автоматизированный анализ этой информации с помощью интеллектуальных методов не проводится.
Предлагаемая методология и технология обеспечивают организацию этих работ, что позволяет в соответствии с установленным регламентом: получить аналитические отчеты о ходе реформы по ее направлениям (приватизация, фондовый рынок, земельная реформа, финансовая сфера, производство, услуги, и т.д.); выявить и изучить взаимосвязи темпа реформы в различных направлениях; выявить и изучить пути движения инвестируемых средств между различными предметными областями и направлениями реформы.
Мониторинг инвестиционных проектов
Конечно, в каждом инвестиционном проекте дается экономическое обоснование целесообразности инвестиций в выбранном направлении. Однако данное обоснование часто страдает некоторой односторонностью, так как обычно разработчики инвестиционной программы не в состоянии учесть обобщенный опыт инвестирования в ту или иную сферу в конкретных условиях рынка Кубани, так как просто не владеют необходимой информацией. Этот обобщенный опыт может быть формализован и накоплен лишь в специально созданной и уполномоченной на получение соответствующей информации структуре. Такая структура может дать независимую комплексную (а не только экономическую) оценку каждого инвестиционного проекта, т.е. сделать по нему заключение типа: "Опыт осуществления 25 подобных проектов показывает, что такого рода проекты, как правило, (в 85% случаев) в условиях Кубани приводят к тому–то и тому–то". Это заключение может быть отрицательным даже в том случае, если его экономическое обоснование является блестящим, но... проведенным по неадаптированным западным методикам, слабо учитывающим специфику России вообще и Кубани в частности.
Мониторинг предприятий
Основные цели организации мониторинга предприятий – прогнозирование целесообразности инвестирования в данное предприятие, оценка рисков его кредитования и страхования, выявление предприятий, попадающих в различные "зоны риска".
Для достижения этих целей необходимы следующие виды работ:
1) классификация предприятий, например, по трем шкалам: форма собственности; направление деятельности; объем деятельности;
2) организация ведения базы данных, которая содержит и накапливает в формализованном виде информацию по предприятиям, необходимую для достижения сформулированных целей;
3) формирование обобщенных информационных портретов предприятий различных категорий;
4) выдача характеристики на основании запроса в необходимых аспектах по любому предприятию, по которому имеется заполненный формализованный паспорт.
Мониторинг состояния сотрудников
Известно, что одной из основных причин производственного брака является ухудшение состояния сотрудников. Но сотрудники не всегда могут вовремя заметить это ухудшение, т.к. самооценка (самочувствие) обычно запаздывает по времени за моментом объективного ухудшения состояния. Поэтому является актуальным своевременное обнаружение объективного ухудшения параметров и адекватное реагирование на него.
С помощью систем БОС это достигается тем, что:
1. Каждому сотруднику одевается на руку браслет с компактным устройством диагностики ряда параметров, например таких, как:
– частота и наполнение пульса;
– кожно-гальваническая реакция;
– температура;
– давление;
– пототделение.
2. Это же устройство и периодически передает значения данных параметров на компьютер по радиоканалу.
3. Параметры от каждого сотрудника накапливаются в базе данных системы мониторинга на сервере, а также анализируются в режиме реального времени с учетом текущего состояния и динамики, в т.ч. вторичных (расчетных) показателей.
4. Когда параметры выходят за пределы коридора "нормы" или по их совокупности может быть поставлен диагноз, – сотрудник оперативно снимается с рабочего места и заменяется другим из резерва, а затем, при наличии показаний, направляется на лечение.
Мышление как вычисление смысла
В связи с ограниченностью объема данной работы нет возможности подробно рассмотреть вопросы, вынесенные в заголовок данного раздела. Но в этом и нет особой необходимости, т.к. такие вопросы как:
– системное обобщение семантической меры целесообразности информации как количественная мера знаний;
– способ представления и обобщения фактов в модели СК-анализа;
– способ вычисления смысла фактов и неклассическая логика;
– структуры данных базовых когнитивных операций;
– алгоритмы базовых когнитивных операций;
и ряд других, раскрывающих содержание математической модели, методики численных расчетов и технологии СК-анализа, подробно описаны в работе [64], размещенной на сайте автора: http://Lc.kubagro.ru.
Начальный этап синтеза модели
Подсистема "Словари" обеспечивает формализацию предметной области. Она реализует следующие режимы: классификационные шкалы и градации; описательные шкалы и градации; градации описательных шкал; иерархические уровни организации систем; автоматический ввод первичных признаков из текстовых файлов; почтовая служба по нормативно-справочной информации; печать анкеты.
Наименования тем для самостоятельной работы студентов
Задания к самостоятельной работе (СР) студентов пронумерованы и снабжены индексом «Ю» или «Э», означающими, что эти задания рекомендуются студентам, обучающимся по «юридической» (Ю) или «экономической» (Э) специальностям. Все самостоятельные работы выполняются с применением системы «Эйдос», кроме тех случаев, когда другие системы указаны конкретно.
Недостатки нейронных сетей и пути их преодоления в семантической информационной модели
К основным недостаткам нейронных сетей можно отнести:
1. Сложность содержательной интерпретации смысла интенсивности входных сигналов и весовых коэффициентов ("проблема интерпретируемости весовых коэффициентов").
2. Сложность содержательной интерпретации и обоснования аддитивности аргумента и вида активационной (передаточной) функции нейрона ("проблема интерпретируемости передаточной функции").
3. "Комбинаторный взрыв", возникающий при определении структуры связей нейронов, подборе весовых коэффициентов и передаточных функций ("проблема размерности").
Проблемы интерпретируемости приводят к снижению ценности полученных результатов работы сети, а проблема размерности – к очень жестким ограничениям на количество выходных нейронов в сети, на количество рецепторов и на сложность структуры взаимосвязей нейронов с сети. Достаточно сказать, что количество выходных нейронов в реальных нейронных сетях, реализуемых на базе известных программных пакетов, обычно не превышает несколько сотен, а чаще всего составляет единицы и десятки.
Недостатки традиционных путей
Отсутствие системного подхода к оценке и использованию потенциала природных ресурсов и биологического потенциала сортов. Отсутствие анализируемого разработчиками проекта массива данных в системе взаимодействия "генотип-среда". Отсутствие информации по степени адаптивного потенциала конкретных сортов к конкретным условиям среды. Отсутствие прогноза вероятности проявления лимитирующих факторов (морозов, заморозков в конкретные фазы развития растений в зимне-весенний и поздне-осенний периоды, засухи, жары в летне-осенний период).
В связи с вышеизложенным неизбежен субъективизм и низкая адекватность решений по выбору культур и сортов для посадки со стороны руководителя хозяйства и специалистов проектных организаций.
Неизбежность возникновения компьютеров, информационных систем и систем искусственного интеллекта
Физический организм выполняет следующие трудовые функции:
1. Функция контакта с физической средой.
2. Функция трансмиссии (передачи и перераспределения энергии).
3. Рабочая функция (преобразование простого движения в сложное и выполняющее работу).
4. Функция двигателя (преобразование формы энергии).
5. Функция преобразования формы информации.
Другие структурные уровни организма человека поддерживают еще ряд функций, связанных с чувственно-эмоциональной и интеллектуальной обработкой информации. Рассмотрение этих функций выходит за рамки данного учебного пособия. Но именно с их передачей средствам труда будет связано создание компьютерных систем, не просто имитирующих некоторые стороны этих видов деятельности человека, а действительно реализующих их.
Развитие технологии связано с последовательной передачей всех этих функций средствам труда и, следовательно, настанет черед и функций, связанных с эмоциональной и интеллектуальной обработкой информации. Следовательно, создание систем искусственного интеллекта является столь же неизбежным и закономерным, как и создание рабочей машины или двигателя.
Нейронные сети
Нейронные представляют собой большой класс систем, архитектура которых пытается имитировать построение нервной ткани из нейронов. В одной из наиболее распространенных архитектур, многослойном персептроне с обратным распространением ошибки, эмулируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д.
Эти значения рассматриваются как сигналы, передающиеся в вышележащий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ, реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо «натренировать» на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Эта тренировка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам.
Нейронные сети и СК-анализ
Известные в литературе нейронные сети, в отличие от предлагаемой семантической информационной модели и нелокальных нейронных сетей, не обеспечивают реализацию всех базовых когнитивных операций, входящих в когнитивный конфигуратор. В частности, традиционные нейронные сети решают лишь задачу идентификации (прогнозирования) и не обеспечивают решение обратной задачи (дедукции), необходимой для принятия решения о выборе многофакторного управляющего воздействия. Кроме того не решается вопрос об уменьшении размерности нейронной сети без ущерба для ее адекватности (абстрагирование).
Результаты численного моделирования и исследования свойств нейронных сетей этого класса при управлении в АПК и других предметных областях позволяют предположить, в качестве модели реальных когнитивных процессов они обладает более высокой адекватностью, чем нейронные сети других типов.
Графическое отображение нейронов и Паррето-подмножеств нелокальной нейронной сети
Ниже приводятся примеры графического отображения нелокального нейрона и Паретто-подмножества (нейронов с наиболее значимыми связями) нелокальной нейронной сети в системе "Эйдос" (рисунки 39 и 40).
Рисунок 39. Графическое отображение нелокального нейрона
в системе "Эйдос" | |
Рисунок 40. Графическое отображение нелокальной нейронной сети
в системе "Эйдос" |
Некоторые количественные характеристики системы "Эйдос"
Система "Эйдос" обеспечивает генерацию и запись в виде файлов более 54 видов 2d & 3d графических форм и 50 видов текстовых форм, перечень которых приведен в таблице 31.
При применении системы в самых различных предметных областях обеспечивается достоверность распознавания обучающей выборки: на уровне 90% (интегральная валидность), которая существенно повышается после Парето-оптимизации системы признаков (т.е. после исключения признаков с низкой селективной силой), удаления из модели артефактов, а также классов и признаков, по которым недостаточно данных. Система "Эйдос" версии 12.5 обеспечивает синтез модели, включающей десятки тысяч классов и признаков при неограниченном объеме обучающей выборки, причем признаки могут быть не только качественные (да/нет), но и количественные, т.е. числовые. В некоторых режимах анализа модели имеются ограничения на ее размерность, которые на данном этапе преодолеваются путем оптимизации модели. Реализована возможность разработки супертестов, в том числе интеграции стандартных тестов в свою среду, (при этом не играет роли известны ли методики интерпретации, т.е. "ключи" этих тестов). В системе имеется научная графика, обеспечивающая высокую степень наглядности, а также естественный словесный интерфейс при обучении Системы и запросах на распознавание.
Исходные тексты системы "Эйдос" и систем окружения "Эйдос-Y" и "Эйдос-фонд" в формате "Текст-DOS" имеют объем около 2.5 Мб; их распечатка 6-м шрифтом составляет около 800 страниц.
Таблица 31 – ПЕРЕЧЕНЬ ТЕКСТОВЫХ ФОРМ СИСТЕМЫ "ЭЙДОС" | |
Некоторые перспективные области применения АСК-анализа
Технологии АСК-анализа могут быть успешно применены в ряде предметных областей:
1) экологический мониторинг, анализ и прогнозирование;
2) технология (РАСУ индивидуального управления лечением, управление неклассическими техническими системами и др.);
3) психология;
4) правоохранительная сфера.
Подробнее эти вопросы освещены в работе [64] и ряде других работ автора с соавторами: [29, 30, 34, 62, 64 – 111, 139 – 146, 169, 172 – 185, 201 – 206, 212, 214, 224 – 226].
Некоторые перспективные направления применения АСК-анализа для управления в АПК на уровне хозяйств приведены в таблице 39.
Таблица 39 – ПЕРСПЕКТИВНЫЕ ОБЛАСТИ ПРИМЕНЕНИЯ
АСК-АНАЛИЗА В АПК
№ | Наименование задачи | Имеющийся задел | Ожидаемые результаты | |||||
1 | Прогнозирование количественных и качественных результатов выращивания сельскохозяйственных культур на основе данных о предшественниках, видах почв и применяемых агротехнологиях | Имеются апробированные математическая модель, численный метод и инструментарий. Разработана автоматизированная методика прогнозирования результатов выращивания по одной культуре (зерновые колосовые) | Повышение прибыли и рентабельности производства сельскохозяйственных культур на 3-5% за счет повышения адекватности принимаемых решений по выбору культур, полей и агротехнологий для выращивания | |||||
2 | Выработка рекомендаций по выбору поля и агротехнологии для получения заданных количественных и качественных результатов выращивания сельскохозяйственных культур | Имеются апробированные математическая модель, численный метод и инструментарий. Разработана автоматизированная методика прогнозирования результатов выращивания по одной культуре (зерновые колосовые) | Повышение прибыли и рентабельности производства сельскохозяйственных культур на 5-7% за счет повышения адекватности принимаемых решений по выбору культур, полей и агротехнологий для выращивания | |||||
3 | Оценка и прогнозирование уровня безработицы в хозяйстве | Имеются апробированные математическая модель, численный метод и инструментарий, опыт разработки методики прогнозирования уровня безработицы (для Ярославской области) | Принятие превентивных мер по созданию дополнительных рабочих мест | |||||
4 | Управление персоналом (оценка и прогнозирование оптимальной профессиональной принадлежности) | Имеются апробированные математическая модель, численный метод и инструментарий, опыт разработки и эксплуатации ряда методик управления персоналом | Повышение эффективности использования кадров и отдачи от них, степени удовлетворенности работой уменьшение текучести, профилактика криминогенных проявлений | |||||
5 | Прогнозирование структуры и объема рынка сельскохозяйственной продукции | Имеются апробированные математическая модель, численный метод и инструментарий, опыт разработки методики прогнозирования фондового рынка | Выработка рекомендаций по реструктурированию производства с учетом прогнозируемой коньюктуры рынка | |||||
6 | Прогнозирование молочной и мясной продуктивности крупного рогатого скота | Имеются апробированные математическая модель, численный метод и инструментарий | Повышение удоев и приростов мяса за счет более рационального использования поголовья | |||||
7 | Анализ качества жизни населения и выработка рекомендаций | Имеются апробированные математическая модель, численный метод и инструментарий, опыт разработки и эксплуатации подобных методик | Повышение удовлетворенности жизнью, уменьшение социальной напряженности | |||||
8 | Анализ общественного мнения по актуальным вопросам жизни и населения и развития хозяйства | Имеются апробированные математическая модель, численный метод и инструментарий, опыт разработки и эксплуатации ряда анализа общественного мнения | Знание мнения населения в разрезе по различным возрастным, половым, профессиональным и др. группам позволит руководству принимать более обоснованные решения по вопросам развития хозяйства и его социальной инфраструктуры, повысить популярность руководства |
Работы, необходимые для внедрения: разработка методик по различным культурам, увеличение базы прецедентов: формализация исходных данных; ввод исходных данных в систему; синтез, оптимизация, проверка адекватности модели; эксплуатация методики в режиме адаптации и пересинтеза модели. Основная проблема: получение исходной информации.
Некоторые свойства математической модели (сходимость, адекватность, устойчивость и др.)
Под сходимостью семантической информационной модели в данной работе понимается:
а) зависимость информативностей факторов (в матрице информативностей) от объема обучающей выборки;
б) зависимость адекватности модели (интегральной и дифференциальной валидности) от объема обучающей выборки.
Для измерения сходимости в смыслах "а" и "б" в инструментарии СК-анализа – системе "Эйдос" реализован специальный исследовательский режим.
Под адекватностью модели понимается ее внутренняя и внешняя дифференциальная и интегральная валидность. Понятие валидности является уточнением понятия адекватности, для которого определены процедуры количественного измерения, т.е. валидность – это количественная адекватность. Это понятие количественно отражает способность модели давать правильные результаты идентификации, прогнозирования и способность вырабатывать правильные рекомендации по управлению. Под внутренней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов обучающей выборки. Под внешней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов, не входящих в обучающую выборку. Под дифференциальной валидностью модели понимается достоверность идентификации объектов в разрезе по классам. Под интегральной валидностью средневзвешенная дифференциальная валидность. Возможны все сочетания: внутренняя дифференциальная валидность, внешняя интегральная валидность и т.д. (таблица 20).
Таблица 20 – К ОПРЕДЕЛЕНИЮ ПОНЯТИЯ ВАЛИДНОСТИ | |||||
Внутренняя валидность | Внешняя валидность | ||||
Дифференциальная валидность | Валидность модели, измеренная после синтеза модели путем идентификации объектов обучающей выборки в разрезе по классам | Валидность модели, измеренная после синтеза модели путем идентификации объектов, не входящих в обучающую выборку в разрезе по классам | |||
Интегральная валидность | Средневзвешенная по всем классам достоверность идентификации объектов обучающей выборки | Средневзвешенная по всем классам достоверность идентификации объектов, не входящих в обучающую выборку |
Под устойчивостью модели понимается ее способность давать незначительные различия в прогнозах и рекомендациях по управлению при незначительных различиях в исходных данных для решения этих задач.
Некоторые замечания к общему описанию задачи
Считаем необходимым согласится с мнением модератора UCI, который отметил два несоответствия в общем описании задачи (см. п.4):
– во-первых, 18-й атрибут "type" на самом деле содержит информацию о принадлежности объекта к классу и, поэтому, относится не к описательным шкалам и градациям, а к классификационным;
– во-вторых, в 5-м классе 2 раза указан один и тот же объект "frog" (возможно, они разного пола?).
Кроме того, проанализировав общее описание задачи, представленное репозитарием UCI, мы также отмечаем ряд несоответствий. Так, 1-й атрибут "animal name"
является прямым указанием на объект и не должен включаться в систему атрибутов, т.к. это делает задачу идентификации объектов тривиальной. Классы автором задачи никак не названы и мы дали им свои названия. Вызывает некоторое сомнение объединение в один класс, который мы условно назвали "Многоногие", представителей различных видов, например таких, как скорпион и осьминог.
Неопределенность последствий
Когда последствия выбора той или иной альтернативы однозначно определяются самой альтернативой, тогда можно не различать альтернативу и ее последствия, считая само собой разумеющимся, что выбирая альтернативу мы в действительности выбираем ее последствия.
Однако, в реальной практике нередко приходится иметь дело с более сложной ситуацией, когда выбор той или иной альтернативы неоднозначно определяет последствия сделанного выбора.
В случае дискретного набора альтернатив и исходов их выбора, при условии, что сам набор возможных исходов общий для всех альтернатив, можно считать, что различные альтернативы отличаются друг от друга распределением вероятностей исходов. Эти распределения вероятностей вообще говоря могут зависеть от результатов выбора альтернатив и реально наступивших в результате этого исходов. В простейшем случае исходы равновероятны. Сами исходы обычно имеют смысл выигрышей или потерь и выражаются количественно.
Если исходы равны для всех альтернатив, то выбирать нечего. Если же они различны, то можно сравнивать альтернативы, вводя для них те или иные количественные оценки. Разнообразие задач теории игр связано с различным выбором числовых характеристик потерь и выигрышей в результате выбора альтернатив, различными степенями конфликтности между сторонами, выбирающими альтернативы и т.д.
Непараметричность модели. Робастные процедуры и фильтры для исключения артефактов
Предложенная семантическая информационная модель является непараметрической, т.к. не основана на предположениях о нормальности распределений исследуемой выборки. Под робастными понимаются процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. данными, выпадающими из общих статистических закономерностей, которым подчиняется исследуемая выборка. Выявление артефактов возможно только при большой статистике, т.к. при малой статистике все частоты атрибутов малы и невозможно отличить артефакт от значимого атрибута. Критерий выявления артефактов основан на том, что при увеличении объема статистики частоты значимых атрибутов растут, как правило, пропорционально объему выборки, а частоты артефактов так и остаются чрезвычайно малыми, близкими к единице. В модели реализована такая процедура удаления наиболее вероятных артефактов, и она, как показывает опыт, существенно повышает качество (адекватность) модели.
Обеспечение эксплуатации системы "Эйдос"
Универсальная когнитивная аналитическая система "Эйдос" представляет собой программную систему, и для ее эксплуатации, как и для эксплуатации любой программной системы, необходима определенная инфраструктура. Без инфраструктуры эксплуатации любая программная система остается лишь файлом, записанным на винчестере. В зависимости от масштабности решаемых задач управления и специфики предметной области данная структура может быть как довольно малочисленной, так и более развитой. Однако в любом случае ее основные функциональные и структурные характеристики остаются примерно одними и теми же. Кратко рассмотрим эту инфраструктуру на примере гипотетической организации, производящей определенные виды продукции.
Основная цель: обеспечивать информационную и аналитическую поддержку деятельности организации, направленную на производство запланированного объема продукции заданного качества, достижение высокой эффективности управления и устойчивого поступательного развития.
Данная основная цель предполагает выполнение информационных и аналитических работ с различными объектами деятельности, находящимися на различных структурных уровнях как самой организации, так и ее окружения: персональный уровень; уровень коллективов (подразделений); уровень организации в целом; окружающая среда (непосредственное, региональное, международное окружение). Для достижения основной цели для каждого класса объектов должны регулярно выполняться следующие работы: оценка (идентификация) текущего состояния с накоплением данных (мониторинг); прогнозирование развития (оперативное, тактическое и стратегическое); выработка рекомендаций по управлению. Необходимо особо подчеркнуть, что основная цель может быть достигнута только при условии соблюдения вполне определенной наукоемкой технологии, основы которой изложены в данном исследовании.
Задачи, решаемые для достижения цели работы:
1. Мониторинг: оценка и идентификация текущего (фактического, актуального) состояния объекта управления; накопление данных идентификации в базах данных в течение длительного времени.
2. Анализ: выявление причинно- следственных зависимостей путем анализа данных мониторинга.
3. Прогнозирование: оперативное, тактическое и стратегическое прогнозирование развития объекта управления и окружающей среды путем использования закономерностей, выявленных на этапе анализа данных мониторинга.
4. Управление: анализ взаимодействия объекта управления с окружающей средой и выработка рекомендаций по управлению.
Таким образом, по мнению автора, управление является высшей, существующей на данный момент формой обработки информации.
Для достижения основной цели и решения задач управления необходимо выполнять работы по следующим направлениям: регулярное получение исходной информации о состоянии объекта управления; обработка исходной информации на компьютерах; анализ обработанной информации, прогнозирование развития объекта управления, выработка рекомендаций по оказанию управляющих воздействий на объект управления; разработка и применение (или предоставление рекомендаций заказчикам) различных методов оказания управляющих воздействий на объект управления.
Для этого необходима определенная организационная структура: научно–методический отдел включает: научно-методический сектор; сектор разработки программного обеспечения; сектор внедрения и сопровождения программного обеспечения; сектор организационного и юридического обеспечения; отдел мониторинга: сектор исследования объекта управления; сектор по работе с независимыми экспертами; сектор по взаимодействию с поставляющими информацию организациями; сектор по анализу информации общего пользования; отдел обработки информации: сектор ввода исходной информации (операторы); сектор сетевых технологий и Internet; сектор внедрения, эксплуатации и сопровождения программных систем; сектор технического обслуживания компьютерной техники; сектор ведения архивов баз данных по проведенным исследованиям; аналитический отдел имеет структуру, обеспечивающую компетентный профессиональный анализ результатов обработки данных мониторинга по объектам, которые приняты для контроля и управления.
Для выполнения работ по этим направлениям необходимо определенное обеспечение деятельности: техническое, программное, информационное, организационное, юридическое и кадровое. Детально подобная структура и виды обеспечения ее деятельности описаны в работе [92].