Верификация модели (оценка ее адекватности) (БКОСА-

Данный режим исполняется после синтеза модели. Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую, пакетного распознавания и последующего анализа в режиме "Измерение валидности системы распознавания" подсистемы "Анализ". Он показывает средневзвешенную погрешность идентификации (интегральная валидность) и погрешность идентификации в разрезе по классам. При этом объект считается отнесенным к классу, с которым у него наибольшее сходство. Необходимо отметить, что остальные классы, находящиеся по уровню сходства на второй и последующих позициях не учитываются. Это обусловлено тем, что их учет привел бы к завышению оценки валидности модели.

Классы, по которым дифференциальная валидность неприемлемо низка считаются не сформированными. Причинами этого может быть очень высокая вариабельность объектов, отнесенных к данным классам (тогда имеет смысл разделить их на несколько), а также недостаток достоверной классификационной и описательной информации по этим классам (некорректная работа экспертов).

Внешняя дифференциальная и интегральная валидность

Под внешней валидностью понимается способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.

Для измерения внешней валидности необходимо выполнить следующие действия:

1. В режиме измерения адекватности модели запустить режим измерения внешней валидности (нажав F8 Измерение внешней валидности) (рисунок 166).

2. Выбрать один из режимов удаления объектов обучающей выборки, приведенный на экранной форме (рисунок 167).

Рисунок 166. Режим переноса анкет обучающей выборки

в распознаваемую для измерения внешней валидности

Результат выполнения всех указанных на рисунке 166 действий приведен на рисунке 167.

Рисунок 167. Выходная форма с результатами измерения

внешней валидности методом бутстрепной статистики

При этом исходная выборка была разделена на две:

– в обучающей выборке остались только нечетные анкеты;

– в распознаваемую выборку были включены только четные анкеты;

– при распознавании был использован 2-й интегральный критерий: сумма количества информации.

Анализ отчета по внешней валидности, приведенного на рисунке 167, позволяет сделать вывод о высокой степени адекватности семантической информационной модели. Это значит, что взаимосвязи между словами, использованными в текстах, и принадлежностью этих текстов различным авторам, выявленные по примерам обучающей выборки, оказались имеющими силу и для других фрагментов текстов, приведенных в распознаваемой выборке. Это означает, что они относятся к генеральной совокупности, по отношению к которой обучающая выборка репрезентативна.

Внутренняя дифференциальная и интегральная валидность

Под внутренней валидностью понимается способность модели верно идентифицировать объекты, входящие в обучающую выборку.

Для измерения адекватности модели необходимо выполнить следующие действия:

1. Скопировать обучающую выборку в распознаваемую (во 1-м режиме 2-й подсистемы нажав клавишу F5).

2. Выполнить пакетное распознавание (во 2-м режиме 4-й подсистемы, задав 1-й критерий сходства) (рисунок 161).

3. Измерить адекватность модели (во 2-м режиме 6-й подсистемы) (рисунки 162 и 163).


Рисунок 161. Выход на режим пакетного распознавания


Рисунок 162. Выход на режим измерения адекватности модели


Рисунок 163. Экранная форма управления измерением адекватности модели и отображения результатов

Эта форма может прокучиваться вправо-влево. В верхней части формы приведены показатели интегральной валидности (средневзвешенные по всей обучающей выборке), а в самой таблице – дифференциальной валидности, т.е. в разрезе по классам.

Кроме того, результаты измерения адекватности модели выводятся в форме файлов с именами ValidSys.txt (рисунок 164) и ValAnkSt.txt (рисунок165) стандарта "TXT-текст DOS" в поддиректории TXT. Первый файл имеет вид:

Рисунок 164. Выходная форма ValidSys.txt с результатами измерения

адекватности модели и отображения результатов

Рассмотрим, что означают графы этой выходной формы.

"Всего логических анкет" – это количество анкет (примеров текстов) в обучающей выборке, на основе которых формировался образ данного класса.

"Идентифицировано верно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся.

"Идентифицировано ошибочно"

– это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации).

"Неидентифицировано верно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся.

"Неидентифицировано ошибочно"

– это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации).

В правой части формы приведены те же показатели, но в процентом выражении:

– для анкет, идентифицированных верно и неидентифицированных ошибочно за 100% принимается количество логических анкет обучающей выборки по данному классу;

– для анкет, идентифицированных ошибочно и неидентифицированных верно за 100% принимается суммарное количество логических анкет обучающей выборки за вычетом логических анкет по данному классу.

Рисунок 165. Фрагмент выходной формы ValAnkSt.txt с результатами измерения адекватности модели и отображения результатов

В данной форме приведены коды анкет обучающей выборки, которые были учтены в каждой графе предыдущей формы по каждому классу.

Вопросы, относящиеся к дисциплине "ИИС", выносящиеся на государственный экзамен

1. Интеллектуальные информационные системы, как закономерный и неизбежный этап развития информационных систем.

2. Определение и критерии идентификации систем искусственного интеллекта. Тест Тьюринга.

3. Системы с интеллектуальной обратной связью.

4. Автоматизированные системы распознавания образов.

5. Системы поддержки принятия решений.

6. Экспертные системы.

7. Нейронные сети.

8. Генетические алгоритмы и моделирование эволюции.

9. Когнитивное моделирование.

10. Выявление знаний из опыта (эмпирических фактов) и интеллектуальный анализ данных (data mining).

11. Области применения систем искусственного интеллекта

12. Перспективы развития систем искусственного интеллекта, в т.ч. в Internet.

13. Абсолютная, относительная и аналитическая информация. Данные, информация, знания. Классификация СИИ.

14. Базы данных для поддержки принятия решений.

15. Автоматизированный системно-когнитивный анализ и универсальная когнитивная аналитическая система "Эйдос".

Вопросы, выносящиеся на экзамен по дисциплине

На экзамен выносятся вопросы, приведенные как контрольные вопросы к лекциям и лабораторным работам.

Возможность решения простых задач классификации непосредственно одним нейроном

Представим себе, что необходимо решать задачу определения пола студентов по их внешне наблюдаемым признакам.

Есть, конечно, и более надежные способы, но мы их рассматривать не будем, т.к. они требуют дополнительных затрат для получения исходной информации и превращают задачу в тривиальную.

Поэтому будем рассматривать такие описательные шкалы и градации:

1. Длина волос: длинные, средние, короткие.

2. Наличие брюк: да, нет.

3. Использование духов или одеколона:

да, нет.

Составим таблицу для определения весовых коэффициентов (таблица 33). Пусть столбцы этой таблицы соответствуют состояниям нейрона, а строки – дендритам, соединенным с соответствующими органами восприятия, которые способны устанавливать наличие или отсутствие соответствующего признака.

Тогда один из простейших способов определить значения весовых коэффициентов на дендритах будет заключаться в том, чтобы на пересечениях строк и столбцов просто проставить суммарное количество студентов в обучающей выборке, обладающих данным признаком.

Таблица 33 – ОПРЕДЕЛЕНИЕ ВЕСОВЫХ

КОЭФФИЦИЕНТОВ НЕЙРОНОВ НЕПОСРЕДСТВЕННО

НА ОСНОВЕ ЭМПИРИЧЕСКИХ ДАННЫХ

Описательные шкалы и градации	Классификационные шкалы и градации
Юноши	Девушки
Длина волос:
– длинные	5	15
– средние	10	10
– короткие	15	5
Наличие брюк:
– да;	30	10
– нет	0	20
Использование духов или одеколона:
– да;	5	20
– нет	25	10

Если нейрон должен выдавать высокий выходной сигнал, когда на входе ему предъявляется юноша и низкий – когда девушка, то весовые коэффициенты на дендритах берутся из столбца: "Юноши". И наоборот, если нейрон должен выдавать высокий выходной сигнал, когда на входе ему предъявляется девушка и низкий – когда юноша, то весовые коэффициенты на дендритах берутся из столбца: "Девушки".

Можно представить себе сеть из двух нейронов, в которой весовые коэффициенты на дендритах взяты из столбцов: "Юноши" и "Девушки".

Большее количество нейронов для решения данной задачи будет избыточным. Его имеет смысл использовать в том случае, когда мы хотим повысить надежность идентификации объектов нейронной сетью и различные сходные по смыслу нейроны будут использовать независимые друг от друга рецепторы.

Например, если мы не только видим идентифицируемый объект, но можем его и обонять, и ощупывать, то это повышает надежность его идентификации. В этом состоит общепринятый в физике критерий реальности – принцип наблюдаемости, согласно которому объективное существование установлено для тех объектов и явлений, существование которых установлено несколькими, по крайней мере, двумя, независимыми способами.

В общем случае в нейронной сети каждому классу (градации классификационной шкалы) будет соответствовать один нейрон и объект, признаки которого будут измерены рецепторами на входе нейронной сети, будет идентифицирован сетью как класс, соответствующий нейрону с максимальным уровнем сигнала на выходе.

Психологические тесты обычно позволяют тестировать респондента сразу по нескольким шкалам. Очевидно, нейронные сети, реализующие эти тесты, будут иметь как минимум столько нейронов, сколько шкал в психологическом тесте.

Временные ряды

Временной ряд – это расположение во времени статистических показателей, которые в своих последовательных изменениях отражают ход развития изучаемых процессов.

Временные ряды исследуются с различными целями. В одном ряде случаях бывает достаточно получить описание характерных особенностей ряда, а в другом ряде случаев требуется не только предсказывать будущие значения временного ряда, но и управлять его поведением. Метод анализа временного ряда определяется, с одной стороны, целями анализа, а с другой стороны, вероятностной природой формирования его значений.

Спектральный анализ. Позволяет находить периодические составляющие временного ряда

Корреляционный анализ. Позволяет находить существенные периодические зависимости и соответствующие им задержки (лаги) как внутри одного ряда (автокорреляция), так и между несколькими рядами. (кросскорреляция)

Модели авторегрессии и скользящего среднего. Модели ориентированы на описание процессов, проявляющих однородные колебания, возбуждаемые случайными воздействиями. Позволяют предсказывать будущие значения ряда.

Время реакции системы на изменение факторов (ригидность)

Исследование, проведенное после разработки методики, показало, что наиболее сильное влияние на текущую ситуацию оказывают факторы, действующие неделю назад, а более поздние факторы практически не оказывают на нее никакого влияния. Это означает, что в ММВБ в 1995 году имела высокую "инерционность", "время реакции", "ригидность", составляющую примерно одну неделю. По некоторым данным аналогичный параметр для Лондонской биржи в этот же период времени составлял около 32 секунд.

Ввод-корректировка обучающей информации (БКОСА-

Данная подсистема обеспечивает ввод и корректировку обучающей выборки, управление ею, синтез и адаптацию модели на основе данных обучающей выборки, экспорт и импорт данных с других компьютеров.

Для ввода-корректировки обучающей выборки служит соответствующий режим, имеющий двухоконный интерфейс, позволяющий ввести в обучающую выборку двухвекторные описания объектов. Левое окно служит для ввода классификационной характеристики объекта. В этом окне каждому объекту соответствует одна строка с прокруткой. В правом окне вводится описательная характеристика объекта на языке признаков. Каждому объекту соответствует окно с прокруткой. Переход между окнами осуществляется по нажатию клавиши "TAB". Количество объектов в обучающей выборке не ограничено. Имеется практический опыт проведения расчетов с объемами обучающей выборки до 7000 объектов, суммарным количеством градаций описательных шкал до 3900 и количеством классов до 1500. Реализована также возможность автоматического формирования объектов обучающей выборки путем кодирования текстовых файлов.

В системе реализован ряд программных интерфейсов, обеспечивающих автоматическое формирование классификационных и описательных шкал и градаций, а также обучающей выборки:

– импорт данных из файлов стандарта "Текст DOS";

– импорт данных из DBF-файлов, стандарта проф. А.Н.Лебедева;

– импорт данных из транспонированных DBF-файлов, стандарта профессора А.Н.Лебедева;

– генерация случайной модели;

– генерация учебной модели для исследования свойств натуральных чисел.

Выбор единой интерпретируемой численной меры для классов и атрибутов

При построении модели объекта управления одной из принципиальных проблем является выбор формализованного представления для индикаторов, критериев и факторов (далее: факторов). Эта проблема распадается на две подпроблемы:

1. Выбор и обоснование смысла выбранной численной меры.

2. Выбор математической формы и способа определения (процедуры, алгоритма) количественного выражения для значений, отражающих степень взаимосвязи факторов и будущих состояний АОУ.

Рассмотрим требования к численной мере, определяемые существом подпроблем. Эти требования вытекают из необходимости совершать с численными значениями факторов математические операции (сложение, вычитание, умножение и деление), что в свою очередь необходимо для построения полноценной математической модели.

Требование 1: из формулировки 1-й подпроблемы следует, что все факторы должны быть приведены к некоторой общей и универсальной для всех факторов единице измерения, имеющей какой-то смысл, причем смысл, поддающийся единой сопоставимой в пространстве и времени интерпретации.

Традиционно в специальной литературе [10] рассматриваются следующие смысловые значения для факторов: стоимость (выигрыш-проигрыш или прибыль-убытки); полезность; риск; корреляционная или причинно-следственная взаимосвязь. Иногда предлагается использовать безразмерные меры для факторов, например эластичность, однако, этот вариант не является вполне удовлетворительным, т.к. не позволяет придать факторам содержательный и сопоставимый смысл и получить содержательную интерпретацию выводов, полученных на основе математической модели.

Таким образом, возникает ключевая при выборе численной меры проблема выбора смысла, т.е. по сути единиц измерения, для индикаторов, критериев и факторов.

Требование 2: высокая степень адекватности предметной области.

Требование 3: высокая скорость сходимости при увеличении объема обучающей выборки.

Требование 4: высокая независимость от артефактов.

Что касается конкретной математической формы и процедуры

определения числовых значений факторов в выбранных единицах измерения, то обычно применяется метод взвешивания экспертных оценок, при котором эксперты предлагают свои оценки, полученные как правило неформализованным путем.
При этом сами эксперты также обычно ранжированы по степени их компетентности. Фактически при таком подходе числовые значения факторов является не определяемой, искомой, а исходной величиной. Иначе обстоит дело в факторном анализе, но в этом методе, опять же на основе экспертных оценок важности факторов, требуется предварительно, т.е. перед проведением исследования, принять решение о том, какие факторы исследовать (из-за жестких ограничений на размерность задачи в факторном анализе). Таким образом оба эти подхода реализуемы при относительно небольших размерностях задачи, что с точки зрения достижения целей настоящего исследования, является недостатком этих подходов.

Поэтому самостоятельной и одной из ключевых проблем является обоснованный и удачный выбор математической формы для численной меры индикаторов и факторов.

Эта математическая форма с одной стороны должна удовлетворять предыдущим требованиям, прежде всего требованию 1, а также должна быть процедурно вычислимой, измеримой.

Выбор неметрической меры сходства объектов в семантических пространствах

Существует большое количество мер сходства, из которых можно было бы упомянуть скалярное произведение, ковариацию, корреляцию, евклидово расстояние, расстояние Махалонобиса и др.

Проблема выбора меры сходства состоит в том, что при выбранной численной мере для координат классов и факторов она должна удовлетворять определенным критериям:

1. Обладать высокой степенью адекватности предметной области, т.е. высокой валидностью, при различных объемах выборки, как при очень малых, так и при средних и очень больших.

2. Иметь обоснованную, четкую, ясную и интуитивно понятную интерпретацию.

3. Быть нетрудоемкой в вычислительном отношении.

4. Обеспечивать корректное вычисление меры сходства для пространств с неортонормированным базисом.

Выбор в качестве базовой численной меры количества информации

Как было показано в лекции 2, системный анализ представляет собой теоретический метод познания, т.е. информационный процесс, в котором поток информации направлен от познаваемого объекта к познающему субъекту. Процесс труда, напротив, представляет собой процесс, в котором поток информации направлен от субъекта к объекту. При этом информация передается по каналу связи, представляющему собой средства труда, и записывается в носитель информации (предмет труда), который в ходе этого процесса преобразуется в заранее заданную форму, т.е. в продукт труда. Таким образом, процесс труда по сути дела представляет собой информационный процесс, обратный по направлению потока информации процессу познания. Управление представляет собой процесс, на различных этапах которого выполняются функции, сходные с процессами труда (управляющее воздействие) и познания (обратная связь). По мнению автора, информационный подход к управлению является наиболее общим. Поэтому в качестве количественной меры взаимосвязи факторов и будущих состояний АОУ целесообразно использовать количество информации. Более подробное обоснование целесообразности выбора в качестве численной меры количества информации приведено в работе автора[64].

Однако, известно много различных информационных мер и, следовательно, возникает задача выбора одной из них, оптимальной по выбранным критериям. Различные выражения классической теории информации для количества информации: Хартли, Шеннона, Харкевича и др., учитывают различные аспекты информационного моделирования объектов (таблице 8):

Таблица 8 – СООТВЕТСТВИЕ ТРЕБОВАНИЯМ

ВЫРАЖЕНИЙ ДЛЯ КОЛИЧЕСТВА ИНФОРМАЦИИ

– формула Хартли учитывает количество классов (мощность множества состояний объекта управления) но никак не учитывает их признаков или факторов, переводящих объект в эти состояния, т.е. содержит интегральное описание объектов;

– формула Шеннона основывается на учете признаков, т.е. основывается на дискретном описании объектов;

– формула Харкевича учитывает понятие цели и также как формула Шеннона основана на статистике признаков, но не учитывает мощности множества будущих состояний объекта управления, включающего целевые и другие будущие состояния объекта управления и также как формула Шеннона основывается на дискретном описании объектов.

Как видно из таблицы 8, классическая формула Харкевича по учитываемым критериям имеет преимущества перед классическими формулами Хартли и Шеннона, т.к. учитывает как факторы, так и понятие цели, ключевое для системного анализа, теории и практики управления (в т.ч. АСУ). Поэтому именно выражение для семантической целесообразности информации Харкевича взято за основу при выводе обобщающего выражения, удовлетворяющего всем предъявляемым требованиям.

Выбор в условиях неопределенности

Выбор в условиях определенности – это частный случай выбора в условиях неопределенности (когда неопределенность близка к нулю).

Но неопределенность чего конкретно имеется в виду?

В современной теории выбора считается, что в задачах принятия решений существует три основных вида неопределенности:

1. Информационная (статистическая) неопределенность исходных данных для принятия решений.

2. Неопределенность последствий принятия решений (выбора).

3. Расплывчатость в описании компонент процесса принятия решений.

Рассмотрим их по порядку.

Выполнение и сдача лабораторной работы

Выполняются лабораторные работы, как правило, студентами индивидуально. В качестве исключения (при недостатке компьютеров в классе) допускается выполнение одной работы небольшими группами по 2-3 студента.

Сдаются лабораторные работы студентами только индивидуально в форме:

– демонстрации и объяснению преподавателю созданного ими приложения на компьютере непосредственно в среде используемой интеллектуальной информационной системы;

– предъявления и анализа сгенерированных в системе текстовых и графических выходных форм (в виде файлов);

– ответов на контрольные вопросы к данной лабораторной работе и на понимание базовых понятий.

Выполнить адаптацию модели и измерить, как изменилась ее адекватность

Под адаптацией модели понимается ее количественная модификация, осуществляемая путем включения в обучающую выборку дополнительных примеров реализации объектов, относящихся к тем же самым классам и описанным в той же системе признаков.

На первом этапе, для изучения адаптивности модели осуществим ее синтез на основе обучающей выборки, состоящей из нечетных анкет, которая использовалась в примере для измерения внешней валидности. Но в отличие от этого примера эту же выборку используем и как распознаваемую.

На втором этапе осуществим синтез модели на основе полной обучающей выборки, включающей как четные, так и нечетные анкеты.

Адаптация модели повышает точность идентификации объектов той же самой генеральной совокупности.

Выполнить формализацию предметной области.

Под формализацией предметной области понимается разработка классификационных и описательных шкал и градаций и ввод их в программную систему "Эйдос", являющуюся инструментарием СК-анализа.

2.1. Формирование классификационных шкал и градаций

В подсистеме "Классификационные шкалы и градации" введем классы, соответствующие следующим писателям: Ф.М. Достоевский; Н.В. Гоголь; А.С.Грибоедов; М.Ю. Лермонтов; А.С. Пушкин; Л.Н. Толстой; И.С. Тургенев (рисунок 152).


Рисунок 152. Ввод классов

2.1. Формирование описательных шкал и градаций

Для этого исходные файлы для формирования объекты обучающей выборки должны быть средствами Word представлены в виде текстовых файлов, стандарта "Текст DOS" (без разбиения на строки).

Затем каждый из этих файлов разбивается на столько файлов, сколько в нем строк, причем имена этих файлов должны иметь вид: ####SUBSTR(File_name,4).TXT, где #### – сквозной номер файлов, соответствующий будущему номеру анкеты обучающей выборки, SUBSTR(File_name,4) – первые 4 символа имени исходного файла.

Полученные файлы должны быть помещены в поддиректорию DOB системы "Эйдос", а исходные – удалены из нее.

Это осуществляется одним из трех способов:

1. Вручную.

2. С использованием специальной программы, текст которой приводится ниже (язык программирования xBase).

3. В режиме: "Словари – Программные интерфейсы для импорта данных – Импорт данных из TXT-файлов стандарта "Текст DOS", формируем описательные шкалы и градации (рисунок 153), причем в качестве признаков выбираем слова.

Исходный текст программы записи TXT-файлов с данными по строкам

**************************************************************************

********** Разбиение текстовых файлов DOS на нумерованные файлы по строкам

********** Луценко Е.В., 03/31/04 04:24pm

**************************************************************************

scr_start=SAVESCREEN(0,0,24,79)

SHOWTIME(0,58,.T.,"rb/n")

FOR j=0 TO 24

    @j,0 SAY SPACE(80) COLOR "n/n"

NEXT

********** Удаление TXT-файлов, имена которых начинаются на 0

FILEDELETE("0*.TXT")

***** РЕКОГНОСЦИРОВКА

Count = ADIR("*.TXT")             && Кол-во TXT-файлов

IF Count = 0

   Mess = "В текущей директории TXT-файлов не обнаружено !!!"

   @15,40-LEN(Mess)/2 SAY Mess COLOR "gr+/n"

   INKEY(0)

   RESTSCREEN(0,0,24,79,scr_start)

   SHOWTIME()

   QUIT

ENDIF

PRIVATE Name[Count],Size[Count]   && Имена и размеры файлов

Count = ADIR("*.txt",Name,Size)

SortData(Name,Size,LEN(Name),1)   && Сортировка файлов по алфавиту

CrLf = CHR(13)+CHR(10)            && Конец строки (абзаца) (CrLf)

*** Загрузка TXT-файлов

Num_pp = 0                        && Номера выходных файлов

FOR f = 1 TO Count                && Начало цикла по TXT-файлам

    ****** Загрузка файла

    Buffer = FILESTR(Name[f],.T.)

    Buffer = CHARONE(" ",Buffer) && Удаление повторяющихся пробелов

    Buffer = Buffer + CrLf

    Len = AT(CrLf,Buffer)

    DO WHILE Len > 0 .AND. LASTKEY() <> 27     && Цикл по строкам

       Len = AT(CrLf,Buffer)

       IF Len > 0

          ****** Запись фрагмента файла

          Str_pr = ALLTRIM(SUBSTR(Buffer,1,Len-1))

          Fn_out = STRTRAN(STR(++Num_pp,4)," ","0")+SUBSTR(Name[f],1,4)+".TXT"

          STRFILE(Str_pr,Fn_out)

          ****** Исключение из буфера записанной строки

          Buffer = ALLTRIM(SUBSTR(Buffer,Len+1))

       ENDIF

    ENDDO

NEXT

*** Удаление исходных TXT-файлов

FOR f=1 TO Count

    FILEDELETE(Name[f])

NEXT

RESTSCREEN(0,0,24,79,scr_start)

SHOWTIME()

QUIT

Рисунок 153. Выход на режим генерации справочников

на основе текстовых файлов

На рисунке 154 приведена экранная форма, отображающая ход процесса генерации описательных шкал и градаций и TXT-файлов, содержащих примеры текстов с разбиением по строкам.

Рисунок 154. Генерация описательных шкал и градаций

на основе TXT-файлов

В результате получаем классификационные и описательные шкалы и градации, приведенные в таблицах 79 и 80.

Таблица 79 – КЛАССИФИКАЦИОННЫЕ

ШКАЛЫ И ГРАДАЦИИ

Код	Наименование
1	Достоевский
2	Гоголь
3	Грибоедов
4	Лермонтов
5	Пушкин
6	Толстой
7	Тургенев

Таблица 80 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (фрагмент)

Код	Наименование	Код	Наименование	Код	Наименование
1	!	41	Бедные	81	Все
2	(	42	Без	82	Вспомним
3	(основной	43	Бездушных	83	Встреча
4	)	44	Безумным	84	Всюду
5	,	45	Безумных	85	Вы
6	-	46	Безухов	86	Вызывают
7	.	47	Безухову	87	Высокие
8	1812	48	Белинский	88	Высокопарные
9	20-	49	Бессильной	89	Г
10	30-е	50	Бог	90	Герой
11	30-х	51	Боже	91	Главная
12	60-х	52	Болконский	92	Глухость
13	:	53	Болконскому	93	Говоря
14	;	54	Бордо	94	Гоголь
15	?	55	Борис	95	Гоголя
16	Bcтает	56	Бориса	96	Годунов
17	XIX	57	Бородинским	97	Горе
18	А	58	Бородинского	98	Гости
19	Автор	59	Буянов	99	Грибоедов
20	Авторский	60	Была	100	Грибоедова
21	Агрессивная	61	В	101	Гулливера
22	Адама	62	Ведь	102	Да
23	Александр	63	Везде	103	Даже
24	Александра	64	Век	104	Дворянин-аристократ
25	Алексевна	65	Великий	105	Действительно
26	Алексеевна	66	Великолепная	106	Дельвигу
27	Аммоса	67	Вернулся	107	Денисова
28	Андреевич	68	Взволнованный	108	Дидло
29	Андрей	69	Взгляды	109	Для
30	Андрею	70	Власы	110	Дмитриевна
31	Анной	71	Вместе	111	Добролюбова
32	Архивам	72	Внешней	112	Достоевского
33	Афанасьевича	73	Внешние	113	Драматична
34	Ах	74	Воды	114	Друбецкого
35	Базаров	75	Возникает	115	Другое
36	Базарова	76	Война	116	Думы
37	Базаровым	77	Вообще	117	Дуни
38	Балы	78	Вопрос	118	Дуня
39	Бегущим	79	Вот	119	Душа
40	Бедность	80	Время	120	Евгений

Приводится лишь фрагмент описательных шкал и градаций, т.к. размерность справочника составляет 3522 градации (т.е. слова).

Выполнить кластерно-конструктивный анализ модели

Кластерно-конструктивный анализ классов и признаков реализуется в 5-й подсистеме "Типология". В результате рассчитываются матрицы сходства классов и признаков, на основе которых генерируется и выводится ряд текстовых и графических форм. В данной работе мы приведем для примера лишь матрицу сходства классов (таблица 82 и отображающую ее в графической форме семантическую сеть классов (рисунок 170).

Таблица 82 – МАТРИЦА СХОДСТВА КЛАССОВ

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
1	100,0	-9,55	-8,94	-8,16	-9,46	6,32	-10,08	38,11	-6,24	33,86	-4,34	41,96	-11,12	-8,17	11,70	-8,00	-11,05
2	-9,55	100,0	-5,11	-0,35	-2,47	-7,84	-2,95	-9,07	-5,50	-5,44	-6,47	1,20	-16,31	-5,43	-10,08	-8,26	2,04
3	-8,94	-5,11	100,0	-2,39	1,12	-3,97	-6,81	-5,61	-0,10	-6,56	-3,05	-10,13	-0,41	-7,36	-11,47	-6,04	-6,32
4	-8,16	-0,35	-2,39	100,0	2,52	9,73	1,33	-4,36	-6,23	-9,19	-4,94	-8,33	-9,55	-1,41	-9,14	-1,91	3,14
5	-9,46	-2,47	1,12	2,52	100,0	-8,31	-1,87	-5,24	-12,74	-1,25	-5,30	-4,55	-12,89	-8,85	-6,73	-9,59	-3,52
6	6,32	-7,84	-3,97	9,73	-8,31	100,0	-6,55	-5,05	-12,06	0,49	-7,34	-2,99	-15,19	-11,13	8,18	-3,10	-8,75
7	-10,08	-2,95	-6,81	1,33	-1,87	-6,55	100,0	-4,35	-1,04	-6,10	-10,14	-5,71	-7,09	-0,21	-9,40	-3,97	3,67
8	38,11	-9,07	-5,61	-4,36	-5,24	-5,05	-4,35	100,0	-2,38	34,04	-6,03	41,21	-6,48	-4,72	0,87	-8,50	-8,17
9	-6,24	-5,50	-0,10	-6,23	-12,74	-12,06	-1,04	-2,38	100,0	-1,85	-8,20	-6,28	-12,89	-1,18	-2,41	0,73	-3,53
10	33,86	-5,44	-6,56	-9,19	-1,25	0,49	-6,10	34,04	-1,85	100,0	-8,76	39,59	-9,83	-9,07	-1,63	-11,22	-7,73
11	-4,34	-6,47	-3,05	-4,94	-5,30	-7,34	-10,14	-6,03	-8,20	-8,76	100,0	-7,79	13,47	-3,96	-5,98	-11,77	-2,47
12	41,96	1,20	-10,13	-8,33	-4,55	-2,99	-5,71	41,21	-6,28	39,59	-7,79	100,0	-8,80	-8,13	5,09	-8,29	-5,24
13	-11,12	-16,31	-0,41	-9,55	-12,89	-15,19	-7,09	-6,48	-12,89	-9,83	13,47	-8,80	100,0	-3,67	-3,20	-1,92	1,77
14	-8,17	-5,43	-7,36	-1,41	-8,85	-11,13	-0,21	-4,72	-1,18	-9,07	-3,96	-8,13	-3,67	100,0	-11,07	-0,69	-3,25
15	11,70	-10,08	-11,47	-9,14	-6,73	8,18	-9,40	0,87	-2,41	-1,63	-5,98	5,09	-3,20	-11,07	100,0	-8,44	-12,23
16	-8,00	-8,26	-6,04	-1,91	-9,59	-3,10	-3,97	-8,50	0,73	-11,22	-11,77	-8,29	-1,92	-0,69	-8,44	100,0	-5,50
17	-11,05	2,04	-6,32	3,14	-3,52	-8,75	3,67	-8,17	-3,53	-7,73	-2,47	-5,24	1,77	-3,25	-12,23	-5,50	100,0


Рисунок 170. Отображение матрицы сходства классов в графической форме семантической сети классов (отображены связи значимостью более 5%)

Вывести информационные портреты текстов и дать их интерпретацию

Информационный портрет класса представляет собой список признаков в порядке убывания количества информации, содержащегося в этих признаках о принадлежности к данному классу.

Генерируются они 1-м режиме 5-й подсистемы "Типология" (рисунок169). Информационные портреты классов отображаются системой "Эйдос" в виде экранных форм, круговых диаграмм и гистограмм, а также в распечатываются в форме таблиц в поддиректории TXT. Графические формы записываются в поддиректории PCX.






Рисунок 169. Информационные портреты классов

Вывод -семантических сетей атрибутов (БКОСА-.

Результаты кластерно-конструктивного анализа признаков отображаются для заданных признаков в наглядной графической форме семантических сетей.

Вывод -семантических сетей классов (БКОСА-.

В данном режиме пользователем в диалоге с системой "Эйдос" задаются коды от 3 до 12 классов (ограничение связано с тем, что больше классов не помещается на мониторе при используемом разрешении), а затем на основе данных матрицы сходства классов отображается ориентированный граф, в вершинах которого находятся классы, а ребра соответствуют знаку (красный – "+", синий – "-") и величине (толщина линии) сходства/различия между ними. Посередине каждой линии уровень сходства/различия соответствующих классов отображается в числовой форме (в процентах). Такие графы в данной работе называются 2d-семантическими сетями классов (2d означает "двухмерные").

Интервальные оценки сводят анализ чисел

Интервальные оценки сводят анализ чисел к анализу фактов и позволяют обрабатывать количественные величины как нечисловые данные. Это ограничивает возможности обработки количественных величин методами обработки нечисловых данных. В математической модели СК-анализа, основанной на системной теории информации, наоборот, качественным, нечисловым данным, сопоставляются количественные величины. Это позволяет использовать все возможности количественных методов для исследования нечисловых данных.
Таким образом, в СК-анализе числовые и нечисловые данные обрабатываются единообразно на основе единой математической модели как числовые данные.
Рассматривается связь метода измерения адекватности модели в СК-анализе с бутстрепными методами.
Описывается робастная процедура выявления и устранения артефактов в СК-анализе.

Таким образом, вербальные описания объектов реальности на естественном языке с полным основанием могут рассматриваются как их иерархические лингвистические модели. Предложены методика и автоматизированная технология, основанные на универсальной когнитивной аналитической системе "Эйдос", которые обеспечивают:
– автоматизированную формализацию предметной области на основе вербального описания ее объектов;
– автоматизированное формирование описательных шкал и градаций;
– автоматизированную генерацию обучающей выборки;
– синтез семантической информационной модели, ее оптимизацию, проверку адекватности и анализ.
Предлагаемые технологии обеспечивают значительную экономию труда и времени по сравнению с традиционным подходом.
Необходимо отметить также, что в системе "Эйдос" реализована полнофункциональная интеллектуальная информационно-поисковая система, обеспечивающая работу по приведенной в работе технологии с объектами, описанными на естественном языке.

На основе вышеизложенного можно сделать вывод о том, что для надежной и достоверной идентификации слов (по крайней мере при сравнительно небольшом их количестве) вполне достаточно информации о входящих в них буквах, и для этого нет особой необходимости привлекать дополнительную информацию о последовательности букв и их сочетаний. Продемонстрирована устойчивость модели от неполноты и зашумленности информации. Приведено более 30 графических форм, генерируемых системой "Эйдос", в т.ч. новые формы – классическая и интегральная когнитивные карты.

Продемонстрирована возможность и эффективность применения технологии и инструментария системно- когнитивного анализа для решения ряда задач атрибуции текстов.
Приведен подробный численный пример (с большим количеством конкретных иллюстративных материалов) реализации всех этапов СК-анализа при атрибуции текстов: когнитивной структуризации и формализации предметной области; формирования обучающей выборки; синтеза семантической информационной модели; оптимизации и измерения адекватности модели; адаптации и пересинтеза модели; типологического и кластерно-конструктивного анализа модели.

Взаимосвязь системной меры целесообразности

Статистика c2 представляет собой сумму вероятностей совместного наблюдения признаков и объектов по всей корреляционной матрице или определенным ее подматрицам (т.е. сумму относительных отклонений частот совместного наблюдения признаков и объектов от среднего):

(3. 57)

где:

– Nij – фактическое количество встреч i-го признака у объектов j-го класса;

– t – ожидаемое количество встреч i-го признака у объектов j-го класса.

(3. 58)

Отметим, что статистика c2 математически связана с количеством информации в системе признаков о классе распознавания, в соответствии с системным обобщением формулы Харкевича для плотности информации(3.28)

(3. 59)

а именно из (3.58) и (3.59) получаем:

(3. 60)

Из (3.60) очевидно:

(3. 61)

Сравнивая выражения (3.57) и (3.61), видим, что числитель в выражении (3.57) под знаком суммы отличается от выражения (3.61) только тем, что в выражении (3.61) вместо значений Nij и t взяты их логарифмы. Так как логарифм является монотонно возрастающей функцией аргумента, то введение логарифма не меняет общего характера поведения функции.

Фактически это означает, что:

(3. 62)

Если фактическая вероятность наблюдения i–го признака при предъявлении объекта j–го класса равна ожидаемой (средней), то наблюдение этого признака не несет никакой информации о принадлежности объекта к данному классу. Если же она выше средней – то это говорит в пользу того, что предъявлен объект данного класса, если же ниже – то другого.

Поэтому наличие статистической связи (информации) между признаками и классами распознавания, т.е. отличие вероятностей их совместных наблюдений от предсказываемого в соответствии со случайным нормальным распределением, приводит к увеличению фактической статистики c2 по сравнению с теоретической величиной.

Из этого следует возможность использования в качестве количественной меры степени выраженности закономерностей в предметной области не матрицы абсолютных частот и меры c2, а новой меры H, основанной на матрице информативностей и системном обобщении формулы Харкевича для количества информации:

средняя информативность признаков по матрице

(3. 63)

где:

– средняя информативность признаков по матрице информативностей.

Меру H в выражении (3.63) предлагается назвать обобщенным критерием сформированности модели Харкевича.

Значение данной меры показывает среднее отличие количества информации в факторах о будущих состояниях активного объекта управления от среднего количества информации в факторе (которое при больших выборках близко к 0). По своей математической форме эта мера сходна с мерами для значимости факторов и степени сформированности образов классов и коррелирует с объемом пространства классов и пространства атрибутов.

Описанная выше математическая модель обеспечивает инвариантность результатов ее синтеза относительно следующих параметров обучающей выборки: суммарное количество и порядок ввода анкет обучающей выборки; количество анкет обучающей выборки по каждому классу распознавания; суммарное количество признаков во всех анкетах обучающей выборки; суммарное количество признаков по эталонным описаниям различных классов распознавания; количество признаков и их порядок в отдельных анкетах обучающей выборки.

Это обеспечивает высокое качество решения задач системой распознавания на неполных и разнородных (в вышеперечисленных аспектах) данных как обучающей, так и распознаваемой выборки, т.е. при таких статистических характеристиках потоков этих данных, которые чаще всего и встречается на практике и которыми невозможно или очень сложно управлять.

и обучающую выборку на основе

1. Формализовать задачу, создав классификационные и описательные шкалы (с использованием таблицы 42) и обучающую выборку на основе рисунка 93.
2. Осуществить синтез и верификацию модели.
3. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портреты классов").
4. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
5. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.

с использованием исходных данных, приведенных

1. Создать стандартизированные ( с использованием исходных данных, приведенных на рисунке 93) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB в виде: ####-zap.txt и ####-vos.txt.
2. Сгенерировать классификационные и описательные шкалы в режиме: "Автоввод первичных признаков и TXT-файлов", "Признаки – слова".
3. Сгенерировать обучающую выборку с использованием режима: "Ввод – корректировка обучающей выборки", "F7 InpTXT", "F6 Ввод из всех файлов". Дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток".
4. Осуществить синтез и верификацию семантической информационной модели.
5. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портеры классов").
6. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
7. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Отобразить в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.

Задачи формализации базовых когнитивных операций системного анализа

Для решения задачи формализации БКОСА необходимо решить следующие задачи:

1. Выбор единой интерпретируемой численной меры для классов и атрибутов.

2. Выбор неметрической меры сходства объектов в семантических пространствах.

4. Определение идентификационной и прогностической ценности атрибутов.

5. Ортонормирование семантических пространств классов и атрибутов (Парето-оптимизация).

Выбор единой интерпретируемой численной меры для классов и атрибутов

1. Выбор и обоснование смысла выбранной численной меры.

Для решения задачи формализации БКОСА необходимо решить следующие задачи:
1. Выбор единой интерпретируемой численной меры для классов и атрибутов.
2. Выбор неметрической меры сходства объектов в семантических пространствах.
4. Определение идентификационной и прогностической ценности атрибутов.
5. Ортонормирование семантических пространств классов и атрибутов (Парето-оптимизация).

Таким образом, возникает ключевая при выборе численной меры проблема выбора смысла, т.е. по сути единиц измерения, для индикаторов, критериев и факторов.
Требование 2: высокая степень адекватности предметной области.
Требование 3: высокая скорость сходимости при увеличении объема обучающей выборки.
Требование 4: высокая независимость от артефактов.
Что касается конкретной математической формы и процедуры определения числовых значений факторов в выбранных единицах измерения, то обычно применяется метод взвешивания экспертных оценок, при котором эксперты предлагают свои оценки, полученные как правило неформализованным путем. При этом сами эксперты также обычно ранжированы по степени их компетентности. Фактически при таком подходе числовые значения факторов является не определяемой, искомой, а исходной величиной. Иначе обстоит дело в факторном анализе, но в этом методе, опять же на основе экспертных оценок важности факторов, требуется предварительно, т.е. перед проведением исследования, принять решение о том, какие факторы исследовать (из-за жестких ограничений на размерность задачи в факторном анализе). Таким образом оба эти подхода реализуемы при относительно небольших размерностях задачи, что с точки зрения достижения целей настоящего исследования, является недостатком этих подходов.
Поэтому самостоятельной и одной из ключевых проблем является обоснованный и удачный выбор математической формы для численной меры индикаторов и факторов.
Эта математическая форма с одной стороны должна удовлетворять предыдущим требованиям, прежде всего требованию 1, а также должна быть процедурно вычислимой, измеримой.
Выбор неметрической меры сходства объектов в семантических пространствах
Существует большое количество мер сходства, из которых можно было бы упомянуть скалярное произведение, ковариацию, корреляцию, евклидово расстояние, расстояние Махалонобиса и др.
Проблема выбора меры сходства состоит в том, что при выбранной численной мере для координат классов и факторов она должна удовлетворять определенным критериям:

1. Обладать высокой степенью адекватности предметной области, т.е. высокой валидностью, при различных объемах выборки, как при очень малых, так и при средних и очень больших.
2. Иметь обоснованную, четкую, ясную и интуитивно понятную интерпретацию.
3. Быть нетрудоемкой в вычислительном отношении.
4. Обеспечивать корректное вычисление меры сходства для пространств с неортонормированным базисом.
5. Обеспечивать высокую достоверность и устойчивость идентификации при неполных (фрагментарных) и зашумленных данных.
Определение идентификационной и прогностической ценности атрибутов
Не все факторы имеют одинаковую ценность для решения задач идентификации, прогнозирования и управления. Традиционно считается, что факторы имеют одинаковую ценность только в тех случаях (обычно в психологии), когда определить их действительную ценность не представляется возможным по каким-либо причинам.
Для достижения целей, поставленных в данном исследовании, необходимо решить проблему определения ценности факторов, т.е. разработать математическую модель и алгоритм, которые допускают программную реализацию и обеспечивают на практике определение идентификационной и прогностической ценности факторов.
Ортонормирование семантических пространств классов и атрибутов (Парето-оптимизация)
Если не все факторы имеют одинаковую ценность для решения задач идентификации, прогнозирования и управления, то возникает проблема исключения из системы факторов тех из них, которые не представляют особой ценности.
Удаление малоценных факторов вполне оправданно и целесообразно, т.к. сбор и обработка информации по ним в среднем связана с такими же затратами времени, вычислительных и информационных ресурсов, как и при обработке ценных факторов. В этом состоит идея Парето-оптимизации.
Однако это удаление должно осуществляться при вполне определенных граничных условиях, характеризующих результирующую систему:
– адекватность модели;
– количество признаков на класс;
– суммарное количество градаций признаков в описательных шкалах.
В противном случае удаление факторов может отрицательно сказываться на качестве решения задач. На практике проблема реализации Парето-оптимизации состоит в том, что факторы вообще говоря коррелируют друг с другом и поэтому их ценность может изменяться при удалении любого из них, в том числе и наименее ценного. Поэтому просто взять и удалить наименее ценные факторы не представляется возможным и необходимо разработать корректный итерационный вычислительный алгоритм обеспечивающий решение этой проблемы при заданных граничных условиях.

Оценить ценность признаков для прогнозирования.

1. Формализовать задачу:
– создать классификационные и описательные шкалы;
– собрать исходную фактографическую информацию и ввести в систему обучающую выборку.
2. Осуществить синтез и верификацию модели.
3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
4. Провести анализ модели, дав ответы на следующие вопросы:
– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
– как сказывается пол на посещаемости?
– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?
– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;
Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.
1.2. В качестве описательных шкал и градаций использовать характеристики подчерка.
1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования (для себя).
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.
1.2. В качестве описательных шкал и градаций использовать предлагаемую анкету.
1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования (для себя).
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

1. Создать файл в стандарте DOS-текст с концами строк, записать его в поддиректорию DOB.
2. Сгенерировать классификационные и описательные шкалы и градации, а также обучающую выборку.
3. Осуществить синтез и верификацию модели.
4. Провести анализ устойчивости модели к неполноте информации и наличию шума.
5. Проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого.
6. Оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв.
7. Выполнить кластерно-конструктивный анализ слов и букв, вывести информационные и семантические портреты слов и букв, построить их профили.
8. Вывести в графической форме семантические сети и когнитивные диаграммы слов и букв, а также классическую и интегральную когнитивные карты.

1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации.
1.2. Сконструировать описательные шкалы и градации.
1.3. Сгенерировать обучающую выборку.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации.
1.2. Сконструировать описательные шкалы и градации.
1.3. Сгенерировать обучающую выборку.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

На основе предложенной технологии АСК- анализа разработать конкретное приложение системы "Эйдос", обеспечивающее управление урожайностью и качеством сельскохозяйственных культур путем выбора и применения оптимальной агротехнологии в зависимости от поставленной цели и вида почв, культуры–предшественника, а также ряда других параметров объекта управления и окружающей среды, например, таких как: нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация и др.

1. Исследовать зависимость интегральной валидности семантической информационной модели в зависимости от объема обучающей выборки при различном количестве классов и признаков.
2. Построить графики в Excel и дать их интерпретацию.

Задание Обучающую выборку заполнить

Чтобы собрать информацию для обучающей выборки, студенты на доске рисуют и заполняют таблицу, аналогичную таблице 61. Каждый заполняет строку по себе, и все учащиеся переписывают таблицу целиком к себе в тетрадь. Затем, когда таблица в тетради заполнена – она заносится в систему "Эйдос" в 1-м режиме 2-й подсистемы.

Таблица 61 – ОБУЧАЮЩАЯ ВЫБОРКА

Код	Наименование	Коды классов	Коды признаков
2	Воробьева ПИ-51	2	5	10	12	13	16	4	7	10	14	17	21	23
3	Гура ПИ-51	1	13	17	0	0	0	3	7	11	15	17	21	24
5	Дыбова ПИ-51	2	13	19	0	0	0
6	Жеребятьев ПИ51	1	5	8	12	13	20
8	Иванова ПИ-51	2	3	7	12	13	22	3	6	7	12	14	17	19
9	Котенко ПИ-51	2	4	7	12	13	23	3	7	10	14	17	21	23
10	Кузина О. ПИ-51	2	3	8	12	13	24	3	7	12	14	17	21	22
11	Кузина Я. ПИ-51	2	3	8	12	13	25	3	7	11	14	17	21	22
12	Лях ПИ-51	1	3	8	12	13	26	2	6	11	14	16	20	24
13	Мясников ПИ-51	1	3	9	12	13	27	3	7	10	14	17	21	22
14	Нагапетян ПИ-51	1	4	9	12	13	28	3	8	12	13	18	19	23
15	Полонская ПИ-51	2	13	29	0	0	0
16	Трунина ПИ-51	2	13	30	0	0	0	3	7	12	13	18	19	23
17	Черкашина ПИ-51	2	4	10	12	13	31	3	7	12	14	17	19	23
18	Чепурченко ПИ51	1	13	32	0	0	0	3	8	12	13	16	19	23
19	Чушкин ПИ-51	1	13	33	0	0	0	3	6	11	14	17	20	23
20	Шульгин ПИ-51	1	5	8	12	13	34
21	Арушунян ПИ-52	1	14	35	0	0	0
22	Быченок ПИ-52	1	14	36	0	0	0
23	Веревкина ПИ-52	2	3	9	12	14	37
24	Григорьева ПИ52	2	4	8	12	14	38
25	Давыдич ПИ-52	2	14	39	0	0	0
26	Дронова ПИ-52	2	14	40	0	0	0	3	7	11	14	17	20	23
27	Еременко ПИ-52	2	4	8	12	14	41
28	Жмурко ПИ-52	1	14	42	0	0	0	3	7	10	14	17	21	23
29	Иванова ПИ-52	2	3	9	12	14	43
30	Костенко ПИ-52	2	14	44	0	0	0
31	Крейс ПИ-52	2	4	8	12	14	45
32	Куркина ПИ-52	2	3	8	12	14	46
33	Люлик ПИ-52	2	5	8	12	14	47
34	Максимов ПИ-52	1	14	48	0	0	0
35	Мануйлов ПИ-52	1	3	7	12	14	49
36	Нарижний ПИ-52	1	3	7	12	14	50
37	Ольховская ПИ52	2	14	51	0	0	0
38	Паршакова ПИ-52	2	6	8	12	14	52
39	Силенко ПИ-52	1	3	7	12	14	53	3	5	11	14	17	21	23
40	Соколова ПИ-52	2	4	8	12	14	54
41	Турбин ПИ-52	1	14	55	0	0	0	3	7	11	14	17	21	23
42	Цисарь ПИ-52	2	5	9	12	14	56	3	9	10	14	17	21	23
43	Бабенко ПИ-51	0	0	0	0	0	0	2	7	11	14	17	21	24

Так как по ряду студентов данных нет, то пример выполнения заданий 2 и 3 не приводится и они выполняются студентами самостоятельно.

Для этих целей каждый учащийся заполняет данными о себе "Карточку респондента", имеющую вид, представленный на таблице 64:

Таблица 64 – КАРТОЧКА РЕСПОНДЕНТА № _____

Учебная группа:

Фамилия, имя, отчество:

Коды классов, к которым он принадлежит:

Коды признаков, которыми он характеризуется:

При необходимости строки с кодами добавляются. На каждой карточке имеется номер студента по списку группы, который затем используется как номер анкеты в обучающей выборке. Необходимо сначала ввести пустые анкеты обучающей выборки по списку группы, а затем заполнить их, используя карточки. Учащиеся передают друг другу карточки передавать по компьютерному классу. В графе "Наим.физ.источника" указываются полностью: фамилия, и сокращенно: имя и отчество студента. Аналогично поступаем с карточками студентов 2-й группы, за исключением того, что для определения номера анкеты в обучающей выборке к списочному номеру студента 2-й группы прибавляется номер последнего студента 1-й группы.

Осуществить синтез и верификацию

Синтез и верификация модели осуществляется в соответствующих подсистемах системы "Эйдос". Результаты верификации представлены в таблице 65.

Таблица 65 – РЕЗУЛЬТАТЫ ВЕРИФИКАЦИИ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ

№	Код	Наименование класса	Ко-во лог. анк.	% верной идентификации
ВЫСОКАЯ адекватность модели
1	87	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - низкая	1	100,00
2	106	УСП.ПО ДИСЦ.СД-05 (социология культуры) - высокая	27	88,89
3	46	УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - высокая	35	88,57
4	55	УСП.ПО ДИСЦ.ОПД-02 (общая социология) - высокая	26	88,46
5	45	УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - низкая	8	87,50
6	85	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - высокая	24	87,50
7	13	УСП.ПО ДИСЦ.ГСД-01 (философия) - высокая	23	86,96
8	28	УСП.ПО ДИСЦ.ГСД-06 (право) - высокая	35	85,71
9	37	УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - высокая	26	84,62
10	14	УСП.ПО ДИСЦ.ГСД-01 (философия) - средняя	6	83,33
11	16	УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - высокая	24	83,33
12	18	УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - низкая	6	83,33
СРЕДНЯЯ адекватность модели
13	24	УСП.ПО ДИСЦ.ГСД-04 (история) - низкая	9	77,78
14	22	УСП.ПО ДИСЦ.ГСД-04 (история) - высокая	17	76,47
15	17	УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - средняя	12	75,00
16	56	УСП.ПО ДИСЦ.ОПД-02 (общая социология) - средняя	8	75,00
17	57	УСП.ПО ДИСЦ.ОПД-02 (общая социология) - низкая	8	75,00
18	43	УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - высокая	15	73,33
19	29	УСП.ПО ДИСЦ.ГСД-06 (право) - средняя	7	71,43
20	47	УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - средняя	7	71,43
НИЗКАЯ адекватность модели
21	113	Группа-2	23	69,57
22	23	УСП.ПО ДИСЦ.ГСД-04 (история) - средняя	16	68,75
23	44	УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - средняя	19	68,42
24	39	УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - низкая	3	66,67
25	112	Группа-1	19	63,16
26	15	УСП.ПО ДИСЦ.ГСД-01 (философия) - низкая	13	61,54
ОЧЕНЬ НИЗКАЯ адекватность модели
27	107	УСП.ПО ДИСЦ.СД-05 (социология культуры) - средняя	11	54,55
28	38	УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - средняя	13	53,85
29	86	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - средняя	17	52,94
30	108	УСП.ПО ДИСЦ.СД-05 (социология культуры) - низкая	4	50,00

Из таблицы 65 видно, что:

– из 113 классов сформированными оказались лишь 30, т.к. по остальным в обучающей выборке просто не было данных;

– если исключить из модели не сформированные классы, а также классы с дифференциальной валидностью (% верной идентификации) меньше 70% (строки с 21 по 30), то получившаяся в результате модель по 20 классам модель будет иметь среднюю адекватность не ниже 70%. Для автоматизации

этой операции в системе "Эйдос" в подсистеме измерения адекватности имеется специальный режим. Необходимо отметить, что этот прием аналогичен исключению из рассмотрения результатов обработки с низким доверительным интервалом, что широко используется в дискриминантом анализе.

Осуществить содержательное

Для этого в 3-й функции 1-го режиме 5-й подсистемы системы "Эйдос" зададим коды классов 13 и 15 (высокая и низкая успеваемость по философии) и фильтр по факторам для обоих портретов от 347 до 373 (влияние образовательного уровня отца). В результате получим когнитивную диаграмму, представленную на рисунке 118.


Рисунок 118. Когнитивная диаграмма, показывающая результаты содержательного сравнения двух классов по системам их детерминации

Проинтерпретировать данную когнитивную диаграмму студенты должны самостоятельно.

Построить интегральные

В 7-м режиме 6-й подсистемы системы "Эйдос" при задании диапазона кода классов {13, 15} и диапазона кодов факторов {1, 11} генерируется следующая классическая когнитивная карта (рисунок 120), которая, по сути, является суперпозицией нескольких классических когнитивных карт.

Из этого рисунка видно, что факторы с кодами 3, 5, 11 сходны по влиянию на учебные достижения по философии:

– они все препятствуют достижению результата с кодом 13;

– они все способствуют достижению результата с кодом 15;

– результаты с кодами 13 и 15 детерминируются несовместимыми системами факторов и одновременно недостижимы, на что указывает антикорреляция между ними в семантической сети классов;

– фактор 3 способствует результату 14 и препятствует результату 13, а фактор 2, наоборот, препятствует 14 и способствует 13, и факторы 2 и 3 имеют различное влияние на поведение объекта управления, на что указывает антикорреляция между ними в семантической сети факторов.

Насколько известно, система "Эйдос" на данный момент является единственной системой, обеспечивающей автоматический синтез непосредственно на основе эмпирических данных и отображение в графической форме классических и интегральных когнитивных карт (интегральные когнитивные карты впервые предложены автором).


Рисунок 120. Пример интегральной когнитивной карты

Построить классические когнитивные модели (отобразить в форме когнитивных карт).

В 7-м режиме 6-й подсистемы системы "Эйдос" при задании кода класса13 и диапазона кодов факторов 1 – 11 генерируется следующая классическая когнитивная карта (рисунок 119).


Рисунок 119. Пример классической когнитивной карты

Построить нелокальные нейроны и интерпретируемые нейронные сети.

Это задание предлагается выполнить самостоятельно. При этом использовать 6-й режим 6-й подсистемы системы "Эйдос".

Провести кластерно-конструктивный

В 5-й подсистеме системы "Эйдос" получены следующие семантические сети классов, отражающие степень их сходства по детерминирующим их факторам (рисунок 116), и факторов, отражающие, их сходство и различие по влиянию на уровень учебных достижений учащихся (рисунок117).


Рисунок 116. Пример семантической сети классов

Рисунок 117. Пример семантической сети факторов

Решить задачи идентификации и прогнозирования (для себя).

Эти операции выполняются в 4-й подсистеме системы "Эйдос". Результаты выводятся в двух разрезах:

– индивидуальная универсальная характеристика конкретного респондента (рисунок 113);

– выборка респондентов, имеющих наивысшие сходство с заданным классом (рисунок 114).

Анализ карточек прогноза успеваемости показывает, что вариабельность внутри группы успевающих студентов гораздо выше, чем в группе неуспевающих. В результате в среднем уровень сходства конкретных респондентов с обобщенными образами классов, соответствующих высоким уровням успеваемости, гораздо ниже, чем с классами, соответствующими низким уровням успеваемости.

Это дает основание предложить гипотезу, что высокая успеваемость детерминируется менее жестко, чем низкая, т.е. существуют конкретные факторы, фактически предопределяющие

низкую успеваемость, тогда как для высокой успеваемости можно говорить лишь о системе факторов, способствующих высокой успеваемости.

Конечно, чтобы подобные выводы имели достаточную научную достоверность необходима значительно большая статистика, чем использованная в данном учебном примере. Например, если бы подобное исследование было проведено хотя бы в масштабах КубГАУ (более 17000 студентов), то тогда уже с достаточной уверенностью можно было бы говорить о реально обнаруженных закономерностях.

Рисунок 113. Прогноз успеваемости по различным предметам

для конкретного студента

Рисунок 114. Список респондентов в порядке убывания сходства

с заданным классом

Формы, подобные представленной на рисунке 113, могут интересовать потенциальных работодателей, а также приемную комиссию вуза в качестве дополнительной информации для принятия решения.

Сгенерировать информационные

Определим, как влияют "ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ" на успеваемость по философии. Для этого в 1-м режиме 5-й подсистемы системы "Эйдос" получим информационный портрет класса с кодом 13: УСП.ПО ДИСЦ.ГСД-01 (философия) – высокая и нажав клавишу F6 зададим фильтр по диапазону градаций названной шкалы с кодом 50: {347, 373}. В результате получим информационный портрет данного класса, представленный в таблице 66.

Таблица 66 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА, КОД: 13

Профиль класса в разрезе по диапазону факторов можно получить в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 115).

Рисунок 115. Профиль влияния образовательного уровня отца

на отличную успеваемость студента по философии

Из этого рисунка видно, что на отличную успеваемость студента по философии наиболее положительно сказывается если его отец – доктор наук.

В этой связи позволим себе немного повеселить читателей следующей историей. Профессор спрашивает абитуриента на вступительном экзамене:

– из каких соображений Вы выбрали для поступления именно наш вуз и именно эту специальность?

– не задавай глупых вопросов, папа!

отвечает абитуриент.

Оставшуюся часть задания студентам предлагается выполнить самостоятельно.

Сконструировать классификационные

Пример формирования классификационных шкалы и градаций приведен в таблице 59.

Таблица 59 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ

Код	Наименование класса	Код	Наименование класса
1	ПОЛ - мужской	29	Полонская ПИ-51
2	ПОЛ - женский	30	Трунина ПИ-51
3	ОТКУДА РОДОМ - город-краевой центр	31	Черкашина ПИ-51
4	ОТКУДА РОДОМ - город-районный центр	32	Чепурченко ПИ-51
5	ОТКУДА РОДОМ - поселок городского типа	33	Чушкин ПИ-51
6	ОТКУДА РОДОМ - село	34	Шульгин ПИ-51
7	УСПЕВАЕМОСТЬ - "5" более 75%	35	Арушанян ПИ-52
8	УСПЕВАЕМОСТЬ - "5" более 50% но меньше 75%	36	Быченок ПИ-52
9	УСПЕВАЕМОСТЬ - "5" более 25% но меньше 50%	37	Веревкина ПИ-52
10	УСПЕВАЕМОСТЬ - "5" менее 25%	38	Григорьева ПИ-52
11	ФОРМА ОБУЧЕНИЯ - бюджетная	39	Давыдич ПИ-52
12	ФОРМА ОБУЧЕНИЯ - платная	40	Дронова ПИ-52
13	ГРУППА ПИ-51	41	Еременко ПИ-52
14	ГРУППА ПИ-52	42	Жмурко ПИ-52
15	Бабенко ПИ-51	43	Иванова ПИ-52
16	Воробьева ПИ-51	44	Костенко ПИ-52
17	Гура ПИ-51	45	Крейс ПИ-52
18	Головнев ПИ-51	46	Куркина ПИ-52
19	Дыбова ПИ-51	47	Люлик ПИ-52
20	Жеребятьев ПИ-51	48	Максимов ПИ-52
21	Заяц ПИ-51	49	Мануйлов ПИ-52
22	Иванова ПИ-51	50	Нарижний ПИ-52
23	Котенко ПИ-51	51	Ольховская ПИ-52
24	Кузина О. ПИ-51	52	Паршакова ПИ-52
25	Кузина Я. ПИ-51	53	Силенко ПИ-52
26	Лях ПИ-51	54	Соколова ПИ-52
27	Мясников ПИ-51	55	Турбин ПИ-52
28	Нагапетян ПИ-51	56	Цисарь ПИ-52

Продолжение таблицы 62

Код	Наименование класса
72	УСП.ПО ДИСЦ.ОПД-07 (социальная психология) – низкая
73	УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - высокая
74	УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - средняя
75	УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - низкая
76	УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - высокая
77	УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - средняя
78	УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - низкая
79	УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - высокая
80	УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - средняя
81	УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - низкая
82	УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - высокая
83	УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - средняя
84	УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - низкая
85	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - высокая
86	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - средняя
87	УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - низкая
88	УСП.ПО ДИСЦ.ОПД-13 (социология религий) - высокая
89	УСП.ПО ДИСЦ.ОПД-13 (социология религий) - средняя
90	УСП.ПО ДИСЦ.ОПД-13 (социология религий) - низкая
91	УСП.ПО ДИСЦ.ОПД-14 (дисц. и курсы по выбору) - высокая
92	УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по выбору) - средняя
93	УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по выбору) - низкая
94	УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - высокая
95	УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - средняя
96	УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - низкая
97	УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - высокая
98	УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - средняя
99	УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - низкая
100	УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - высокая
101	УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - средняя
102	УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - низкая
103	УСП.ПО ДИСЦ.СД-04 (социология семьи) - высокая
104	УСП.ПО ДИСЦ.СД-04 (социология семьи) - средняя
105	УСП.ПО ДИСЦ.СД-04 (социология семьи) - низкая
106	УСП.ПО ДИСЦ.СД-05 (социология культуры) - высокая
107	УСП.ПО ДИСЦ.СД-05 (социология культуры) - средняя
108	УСП.ПО ДИСЦ.СД-05 (социология культуры) - низкая
109	УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору) - высокая
110	УСП.ПО ДИСЦ.СД-06 (дисц.и кусры по выбору) - средняя
111	УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору) - низкая
112	Группа-1
113	Группа-2

В качестве описательных шкал и градаций использовать характеристики подчерка.

Существует много различных систем выявления признаков подчерка. Мы в учебных целях воспользуемся одной из самых простых из них, используемой на сайте: Альянс-медиа "Деловые тесты":

http://www.businesstest.ru/test.asp?test_id=155&topic_id=3

В таблице 60 эта система приведена в виде, преобразованном для удобства использования в системе "Эйдос".

Таблица 60 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

СПРАВОЧНИК НАИМЕНОВАНИЙ ШКАЛ И ГРАДАЦИЙ ПРИЗНАКОВ

06-09-04 10:39:45 г.Краснодар

==========================================================================

| N | Код | Наименование |

|========================================================================|

| |[ 1]|РАЗМЕР БУКВ: |

| 1| 1 |Очень мелкие................................................|

| 2| 2 |Мелкие......................................................|

| 3| 3 |Средние.....................................................|

| 4| 4 |Крупные.....................................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

| |[ 2]|НАКЛОН БУКВ: |

| 5| 5 |Влево.......................................................|

| 6| 6 |Легкий влево................................................|

| 7| 7 |Вправо......................................................|

| 8| 8 |Резкий вправо...............................................|

| 9| 9 |Прямое написание............................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

| |[ 3]|ФОРМА БУКВ: |

| 10| 10 |Округлые....................................................|

| 11| 11 |Бесформенные................................................|

| 12| 12 |Угловатые...................................................|

Анкета организаторов тестирования преобразована к виду, удобному для обработки в системе "Эйдос" (таблица 63).

Таблица 63 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Код		Наименования шкал и градаций признаков
[ 1]		ВАШ ВОЗРАСТ:
1		17
2		18
3		19
4		20
5		21
6		22
7		23
8		24
9		25 или более
[ 2]		ВЫ РОДИЛИСЬ В РОССИИ?
10		Да
11		Нет
[ 3]		ЕСЛИ ВЫ РОДИЛИСЬ НЕ В РОССИИ, ТО ВО СКОЛЬКО ЛЕТ ВЫ СЮДА ПРИЕХАЛИ?
12		До 7 лет
13		От 7 до 17 лет
14		Больше 17 лет
[ 4]		КОЛИЧЕСТВО ЖИЛЫХ КОМНАТ У ВАС ДОМА:
15		1
16		2
17		3
18		4
19		5 или более
[ 5]		СКОЛЬКО ВСЕГО ЧЕЛОВЕК ЖИВУТ У ВАС ДОМА?
20		1
21		2
22		3
23		4
24		5
25		6
26		7 и более
[ 6]		ДОХОД НА ЧЛЕНА СЕМЬИ (В МЕСЯЦ):
27		Низкий
28		Средний
29		Высокий
[ 7]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО РУССКОМУ ЯЗЫКУ:
30		Отличные
31		Хорошие
32		Средние
33		Низкие
[ 8]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО АЛГЕБРЕ:
34		Отличные
35		Хорошие
36		Средние
37		Низкие
[ 9]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ГЕОМЕТРИИ:
38		Отличные
39		Хорошие
40		Средние
41		Низкие
[ 10]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ФИЗИКЕ:
42		Отличные
43		Хорошие
44		Средние
45		Низкие

Продолжение таблицы 63

Код		Наименования шкал и градаций признаков
[ 11]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ХИМИИ:
46		Отличные
47		Хорошие
48		Средние
49		Низкие
[ 12]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНФОРМАТИКЕ:
50		Отличные
51		Хорошие
52		Средние
[ 13]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО БИОЛОГИИ:
54		Отличные
55		Хорошие
56		Средние
57		Низкие
[ 14]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИСТОРИИ:
58		Отличные
59		Хорошие
60		Средние
61		Низкие
[ 15]		КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНОСТРАННОМУ ЯЗЫКУ
62		Отличные
63		Хорошие
64		Средние
65		Низкие
[ 16]		КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО РУССКОМУ ЯЗЫКУ:
66		Уроки в школе
67		Со знакомыми
68		С репетитором
69		Факультатив в школе
70		Курсы при ВУЗе
71		Заочно при ВУЗе
[ 17]		КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО АЛГЕБРЕ:
72		Уроки в школе
73		Со знакомыми
74		С репетитором
75		Факультатив в школе
76		Курсы при ВУЗе
77		Заочно при ВУЗе
[ 18]		КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ГЕОМЕТРИИ:
78		Уроки в школе
79		Со знакомыми
80		С репетитором
81		Факультатив в школе
82		Курсы при ВУЗе
83		Заочно при ВУЗе
[ 19]		КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ФИЗИКЕ:
84		Уроки в школе
85		Со знакомыми
86		С репетитором
87		Факультатив в школе
88		Курсы при ВУЗе
89		Заочно при ВУЗе
[ 20]		КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ХИМИИ:
90		Уроки в школе
91		Со знакомыми
92		С репетитором
93		Факультатив в школе
94		Курсы при ВУЗе
95		Заочно при ВУЗе

<

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|    |[   4]|НАПРАВЛЕНИЕ ПОЧЕРКА:                                        |
| 13|   13 |Строчки "ползут" вверх......................................|
| 14|   14 |Строчки прямые..............................................|
| 15|   15 |Строчки "сползают" вниз.....................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|    |[   5]|ИНТЕНСИВНОСТЬ ПОЧЕРКА И СИЛА НАЖИМА:                        |
| 16|   16 |Легкая......................................................|
| 17|   17 |Средняя.....................................................|
| 18|   18 |Сильная.....................................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|    |[   6]|ХАРАКТЕР НАПИСАНИЯ СЛОВ:                                    |
| 19|   19 |Склонность к соединению букв................................|
| 20|   20 |Склонность к отделению букв друг от друга...................|
| 21|   21 |Смешанный стиль.............................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|    |[   7]|ОБЩАЯ ОЦЕНКА ПОЧЕРКА:                                       |
| 22|   22 |Почерк старательный, буквы аккуратные.......................|
| 23|   23 |Почерк неровный, одни слова видны, другие читаются с трудом.|
| 24|   24 |Буквы написаны кое-как, почерк неразборчивый и небрежный....|
==========================================================================
Универсальная когнитивная аналитическая система               НПП *ЭЙДОС*

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
[ 21]	КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНФОРМАТИКЕ:
96	Уроки в школе
97	Со знакомыми
98	С репетитором
99	Факультатив в школе
100	Курсы при ВУЗе
101	Заочно при ВУЗе
[ 22]	КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО БИОЛОГИИ:
102	Уроки в школе
103	Со знакомыми
104	С репетитором
105	Факультатив в школе
106	Курсы при ВУЗе
107	Заочно при ВУЗе
[ 23]	КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИСТОРИИ:
108	Уроки в школе
109	Со знакомыми
110	С репетитором
111	Факультатив в школе
112	Курсы при ВУЗе
113	Заочно при ВУЗе
[ 24]	КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНОСТРАННОМУ ЯЗЫКУ
114	Уроки в школе
115	Со знакомыми
116	С репетитором
117	Факультатив в школе
118	Курсы при ВУЗе
119	Заочно при ВУЗе
[ 25]	СКОЛЬКО ВРЕМЕНИ СУММАРНО УХОДИТ У ВАС НА ВЫПОЛНЕНИЕ ДОМАШНИХ ЗАДАНИЙ?
120	До 15 минут
121	Около 30 минут
122	1 - 2 часа
123	Более 2-х часов
[ 26]	УКАЖИТЕ УРОВЕНЬ ОБРАЗОВАНИЯ ОТЦА:
124	Неполное среднее
125	Среднее
126	Среднее техническое
127	Незаконченное высшее
128	Высшее
129	Кандидат наук
130	Доктор наук
[ 27]	УКАЖИТЕ УРОВЕНЬ ОБРАЗОВАНИЯ МАТЕРИ:
131	Неполное среднее
132	Среднее
133	Среднее техническое
134	Незаконченное высшее
135	Высшее
136	Кандидат наук
137	Доктор наук
[ 28]	УКАЖИТЕ НАЦИОНАЛЬНОСТЬ ОТЦА:
138	Русский
139	Украинец
140	Белорус
141	Татарин
142	Мордвин
143	Удмурт
144	Мари
145	Башкир
146	Чуваш

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
147	Еврей
148	Калмык
149	Бурят
150	Коми
151	Грузин
152	Армянин
153	Азербайджанец
154	Другая
[ 29]	УКАЖИТЕ НАЦИОНАЛЬНОСТЬ МАТЕРИ:
155	Русский
156	Украинец
157	Белорус
158	Татарин
159	Мордвин
160	Удмурт
161	Мари
162	Башкир
163	Чуваш
164	Еврей
165	Калмык
166	Бурят
167	Коми
168	Грузин
169	Армянин
170	Азербайджанец
171	Другая
[ 30]	ВЫ ПОСТОЯННО ЖИВЕТЕ В ДАННОМ МЕСТЕ ИЛИ ПЕРЕЕХАЛИ СЮДА ИЗ ДРУГОЙ МЕСТНОСТИ?
172	Родился и живу здесь постоянно
173	Приехал сюда из другого города России
174	Приехал из сельской местности России
175	Приехал из бывших республик СССР
[ 31]	ВЫ ПРОЖИВАЕТЕ:
176	Москве
177	Санкт-Петербурге
178	В областном (краевом) центре или столице республики
179	В крупном городе
180	В среднем городе
181	В малом городе
182	В поселке, деревне, селе, хуторе и т.п.
[ 32]	КАК ЧАСТО ВЫ ДОМА РАЗГОВАРИВАЕТЕ НА РУССКОМ ЯЗЫКЕ?
183	Всегда
184	Почти всегда
185	Иногда
186	Очень редко
187	Никогда
[ 33]	ВМЕСТЕ С ВАМИ ПОСТОЯННО ПРОЖИВАЮТ:
188	Мать
189	Отец
190	Отчим/мачеха
191	Братья/сестры
192	Бабушки/дедушки
193	Другие родственники
[ 34]	КОЛИЧЕСТВО ДЕТЕЙ В СЕМЬЕ, ВКЛЮЧАЯ ВАС:
194	Один
195	Двое
196	Трое
197	Четверо или более

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
[ 35]	ИМЕЕТ ЛИ ВАША СЕМЬЯ:
198	Видеомагнитофон
199	Видеокамеру
200	Несколько цветных телевизоров
201	Компьютер
202	Отечественную автомашину
203	Несколько отечественных автомашин или иномарку
[ 36]	ЕСЛИ ВЫ ИМЕЕТЕ КОМПЬЮТЕР ДОМА, ТО КАК ВЫ ЕГО ИСПОЛЬЗУЕТЕ?
204	Для игр
205	Для изучения учебных предметов (например, иностранных языков)
206	Для обмена информацией с помощью модема, в т.ч. в Internet
207	Для оплачиваемой работы
[ 37]	СКОЛЬКО ПРИМЕРНО КНИГ У ВАС В СЕМЬЕ (НЕ СЧИТАЯ УЧЕБНИКОВ И УЧЕБНЫХ ПОСОБИЙ)?
208	Менее 50
209	Около 100
210	Несколько сотен
211	Более тысячи
[ 38]	ВАШЕ ОТНОШЕНИЕ К ПЕРИОДИЧЕСКОЙ ПЕЧАТИ:
212	Выписываем на дом
213	Покупаем ежедневно
214	Покупаем еженедельно
215	Почти не читаем
[ 39]	ЖИЛИЩНЫЕ УСЛОВИЯ ВАШЕЙ СЕМЬИ:
216	Комната в коммунальной квартире
217	1-комнатная квартира
218	2-комнатная квартира
219	Квартира из 3-х или более комнат
220	Обычный дом в сельской местности
221	Дом повышенной комфортности (особняк)
[ 40]	ПРИ СОСТАВЛЕНИИ ПЛАНОВ НА БУДУЩЕЕ ЧЬЕ МНЕНИЕ ВЫ УЧИТЫВАЕТЕ В ПЕРВУЮ ОЧЕРЕДЬ (ВЫБЕРИТЕ ТОЛЬКО ОДИН ОТВЕТ):
222	Родителей
223	Учителей
224	Сверстников (друзей)
225	Средств массовой информации
226	Свое собственное
[ 41]	ГДЕ ВЫ ОБЫЧНО ПРОВОДИТЕ ЕЖЕГОДНЫЙ ОТПУСК (КАНИКУЛЫ):
227	Дома
228	На собственной даче
229	В другом городе или на даче у родственников или знакомых
230	В туристическом походе
231	На Черном море в России
232	В бывших республиках СССР
233	За рубежом
234	Другое
[ 42]	ВЫ ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС:
235	Общеобразовательный
236	Профилированный на ВУЗ
237	Гимназический или лицейский
238	другой (экономический, юридический и др.)
[ 43]	ВЫ ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС С УГЛУБЛЕННЫМ ИЗУЧЕНИЕМ:
239	Математики
240	Физики
241	Биологии
242	Химии
243	Географии
244	Информатики
245	Истории, обществоведения
246	Русского языка, литературы

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
247	Иностранных языков
[ 44]	ВЫБЕРИТЕ ПРЕДМЕТЫ, КОТОРЫЕ ВАМ НРАВЯТСЯ:
248	Русский язык
249	Математика
250	Физика
251	Химия
252	Информатика
253	Биология
254	История
255	Иностранный язык
256	География
[ 45]	ЧЕМ ВАМ НРАВИТСЯ ШКОЛА, КОТОРУЮ ВЫ ЗАКОНЧИЛИ?
257	Хорошие отношения со сверстниками
258	Хорошие учителя
259	Хорошая подготовка к поступлению в ВУЗ
260	Расположена рядом с домом
261	Ничем не нравится
262	Другое
[ 46]	ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ ОТЦА:
263	Промышленность (тяжелая)
264	Промышленность (легкая)
265	Строительство
266	Сельское хозяйство
267	Транспорт
268	Коммерция, торговля, сфера бытового обслуживания
269	Экономика
270	Частный бизнес, предпринимательство
271	Государственная служба
272	Служба в силовых структурах
273	Выборные органы власти
274	Образование
275	Здравоохранение, медицина
276	Культура, искусство
277	Наука
278	Юриспруденция
279	Спорт
280	Религия
281	Другое
[ 47]	ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ МАТЕРИ:
282	Промышленность (тяжелая)
283	Промышленность (легкая)
284	Строительство
285	Сельское хозяйство
286	Транспорт
287	Коммерция, торговля, сфера бытового обслуживания
288	Экономика
289	Частный бизнес, предпринимательство
290	Государственная служба
291	Служба в силовых структурах
292	Выборные органы власти
293	Образование
294	Здравоохранение, медицина
295	Культура, искусство
296	Наука
297	Юриспруденция
298	Спорт
299	Религия
300	Другое

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков

[ 48]	ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ, НАИБОЛЕЕ ПРИВЛЕКАЮЩАЯ МЕНЯ
301	Промышленность (тяжелая)
302	Промышленность (легкая)
303	Строительство
304	Сельское хозяйство
305	Транспорт
306	Коммерция, торговля, сфера бытового обслуживания
307	Экономика
308	Частный бизнес, предпринимательство
309	Государственная служба
310	Служба в силовых структурах
311	Выборные органы власти
312	Образование
313	Здравоохранение, медицина
314	Культура, искусство
315	Наука
316	Юриспруденция
317	Спорт
318	Религия
319	Другое
[ 49]	УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ПРАКТИЧЕСКИ НЕ ИСПОЛЬЗУЕТЕ:
320	Просмотр видео и кинофильмов
321	Чтение художественной литературы
322	Спорт, туризм
323	Дискотеки и т.п.
324	Общение с родителями
325	Общение с любимым человеком
326	Работа на дому
327	Оплачиваемая работа
328	Дополнительное образование
329	Техническое творчество
330	Занятия искусством
331	Коллекционирование
332	Посещение музеев и выставок
333	Посещение оперы и балета
334	Посещение драматических театров
335	Посещение концертов классической музыки
336	Посещение концертов попмузыки
337	Слушание радио
338	Слушание аудио-музыки
339	Просмотр теленовостей
340	Просмотр развлекательных TV-программ
341	Просмотр спортивных TV-программ
342	Просмотр мультфильмов
343	Просмотр телесериалов
344	Просмотр познавательных передач
345	Просмотр религиозных программ
346	Посещение религиозных центров
[ 50]	УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ:
347	Просмотр видео и кинофильмов
348	Чтение художественной литературы
349	Спорт, туризм
350	Дискотеки и т.п.
351	Общение с родителями
352	Общение с любимым человеком
353	Работа на дому
354	Оплачиваемая работа
355	Дополнительное образование

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
356	Техническое творчество
357	Занятия искусством
358	Коллекционирование
359	Посещение музеев и выставок
360	Посещение оперы и балета
361	Посещение драматических театров
362	Посещение концертов классической музыки
363	Посещение концертов попмузыки
364	Слушание радио
365	Слушание аудио-музыки
366	Просмотр теленовостей
367	Просмотр развлекательных TV-программ
368	Просмотр спортивных TV-программ
369	Просмотр мультфильмов
370	Просмотр телесериалов
371	Просмотр познавательных передач
372	Просмотр религиозных программ
373	Посещение религиозных центров
[ 51]	УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ЧАСТО ИСПОЛЬЗУЕТЕ:
374	Просмотр видео и кинофильмов
375	Чтение художественной литературы
376	Спорт, туризм
377	Дискотеки и т.п.
378	Общение с родителями
379	Общение с любимым человеком
380	Работа на дому
381	Оплачиваемая работа
382	Дополнительное образование
383	Техническое творчество
384	Занятия искусством
385	Коллекционирование
386	Посещение музеев и выставок
387	Посещение оперы и балета
388	Посещение драматических театров
389	Посещение концертов классической музыки
390	Посещение концертов попмузыки
391	Слушание радио
392	Слушание аудио-музыки
393	Просмотр теленовостей
394	Просмотр развлекательных TV-программ
395	Просмотр спортивных TV-программ
396	Просмотр мультфильмов
397	Просмотр телесериалов
398	Просмотр познавательных передач
399	Просмотр религиозных программ
400	Посещение религиозных центров
[ 52]	УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПРАКТИЧЕСКИ ВСЕГДА:
401	Просмотр видео и кинофильмов
402	Чтение художественной литературы
403	Спорт, туризм
404	Дискотеки и т.п.
405	Общение с родителями
406	Общение с любимым человеком
407	Работа на дому
408	Оплачиваемая работа
409	Дополнительное образование
410	Техническое творчество
411	Занятия искусством
412	Коллекционирование
413	Посещение музеев и выставок

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
414	Посещение оперы и балета
415	Посещение драматических театров
416	Посещение концертов классической музыки
417	Посещение концертов попмузыки
418	Слушание радио
419	Слушание аудио-музыки
420	Просмотр теленовостей
421	Просмотр развлекательных TV-программ
422	Просмотр спортивных TV-программ
423	Просмотр мультфильмов
424	Просмотр телесериалов
425	Просмотр познавательных передач
426	Просмотр религиозных программ
427	Посещение религиозных центров
[ 53]	УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС МАЛУЮ ЦЕННОСТЬ:
428	Общение с друзьями
429	Общение с родителями
430	Наличие вещей, имеющих продуктивную работу и учебу
431	Наличие престижных вещей
432	Наличие вещей, обеспечивающих комфортные условия жизни
433	Возможность влияния на ход важных событий в семье
434	Материальная независимость
435	Свобода высказываться и публиковаться
436	Свобода религии
437	Удовольствия, развлечения
438	Работа и учеба как творчество
439	Работа на благо общества
440	Работа как средство заработка
441	Счастливая семья
442	Любовь
443	Красота человека
444	Природа
445	Культура, искусство
[ 54]	УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС НЕКОТОРУЮ ЦЕННОСТЬ:
446	Общение с друзьями
447	Общение с родителями
448	Наличие вещей, имеющих продуктивную работу и учебу
449	Наличие престижных вещей
450	Наличие вещей, обеспечивающих комфортные условия жизни
451	Возможность влияния на ход важных событий в семье
452	Материальная независимость
453	Свобода высказываться и публиковаться
454	Свобода религии
455	Удовольствия, развлечения
456	Работа и учеба как творчество
457	Работа на благо общества
458	Работа как средство заработка
459	Счастливая семья
460	Любовь
461	Красота человека
462	Природа
463	Культура, искусство
[ 55]	УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС БОЛЬШУЮ ЦЕННОСТЬ:
464	Общение с друзьями
465	Общение с родителями
466	Наличие вещей, имеющих продуктивную работу и учебу
467	Наличие престижных вещей
468	Наличие вещей, обеспечивающих комфортные условия жизни
469	Возможность влияния на ход важных событий в семье

<

Продолжение таблицы 63

Код	Наименования шкал и градаций признаков
470	Материальная независимость
471	Свобода высказываться и публиковаться
472	Свобода религии
473	Удовольствия, развлечения
474	Работа и учеба как творчество
475	Работа на благо общества
476	Работа как средство заработка
477	Счастливая семья
478	Любовь
479	Красота человека
480	Природа
481	Культура, искусство

Проверить семантическую информационную модель на

Следуя логике Системно-когнитивного анализа выполнить следующие работы.
1. Осуществить когнитивную структуризацию предметной области.
2. Выполнить формализацию предметной области.
3. Сформировать обучающую выборку.
4. Осуществить синтез семантической информационной модели.
5. Оптимизировать семантическую информационную модель.
6. Проверить семантическую информационную модель на адекватность, измерить внутреннюю и внешнюю, дифференциальную и интегральную валидность.
7. Выполнить адаптацию модели и измерить, как изменилась ее адекватность.
8. Осуществить пересинтез модели и измерить, как изменилась ее адекватность.
9. Вывести информационные портреты текстов и дать их интерпретацию.
10. Выполнить кластерно-конструктивный анализ модели.

В заключение хотелось бы отметить,

В заключение хотелось бы отметить, что данное учебное пособие основано на материалах печати, Internet, а также на научных материалах кандидатской и докторской диссертаций автора, его научных работах, учебно-методических материалах, разработанных в ходе преподавания дисциплины "Интеллектуальные информационные системы" в течение 2002-2003 учебного года на факультете прикладной информатики КубГАУ и опыте, полученном в ходе преподавания этой и других дисциплин. Таким образом, это 1-е издание.
Объем учебного пособия по ряду лекций оказался превышен и в будущем безусловно будет сокращен. Мы надеемся, что студенты сами обнаружат эти лекции и, прочитав их "по диагонали", смогут извлечь из них самую суть и в краткой форме донести ее до экзамена, способность к чему они уже не раз успешно демонстрировали.
Мы надеемся, что в дальнейшем данное учебное пособие будет совершенствоваться, как и универсальная когнитивная аналитическая система "Эйдос" и методология и технология системно-когнитивного анализа, на которых оно основано. Все критические замечания и пожелания, направленные на совершенствование данного учебного пособия, будут с благодарностью приняты.
Автор
Краснодар. 22.08.2004.

Закон перераспределения функций между человеком и средствами труда

Развитие средств труда происходит путем последовательной передачи им трудовых функций человеческого организма в результате чего они начинают выполняться средствами труда вне естественных ограничений организма человека, а человек выполняет оставшиеся функции вне ограничений, связанных с необходимостью выполнения переданных функций.

Физический организм выполняет следующие функции, трудовые функции, последовательно передаваемые средствам труда:

1. Функция контакта с физической средой.

2. Функция трансмиссии (передачи и перераспределения энергии).

3. Рабочая функция (преобразование простого движения в сложное и выполняющее работу).

4. Функция двигателя (преобразование формы энергии).

5. Функция преобразования формы информации.

Другие структурные уровни организма человека поддерживают еще ряд функций, связанных с чувственно-эмоциональной и интеллектуальной обработкой информации. Рассмотрение этих функций выходит за рамки данного учебного пособия.

Когда средствам передается очередная трудовая функция – происходит технологическая революция, которая с неизбежностью вызывает революцию экономическую и социальную, а значит переход к новой общественно–экономической формации и соответствующему состоянию сознания (этапу общественного познания). Так формулируется закон перераспределения трудовых функций в системе "человек–машина", т.е. закон количественного повышения базиса.

Закон повышения качества базиса

Формулировка закона повышения качества базиса.

Развитие любой системы происходит путем разрешения противоречий между системой и средой в наинизшем качественном уровне системы, в котором они еще не разрешены. Этот уровень называется базисом (базисным). Разрешение противоречия в базисном уровне осуществляется поэтапно, путем перераспределения функций по преобразованию формы информации между внешним и внутренним.

Это перераспределение может осуществляться в двух формах:

1) в форме внешнего отчуждения (развитие средств труда и технологии);

2) путем внутреннего отчуждения (развитие сознания).

Причем развитие технологии детерминирует соответствующее развитие сознания, а уровень сознания определяет функциональный уровень технологии.

При отчуждении каждой очередной функции базисного уровня (передаче ее средствам труда или осознания ее как "не-Я") происходит количественное изменение системы. При отчуждении всех функций некоторого базисного уровня происходит качественное изменение системы и она переходит к развитию путем разрешения противоречий в следующем, более глубоком чем предыдущий уровне, который и становится базисным.

Когда средствам труда полностью и в массовом масштабе передается последняя функция некоторого относительно автономного уровня организации организма человека, то это вызывает переход к следующей группе общественно–экономических формаций и к следующему типу сознания. При этом человек как объективное начинает осознавать соответствующий качественно новый уровень Реальности и постепенно начинает действовать на нем как человек используя принцип свободы воли, в частности: сначала пользоваться тем, что "лежит на поверхности и ждет когда его возьмут", а затем трудиться и производить для потребления то, чего "на поверхности" не оказалось, и, наконец, производить средства производства. Таким образом при переходе к следующей группе формаций технологический базис общества повышается качественно, т.е. включает в себя средства труда, созданные на тех уровнях Реальности, которые ранее осознавались основной массой людей как субъективные.
Так формулируется закон повышения качества базиса.

Таким образом, в процессе развития технологии создаются технические системы, в состав которых входят уровни Реальности, поддерживающие так называемые субъективные функции (чувственно–эмоциональное восприятие и формально–логическое мышление), которые на предыдущих этапах эволюции общества осознавались как субъективные и относились не к базису, а к надстройке. В результате этого изменяется положение границы между базисом и надстройкой и соответственно изменяется содержание этих понятий, хотя их соотношение остается тем же что и раньше. Конечно, в этой связи изменяется и содержание таких понятий, как "производственная сфера" и "непроизводственная сфера", под которыми ранее понимались соответственно "сфера материального производства" и сфера производства самого человека, т.е. в основном культура, наука, образование и медицина. Становится вполне очевидным, что главной производительной силой является сам человек.

Законы развития техники

На любом этапе развития общества технологический базис общества основан на тех уровнях Реальности, которые осознаются как объективное при соответствующей данному этапу форме сознания. Технологический прогресс состоит в последовательной передаче трудовых функций организма человека средствам труда.

Зависимость адекватности модели от ее ортонормированности

Модель изучалась методом численного эксперимента. При этом были получены следующие результаты.

На 1-м этапе ортонормирования

адекватность модели (ее внутренняя дифференциальная и интегральная валидность) возрастает. Это можно объяснить тем, что, во-первых, уменьшается количество ошибок идентификации с близкими, т.е. коррелирующими классами, и, во-вторых, удаление из модели малоинформативных признаков по сути улучшает отношение "сигнал/шум" модели, т.е. качество идентификации.

На 2-м этапе ортонормирования

адекватность модели стабилизируется и незначительно колеблется около максимума. Это объясняется тем, что атрибуты, удаляемые на этом этапе, не являются критическим для адекватности модели.

На 3-м этапе ортонормирования

адекватность модели начинает уменьшаться, т.к. дальнейшее удаление атрибутов не позволяет адекватно описать предметную область.

При приближении процесса ортонормирования к 3-му этапу или его наступлении этот процесс должен быть остановлен.

Зависимость адекватности семантической

При экспериментальном исследовании свойств предлагаемой математической модели было установлено следующее (рисунок 35).


Рисунок 35. Зависимость адекватности модели от объема обучающей выборки

1. При малых выборках адекватность модели (внутренняя интегральная и дифференциальная валидность) равна 100% (рисунок 35, диапазон "А"). Это можно объяснить тем, что при малых объемах выборки все выявленные закономерности имеют детерминистский характер.

2. При увеличении объема исследуемой выборки происходит понижение адекватности модели (переход: А®В) и стабилизация ее адекватности на некотором уровне около 95-98% (рисунок 35, диапазон "В").

3. Учет в модели объектов обучающей выборки, отражающих закономерности, качественно отличающиеся от ранее выявленных, приводит к понижению адекватности модели (переход: В®С) и ее стабилизации на уровне от 80 до 90% (рисунок 35, диапазон "С").

4. Внутри диапазона "В" вариабельность объектов обучающей выборки по закономерностям "атрибут®класс" меньше, чем в диапазоне "С", т.е. объекты обучающей выборки диапазона "В" более однородны, чем "С".

Выявленные в модели причинно-следственные закономерности имеют силу для определенного подмножества обучающей выборки, например, отражающих определенный период времени, который соответствует детерминистскому периоду развития предметной области. При качественном изменении закономерностей устаревшие данные могут даже на некоторое время (пока модель не сойдется к новым закономерностям) нарушать ее адекватность.

В многочисленных проведенных практических исследованных модель показала высокую скорость сходимости и высокую адекватность на малых выборках. На больших выборках (т.е. охватывающих несколько детерминистских и бифуркационных состояний предметной области) закономерности с коротким периодом "причина-следствие" переформировываются заново, а с длительным (охватывающим несколько детерминистских и бифуркационных состояний) – автоматически становятся незначимыми и не ухудшают адекватность модели, если процесс апериодический, или сохраняют силу, если они имеют фундаментальный характер.

Выявленные закономерности сходимости модели позволяют сформулировать следующий критерий остановки процесса обучения:

если в модели ничего существенно не меняется при добавлении в обучающую выборку все новых и новых данных, то это означает, что модель адекватно отображает генеральную совокупность, к которой относятся эти данные, и продолжать процесс обучения нецелесообразно.

Здесь уместно рассмотреть ответ на следующий вопрос. Если для формирования образов классов распознавания предъявлено настолько малое количество обучающих объектов, что говорить об обобщении и статистике не приходится, то как это может повлиять на качество формирования модели и ее адекватность? При большой статистике, как показывает опыт, около 95% объектов, формирующих образ некоторого класса оказывается типичными для него, а остальные не типичными. Следовательно, если этот образ формируется на основе буквально одного - двух объектов, то вероятнее всего (т.е. с вероятностью около 95%) они являются типичными, и, следовательно, образ будет сформирован практически таким же, как и при большой статистике, т.е. правильным. При увеличении статистики в этом случае информативности признаков, составляющих образ практически не меняются). Но есть некоторая, сравнительно незначительная вероятность (около 5%), что попадется нетипичная анкета. Тогда при увеличении статистики образ быстро качественно изменится и "быстро сойдется" к адекватному, "нетипичная" анкета будет идентифицирована и ее данные либо будут удалены из модели, либо для нее специально будет создан свой класс.

При незначительной статистике относительный вклад каждого объекта в обобщенный образ некоторого класса, сформированный с его применением, будет достаточно велик. Поэтому в этом случае при распознавании модель уверенно относит объект к этому классу. При большой статистике модель также уверенно относит типичные объекты к классам, сформированным с их применением. Незначительное количество нетипичных объектов могут быть распознаны ошибочно, т.е.не отнесены моделью к тем классам, к которым их отнесли эксперты.

Наличие в системе очень сходных классов также может формально уменьшать валидность модели. Однако фактически эти очень сходные классы целесообразно объединить в один, т.к. по-видимому, их разделение объективно ничем не оправдано, т.е. не соответствует действительности. Для осуществления данной операции в математической модели целесообразно использовать режим: "Получение статистической характеристики обучающей выборки и объединение классов (ручной ремонт обучающей выборки)".

Зависимость информативностей факторов от объема обучающей выборки

При учете в модели апостериорной информации, содержащейся в очередном объекте обучающей выборки, осуществляется перерасчет значений информативностей всех атрибутов. При этом изменяется количество информации, содержащейся в факте обнаружения у объекта данного атрибута о принадлежности объекта к определенному классу.

В этом процессе пересчета информативностей атрибута их значения "сходятся" к некоторому пределу в соответствии с двумя "сценариями":

1) процесс "последовательных приближений", напоминающего по своей форме "затухающие колебания" (рисунок33);

2) относительно "плавное" возрастание или убывание с небольшими временными отклонениями от этой тенденции (рисунок 34).

Рисунок 33. Зависимость количества информации, содержащегося

в атрибуте №1 о принадлежности идентифицируемого объекта

(обладающего этим атрибутом) к классу №4 от объема обучающей выборки


Рисунок 34. Зависимость количества информации, содержащегося в атрибуте №1 о принадлежности идентифицируемого объекта (обладающего этим атрибутом) к классу №10 от объема обучающей выборки

Как показали численные эксперименты и специально проведенные исследования, других сценариев на практике не наблюдается.

В любом случае при накоплении достаточно большой статистики и сохранении закономерностей предметной области, отражаемых обучающей выборкой, модель стабилизируется в том смысле, что значения информативностей атрибутов перестают существенно изменяться.

Это дает основание утверждать, что при достижении этого состояния добавление новых примеров из обучающей выборки не вносит в модель ничего нового в модель и процесс обучения продолжать нецелесообразно. Это и является одним из критериев для принятия решения об остановке процесса обучения.

Зависимость некоторых параметров модели от ее ортонормированности

Изучим зависимость уровня системности, степени детерминированности и адекватности модели от ее ортонормированности. В связи с тем, что соответствующий научно-исследовательский режим, позволяющий изучить эти зависимости методом численного эксперимента, на момент написания данной работы находится в стадии разработки, получим интересующие нас зависимости путем анализа выражений (3.9) и (3.25).

При этом будем различать ортонормированность модели по классам и ортонормированность по атрибутам.

Зависимость степени детерминированности модели от ее ортонормированности

Рассмотрим выражение (3.25):

(3.25)

Так как каждый класс как правило описан более чем одним признаком, то при ортонормировании классов и удалении некоторых из них из модели суммарное количество признаков N будет уменьшаться быстрее, чем количество классов W, поэтому степень детерминированности будет возрастать.

При ортонормировании атрибутов числитель выражения (3.25) не изменяется, а знаменатель уменьшается, поэтому и в этом случае степень детерминированности возрастает.

Таким образом, ортонормирование модели приводит к увеличению степени ее детерминированности.

По этой причине предлагается считать "детерменированностью" и "системностью" модели не их значения в текущем состоянии модели, а тот предел, к которому стремятся эти величины при корректном ортонормировании модели при достижении ею точки максимума адекватности.

Зависимость уровня системности модели от ее ортонормированности

Рассмотрим выражение (3.9):

(3.9)

При выполнении операции ортонормирования по классам из модели последовательно удаляются те из них, которые наиболее сильно корреляционно связаны друг с другом. В результате в модели остаются классы практически не коррелирующие, т.е. ортонормированные. Поэтому можно предположить, что в результате ортонормирования правила запрета на образование подсистем классов становятся более жесткими, и уровень системности модели уменьшается.

Жизненный цикл системы искусственного интеллекта и критерии перехода между этапами этого цикла

Жизненный цикл систем искусственного интеллекта сходен с жизненным циклом другого программного обеспечения и включает этапы и критерии перехода между ними, представленные в таблице 2.

Таблица 2 – ЭТАПЫ ЖИЗНЕННОГО ЦИКЛА СИСТЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И КРИТЕРИИ ПЕРЕХОДА МЕЖДУ НИМИ

№	Наименование этапа	Критерии перехода к следующему этапу
1	Разработка идеи и концепции системы	Появление (в результате проведения маркетинговых и рекламных мероприятий) заказчика или спонсора, заинтересовавшегося системой
2	Разработка теоретических основ системы	Обоснование выбора математической модели по критериям или обоснование необходимости разработки новой модели
3	Разработка математической модели системы	Детальная разработка математической модели
4	Разработка методики численных расчетов в системе:
4.1	– разработка структур данных	детальная разработка структур входных, промежуточных и выходных данных
4.2	– разработка алгоритмов обработки данных	разработка обобщенных и детальных алгоритмов, реализующих на разработанных структурах данных математическую модель
5	Разработка структуры системы и экранных форм интерфейса	Разработка иерархической системы управления системой, структуры меню, экранных форм и средств управления на экранных формах
6	Разработка программной реализации системы	Разработка исходного текста программы системы, его компиляция и линковка. Исправление синтаксических ошибок в исходных текстах
7	Отладка системы	Поиск и исправление логических ошибок в исходных текстах на контрольных примерах. На контрольных примерах новые ошибки не обнаруживаются.
8	Экспериментальная эксплуатация	Поиск и исправление логических ошибок в исходных текстах на реальных данных без применения результатов работы системы на практике. На реальных данных новые ошибки практически не обнаруживаются, но считаются в принципе возможными.
9	Опытная эксплуатация	Поиск и исправление логических ошибок в исходных текстах на реальных данных с применением результатов работы системы на практике. На реальных данных новые ошибки не обнаруживаются и считаются недопустимыми.
10	Промышленная эксплуатация	Основной по длительности период, который продолжается до тех пор, пока система функционально устраивает Заказчика. У Заказчика появляется необходимость внесения количественных (косметических) изменений в систему на уровне п.5 (т.е. без изменения математической модели, структур данных и алгоритмов)
11	Заказные модификации системы	У Заказчика формируется потребность внесения качественных (принципиальных) изменений в систему на уровне п.3 и п.4, т.е. с изменениями в математической модели, структурах данных и алгоритмах
12	Разработка новых версий системы	Выясняется техническая невозможность или финансовая нецелесообразность разработки новых версий системы
13	Снятие системы с эксплуатации