Для простоты будем полагать, что управляемая система
является инвариантной по времени детерминированной системой с конечным числом состояний. Именно каждое состояние , в котором система
находится в момент времени , , принадлежит заданному конечному множеству возможных состояний ; при этом входной сигнал в момент времени является элементом множества . Динамика системы во времени описывается уравнением состояния
в котором — заданная функция, отображающая в . Таким образом, представляет собой последующее состояние для при входном сигнале . Считается также, что заданы начальное состояние и фиксированное время окончания процесса .
Предполагается, что в каждый момент времени на входную переменную наложено нечеткое ограничение , являющееся нечетким множеством в с функцией принадлежности . Кроме того, считается, что цель — нечеткое множество в , определяемое функцией принадлежности . Задача заключается в нахождении максимизирующего решения.
Можно записать решение как нечеткое множество в в виде
где — нечеткое множество в , индуцируемое в . Для функции принадлежности имеем
где может быть выражено как функция от и
путем последовательного применения уравнения .
Для многошаговых процессов целесообразно представить решение в виде:
где — принятая "стратегия", или правило выбора входного воздействия в зависимости от состояния системы .
Таким образом, задача сводится к нахождению оптимальных стратегий и соответствующей последовательности входных воздействий , максимизирующих . Для решения применяется метод динамического программирования:
где
может рассматриваться как функция принадлежности нечеткой цели в момент , индуцированной заданной целью в момент .
Повторяя процесс обратных итераций, получаем систему рекуррентных уравнений
где , которая дает решение задачи. Таким образом, максимизирующее решение достигается последовательной максимизацией величин , причем
определяется как функция от .
В качестве простого примера рассмотрим систему с тремя состояниями , и и двумя входными сигналами и .
Пусть и нечеткая цель в момент времени определяется функцией принадлежности, принимающей значения
Пусть далее, нечеткие ограничения в моменты и
задаются функциями
1 | 3 | 1 | |
2 | 1 | 3 |