Если управляющая система выясняет, что причинно-следственные связи некоторых образов неслучайны, то она запоминает это в своей базе знаний. Заметим, что такие «знания» управляющая система добывает самостоятельно, в этом проявляется ее автономность. Чем больше знаний о свойствах космического аппарата накопила управляющая система, тем более успешно она может управлять им. Если свойства космического аппарата изменяются, например, аппарат стал легче из-за выработки горючего или изменилась конфигурация аппарата — раскрылись антенны, изменились упругие свойства осцилляторов из-за поломки, появилась утечка газа и аппарат стало разворачивать, — управляющая система, обнаружив ухудшение качества управления, начинает переучиваться, корректирует свои знания, и качество управления вновь повышается. Если на аппарат воздействовать кратковременным возмущением (толкнуть его), управляющая система быстро гасит возмущение.
Одно свойство управляющей системы для нас оказалось неожиданным. После обучения управляющей системы, при котором на космический аппарат оказывают случайные пробные воздействия, качество управления вначале невысоко, но уже в процессе управления оно постепенно возрастает. Выяснилось, что свойства объекта управления зависят от того, каким способом вы его испытываете: обращаетесь ли с ним бесцеремонно, дергая его во все стороны, «тряся как грушу» в процессе исследования-обучения, или испытываете его осторожно. Это имеет прямую аналогию с жизненными ситуациями: так врач, бережно исследующий пациента, точнее поставит диагноз, нежели обращающийся с пациентом неделикатно. Оказалось также, что из обученной базы знаний можно извлечь самые важные знания и, представив их в удобной форме, передать более простой детерминированной системе управления, которая сможет управлять объектом, но уже без адаптации.
Важно, что с небольшими изменениями система Pilot может быть использована для управления и многими другими объектами: активными подвесками транспортных средств, стабилизаторами блоков питания и других энергетических установок, обрабатывающими станками и так далее.
По мере накопления знаний в базе знаний управляющей системы Pilot (количество цветных точек в верхнем прямоугольнике) растет качество управления космическим аппаратом: графики угла рассогласования (верхний) и угловой скорости (нижний) приближаются к нулю (горизонтальной черте).
«Тактик» — прототип системы поддержки принятия решений при управлении социальными объектами.
Метод автономного адаптивного управления может быть использован и для решения социальных задач.
По заказу Центра президентских программ мы исследовали возможность применения нашего метода в системе поддержки принятия решений при управлении социальными объектами. Сначала нас тревожило, возможно ли вообще представлять в цифровой форме состояния социального объекта. Но оказалось, что такая задача вполне решаема.
Следующая проблема возникла в связи с очень медленным поступлением входной информации, что крайне замедляло бы процесс накопления эмпирических знаний. Это натолкнуло нас на идею обучения системы по архивным данным. Эксперименты на архивных данных, описывающих социальные процессы в одном из районов Сибири, показали, что такое обучение возможно и после накопления необходимых знаний управляющая система может в некоторых ситуациях принимать эмпирически обоснованные решения.
Сравнив возможности системы «Тактик» с возможностями обычной нейросети, мы показали, что «Тактик», в отличие от нейросети, не только предсказывает некоторые события, но и предлагает на каждом шаге управляющие воздействия, которые способны улучшить текущую ситуацию.
Конечно, при управлении социальными объектами окончательные решения должны приниматься ответственными лицами. Задача управляющей системы — помочь выявить некоторые закономерности в развитии социальной ситуации, которые могут ускользнуть от взгляда человека.
В настоящее время наша группа работает и над другими системами управления, имеющими как практическое, так и теоретическое значение. Мы надеемся, что свойства созданных прототипов управляющих систем привлекут к ним внимание разработчиков объектов, которым требуется автономное адаптивное управление. Это в свою очередь поможет развивать его теорию и продвигаться по пути создания систем «автономного искусственного интеллекта».
Наши исследования финансировались, в частности, грантами Российского фонда фундаментальных исследований и Министерства науки и технологий РФ.