Оптимальна поведінка системи. Оптимальна поведінка в ієрархічних системах захарів, Віктор Васильович

Під принципом оптимальності розуміється та сукупність правил, з яких ЛПР визначає свою дію (рішення, альтернативу, стратегію, управлінське рішення), найкраще сприяє досягненню поставленої їм мети. Принцип оптимальності вибирається з урахуванням конкретних умов прийняття рішення: кількості учасників, їх можливостей та цілей, характеру зіткнення інтересів (антагонізм, неантагонізм, кооперація тощо).

У моделях прийняття рішення, особливо в теорії ігор, розроблено велику кількість формальних принципів оптимальної поведінки. Ми тут зупинимося лише на деяких із них.

Принцип максимізації (мінімізації). Такий принцип застосовується, здебільшого в задачах математичного програмування (див. (2) - (4)).

Принцип згортання критеріїв.Застосовується при "оптимізації" багатьох критеріїв одним координуючим центром (завдання багатокритеріальної оптимізації (5)). Для кожного з критеріїв (цільових функцій)

f 1 (u),...,f n (u)

експертним шляхом призначаються "ваги" (числа)

причому α i показує "важливість або значущість" критерію f. Далі рішення x* з безлічі допустимих рішень Х вибирається так, щоб максимізувати (або мінімізувати) згортку критеріїв:

Принцип лексикографічної переваги.Це ще один принцип оптимальності у задачах багатокритеріальної оптимізації. Спочатку критерії ранжуються за "важливістю". Нехай таке ранжування складено:

f 1 (x), f 2 (x), ..., f n (x)

Рішення х*Х "краще" рішення хХ у сенсі лексикографічної переваги, якщо виконано одну з n+1 умов:

    f 1 (x*)>f 1 (x);

    f 1 (x *) = f 1 (x), f 2 (x *)> f 2 (x);

    f 1 (x *) = f 1 (x), f 2 (x *) = f 2 (x), f 3 (x *)> f 3 (x);

………………

    f i (x *) = fi (x) для i = 1, ..., n-1, f n (x *)> f n (x);

n+1) f i (x *) = fi (x) для i = 1, ..., n.

Принцип мінімаксу.Застосовується при зіткненні інтересів двох протиборчих сторін (антагоністичний конфлікт). Кожне ЛПР спочатку кожної своєї стратегії (альтернативи) обчислює " гарантований " результат, потім остаточно вибирає ту стратегію, на яку цей результат найбільший проти іншими його стратегіями. Така дія не дає ЛВР "максимальний виграш", однак є єдиним розумним принципом оптимальності в умовах антагоністичного конфлікту. Зокрема, виключено будь-який ризик.

Принцип рівновагиЦе узагальнення принципу мінімаксу, коли у взаємодії беруть участь багато сторін, які мають кожен свою мету (прямого протистояння немає). Нехай число ЛПР (учасників неантагоністичного конфлікту) є n. Набір обраних стратегій (ситуація) x 1 *, x 2 *, ..., x n * називається рівноважним, якщо одностороннє відхилення будь-якого ЛПР від цієї ситуації може призвести хіба лише до зменшення його "виграшу". У ситуації рівноваги учасники не одержують «максимального» виграшу, але вони змушені дотримуватись її.

Принцип оптимальності за Парето.Цей принцип передбачає як оптимальні ті ситуації (набори стратегій х 1 ,…,x n), у яких поліпшення «виграшу» окремого учасника неможливе без погіршення «виграшів» інших учасників. Цей принцип ставить слабкі вимоги до поняття оптимальності, ніж принцип рівноваги. Тому Парето-оптимальні ситуації є майже завжди.

Принцип недомінованих результатів. Цей принцип є представником багатьох принципів оптимальності в кооперативних іграх (колективне ухвалення рішень) і призводить до поняття "ядра" рішень. Усі учасники об'єднуються та спільними узгодженими діями максимізують «загальний виграш». Принцип недомінованості -один із принципів "справедливого" розподілу між учасниками. Це та ситуація, коли жоден із учасників не може аргументовано заперечити проти пропонованого розподілу (елемента "ядра"). Існують інші принципи «оптимального» розподілу загального сумарного виграшу.

Принципистійкості(Загрозиіконтрзагрози).Ідея всіх принципів стійкості на основі загроз та контрзагроз полягає в наступному. Кожна коаліція учасників висуває свою пропозицію, супроводжуючи її реальною загрозою: якщо пропозиція не буде прийнята рештою учасників, то будуть вжиті такі дії, які погіршують становище решти учасників і не погіршують (можливо покращують) становище загрозливої ​​коаліції. Оптимальним вважається те рішення, в умовах якого проти будь-якої загрози будь-якій коаліції знайдеться контрзагроза з боку якоїсь коаліції.

Арбітражні схеми. Економічні конфлікти наводять на думку про "суспільний арбітр". Небажано, щоб зіткнення інтересів переходили, наприклад, відкриті загрози та контрзагрози. Повинні існувати соціальні механізми, які дозволяли б враховувати переваги та стратегічні можливості кожного учасника та забезпечили б "справедливе" вирішення конфлікту. Такий попередній механізм, чи це окрема особа чи система голосування, називається арбітром. Теоретично ігор оптимальне, у сенсі арбітражної схеми, рішення будується з допомогою системи аксіом, які включають такі поняття, як статус-кво, оптимальність по Парето, лінійність альтернатив, незалежність від " рангів " тощо.

Розглянемо далі питання оптимального ухвалення рішення в умовах невизначеності. Для вироблення оптимальної поведінки ЛПР таку ситуацію корисно моделювати, як антагоністичну гру двох осіб, де як противник ЛПР розглядається природа. Остання наділяється всіма можливими у умовах можливостями.

В "іграх з природою" існують свої специфічні (хоча й нагадують принцип мінімаксу) принципи раціонального вибору рішення.

Принцип останнього песимізму (критерій Вальда). Відповідно до цього принципу гра з природою (прийняття рішення в умовах невизначеності) ведеться як гра з розумним, агресивним противником, який робить все для того, щоб завадити нам досягти успіху. Оптимальною вважається стратегія ЛПР, за якої гарантується виграш, не менший, ніж "дозволений природою".

Принцип мінімаксного ризику (критерій Севіджа). Цей принцип також песимістичний, але за виборі оптимальної стратегії радить орієнтуватися не так на "виграш", але в ризик. Ризик визначається як різницю між максимальним виграшем ЛПР (за умови повної інформації про стан природи) та реальним виграшем (при незнанні стану природи). Як оптимальна вибирається та стратегія, при якій величина ризику мінімальна.

Принцип песимізму - оптимізму (критерії Гурвіца).Цей критерій рекомендує при виборі рішення не керуватися ні крайнім песимізмом («завжди розраховуй на гірше!»), ні крайнім оптимізмом («а може крива вивезе!»). Причому «вага» вибирається із суб'єктивних міркувань про небезпеку ситуацій.

Динамічна стійкість концепції.Усі викладені вище принципи оптимальності сформульовані щодо статичних завдань ухвалення рішення. Спроба застосування в динамічних завданнях може супроводжуватися всілякими ускладненнями.

Головне - це особливості динамічних процесів. Потрібно, щоб той чи інший принцип оптимальності, обраний у початковому стані процесу (у початковий момент часу), залишався оптимальним у будь-якому поточному стані(у будь-який час) остаточно динамічного процесу. Цей принцип називається динамічною стійкістю.

Здійснюється з урахуванням структурно-динамічного підходу. Найважливішими розділами етології є:

  1. морфологія поведінки - опис та аналіз елементів поведінки (поз та рухів);
  2. функціональний аналіз - аналіз зовнішніх та внутрішніх факторів поведінки;
  3. порівняльні дослідження - еволюційно-генетичний аналіз поведінки [Дерягіна, Бутовська, 1992, с. 6].

В рамках системного підходу поведінка визначається як система взаємопов'язаних компонентів, що забезпечує інтегровану оптимальну відповідь організму при взаємодії із середовищем; це процес, що відбувається у певному проміжку часу [Дерягіна, Бутовська 1992, с.7]. Як компонент системи виступають «зовнішні» рухові реакції організму, що виникають у відповідь на зміну навколишнього середовища. Об'єктом етологічних досліджень є як інстинктивні форми поведінки, і ті, пов'язані з тривалим процесів навчання (соціальні традиції, гарматна діяльність, неритуальні форми комунікації).

Сучасний аналіз поведінки будується на наступних принципах: 1) ієрархічність; 2) динамічність; 3) кількісний облік; 4) системний підхід, що враховує, що форми поведінки між собою тісно взаємопов'язані.

Поведінка організована за ієрархічним принципом. У системі поведінки тому виділяють різні рівні інтеграції:

  1. елементарні рухові акти;
  2. пози та рухи;
  3. послідовності взаємопов'язаних поз та рухів;
  4. ансамблі, представлені комплексами ланцюгів процесів;
  5. функціональні сфери – комплекси ансамблів, пов'язані з конкретним типом активності [Панов, 1978].

Центральною властивістю системи поведінки є впорядкована взаємодія її компонентів задля досягнення кінцевої мети. Взаємозв'язок забезпечується за допомогою ланцюгів переходів між елементами і може розглядатися як специфічний етологічний механізм функціонування цієї системи [Дерягіна, Бутовська, 1992, с. 9].

Основні концепції та методи етології людини запозичені з етології тварин, але адаптовані з урахуванням унікального становища людини серед інших представників тваринного царства. Важливою особливістю етології, на відміну культурної антропології, є застосування методів прямого невключенного спостереження (хоча методи включеного спостереження також використовуються). Спостереження організуються таким чином, щоб спостерігач не підозрював про це, або не здогадувався про мету спостережень, що проводяться. Традиційним об'єктом дослідження етологів є поведінка, властива людині як виду. Етологія людини особлива увагаприділяє аналізу універсальних проявів невербальної поведінки. Другим аспектом досліджень є аналіз моделей соціальної поведінки(агресії, альтруїзму, соціального домінування, батьківської поведінки).

Цікавим є питання про межі індивідуальної та культурної мінливості поведінки. Спостереження за поведінкою можуть вестись і в лабораторії. Але в цьому випадку найчастіше йдетьсяпро прикладну етологію (застосування етологічних методів у психіатрії, у психотерапії або для експериментальної перевірки конкретної гіпотези). [Самохвалов та ін., 1990; Cashdan, 1998; Grummer та ін, 1998].

Якщо вихідно етологія людини концентрувалася на питаннях про те, як і наскільки запрограмовані людські вчинки та дії, що вело до протиставлення філогенетичних адаптацій процесам індивідуального навчання, то в даний час приділяється увага вивченню моделей поведінки в різних культурах (і субкультурах), аналізу процесів формування поведінки у процесі індивідуального розвитку. Отже, на етапі ця наука вивчає як поведінка, має філогенетичне походження, а й враховує, як поведінкові універсалі можуть трансформуватися у межах культури. Остання обставина сприяла розвитку тісної співпраці етологів із мистецтвознавцями, архітекторами, істориками, соціологами та психологами. В результаті такого співробітництва показано, що унікальні етологічні дані можуть бути отримані шляхом ретельного аналізу історичних матеріалів: літописів, епосу, хронік, літератури, преси, живопису, архітектури та інших предметів мистецтва [Eibl-Eibesfeldt, 1989; Dunbar et а1, 1995; Dunbar, Spoors, 1995].

Рівні соціальної складності

У сучасній етології вважається очевидним, що поведінка окремих особин у соціальних тварин і людини багато в чому залежить від соціального контексту [Нindе, 1990]. Соціальний вплив є комплексним. Тому Р. Хайндом було запропоновано виділити кілька рівнів соціальної складності. Крім окремого індивіда, виділяється рівень соціальних взаємодій, взаємовідносин, рівень групи та рівень соціуму. Всі рівні надають взаємний вплив один на одного і розвиваються під постійним впливом фізичного середовища та культури. Слід чітко розуміти, що закономірності функціонування поведінки на складнішому соціальному рівні не зводяться до суми проявів поведінки на нижчому рівні організації. Для пояснення поведінкового феномена кожному рівні потрібно окрема додаткова концепція. Так, агресивні взаємодії між сиблінгами аналізуються з урахуванням безпосередніх стимулів, що лежать в основі цієї поведінки, тоді як агресивна природа відносин між сиблінгами може розглядатися з точки зору концепції «конкуренції сиблінгів».

Поведінка окремого індивіда в рамках зазначеного підходу розглядається як наслідок його взаємодії з іншими членами групи. Передбачається, що кожна з особин, що взаємодіють, має певні уявлення про можливий наказ партнера в даній ситуації. Необхідні уявлення особин отримує з урахуванням попереднього досвіду спілкування коїться з іншими представниками свого виду. Контакти двох незнайомих особин, які мають чітко ворожий характер, часто обмежуються лише серіями демонстрацій. Такого спілкування буває достатньо, щоб один із партнерів визнав себе переможеним та продемонстрував підпорядкування. Якщо конкретні особини взаємодіяли багато разів, то між ними виникають певні взаємини, що здійснюються на загальному тлі соціальних контактів. Соціальне середовище і для людини, і для тварин є своєрідною оболонкою», яка оточує особин і трансформує вплив на них фізичного середовища. Соціальність у тварин можна розглядати як універсальну адаптацію до середовища проживання. Чим складніше та гнучкіша соціальна організація, тим велику рольвона грає у захисті особин цього виду. Пластичність соціальної організації могла бути базовою адаптацією наших спільних з шимпанзе і бонобо предків, що забезпечила вихідні передумови гомінізації [Бутовська, Файнберг, 1993].

Найважливішою проблемою сучасної етології є пошук причин, через які соціальні системи тварин і людини завжди структуровані, причому найчастіше за ієрархічним принципом. Реальна роль концепції домінування розуміння суті соціальних зв'язків у соціумі постійно дискутується. Мережі відносин між особами описуються у тварин і людини у поняттях споріднених та репродуктивних зв'язків, систем домінування, індивідуальної вибірковості. Вони можуть перекриватися (наприклад, рангові, споріднені та репродуктивні відносини), але можуть і існувати незалежно один від одного (наприклад, мережі відносин підлітка в сім'ї та школі з однолітками у сучасному людському суспільстві).

Зрозуміло, слід з усією обережністю застосовувати прямі паралелі при порівняльному аналізі поведінки тварин і людини, бо всі рівні соціальної складності впливають один на одного. Багато видів людської діяльності специфічні і носять символічний характер, зрозуміти який можна, лише володіючи знаннями щодо соціального досвіду даного індивідуума та особливостей соціально-культурної структури суспільства [Еibl-Eibesfeldt, 1989], проте, незаперечною гідністю етологічного підходу при обговоренні проблем спадкоємності принципу соціальної організації є уніфікованість методів оцінки та опису поведінки приматів, включаючи людину, що дозволяє об'єктивно оцінювати базові параметри подібності та відмінності. Схема Р. Хайнда дозволяє усунути основні непорозуміння між представниками біологічних та соціальних наук щодо можливостей порівняльного аналізу поведінки людини та тварин і передбачити, на яких рівнях організації можна шукати реальну схожість.

Організаційна діяльність. Альтернативні парадигми організаційного процесу.

Все різноманіття підходів до організаційної діяльності можна подати у вигляді двох альтернативних парадигм (табл. 5.1). Наведені парадигми відбивають два принципово різних підходи до організаційної діяльності. Перший можна умовно назвати підходом примусу, коли для створення та підтримки необхідно докладати зусиль. Щойно ці зусилля припиняються, система повертається до вихідного стану. Можна конструювати скільки завгодно багато штучних організаційних схем, але вони будуть неміцними та неефективними. Історія знає чимало таких прикладів: колгоспи, раднаргоспи, виробничі об'єднання тощо.

Таблиця 5.1

Альтернативні парадигми організаційного процесу

Другий підхід орієнтований на природні процеси організації, що розвивається досить довго, щоб дати місце та волевиявленню людини. Цілі людини, що випадають із діапазону природного розвитку (наприклад, створення колгоспів), приречені на провал, хоч би які ресурси залучалися для їх досягнення. Разом з тим тут немає фаталізму – людина з її цілеспрямованою та вольовою діяльністю не виключається з процесу розвитку, треба лише виконати умову: простір цілей людини має співпадати з діапазоном напрямів природного (можливого у принципі) розвитку. Орієнтацію на природний розвиток можна знайти і в дослідженнях А. Сміта, який стверджував, що для соціально-економічного розвитку суспільства необхідні мир, легкі податки та толерантність в управлінні, а решта зробить природний перебіг речей.

Система управління – кібернетичний підхід. Принципи управління: принцип розімкнутого управління; принцип розімкнутого управління з компенсацією збурень; принцип замкнутого керування; принцип одноразового керування.

Організація як процес організовування – одне з основних функцій управління. Під функцією управління розуміють сукупність повторюваних управлінських процесів, об'єднаних єдністю змісту. Оскільки організація (як процес) служить функцією управління, будь-яке управління є організаційну діяльність, хоча й зводиться лише до неї.

Управління – особливим чином орієнтований вплив на систему, що забезпечує надання їй необхідних властивостей чи станів. Одним із атрибутів стану є структура.

Організувати – отже, передусім створити (чи змінити) структуру.

За відмінностей у підходах до побудови систем управління існують загальні закономірності, розроблені в кібернетиці. З позицій кібернетичного підходу система управління є цілісну сукупність суб'єкта управління (керуюча система), об'єкта управління (керована система), а також прямих і зворотних зв'язків між ними. Передбачається також, що система управління взаємодіє із зовнішнім середовищем.

Базовою класифікаційною ознакою побудови систем управління, що визначає вид системи та її потенційні можливості, спосіб організації контуру управління. Відповідно до останнього виділяють кілька принципів організації контуру управління.

Принцип розімкнутого (програмного) управління.В основі цього принципу лежить ідея автономного на систему незалежно від умов її роботи. Очевидно, що область практичного застосування цього принципу передбачає достовірність знання стану середовища проживання і системи по всьому інтервалі її функціонування. Тоді можна визначити реакцію системи на розрахований вплив, який заздалегідь програмується у вигляді функції (рис. 5.1).

Мал. 5.1. Принцип розімкнутого управління

Якщо це вплив відмінно від передбачуваного, негайно підуть відхилення характері зміни вихідних координат, тобто. система виявиться незахищеною від збурень у вихідному значенні цього слова. Тому подібний принцип використовується за впевненості у достовірності відомостей про умови роботи системи. Наприклад, для організаційних систем подібна впевненість допустима за високої виконавської дисципліни, коли віддане розпорядження не потребує подальшого контролю. Іноді таке керування називають директивним. Безперечною перевагою такої схеми управління є простота організації управління.

Принцип розімкнутого управління з компенсацією збурень.Зміст підходу полягає у прагненні ліквідувати обмеженість першої схеми, тобто. нерегульований вплив збурень на функціонування системи. Можливість компенсації обурень, отже, ліквідація недостовірності апріорної інформації виходить з доступності обурень вимірам (рис. 5.2).


Мал. 5.2. Принцип компенсаційного управління

Вимірювання збурень дозволяє визначити компенсуюче управління, що парирує наслідки збурень. Зазвичай поруч із коригуючим управлінням система піддається програмному впливу. Однак на практиці далеко не завжди вдається зафіксувати інформацію про зовнішні обурення, не кажучи вже про контроль відхилень параметрів системи або несподіваних структурних змін. За наявності інформації про збурення принцип їх компенсації шляхом запровадження компенсуючого управління становить практичний інтерес.

Принцип замкненого керування.Розглянуті вище принципи ставляться до класу розімкнених контурів управління: величина управління залежить від поведінки об'єкта, а є функцію часу чи обурення. Клас замкнутих контурів управління утворюють системи з негативним зворотним зв'язком, що втілюють базовий принципкібернетики.

У цих системах заздалегідь програмується не вхідний вплив, а необхідне стан системи, тобто. наслідок на об'єкт, зокрема управління. Отже, можлива ситуація, коли обурення позитивно впливає на динаміку системи, якщо наближає її до бажаного. Для реалізації принципу апріорно знаходиться програмний закон зміни стану системи у часі Спр(t), а завдання системи формулюється як забезпечення наближення дійсного стану до бажаного (рис. 5.3). Вирішення цього завдання досягається визначенням різниці між бажаним станом і дійсним:

∆С(t) = Спр(t) – С(t).


Рис 5. 3 Принцип замкнутого управління

Ця різниця використовується для управління, покликаного звести до мінімуму виявлену неузгодженість. Тим самим забезпечується наближення регульованої координати до програмної функції незалежно від причин, що викликали появу різниці, чи це обурення різного походження, чи помилки регулювання. Якість управління позначається на характері перехідного процесу і помилці, що встановилася - розбіжності програмного і дійсного кінцевого стану.

Залежно від вхідного сигналу теорії управління розрізняють:

■ системи програмного регулювання (розглянутий випадок);

■ системи стабілізації, коли cпр(t) = 0;

■ системи стеження, коли вхідний сигнал апріорно невідомий.

Ця деталізація ніяк не позначається на реалізації принципу, але вносить специфіку в техніку побудови системи.

Широке поширення цього принципу в природних та штучних системах пояснюється продуктивністю організації контуру: завдання управління ефективно вирішується на концептуальному рівні завдяки запровадженню негативного зворотного зв'язку.

Розглянуто випадок програмування зміни часу стану системи Спр(t),що означає попередній розрахунок траєкторії у просторі станів. Але з поля зору випало питання, як це зробити. Відповідь лімітується двома вимогами до траєкторії, яка повинна:

1) проходити через мету;

2) задовольняти екстремуму критерію якості, тобто. бути оптимальною.

У формалізованих динамічних системах для відшукання такої траєкторії залучається апарат варіаційного обчислення чи його сучасні модифікації: принцип максимуму Л. Понтрягіна чи динамічне програмування Р. Беллмана. У разі, коли завдання зводиться до пошуку невідомих параметрів (коефіцієнтів) системи, її вирішення залучаються методи математичного програмування – потрібно знайти екстремум функції якості (показника) у просторі параметрів. Для вирішення проблем, що погано формалізуються, залишається сподіватися на евристичні рішення, засновані на футурологічних прогнозах, або на результати імітаційного математичного моделювання. Точність таких рішень оцінити складно.

Повернемося до задачі програмування. Якщо існує спосіб розрахунку програмної траєкторії для формалізованих завдань, то природно вимагати від системи управління, щоб вона задовольнялася цілевказівкою, а програмна змінастану системи знаходила безпосередньо у процесі управління (термінальне управління). Така організація системи, звісно, ​​ускладнить алгоритм управління, але дозволить звести до мінімуму вихідну інформацію, отже, зробить управління оперативнішим. Подібне завдання у 1960-х роках. була теоретично вирішена професором Є. Горбатовим для управління рухом балістичних ракетта космічних апаратів.

Щодо постановки та вирішення завдання оптимального управління слід враховувати таку важливу обставину.

Вибрати оптимальну поведінку системи можна, тільки якщо достовірно відомі поведінка об'єкта, що вивчається, на всьому інтервалі управління та умови, в яких відбувається рух.

Оптимальні рішення можуть бути отримані і при виконанні інших додаткових припущень, але справа якраз у тому, що кожен випадок слід обговорити особливо, рішення буде справедливо “з точністю до умов”.

Проілюструємо сформульоване положення на прикладі поведінки бігуна, що прагне досягти високого результату. Якщо йдеться про коротку дистанцію (100, 200 м), то підготовлений спортсмен має на меті забезпечити максимальну швидкість у кожний момент часу. При бігу на довші дистанції успіх визначається його вмінням правильно розподіляти сили на трасі, а для цього він повинен чітко представляти свої можливості, рельєф маршруту та особливості суперників. В умовах обмежених ресурсів ні про яку максимальної швидкостіу кожний момент не може йти й мови.

Цілком очевидно, що наведене обмеження виконується лише рамках детермінованої постановки завдання, тобто. коли апріорно все достовірно відомо. Такі умови виявляються надмірними для реальних завдань: прокрустово ложе детермінізму не відповідає дійсним умовам функціонування системи. Апріорність нашого знання надзвичайно сумнівна як щодо самої системи, так і середовища та її взаємодії з тим чи іншим об'єктом. Достовірність апріорних відомостей тим менше, що складніше система, що ні додає оптимізму дослідникам, які проводять процедуру синтезу.

Подібна невизначеність призвела до появи цілого напрямку теорії управління, що базується на обліку стохастичних умов існування системи. Найбільш конструктивні результати були отримані при розробці принципів адаптивних систем, що самоналаштовуються.

Оптимізація керування. Адаптивні та самоналаштовуються, системи.

Адаптивні системи дозволяють справлятися з невизначеністю шляхом отримання додаткової інформації про стан об'єкта та його взаємодію із середовищем у процесі управління з подальшою перебудовою структури системи та зміною її параметрів при відхиленні умов роботи від апріорно відомих (рис. 5.4). При цьому, як правило, мета трансформацій полягає у наближенні характеристик системи до апріорних, які використовувалися при синтезі управління. Таким чином, адаптація орієнтована збереження гомеостазу системи за умов збурень.


Мал. 5.4. Адаптивна система

Однією із найскладніших конструктивних складових цього завдання є отримання відомостей про стан середовища, без чого важко проводити адаптацію.

Прикладом успішного отримання інформації про стан середовища може бути винахід трубки Піто, якої забезпечені практично всі літальні апарати. Трубка дозволяє виміряти швидкісний напір. найважливішу характеристикувід якої залежать безпосередньо всі аеродинамічні сили. Результати виміру використовуються для налаштування автопілота. Аналогічну роль у соціальних системахграють соціологічні опитування, що дозволяють коригувати вирішення внутрішньо- та зовнішньополітичних проблем.

p align="justify"> Ефективним прийомом вивчення динаміки об'єкта управління є метод дуального управління, колись запропонований А. Фельдбаумом. Суть його полягає в тому, що на об'єкт поряд з командами управління подаються спеціальні сигнали, що тестують, реакція на які заздалегідь встановлена ​​для апріорної моделі. По відхилення реакції об'єкта від еталонної судять про взаємодію моделі із зовнішнім середовищем.

Подібний прийом використовувався у російській контррозвідці під час Першої світової війни для виявлення шпигуна. Виділялося коло співробітників, підозрюваних у зраді, і кожному з цього кола “довірялася” важлива, але хибна інформація, що має унікальний характер. Спостерігалася реакція противника, якою і ідентифікувався зрадник.

Від адаптивних систем відрізняють клас самонастроювання систем. Останні у процесі адаптації налаштовуються. Однак на прийнятому рівні спільності структура системи, що самоналаштовується, аналогічна структурі адаптивної системи (див. рис. 5.4).

Щодо процесів адаптації та самоналаштування можна відзначити, що їхня можливість у конкретних випадках в основному визначається призначенням системи та її технічним втіленням. Подібна теорія систем рясніє ілюстраціями, але, здається, не містить узагальнюючих досягнень.

Інший шлях подолання недостатності апріорних даних про процес управління полягає у поєднанні процесу управління з процедурою його синтезу. Традиційно алгоритм управління є результатом синтезу, що базується на допущенні детермінованого опису моделі руху. Але очевидно, що відхилення в русі прийнятої моделі позначаються на точності досягнення мети та якості процесів, тобто. призводять до відхилення від екстремуму критерію. Звідси випливає, що будувати управління потрібно як термінальне, розраховуючи траєкторію в реальному часі та оновлюючи відомості про модель об'єкта та умови руху. Звичайно, і в даному випадкунеобхідно екстраполювати умови руху на весь інтервал управління, що залишився, але в міру наближення до мети точність екстраполяції зростає, а значить, підвищується якість управління.

У цьому видно аналогію з діями уряду, який не в змозі виконувати планові завдання, наприклад, бюджетні. Умови функціонування економіки змінюються нерозрахунковим чином, з порушенням прогнозів, тому доводиться постійно коригувати намічений план у прагненні досягти підсумкових показників, зокрема виробляти секвестр. Відхилення від апріорних припущень може бути настільки великі, що існуючими ресурсами і заходами управління не можна забезпечити виконання мети. Тоді доводиться "наближати" мету, розміщуючи її всередині нової області досяжності. Зазначимо, що описана схема справедлива лише стійкої системи. Низька якістьОрганізація управління може призвести до дестабілізації і, як наслідок, до руйнування всієї системи.

Зупинимося ще одному принципі управління, що лежить в основі розвиненої теорії дослідження операцій.

Принцип одноразового керування. Широке коло практично значущих завдань передбачає необхідність здійснити одноразовий акт управління, а саме – прийняти деяке рішення, наслідки якого позначаються тривалий час. Вочевидь, і традиційне управління можна інтерпретувати як послідовність разових рішень. Тут ми знову стикаємося з проблемою дискретності та безперервності, межа між якими так само розмита, як і між статичними та динамічними системами. Однак різниця все-таки існує: у класичній теорії управління виходять із того, що вплив на систему є процес, функція часу чи параметрів стану, а не одноразова процедура.

Інший відмінною особливістюдослідження операцій і те, що це наука оперує з управліннями – константами, параметрами системи. Тоді якщо в динамічних завданнях як критерій використовується математична конструкція - функціонал, що оцінює рух системи, то в дослідженні операцій критерій має вигляд функції, заданої на безлічі параметрів системи, що досліджуються.

Область практичних завдань, що охоплюється дослідженням операцій, дуже широка і включає заходи щодо розподілу ресурсів, вибору маршрутів, складання планів, управління запасами, чергами в задачах масового обслуговування та ін. , цілі, критерії, управління. Також формулюється і вирішується проблема оптимізації, яка перебуває у знаходженні екстремуму критерії функції у просторі параметрів. Завдання вирішуються як у детермінованій, так і в стохастичній постановках.

Оскільки процедура оперування з константами значно простіше, ніж дії з функціями, теорія дослідження операцій виявилася більш просунутою, ніж загальна теоріясистем та, зокрема, теорія управління динамічними системами. Дослідження операцій пропонує більший арсенал математичних засобів, Іноді дуже витончених, на вирішення широкого кола практично значущих завдань. Вся сукупність математичних методів, які обслуговують дослідження операцій, отримала назву математичного програмування. Так було в рамках дослідження операцій розвивається теорія прийняття рішень – надзвичайно актуальне напрям.

Теорія прийняття рішень по суті розглядає процедуру оптимізації умов детального опису векторного критерію та особливості встановлення його екстремального значення. Так, постановки завдання характерний критерій, що з кількох складових, тобто. багатокритеріальне завдання.

Щоб підкреслити суб'єктивізм критерію та процесу прийняття рішення, в розгляд вводиться особа, яка приймає рішення (ЛІР), що має індивідуальний погляд на проблему. При вивченні рішень формальними методами це проявляється через систему переваг щодо оцінки тієї чи іншої складової критерію.

Як правило, для прийняття рішення ЛПР отримує кілька варіантів дій, кожен з яких оцінюється. Такий підхід максимально наближено до реальних умов дій відповідального суб'єкта в організаційній системі при виборі одного з варіантів, підготовлених апаратом. За кожним з них стоїть опрацювання (аналітичне, імітаційне математичне моделювання) можливого ходурозвитку подій із аналізом кінцевих результатів – сценарій. Для зручності ухвалення відповідальних рішень організуються ситуаційні кімнати, обладнані наочними засобами відображення сценаріїв на екранах або екранах. І тому залучаються фахівці (операціоналісти), які мають як математичними методами аналізу ситуацій і підготовки прийняття рішень, а й предметної областю.

Зрозуміло, що результатом застосування об'єкта теорії дослідження операцій, зокрема, і теорії прийняття рішень, є певний оптимальний план дій. Отже, на вхід деякого блоку, "начиненого" оптимізаційним алгоритмом і побудованого із застосуванням відповідного методу математичного програмування моделі ситуації, подається інформація: початковий стан, мета, критерій якості, перелік параметрів, що варіюються, обмеження. (Модель системи використовується при побудові алгоритму.) Вихід блоку і є план. З погляду кібернетики така побудова класифікується як розімкнений контур управління, оскільки вихідна інформація не впливає на вхідний сигнал.

У принципі, розглянутий підхід можна застосувати й у разі замкнутого управління. Для цього необхідно організувати ітераційний процес у часі: після реалізації плану ввести новий стан системи як початкову умову і повторити цикл. Якщо дозволяє завдання можна скоротити плановий період за рахунок наближення мети до початкового стану системи. Тоді проглядається аналогія пропонованих дій із розглянутою вище ітераційною процедурою термінального управління, що також базується на періодичному оновленні вихідної інформації. Більше того, динамічну задачу, що оперує з процесами, можна звести до апроксимації функцій функціональними рядами. При цьому змінними, що варіюються, будуть вже параметри таких рядів, а значить, застосуємо апарат теорії дослідження операцій. (Подібне здійснено теорії ймовірностей, коли випадкові процеси описуються канонічним розкладанням.)

Викладена методологія почала знаходити застосування теорії штучного інтелекту при синтезі ситуаційного управління.

Слід зазначити небезпеку, пов'язану з практичним застосуванням теорії прийняття рішень недостатньо компетентними в теорії систем особами. Так, часто в організаційних системах ( державні установи, фірмах, фінансових організаціях) прийняття рішення абсолютизують та зводять до оперування численними показниками та оптимального здійснення разового управлінського акту. При цьому з поля зору упускають наслідки виробленої дії для системи, забувають, що керують не критерієм, а системою, не враховуючи багатостадійність замкнутого процесу – від системи до її стану, далі через показники до рішення та знову до системи. Звичайно, на цьому довгому шляху робиться безліч помилок, об'єктивних та суб'єктивних, яких вже достатньо для серйозного відхилення від планових результатів.

При УМОВІ Cq -^

Дослідження розв'язання задачі для малих значень вагового множника у функціоналі (6.6) є суттєвим інтересом з точки зору оцінки гранично досяжної точності замкнутої системи при несуттєвості обмежень на інтенсивність (потужність) управління. Крім того, є важливим оцінити той максимальний рівеньпотужності керуючого впливу, перевищення якого не призводить до подальшого збільшення точності керування.

Основні положення дослідження граничної поведінки оптимальної системи за умови з 0 - 0 представимо у формі наступного затвердження.

Теорема 6.3. Для замкнутої системи (6.4), (6.7), яка оптимальна у сенсі функціоналу (6.6), справедливі співвідношення

Тут використані такі додаткові позначення:

причому поліном B*(s) є гурвицевим, а комплексні числа(3, Р 2, ..., Р п -це загальне коріння поліномів M(s) і B * (-s).

Доказ.Введемо позначення і за аналогією з формулами (6.26), (6.27) запишемо співвідношення

де gj (i = l,n)- Коріння полінома G '(-s, 7.).

З урахуванням (6.42)-(6.44) формули (6.13)-(6.15) можуть бути подані у такому вигляді:

Очевидно, що розгляд граничної поведінки замкнутої системи за умови з 0 -> 0 еквівалентнорозгляду її граничної поведінки за умови X-> сю.

Перш ніж переходити до безпосереднього доказу тверджень теореми, розглянемо граничну поведінку коренів полінома G*(-s,X) у тотожності (6.43) за зазначеною умовою.

З цією метою скористаємося відомим твердженням, представленим у роботі, відповідно до якого при прагненні X-> 00 m коренів полінома G*(-s,X)прагнуть до коріння полінома B*(-s)-Негурвіцева результату факторизації:

Інші (п - т)коріння полінома G*(-s,X)за умови X-> °о йдуть у нескінченність, асимптотично наближаючись до прямих, що перетинаються на початку координат і утворюють з речовинною віссю кути, що визначаються виразом

причому все це коріння розташоване на колі радіуса

З урахуванням зазначених міркувань маємо
де використані позначення

причому постійні коефіцієнти /с, (/ =,п-т-) не залежать від величини X,

Тепер послідовно розглянемо два можливі варіантипо відношенню до поліномM pb (-s)у розкладанні (6.41), що відповідно характеризуються умовамиМ РЬ=1 іМ РЬ Ф 1.

Варіант 1. Припустимо, що виконується умоваM p b(~ s) =1, яка еквівалентна рівності Г) = 0. Це означає, що поліномВ"(-s) не має спільних коренів з поліномом M(s) = B"(-

Розглянемо граничну поведінку поліномаR(s,X)(6.47) за умовиX ->° °, попередньо помітивши, що

З (6.50) випливає, щоткоренів полінома limG f (-s, X)збігаються з корінням (3, (/ = 1,т) поліномаB*(-s), а решта(п – т)

коріння - з корінням р г (г =т + 1, п)поліномаP(-s,X)(6.53), які визначаються такими виразами:

При цьому з очевидністю виконуються співвідношення

Враховуючи співвідношення (6.50) та (6.54)-(6.56), граничний поліномR(s, X)можна подати у вигляді суми двох граничних поліномівR^SyX)іR 2 (s, X):

Перший з цих поліномів пов'язаний тільки з корінням (3, а другий - тільки з корінням р:

Відповідно (6.56) маємо lim Р(-|3-Д) = ГолокХ1 , тому вираже-

ня (6.57) можна подати у вигляді або

оскільки, згідно з формулами (6.51), (6.53),

Зауважимо, що поліном B,*(s) має кінцеві коефіцієнти, відмінні від нуля в силу умови М(Р,.)*0 і залежні від X.

Тепер перетворимо співвідношення (6.58), нагадавши такі рівні: deg A(s) =п, Sj(s) =N(s)/T(s), degN(s) =p, degT(s) =q. Крім того, врахуємо, що умова degB"(-s) = degB"(s) =т,як неважко показати, тягне за собою виконання співвідношення

Тоді маємо

Але з формули (6.55) з урахуванням співвідношення (6.60) випливає: та згідно (6.56), (6.51):

дег*іг**(/ = m + 1,н) – комплексні числа з кінцевими модулями, відмінними від нуля. Тоді отримуємо

і відповідно

В силу (6.50)-(6.53) та (6.55) маємо:

причому постійні комплексні числа r; , r u , r 2i , і , k 2i , ... , k(n - m -2 )i = + 1,і) не залежать від величини А,.

Тоді, враховуючи справедливість нерівності п-т> 1 (інакше Pj(s,X) = const), маємо lim ?)(s,A)/A = 0 і згідно з формулою (6.61)

Але тоді відповідно до тотожностей (6.59) і (6.62) отримуємо

При цьому, відповідно (6.45) і (6.46), маємо наступні формули для граничних передавальних матриць оптимальної замкнутої системи:

Варіант 2Тепер розглянемо другу ситуацію, коли тотожність М b (-s) = 1 не виконується, тобто. в даному випадку вважаємо, що поліноми В"(-s)і M(s) = B"(-s)RC(s) мають Г) загальних коренів.

При цьому поліном B-s)представляється твором де

На відміну від попереднього випадку, під час розгляду граничної поведінки полінома R(s,X)подаємо його у вигляді суми трьохдоданків:

причому перший поліном будуватимемо тільки звикористанням коренів (3, (/ = 1, Г)) полінома M pb (-s),другий - коріння Р г (I = Т) +1,ш) полінома B" Q (-s) і третій - коріння ц г (i = m + l,n) полінома P(s).

При цьому для другого та третього поліномів, у повній аналогії з попереднім варіантом, отримаємо

Для полінома R xмаємо

оскільки М (РД = 0 Vie.

З наведених формул (6.67)-(6.69) випливає тотожність lim Kj(s,A,) = B* 2 (s), та, замінюючи в (6.64) поліном B[(s)на B* 2 (s),

отримаємо другий варіант граничних передавальних матриць для оптимальної замкнутої системи. Об'єднуючи обидва варіанти єдиним записом, отримаємо співвідношення (6.37)-(6.41).

Теорему доведено повністю. ?

Наведемо природне наслідок теореми 6.3, яке має самостійне значення.

Теорема 6.4.Якщо все коріння полінома *(-s)є одночасно і корінням полінома M(s) =B"(-s)RC(s),і при цьому виконується рівністьRyR = 0,то I x0= Нш1 х (з 0) = 0, тобто.

за умови, що обмеження на потужність керуючого впливу не менше величини 1 і 0 =Нш7 1((з 0),визначається формою-

лой (6.37 а), досяжна абсолютна (з нульовою помилкою) точність управління.

Доказ. Відповідно до умови теореми, на підставі тотожності (6.41) має місце співвідношення Г) =т,але тоді з формули (6.40) випливає тотожністьR"(s) = 0 .

При цьому виконання рівності RyR = 0 відповідно до формул (6.38), (6.39) та (6.37), (6.37а) та з урахуванням (6.41) дає

де. Теорему доведено. ?

Розглянемо таку окрему ситуацію.

Теорема 6.5.Якщо матрицяRє діагональною з єдиним відмінним від нуля елементом r pp = 1, тобто точність замкнутої системи визначається дисперсією р-йкомпоненти векторах,то мають місце такі співвідношення:

а)якщо поліном В р(s)є гурвіцевим або всі його «праві» корені входять до спектру коренів полінома C p (s), то

б)якщо поліном B p (s) має хоча б один корінь у правій напівплощині, який не є коренем полінома C p (s), то

причому тут враховуються формули (6.37а) та (6.39)-(6.41) (в даному випадку маємо р

Доказ. З формули (6.18) випливає, що матриця 7(5) = }

 

Можливо, буде корисно почитати: