Optimalno obnašanje sistema. Optimalno obnašanje v hierarhičnih sistemih Zakharov, Viktor Vasilijevič

Načelo optimalnosti razumemo kot tisto množico pravil, s pomočjo katerih odločevalec določi svoje delovanje (odločitev, alternativo, strategijo, odločitev upravljanja), ki najbolje prispeva k doseganju njegovega cilja. Načelo optimalnosti se izbere glede na specifične pogoje odločanja: število udeležencev, njihove sposobnosti in cilje, naravo nasprotja interesov (antagonizem, neantagonizem, sodelovanje itd.).

V modelih odločanja, predvsem v teoriji iger, je bilo razvitih veliko število formalnih principov optimalnega obnašanja. Tu se bomo osredotočili le na nekatere od njih.

Načelo maksimizacije (minimizacije). To načelo velja v predvsem pri problemih matematičnih programov (glej (2) - (4)).

Načelo konvolucije kriterijev. Uporablja se pri »optimizaciji« več kriterijev s strani enega koordinacijskega centra (problem večkriterijske optimizacije (5)).Za vsakega od kriterijev (ciljne funkcije)

f 1 (u),...,f n (u)

»uteži« (številke) dodelijo strokovnjaki

kjer α i prikazuje "pomembnost ali pomen" merila. Nato je rešitev x* iz nabora izvedljivih rešitev X izbrana tako, da se poveča (ali zmanjša) konvolucija meril:

Načelo leksikografske prednosti. To je še en princip optimalnosti pri problemih večkriterijske optimizacije. Najprej so kriteriji razvrščeni po "pomembnosti". Naj bo naslednja lestvica:

f 1 (x),f 2 (x),...,f n (x)

Rešitev x*X je »boljša« od rešitve xX v smislu leksikografske preference, če je izpolnjen eden od n+1 pogojev:

    f 1 (x*)>f 1 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)>f 2 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)=f 2 (x), f 3 (x*)>f 3 (x);

………………

    f i (x*)=f i (x) za i=1,…,n-1, f n (x*)>f n (x);

n+1) f i (x*)=f i (x) za i=1,…,n.

Minimax princip. Uporablja se v primeru trčenja interesov dveh nasprotujočih si strani (antagonistični konflikt). Vsak odločevalec najprej izračuna »zajamčen« rezultat za vsako svojo strategijo (alternativo), nato pa na koncu izbere strategijo, za katero je ta rezultat največji v primerjavi z drugimi njegovimi strategijami. Takšen ukrep odločevalcu ne daje »največjega dobička«, ampak je edino razumno načelo optimalnosti v razmerah antagonističnega konflikta. Zlasti je izključeno vsako tveganje.

Načelo ravnotežja. To je posplošitev načela minimaksa, ko v interakciji sodeluje več strani, ki zasledujejo vsaka svoj cilj (neposrednega soočenja ni). Naj bo število odločevalcev (udeležencev v neantagonističnem konfliktu) n. Niz izbranih strategij (situacija)x 1 *,x 2 *,…,x n * se imenuje ravnovesje, če Enostransko odstopanje katerega koli odločevalca od te situacije lahko privede le do zmanjšanja lastne »dobičke«. V ravnotežni situaciji udeleženci ne prejmejo "največjega" izplačila, vendar so se ga prisiljeni držati.

Paretov princip optimalnosti. To načelo predpostavlja kot optimalne tiste situacije (množice strategij x 1,...,x n), v katerih je izboljšanje "izplačila" posameznega udeleženca nemogoče brez poslabšanja "izplačila" drugih udeležencev. To načelo postavlja manjše zahteve glede koncepta optimalnosti kot načelo ravnotežja. Zato Pareto-optimalne situacije skoraj vedno obstajajo.

Načelo nedominantnih izidov. To načelo je reprezentativno za številna načela optimalnosti v kooperativnih igrah (kolektivno odločanje) in vodi do koncepta "jedra" odločitev. Vsi udeleženci se združijo in s skupnimi usklajenimi akcijami povečajo »skupni dobiček«. Načelo nedominacije je eno od načel »pravične« delitve med udeleženci. To je situacija, ko nihče od udeležencev ne more razumno ugovarjati predlagani delitvi (»jedrni« element). Obstajajo tudi druga načela za »optimalno« delitev celotnega skupnega dobitka.

Načelatrajnost(grožnjeinprotigrožnje). Ideja za vsemi načeli odpornosti proti grožnjam je naslednja. Vsaka koalicija udeležencev poda svoj predlog in ga pospremi z resnično grožnjo: če predloga ne sprejmejo preostali udeleženci, bodo sprejeti ukrepi, ki poslabšajo položaj drugih udeležencev in ne poslabšajo (morda izboljšajo) položaja grozeče koalicije. Optimalna rešitev je tista, pri kateri proti vsaki grožnji kateri koli koaliciji obstaja protigrožnja neke koalicije.

Arbitražne sheme. Gospodarski konflikti kažejo na idejo o "družbenem razsodniku". Ni zaželeno, da navzkrižje interesov postane na primer odkrita grožnja in protigrožnja. Obstajati morajo družbeni mehanizmi, ki bi omogočali upoštevanje preferenc in strateških zmožnosti vsakega udeleženca in zagotavljali »pravično« rešitev konflikta. Tak vnaprejšnji mehanizem, bodisi posameznik ali glasovalni sistem, se imenuje arbiter. V teoriji iger je optimalna rešitev v smislu arbitražne sheme konstruirana z uporabo sistema aksiomov, vključno s koncepti, kot so status quo, Pareto optimalnost, linearnost alternativ, neodvisnost od "rangov" itd.

Nadalje razmislimo o vprašanjih optimalnega odločanja v pogojih negotovosti. Za razvoj optimalnega vedenja odločevalca je koristno takšno situacijo modelirati kot antagonistično igro dveh oseb, kjer je narava obravnavana kot nasprotnik odločevalca. Slednji je obdarjen z vsemi možnostmi, ki si jih je mogoče zamisliti v danih pogojih.

»Igre z naravo« imajo svoje specifične (čeprav spominjajo na princip minimaksa) principe optimalne izbire rešitve.

Načelo skrajnega pesimizma (Waldov kriterij). Po tem principu se igra z naravo (odločanje v pogojih negotovosti) igra kot igra z razumnim, agresivnim nasprotnikom, ki naredi vse, da nam prepreči uspeh. Strategija odločevalca velja za optimalno, če zagotavlja dobiček, ki ni manjši od tistega, ki ga »dovoljuje narava«.

Načelo minimalnega tveganja (Savagejev kriterij). To načelo je tudi pesimistično, vendar pri izbiri optimalne strategije svetuje, da se ne osredotočite na "zmago", ampak na tveganje. Tveganje je definirano kot razlika med največjim dobičkom odločevalca (ob popolni informaciji o stanju v naravi) in realnim dobičkom (ob nepoznavanju stanja v naravi). Optimalna strategija je tista, pri kateri je tveganje minimalno.

Načelo pesimizma - optimizem (Hurwitzev kriterij). To merilo priporoča, da vas pri izbiri rešitve ne vodi niti skrajni pesimizem (»vedno računajte na najslabše!«) niti skrajni optimizem (»mogoče vas krivulja ponese!«). tehtano povprečje med dobitkoma skrajnega pesimizma in skrajnega optimizma je maksimirano. Poleg tega je "teža" izbrana na podlagi subjektivnih premislekov o nevarnosti situacij.

Koncept dinamične stabilnosti. Vsa zgornja načela optimalnosti so oblikovana glede na statične probleme odločanja. Poskus njihove uporabe v dinamičnih problemih lahko spremljajo najrazličnejši zapleti.

Glavna stvar so značilnosti dinamičnih procesov. Potrebno je, da eno ali drugo načelo optimalnosti, izbrano v začetnem stanju procesa (v začetni točki časa), ostane optimalno v vsakem trenutku. trenutno stanje(kadar koli) do konca dinamičnega procesa. To načelo se imenuje dinamična stabilnost.

Izvaja se na podlagi strukturno-dinamičnega pristopa. Najpomembnejši deli etologije so:

  1. morfologija vedenja - opis in analiza elementov vedenja (drže in gibi);
  2. funkcionalna analiza - analiza zunanjih in notranjih dejavnikov vedenja;
  3. primerjalne študije - evolucijska genetska analiza vedenja [Deryagina, Butovskaya, 1992, str. 6].

V okviru sistemskega pristopa je vedenje opredeljeno kot sistem medsebojno povezanih komponent, ki zagotavlja celosten optimalen odziv telesa pri interakciji z okoljem; to je proces, ki se zgodi v določenem časovnem obdobju [Deryagina, Butovskaya 1992, str.7]. Sestavni deli sistema so "zunanje" motorične reakcije telesa, ki nastanejo kot odziv na spremembe v okolju. Predmet etološkega raziskovanja so tako instinktivne oblike vedenja kot tiste, povezane z dolgotrajnimi učnimi procesi (družbene tradicije, orodna dejavnost, neobredne oblike komunikacije).

Sodobna analiza vedenja temelji na po načelih: 1) hierarhija; 2) dinamičnost; 3) kvantitativno računovodstvo; 4) sistematičen pristop ob upoštevanju, da so oblike vedenja med seboj tesno povezane.

Vedenje je organizirano po hierarhičnem principu. Zato se v vedenjskem sistemu razlikujejo različne stopnje integracije:

  1. osnovna motorična dejanja;
  2. drže in gibanja;
  3. zaporedja med seboj povezanih položajev in gibov;
  4. ansambli, ki jih predstavljajo kompleksi akcijskih verig;
  5. funkcionalne sfere so kompleksi ansamblov, povezanih z določeno vrsto dejavnosti [Panov, 1978].

Osrednja lastnost vedenjskega sistema je urejeno medsebojno delovanje njegovih komponent za doseganje končnega cilja. Odnos je zagotovljen z verigami prehodov med elementi in ga je mogoče obravnavati kot poseben etološki mehanizem za delovanje tega sistema [Deryagina, Butovskaya, 1992, str. 9].

Osnovni koncepti in metode etologije človeka so izposojeni iz etologije živali, vendar so prilagojeni tako, da upoštevajo edinstven položaj človeka med drugimi člani živalskega kraljestva. Pomembna značilnost etologije, v nasprotju s kulturno antropologijo, je uporaba metod neposrednega neudeleženega opazovanja (čeprav se uporabljajo tudi metode sodelujočega opazovanja). Opazovanja so organizirana tako, da opazovani tega ne posumi oziroma nima pojma o namenu opazovanj. Tradicionalni predmet proučevanja etologov je vedenje, značilno za ljudi kot vrsto. Človeška etologija Posebna pozornost se osredotoča na analizo univerzalnih manifestacij neverbalnega vedenja. Drugi vidik raziskave je analiza modelov socialno vedenje(agresija, altruizem, družbena dominantnost, starševsko vedenje).

Zanimivo je vprašanje o mejah individualne in kulturne variabilnosti vedenja. Vedenjska opazovanja je mogoče opraviti tudi v laboratoriju. Toda v tem primeru najpogosteje govorimo o o aplikativni etologiji (uporaba etoloških metod v psihiatriji, psihoterapiji ali za eksperimentalno preverjanje določene hipoteze). [Samokhvalov et al., 1990; Cashdan, 1998; Grummer et al, 1998].

Če se je sprva človeška etologija osredotočala na vprašanja o tem, kako in v kolikšni meri so človeška dejanja in dejanja programirana, kar je vodilo v nasprotje filogenetskih prilagoditev procesom individualnega učenja, je zdaj pozornost namenjena preučevanju vedenjskih vzorcev v različnih kulturah (in subkultur), analiza procesov oblikovanja vedenja v procesu individualnega razvoja. Tako ta znanost na sedanji stopnji ne proučuje le vedenja, ki ima filogenetski izvor, ampak upošteva tudi, kako se lahko vedenjske univerzalije preoblikujejo znotraj kulture. Slednja okoliščina je prispevala k razvoju tesnega sodelovanja med etologi in umetnostnimi zgodovinarji, arhitekti, zgodovinarji, sociologi in psihologi. Kot rezultat takšnega sodelovanja se je pokazalo, da je mogoče pridobiti edinstvene etološke podatke s temeljito analizo zgodovinskega gradiva: kronik, epov, kronik, literature, tiska, slikarstva, arhitekture in drugih umetniških predmetov [Eibl-Eibesfeldt, 1989; Dunbar et al, 1995; Dunbar, Spoors, 1995].

Stopnje družbene kompleksnosti

V sodobni etologiji velja za očitno, da je vedenje posameznih osebkov pri družbenih živalih in ljudeh v veliki meri odvisno od družbenega konteksta [Hinde, 1990]. Družbeni vpliv je kompleksen. Zato je R. Hind predlagal opredelitev več ravni družbene kompleksnosti. Poleg posameznika ločimo raven socialnih interakcij, odnosov, skupinsko raven in raven družbe. Vse ravni med seboj vplivajo in se razvijajo pod stalnim vplivom fizičnega okolja in kulture. Jasno je treba razumeti, da vzorcev vedenja, ki delujejo na kompleksnejši družbeni ravni, ni mogoče reducirati na vsoto manifestacij vedenja na nižji ravni organizacije. Za razlago vedenjskih pojavov na vsaki ravni je potreben ločen komplementarni koncept. Tako se agresivne interakcije med brati in sestrami analizirajo ob upoštevanju neposrednih dražljajev, ki so v ozadju tega vedenja, medtem ko je agresivno naravo odnosov med brati in sestrami mogoče obravnavati z vidika koncepta »konkurence med brati in sestrami«.

Vedenje posameznika v okviru tega pristopa obravnavamo kot posledico njegove interakcije z drugimi člani skupine. Predpostavlja se, da ima vsak od posameznikov v interakciji določene predstave o verjetnem poveljevanju partnerja v dani situaciji. Posameznik prejme potrebne ideje na podlagi predhodnih izkušenj komuniciranja z drugimi predstavniki svoje vrste. Stiki med dvema neznanima posameznikoma, ki so očitno sovražne narave, so pogosto omejeni le na niz demonstracij. Takšna komunikacija je pogosto dovolj, da eden od partnerjev prizna poraz in pokaže pokornost. Če so določeni posamezniki večkrat sodelovali, se med njimi pojavijo določeni odnosi, ki se nadaljujejo splošno ozadje socialni stiki. Družbeno okolje tako za človeka kot za živali je nekakšna lupina,« ki obdaja posameznike in preoblikuje vpliv fizičnega okolja nanje. Socialnost pri živalih lahko razumemo kot univerzalno prilagajanje okolju. Bolj kot je družbena organizacija kompleksna in prožna, več velika vloga ima vlogo pri zaščiti osebkov določene vrste. Plastičnost družbene organizacije bi lahko služila kot osnovna prilagoditev naših skupnih prednikov s šimpanzi in bonobi, kar je zagotovilo začetne predpogoje za hominizacijo [Butovskaya, Fainberg, 1993].

Najpomembnejši problem sodobne etologije je iskanje razlogov, zakaj so družbeni sistemi živali in ljudi vedno strukturirani, največkrat po hierarhičnem principu. O resnični vlogi koncepta dominance za razumevanje bistva družbenih povezav v družbi se nenehno razpravlja. Mreže odnosov med posamezniki so pri živalih in ljudeh opisane v smislu sorodstvenih in reproduktivnih vezi, sistemov dominance in individualne selektivnosti. Lahko se prekrivajo (na primer rang, sorodstvo in reproduktivni odnosi), lahko pa obstajajo tudi neodvisno drug od drugega (na primer mreže odnosov med najstnikom v družini in šoli z vrstniki v sodobni človeški družbi).

Pri uporabi neposrednih vzporednic v primerjalni analizi vedenja živali in človeka je seveda treba biti zelo previden, saj vse ravni družbene kompleksnosti vplivajo druga na drugo. Številne vrste človekovih dejavnosti so specifične in simbolične narave, ki jih je mogoče razumeti le s poznavanjem družbenih izkušenj določenega posameznika in značilnosti družbeno-kulturne strukture družbe [Eibl-Eibesfeldt, 1989]. Nesporna prednost etološkega pristopa pri obravnavi problemov kontinuitete načel družbene organizacije je poenotenje metod za ocenjevanje in opisovanje vedenja primatov, vključno s človekom, kar omogoča objektivno oceno osnovnih parametrov podobnosti in razlike. Shema R. Hinde nam omogoča, da odpravimo glavne nesporazume med predstavniki bioloških in družboslovnih ved glede možnosti primerjalne analize vedenja ljudi in živali ter predvidevamo, na katerih ravneh organizacije je mogoče iskati resnične podobnosti.

Organizacijske aktivnosti. Alternativne paradigme organizacijskega procesa.

Vso raznolikost pristopov k organizacijskim dejavnostim lahko predstavimo v obliki dveh alternativnih paradigem (tabela 5.1). Zgornje paradigme odražajo dva bistveno različna pristopa k organizacijski dejavnosti. Prvemu lahko grobo rečemo pristop prisile, ko je za ustvarjanje in vzdrževanje potreben napor. Takoj, ko se ta prizadevanja ustavijo, se sistem vrne v prvotno stanje. Konstruirate lahko kolikor želite umetnih organizacijskih shem, vendar bodo krhke in neučinkovite. Zgodovina pozna veliko takih primerov: kolektivne kmetije, gospodarski sveti, proizvodna združenja itd.

Tabela 5.1

Alternativne paradigme organizacijskega procesa

Drugi pristop je osredotočen na naravne procese organizacije, ki se razvijajo dovolj dolgo, da pustijo prostor človeški volji. Človeški cilji, ki ne spadajo v obseg naravnega razvoja (na primer ustvarjanje kolektivnih kmetij), so obsojeni na neuspeh, ne glede na to, kateri viri se uporabljajo za njihovo doseganje. Hkrati pa tukaj ni fatalizma - človek s svojim postavljanjem ciljev in voljno dejavnostjo ni izključen iz razvojnega procesa, izpolniti je treba le pogoj: prostor človekovih ciljev mora sovpadati z obsegom smeri. naravnega (načeloma možnega) razvoja. Usmerjenost k naravnemu razvoju najdemo tudi v študijah A. Smitha, ki je trdil, da so za socialno-ekonomski razvoj družbe nujni mir, nizki davki in toleranca v gospodarjenju, ostalo pa bo naredil naravni potek. stvari.

Sistem vodenja - kibernetski pristop. Principi regulacije: princip odprte zanke; odprtozančni princip krmiljenja s kompenzacijo motenj; princip krmiljenja z zaprto zanko; enosmerni princip krmiljenja.

Organizacija kot proces organiziranja je ena glavnih funkcij managementa. Funkcija upravljanja se razume kot niz ponavljajočih se dejanj upravljanja, ki jih združuje enotnost vsebine. Ker je organizacija (kot proces) funkcija upravljanja, je vsako upravljanje organizacijska dejavnost, vendar ni omejeno nanjo.

Krmiljenje je posebej usmerjen vpliv na sistem, ki zagotavlja, da ima zahtevane lastnosti ali stanja. Eden od državnih atributov je struktura.

Organizirati pomeni najprej ustvariti (ali spremeniti) strukturo.

Kljub razlikam v pristopih k izgradnji krmilnih sistemov obstajajo splošna načela, razvita v kibernetiki. Z vidika kibernetičnega pristopa je krmilni sistem celostna množica subjekta krmiljenja (kontrolnega sistema), krmilnega objekta (vodjenega sistema), pa tudi neposrednih in povratnih povezav med njima. Predpostavlja se tudi, da nadzorni sistem sodeluje z zunanjim okoljem.

Osnovna klasifikacijska značilnost za izgradnjo krmilnih sistemov, ki določa vrsto sistema in njegove potencialne zmožnosti, je način organizacije krmilne zanke. V skladu s slednjim je identificiranih več principov za organizacijo krmilne zanke.

Princip odprtozančnega (programskega) krmiljenja. To načelo temelji na ideji avtonomnega vpliva na sistem, ne glede na njegove pogoje delovanja. Očitno je, da obseg praktične uporabe tega načela predpostavlja zanesljivost poznavanja stanja okolja in sistema v celotnem obsegu njegovega delovanja. Nato je možno vnaprej določiti odziv sistema na izračunan vpliv, ki je vnaprej programiran v obliki funkcije (slika 5.1).

riž. 5.1. Načelo krmiljenja z odprto zanko

Če je ta učinek drugačen od pričakovanega, bodo takoj sledila odstopanja v naravi spremembe izhodnih koordinat, tj. sistem bo nezaščiten pred motnjami v izvirnem pomenu besede. Zato se podobno načelo uporablja, kadar obstaja zaupanje v zanesljivost informacij o pogojih delovanja sistema. Na primer, za organizacijske sisteme je takšno zaupanje sprejemljivo z visoko izvršilno disciplino, ko dani ukaz ne zahteva naknadnega nadzora. Včasih se ta vrsta upravljanja imenuje direktivno upravljanje. Nedvomna prednost te nadzorne sheme je preprostost organizacije upravljanja.

Princip odprtozančnega krmiljenja s kompenzacijo motenj. Vsebina pristopa je želja po odpravi omejitev prve sheme, tj. nereguliran vpliv motenj na delovanje sistema. Možnost kompenzacije motenj in s tem odprave nezanesljivosti apriornih informacij temelji na dostopnosti motenj meritvam (slika 5.2).


riž. 5.2. Načelo upravljanja nadomestil

Z merjenjem motenj je mogoče določiti kompenzacijsko regulacijo, ki odpravlja posledice motenj. Običajno je poleg korektivne kontrole sistem podvržen vplivu programske opreme. Vendar pa v praksi ni vedno mogoče zabeležiti informacij o zunanjih motnjah, da ne omenjamo spremljanja odstopanj v sistemskih parametrih ali nepričakovanih strukturnih sprememb. Če so informacije o motnjah na voljo, je praktično zanimiv princip njihove kompenzacije z uvedbo kompenzacijskega vodenja.

Načelo krmiljenja z zaprto zanko. Zgoraj obravnavana načela spadajo v razred odprtih regulacijskih zank: količina regulacije ni odvisna od obnašanja objekta, ampak je funkcija časa ali motenj. Razred zaprtih regulacijskih zank tvorijo sistemi z negativno povratno zvezo, ki vključujejo osnovno načelo kibernetika.

V takšnih sistemih ni vnaprej programiran vhodni učinek, temveč zahtevano stanje sistema, tj. posledica vpliva na objekt, vključno z nadzorom. Posledično je možna situacija, ko motnja pozitivno vpliva na dinamiko sistema, če njegovo stanje približa želenemu. Za uresničitev principa se vnaprej najde programski zakon za spreminjanje stanja sistema v času Spr(t), naloga sistema pa je oblikovana tako, da zagotovi, da se dejansko stanje približa želenemu (slika 5.3). Rešitev tega problema se doseže z določitvijo razlike med želenim stanjem in dejanskim:

∆С(t) = Ср(t) – С(t).


Slika 5. 3 Načelo krmiljenja z zaprto zanko

Ta razlika se uporablja za nadzor, da se zmanjša zaznano neujemanje. S tem je zagotovljeno, da se krmiljena koordinata približa programski funkciji, ne glede na razloge, ki so povzročili razliko, pa naj gre za motnje različnega izvora ali napake pri krmiljenju. Kakovost vodenja vpliva na naravo prehodnega procesa in ugotovljeno napako - neskladje med programiranim in dejanskim končnim stanjem.

Teorija krmiljenja razlikuje glede na vhodni signal:

■ programski krmilni sistemi (primer v obravnavi);

■ stabilizacijski sistemi, ko je cpr(t) = 0;

■ sistemi za sledenje, ko je vhodni signal vnaprej neznan.

Ta podrobnost na noben način ne vpliva na izvajanje principa, ampak vnaša specifičnost v tehniko gradnje sistema.

Široka razširjenost tega principa v naravnih in umetnih sistemih je razložena s produktivnostjo organizacije vezja: problem krmiljenja je učinkovito rešen na konceptualni ravni zaradi uvedbe negativnih povratnih informacij.

Obravnavan je primer programiranja časovnih sprememb stanja sistema Ср(t), kar pomeni predhodni izračun trajektorije v prostoru stanj. Toda vprašanje, kako to narediti, je padlo izpred oči. Odgovor je omejen z dvema zahtevama za trajektorijo, ki morata:

1) skozi tarčo;

2) zadoščajo ekstremu merila kakovosti, tj. biti optimalen.

V formaliziranih dinamičnih sistemih se za iskanje takšne trajektorije uporablja aparat variacijskega računa ali njegove sodobne modifikacije: maksimalni princip L. Pontryagina ali dinamično programiranje R. Bellmana. V primeru, da se problem zmanjša na iskanje neznanih parametrov (koeficientov) sistema, se za njegovo rešitev uporabljajo metode matematičnega programiranja - v prostoru parametrov je treba najti ekstrem funkcije kakovosti (indikatorja). Za reševanje slabo formaliziranih problemov se lahko zanesemo le na hevristične rešitve, ki temeljijo na futuroloških napovedih ali na rezultatih matematičnega simulacijskega modeliranja. Točnost takih odločitev je težko oceniti.

Vrnimo se k problemu programiranja. Če obstaja način za izračun trajektorije programa za formalizirane naloge, potem je naravno zahtevati od nadzornega sistema, da se zadovolji z določitvijo cilja in sprememba programske opreme najde stanje sistema neposredno med procesom krmiljenja (kontrola terminala). Takšna organizacija sistema bo seveda zapletla nadzorni algoritem, vendar bo omogočila minimizacijo začetnih informacij, kar pomeni, da bo nadzor učinkovitejši. Podobna naloga v šestdesetih letih 20. stoletja. je teoretično rešil profesor E. Gorbatov za nadzor gibanja balističnimi izstrelki in vesoljsko plovilo.

V zvezi s formulacijo in rešitvijo problema optimalnega vodenja je treba upoštevati naslednjo temeljno okoliščino.

Optimalno obnašanje sistema je mogoče izbrati le, če so zanesljivo znani obnašanje preučevanega predmeta v celotnem nadzornem intervalu in pogoji, pod katerimi se premika.

Optimalne rešitve lahko dobimo z izpolnjevanjem drugih, dodatnih predpostavk, vendar gre za to, da je treba navesti vsak primer posebej, rešitev bo veljavna »do pogojev«.

Naj navedeno stališče ponazorimo na primeru vedenja tekača, ki si prizadeva doseči visok rezultat. Če govorimo o kratki razdalji (100, 200 m), potem si treniran športnik zastavi cilj zagotavljanja največje hitrosti v vsakem trenutku. Pri teku na daljše razdalje uspeh določa njegova sposobnost pravilne razporeditve moči na progi, za to pa mora jasno razumeti svoje zmožnosti, teren trase in lastnosti svojih nasprotnikov. V razmerah omejenih virov ne največja hitrost v vsakem trenutku ne more biti govora.

Povsem očitno je, da je zgornja omejitev zadoščena le v okviru deterministične formulacije problema, tj. ko je vse a priori z gotovostjo znano. Takšni pogoji se izkažejo za pretirane za resnične probleme: Prokrustovo ležišče determinizma ne ustreza dejanskim pogojem delovanja sistema. Apriorna narava našega znanja je zelo dvomljiva tako v zvezi s samim sistemom kot okoljem in njegovo interakcijo s tem ali onim objektom. Bolj ko je sistem kompleksen, manj zanesljive so apriorne informacije, kar raziskovalcem, ki izvajajo sintezni postopek, ne vliva optimizma.

Takšna negotovost je privedla do nastanka celotne smeri v teoriji nadzora, ki temelji na upoštevanju stohastičnih pogojev obstoja sistema. Najbolj konstruktivni rezultati so bili doseženi pri razvoju principov prilagodljivih in samonastavljivih sistemov.

Optimizacija upravljanja. Prilagodljivi in ​​samonastavljivi sistemi.

Prilagodljivi sistemi omogočajo obvladovanje negotovosti s pridobivanjem dodatnih informacij o stanju objekta in njegovi interakciji z okoljem v procesu krmiljenja, čemur sledi prestrukturiranje strukture sistema in spreminjanje njegovih parametrov, ko pogoji delovanja odstopajo od vnaprej znanih. (slika 5.4). V tem primeru je praviloma cilj transformacij približati značilnosti sistema apriornim, ki se uporabljajo pri sintezi vodenja. Tako je prilagoditev osredotočena na vzdrževanje homeostaze sistema v pogojih motenj.


riž. 5.4. Prilagodljiv sistem

Ena najtežjih projektantskih komponent te naloge je pridobivanje informacij o stanju okolja, brez katerih je prilagajanje težko izvesti.

Primer uspešnega pridobivanja informacij o stanju okolja je izum Pitotove cevi, s katero so opremljeni skoraj vsi letala. Cev vam omogoča merjenje višine hitrosti - najpomembnejša lastnost, od katerega so neposredno odvisne vse aerodinamične sile. Rezultati meritev se uporabljajo za konfiguracijo avtopilota. Podobno vlogo v družbenih sistemov sociološke raziskave prispevajo k prilagajanju rešitev domačih in zunanjepolitičnih problemov.

Učinkovita tehnika za preučevanje dinamike krmilnega objekta je metoda dvojnega nadzora, ki jo je nekoč predlagal A. Feldbaum. Njegovo bistvo je, da se skupaj s krmilnimi ukazi na objekt pošljejo posebni testni signali, katerih reakcija je vnaprej nastavljena za apriorni model. Na podlagi odstopanja reakcije objekta od standardne se ocenjuje interakcija modela z zunanjim okoljem.

Podobno tehniko je med prvo svetovno vojno uporabila ruska protiobveščevalna služba za identifikacijo vohuna. Identificiran je bil krog zaposlenih, osumljenih izdaje, in vsakemu iz tega kroga so bile »zaupane« pomembne, a napačne informacije edinstvene narave. Opazovana je bila sovražnikova reakcija, po kateri je bil prepoznan izdajalec.

Razred samonastavljivih sistemov ločimo od prilagodljivih sistemov. Slednji se prilagodijo v procesu prilagajanja. Vendar pa je na sprejeti ravni splošnosti struktura samouravnavnega sistema podobna strukturi prilagodljivega sistema (glej sliko 5.4).

Glede procesov prilagajanja in samonastavljanja je mogoče ugotoviti, da je njihova možnost v konkretnih primerih odvisna predvsem od namena sistema in njegove tehnične izvedbe. Takšna sistemska teorija je polna ilustracij, vendar se zdi, da ne vsebuje posplošljivih dosežkov.

Drug način za premagovanje pomanjkanja apriornih podatkov o krmilnem procesu je kombinacija krmilnega procesa s postopkom za njegovo sintezo. Tradicionalno je krmilni algoritem rezultat sinteze, ki temelji na predpostavki determinističnega opisa modela gibanja. Očitno pa je, da odstopanja v gibanju sprejetega modela vplivajo na natančnost doseganja cilja in kakovost procesov, tj. vodijo do odstopanja od skrajnosti merila. Iz tega sledi, da je treba krmiljenje zgraditi kot terminalsko krmiljenje, ki izračunava trajektorijo v realnem času in posodablja podatke o objektnem modelu in prometnih razmerah. Seveda, v v tem primeru potrebno je ekstrapolirati vozne razmere za celoten preostali kontrolni interval, vendar ko se približujete cilju, se natančnost ekstrapolacije poveča, kar pomeni izboljšanje kakovosti nadzora.

To kaže na analogijo z delovanjem vlade, ki ne more izpolniti načrtovanih ciljev, na primer proračunskih. Pogoji delovanja gospodarstva se spreminjajo nenačrtovano, v nasprotju z napovedmi, zato je treba nenehno prilagajati načrtovani načrt, da bi dosegli končne kazalnike, zlasti za izvedbo sekvestracije. Odstopanja od apriornih predpostavk so lahko tako velika, da razpoložljivi viri in sprejeti ukrepi upravljanja ne morejo več zagotoviti doseganja cilja. Nato morate cilj »približati« in ga postaviti v novo območje dosegljivosti. Upoštevajte, da opisana shema velja le za stabilen sistem. Nizka kvaliteta Organizacija upravljanja lahko privede do destabilizacije in posledično do uničenja celotnega sistema.

Oglejmo si še eno načelo upravljanja, ki je osnova razvite teorije operacijskih raziskav.

Načelo enkratnega nadzora. Širok nabor praktično pomembnih nalog predpostavlja potrebo po izvedbi enkratnega dejanja upravljanja, in sicer sprejeti neko odločitev, katere posledice vplivajo dolgo časa. Tradicionalno upravljanje si seveda lahko razlagamo tudi kot zaporedje enkratnih odločitev. Tu se spet soočamo s problemom diskretnosti in kontinuitete, meja med katerima je enako zabrisana kot med statičnimi in dinamičnimi sistemi. Vendar razlika še vedno obstaja: v klasični teoriji vodenja se predpostavlja, da je vpliv na sistem proces, funkcija časa ali parametrov stanja, in ne enkraten postopek.

Še ena posebnost operacijske raziskave so, da ta znanost operira s kontrolami – konstantami, sistemskimi parametri. Potem, če se v dinamičnih problemih kot kriterij uporablja matematična konstrukcija - funkcional, ki ocenjuje gibanje sistema, potem ima kriterij v študiji operacij obliko funkcije, definirane na množici proučevanih parametrov sistema.

Področje praktičnih problemov, ki jih pokrivajo operacijske raziskave, je zelo obsežno in vključuje aktivnosti, kot so alokacija virov, izbira poti, načrtovanje, upravljanje zalog, upravljanje čakalnih vrst pri problemih čakalnih vrst itd. Pri reševanju relevantnih problemov se uporablja zgoraj opisana metodologija za njihov opis. uporablja se ob upoštevanju kategorij modela, stanja, ciljev, meril, upravljanja. Formuliran in rešen je tudi optimizacijski problem, ki sestoji iz iskanja ekstrema kriterijske funkcije v prostoru parametrov. Težave se rešujejo v determinističnih in stohastičnih formulacijah.

Ker je postopek operiranja s konstantami veliko enostavnejši od operiranja s funkcijami, se je izkazalo, da je teorija operacijskih raziskav naprednejša od splošna teorija sistemov in še posebej teorije vodenja dinamičnih sistemov. Operacijske raziskave ponujajo večji arzenal matematična orodja, včasih zelo sofisticiran, za reševanje širokega nabora praktično pomembnih problemov. Celoten nabor matematičnih metod, ki služijo operacijskim raziskavam, imenujemo matematično programiranje. Tako se v okviru operacijskih raziskav razvija teorija odločanja - izjemno relevantno področje.

Teorija odločanja v bistvu obravnava postopek optimizacije pogojev za podroben opis vektorskega kriterija in značilnosti določanja njegove ekstremne vrednosti. Tako je za formulacijo problema značilen kriterij, sestavljen iz več komponent, tj. večkriterijski problem.

Za poudarjanje subjektivnosti kriterija in procesa odločanja je v obravnavo vpeljan odločevalec (DDM) z individualnim pogledom na problem. Pri preučevanju rešitev s formalnimi metodami se to kaže v sistemu preferenc pri ocenjevanju ene ali druge komponente merila.

Praviloma za odločitev odločevalec prejme več možnosti za ukrepanje, od katerih je vsaka ocenjena. Ta pristop je čim bližje realnim pogojem delovanja odgovornega subjekta v organizacijskem sistemu pri izbiri ene od možnosti, ki jih pripravi aparat. Za vsakim od njih stoji študija (analitična, simulacijska matematično modeliranje) možna selitev razvoj dogodkov z analizo končnih rezultatov – scenarij. Za udobje sprejemanja kritičnih odločitev so organizirane situacijske sobe, opremljene z vizualnimi sredstvi za prikazovanje scenarijev na zaslonih ali zaslonih. V ta namen so vključeni strokovnjaki (operacionalisti), ki obvladajo ne le matematične metode analiziranja situacij in priprave odločitev, temveč tudi predmetno področje.

Jasno je, da je rezultat uporabe predvsem teorije operacijskega raziskovanja in teorije odločanja na objektu določen optimalen akcijski načrt. Posledično je vhod določenega bloka, "polnjenega" z optimizacijskim algoritmom in zgrajen z ustrezno metodo matematičnega programiranja situacijskega modela, opremljen z informacijami: začetno stanje, cilj, merilo kakovosti, seznam različnih parametrov, omejitve. (Pri konstruiranju algoritma se uporablja sistemski model.) Izhod bloka je želeni načrt. Z vidika kibernetike se takšna konstrukcija uvršča med odprto krmilno zanko, saj izhodna informacija ne vpliva na vhodni signal.

Načeloma lahko obravnavani pristop uporabimo tudi za primer zaprtozančnega vodenja. Da bi to naredili, je treba organizirati iterativni proces skozi čas: po izvedbi načrta uvesti novo stanje sistema kot začetni pogoj in ponoviti cikel. Če naloga dopušča, lahko obdobje načrtovanja skrajšate tako, da cilj približate začetnemu stanju sistema. Nato obstaja analogija med predlaganimi dejanji in zgoraj obravnavanim iterativnim postopkom krmiljenja terminala, ki prav tako temelji na občasnem posodabljanju začetnih informacij. Poleg tega je mogoče dinamični problem, ki operira s procesi, reducirati na aproksimacijo funkcij s funkcionalnimi serijami. V tem primeru bodo variabilne spremenljivke že parametri takih nizov, kar pomeni, da bo uporaben aparat teorije operacijskega raziskovanja. (To se naredi v teoriji verjetnosti, ko so naključni procesi opisani s kanoničnim raztezanjem.)

Začrtana metodologija se je začela uveljavljati v teoriji umetne inteligence v sintezi situacijskega managementa.

Opozoriti je treba na nevarnost, povezano s praktično uporabo teorije odločanja s strani oseb, ki niso dovolj usposobljene za sistemsko teorijo. Tako pogosto v organizacijskih sistemih ( državne institucije, podjetja, finančne organizacije) je odločanje absolutizirano in reducirano na operiranje s številnimi indikatorji in optimalno izvedbo enkratnega akta upravljanja. Ob tem izgubijo izpred oči posledice sprejetega ukrepa za sistem, pozabljajo, da ne upravljajo merila, ampak sistem, pri čemer ne upoštevajo večstopenjskega značaja zaprtega procesa – od sistema v svoje stanje, nato prek indikatorjev v rešitev in spet v sistem. Seveda je na tej dolgi poti storjenih veliko napak, objektivnih in subjektivnih, ki so že dovolj za resen odmik od načrtovanih rezultatov.

Pod POGOJEM Cq -^ O

Študija rešitve problema za majhne vrednosti utežnega faktorja v funkcionalu (6.6) je zelo zanimiva z vidika ocene največje dosegljive natančnosti sistema z zaprto zanko, ko omejitve intenzivnosti krmiljenja (moč) so nepomembne. Poleg tega se zdi pomembno oceniti to najvišja raven moč krmilnega delovanja, katere preseganje ne vodi do nadaljnjega povečanja natančnosti krmiljenja.

Glavne določbe študije mejnega obnašanja optimalnega sistema pod pogojem c 0 -»0 predstavimo v obliki naslednje izjave.

Izrek 6.3. Za zaprt sistem (6.4), (6.7), kar je glede funkcionalnosti optimalno (6.6), razmerja veljajo

Tu se uporablja naslednji dodatni zapis:

in polinom B*(i) je Hurwitz in kompleksna števila(3, Р 2 ,..., Р str so skupne korenine polinomov M(s) in B*(-i).

Dokaz. Uvedemo zapis in po analogiji s formulami (6.26), (6.27) zapišemo razmerja

Kje gj (i = l,n)- korenine polinoma G‘(-s,7.).

Ob upoštevanju (6.42)-(6.44) lahko formule (6.13)-(6.15) predstavimo v naslednji obliki:

Očitno je, da upoštevanje mejnega obnašanja sistema z zaprto zanko pod pogojem od 0 -> 0 enakovreden upoštevanje njegovega omejujočega obnašanja pod pogojem X-> syu.

Preden preidemo na neposredni dokaz izreka, razmislimo o omejevalnem obnašanju korenin polinoma G*(-s,X) v identiteti (6.43) pod podanim pogojem.

V ta namen bomo uporabili v delu predstavljeno znano izjavo, po kateri se pri stremljenju X-> 00 m korenine polinoma G*(-s,X) težijo k koreninam polinoma B*(-s)- rezultat Negurwitzeve faktorizacije:

Počitek (P - T) korenine polinoma G*(-s,X) glede na to X-> °о gredo v neskončnost, asimptotično se približujejo ravnim črtam, ki se sekajo v začetku koordinat in tvorijo kote z realno osjo, določeno z izrazom

in vse te korenine se nahajajo na krogu polmera

Ob upoštevanju zgornjih premislekov imamo
kjer se uporabljajo notacije

in konstantni koeficienti /с, (/ =,p-t-) niso odvisne od vrednosti X,

Zdaj pa poglejmo dva zaporedoma možne možnosti glede na polinomMpb(-s)v ekspanziji (6.41), za katero so značilni pogojiM rb=1 inM rb F 1.

Možnost 1. Predpostavimo, da je pogoj izpolnjenM p b(~ s) =1, kar je enakovredno enakosti Г) = 0. To pomeni, da je polinomIN"(-s) nima skupnih korenin s polinomom M(s) = B"(-

Oglejmo si omejitveno obnašanje polinomaR(s,X)(6,47).X ->°°, ob predhodni ugotovitvi, da

Iz (6.50) sledi, daTkorenine polinoma limG f (-s,X)sovpadajo s koreninami (3, (/ = 1,m) polinomaB*(-s), in ostalo(p - t)

korenine - s koreninami p g (g =t + 1,p)polinomP(-s,X)(6.53), ki so definirani z naslednjimi izrazi:

V tem primeru so razmerja očitno zadovoljna

Ob upoštevanju razmerij (6.50) in (6.54)-(6.56) je mejni polinomR(s, X)lahko predstavimo kot vsoto dveh mejnih polinomovR^SyX)inR2(s,X):

Prvi od teh polinomov je povezan samo s koreninami (3, drugi pa samo s koreninami p,:

Po (6.56) imamo lim Р(-|3-Д) = OrelX1, torej izraz

(6.57) lahko predstavimo v obliki oz

ker je po formulah (6.51), (6.53)

Upoštevajte, da ima polinom B,*(s) končne koeficiente, ki so različni od nič zaradi pogoja M(P,.)*0 in neodvisni od X.

Sedaj preoblikujemo relacijo (6.58) in se spomnimo naslednjih enačb: deg A(s) =p, Sj(s) =N(s)/T(s), degN(s) =str, degT(s) =q. Poleg tega upoštevamo, da je pogoj degB"(-s) = degB“(s) =T,kot je lahko pokazati, vključuje izpolnitev odnosa

Potem imamo

Toda iz formule (6.55) ob upoštevanju razmerja (6.60) sledi: in glede na (6.56), (6.51):

KjeG*inG**(/ = m + 1,н) - kompleksna števila s končnimi moduli, različnimi od nič. Potem dobimo

in temu primerno

Na podlagi (6.50)-(6.53) in (6.55) imamo:

in konstantna kompleksna števila r; , r u , r 2i , k i , k 2i , ... , k(n - m -2 )jaz (jaz= + 1,i) niso odvisne od vrednosti A.

Potem glede na veljavnost neenakosti p-t> 1 (sicer Pj(s,X) = const), imamo lim ?)(s,A)/A = 0 in po formuli (6.61)

Potem pa v skladu z identitetama (6.59) in (6.62) dobimo

V tem primeru imamo v skladu z (6.45) in (6.46) naslednje formule za mejne prenosne matrike optimalnega zaprtega sistema:

Možnost 2. Zdaj razmislite o drugi situaciji, ko je identiteta M b (-s) = 1 ni izpolnjena, tj. v tem primeru predpostavimo, da so polinomi IN"(-s) in M(s) = B"(-s)RC(s) imajo D) skupne korenine.

V tem primeru polinom B-s) je predstavljen z izdelkom, kjer

Za razliko od prejšnjega primera, ko upoštevamo omejevalno obnašanje polinoma R(s,X) predstavimo ga kot vsoto tri pogoji:

in zgradili bomo prvi polinom samo z z uporabo korenin (3, (/ = 1,Г)) polinoma Mpb(-i), drugi - korenine P g (I = T) +1, w) polinoma B" Q (-s) in tretji - korenine c g (i = m + l,n) polinom P(s).

V tem primeru za drugi in tretji polinom, v popolni analogiji s prejšnjo različico, dobimo

Za polinom Rx imamo

ker je M(RD = 0 Vie .

Iz danih formul (6.67)-(6.69) sledi identiteta lim Kj(s,A,) = B*2(s), in zamenjava polinoma v (6.64). B[(e) na B* 2 (s),

dobimo drugo različico mejnih prenosnih matrik za optimalni zaprtozančni sistem. Če združimo obe možnosti z enim zapisom, dobimo relacije (6.37)-(6.41).

Izrek je popolnoma dokazan. ?

Navedimo naravno posledico iz izreka 6.3, ki ima neodvisen pomen.

Izrek 6.4.Če so vse korenine polinoma B*(-s)so tudi korenine polinoma M(s) =B"(-s)RC(s),hkrati pa je enakost izpolnjenaRyR = 0,potem jaz x0= Nsh1 x (z 0) = 0, tiste.

pod pogojem, da omejitev moči krmilnega dejanja ni manjša od 1 in 0 =Nsh7 1((od 0),določena oblika-

loy (6.37 a), je možna absolutna (z ničelno napako) natančnost krmiljenja.

Dokaz. Po pogojih izreka, ki temelji na identiteti (6.41), velja relacija G) =T,potem pa iz formule (6.40) sledi istovetnostR"(s) = 0 .

V tem primeru izpolnjevanje enakosti RyR = 0 v skladu s formulami (6.38), (6.39) in (6.37), (6.37a) in ob upoštevanju (6.41) daje

Kje . Izrek je dokazan. ?

Razmislimo o naslednji konkretni situaciji.

Izrek 6.5.Če matrikoRje diagonala z enim neničelnim elementom r pp = 1, tj. določena je natančnost zaprtozančnega sistema disperzija p-th vektorske komponenteX,potem veljajo naslednje relacije:

A)če je polinom V р(s)je Hurwitz ali so vse njegove "desne" korenine vključene v spekter korenin polinoma C p (s), potem

b)če ima polinom B p (s) vsaj en koren v desni polravnini, ki ni koren polinoma C p (s), potem

in tukaj so upoštevane formule (6.37a) in (6.39)-(6.41) (v tem primeru imamo r

Dokaz. Iz formule (6.18) sledi, da je matrika 7(5) = }

 

Morda bi bilo koristno prebrati: