Comportamentul optim al sistemului. Comportament optim în sistemele ierarhice Zaharov, Viktor Vasilievich

Principiul optimității este înțeles ca acel set de reguli cu ajutorul căruia decidentul își determină acțiunea (decizie, alternativă, strategie, decizie de management) care contribuie cel mai bine la realizarea scopului său. Principiul optimității este ales în funcție de condițiile specifice de luare a deciziilor: numărul de participanți, capacitățile și obiectivele acestora, natura conflictului de interese (antagonism, non-antagonism, cooperare etc.).

În modelele decizionale, în special în teoria jocurilor, au fost dezvoltate un număr mare de principii formale ale comportamentului optim. Ne vom concentra aici doar pe câteva dintre ele.

Principiul maximizării (minimizării). Acest principiu se aplică în în principal în probleme de programare matematică (vezi (2) - (4)).

Principiul convoluției criteriilor. Este folosit la „optimizarea” mai multor criterii de către un centru de coordonare (problema de optimizare multicriterială (5)). Pentru fiecare dintre criterii (funcții obiective)

f 1 (u),...,f n (u)

„greutățile” (numerele) sunt atribuite de experți

unde α i arată „importanța sau semnificația” criteriului. Apoi, soluția x* din mulțimea de soluții fezabile X este selectată astfel încât să maximizeze (sau să minimizeze) convoluția criteriilor:

Principiul preferinței lexicografice. Acesta este un alt principiu al optimității în problemele de optimizare multicriterială. În primul rând, criteriile sunt clasificate după „importanță”. Să se facă următoarea clasare:

f 1 (x),f 2 (x),...,f n (x)

Soluția x*X este „mai bună” decât soluția xX în sensul preferinței lexicografice dacă este îndeplinită una dintre n+1 condiții:

    f 1 (x*)>f 1 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)>f 2 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)=f 2 (x), f 3 (x*)>f 3 (x);

………………

    f i (x*)=f i (x) pentru i=1,…,n-1, f n (x*)>f n (x);

n+1) f i (x*)=f i (x) pentru i=1,…,n.

Principiul Minimax. Este folosit atunci când interesele a două părți opuse se ciocnesc (conflict antagonic). Fiecare factor de decizie calculează mai întâi un rezultat „garantat” pentru fiecare dintre strategiile sale (alternative), apoi selectează în cele din urmă strategia pentru care acest rezultat este cel mai mare în comparație cu celelalte strategii ale sale. O astfel de acțiune nu oferă decidentului „câștigul maxim”, ci este singurul principiu rezonabil al optimității în condițiile unui conflict antagonic. În special, orice risc este exclus.

Principiul echilibrului. Aceasta este o generalizare a principiului minimax, când multe părți participă la interacțiune, fiecare urmărindu-și propriul scop (nu există confruntare directă). Fie numărul factorilor de decizie (participanți la un conflict neantagonic) n. Un set de strategii alese (situație)x 1 *,x 2 *,…,x n * se numește echilibru dacă O abatere unilaterală a oricărui decident de la această situație nu poate duce decât la o scădere a propriului „câștig”. Într-o situație de echilibru, participanții nu primesc o răsplată „maximă”, dar sunt forțați să-l respecte.

Principiul optimității Pareto. Acest principiu presupune ca fiind optime acele situații (seturi de strategii x 1,...,x n) în care îmbunătățirea „retribuției” unui participant individual este imposibilă fără deteriorarea „rambursării” celorlalți participanți. Acest principiu face cereri mai slabe asupra conceptului de optimitate decât principiul echilibrului. Prin urmare, situațiile Pareto-optime există aproape întotdeauna.

Principiul rezultatelor nedominate. Acest principiu este reprezentativ pentru multe principii de optimitate în jocurile cooperative (luarea colectivă a deciziilor) și duce la conceptul de „nucleu” de decizii. Toți participanții se unesc și, prin acțiuni coordonate comune, maximizează „câștigul total”. Principiul non-dominanței este unul dintre principiile împărțirii „echitabile” între participanți. Aceasta este o situație în care niciunul dintre participanți nu poate obiecta în mod rezonabil la diviziunea propusă (elementul „de bază”). Există și alte principii pentru împărțirea „optimă” a totalului câștigurilor.

Principiidurabilitate(amenințăriȘicontra-amenințări). Ideea din spatele tuturor principiilor rezistenței la amenințare-contra-amenințări este următoarea. Fiecare coaliție de participanți își prezintă propunerea, însoțind-o de o amenințare reală: dacă propunerea nu este acceptată de participanții rămași, atunci vor fi întreprinse acțiuni care să înrăutățească poziția celorlalți participanți și să nu înrăutățească (eventual să îmbunătățească) poziția. a coaliţiei ameninţătoare. Soluția optimă este aceea în care, împotriva oricărei amenințări la adresa oricărei coaliții, există o contra-amenințare din partea unei coaliții.

Scheme de arbitraj. Conflictele economice sugerează ideea unui „arbitru social”. Nu este de dorit ca conflictele de interese să devină, de exemplu, amenințări deschise și contra-amenințări. Trebuie să existe mecanisme sociale care să permită luarea în considerare a preferințelor și capacităților strategice ale fiecărui participant și să ofere o soluție „echitabilă” a conflictului. Un astfel de mecanism de avans, indiferent dacă este un individ sau un sistem de vot, se numește arbitru. În teoria jocurilor, o soluție optimă, în sensul unei scheme de arbitraj, este construită folosind un sistem de axiome, incluzând concepte precum status quo-ul, optimitatea Pareto, liniaritatea alternativelor, independența de „ranguri” etc.

Să luăm în considerare în continuare problemele de luare a deciziilor optime în condiții de incertitudine. Pentru a dezvolta un comportament optim al decidentului, este util să modelăm o astfel de situație ca un joc antagonic de două persoane, în care natura este considerată ca adversar al decidentului. Acesta din urmă este înzestrat cu toate posibilitățile imaginabile în condițiile date.

„Jocuri cu natura” au propriile lor principii specifice (deși amintesc de principiul minimax) pentru alegerea optimă a soluției.

Principiul pesimismului extrem (criteriul Wald). Conform acestui principiu, jocul cu natura (luarea deciziilor în condiții de incertitudine) este jucat ca un joc cu un adversar rezonabil, agresiv, care face totul pentru a ne împiedica să obținem succesul. Strategia unui decident este considerată optimă dacă garantează un câștig nu mai mic decât cel „permis de natură”.

Principiul riscului Minimax (criteriul Savage). Acest principiu este și pesimist, dar atunci când alegeți strategia optimă, recomandă să vă concentrați nu pe „câștig”, ci pe risc. Riscul este definit ca diferența dintre câștigul maxim al decidentului (sub rezerva informațiilor complete despre starea naturii) și câștigul real (dată fiind ignorarea stării naturii). Strategia optimă este cea în care riscul este minim.

Principiul pesimismului - optimism (criterii Hurwitz). Acest criteriu recomandă ca atunci când alegeți o soluție, să nu vă ghidați nici de pesimismul extrem („conzează întotdeauna pe ce este mai rău!”) sau de optimism extrem („poate că curba vă va scoate!”). Conform acestui criteriu, media ponderată între câștigurile de pesimism extrem și optimism extrem este maximizată. Mai mult, „greutatea” este aleasă pe baza unor considerații subiective despre pericolul situațiilor.

Concept de stabilitate dinamică. Toate principiile de optimitate de mai sus sunt formulate în raport cu problemele statice de luare a deciziilor. O încercare de a le folosi în probleme dinamice poate fi însoțită de tot felul de complicații.

Principalul lucru este caracteristicile proceselor dinamice. Este necesar ca unul sau altul principiu al optimității, ales în starea inițială a procesului (la momentul inițial în timp), să rămână optim în orice moment. starea curenta(în orice moment) până la sfârșitul procesului dinamic. Acest principiu se numește stabilitate dinamică.

Se realizează pe baza unei abordări structural-dinamice. Cele mai importante secțiuni ale etologiei sunt:

  1. morfologia comportamentului - descrierea și analiza elementelor comportamentului (posturi și mișcări);
  2. analiza functionala - analiza factorilor externi si interni ai comportamentului;
  3. studii comparative - analiza genetică evolutivă a comportamentului [Deryagina, Butovskaya, 1992, p. 6].

În cadrul abordării sistemice, comportamentul este definit ca un sistem de componente interconectate care oferă un răspuns optim integrat al organismului atunci când interacționează cu mediul; acesta este un proces care are loc într-o anumită perioadă de timp [Deryagina, Butovskaya 1992, p.7]. Componentele sistemului sunt reacții motorii „externe” ale corpului care apar ca răspuns la schimbările din mediu. Obiectul cercetării etologice îl constituie atât formele instinctive de comportament, cât și cele asociate proceselor de învățare pe termen lung (tradiții sociale, activitate cu instrumente, forme non-rittuale de comunicare).

Analiza modernă a comportamentului se bazează pe urmând principii: 1) ierarhie; 2) dinamism; 3) contabilitate cantitativă; 4) o abordare sistematică, ținând cont de faptul că formele de comportament sunt strâns legate între ele.

Comportamentul este organizat după un principiu ierarhic. Prin urmare, în sistemul comportamental se disting diferite niveluri de integrare:

  1. acte motorii elementare;
  2. posturi și mișcări;
  3. secvențe de poziții și mișcări interdependente;
  4. ansambluri reprezentate de complexe de lanțuri de acțiune;
  5. sferele funcționale sunt complexe de ansambluri asociate unui anumit tip de activitate [Panov, 1978].

Proprietatea centrală a unui sistem comportamental este interacțiunea ordonată a componentelor sale pentru atingerea scopului final. Relația este asigurată prin lanțuri de tranziții între elemente și poate fi considerată ca un mecanism etologic specific pentru funcționarea acestui sistem [Deryagina, Butovskaya, 1992, p. 9].

Conceptele și metodele de bază ale etologiei umane sunt împrumutate din etologia animală, dar sunt adaptate pentru a ține cont de poziția unică a omului în rândul celorlalți membri ai regnului animal. O caracteristică importantă a etologiei, spre deosebire de antropologia culturală, este utilizarea metodelor directe de observare neparticipantă (deși sunt utilizate și metode de observare participantă). Observațiile sunt organizate în așa fel încât cel observat să nu-l suspecteze sau să nu aibă idee despre scopul observațiilor. Obiectul tradițional de studiu al etologilor este comportamentul caracteristic oamenilor ca specie. Etologie umană Atentie speciala se concentrează pe analiza manifestărilor universale ale comportamentului nonverbal. Al doilea aspect al cercetării este analiza modelelor comportament social(agresiune, altruism, dominație socială, comportament parental).

O întrebare interesantă este despre limitele variabilității individuale și culturale în comportament. Observațiile comportamentale pot fi făcute și în laborator. Dar în acest caz cel mai adesea despre care vorbim despre etologia aplicată (utilizarea metodelor etologice în psihiatrie, psihoterapie sau pentru testarea experimentală a unei ipoteze specifice). [Samokhvalov şi colab., 1990; Cashdan, 1998; Grummer şi colab., 1998].

Dacă inițial etologia umană s-a concentrat pe întrebări despre cum și în ce măsură sunt programate acțiunile și acțiunile umane, ceea ce a condus la opoziția adaptărilor filogenetice la procesele de învățare individuală, acum se acordă atenție studiului modelelor comportamentale din diferite culturi (și subculturi), analiza proceselor de formare a comportamentului în procesul de dezvoltare individuală. Astfel, în stadiul actual, această știință nu studiază doar comportamentul care are origine filogenetică, ci ia în considerare și modul în care universalurile comportamentale pot fi transformate în cadrul unei culturi. Această din urmă împrejurare a contribuit la dezvoltarea unei strânse cooperări între etologi și istorici de artă, arhitecți, istorici, sociologi și psihologi. În urma unei astfel de cooperări, s-a demonstrat că datele etologice unice pot fi obținute printr-o analiză minuțioasă a materialelor istorice: cronici, epopee, cronici, literatură, presă, pictură, arhitectură și alte obiecte de artă [Eibl-Eibesfeldt, 1989; Dunbar şi colab., 1995; Dunbar, Spoors, 1995].

Niveluri de complexitate socială

În etologia modernă, se consideră evident că comportamentul indivizilor la animalele sociale și la oameni depinde în mare măsură de contextul social [Hinde, 1990]. Influența socială este complexă. Prin urmare, R. Hind a propus identificarea mai multor niveluri de complexitate socială. Pe lângă individ, se disting nivelul interacțiunilor sociale, al relațiilor, nivelul grupului și nivelul societății. Toate nivelurile se influențează reciproc și se dezvoltă sub influența constantă a mediului fizic și a culturii. Trebuie înțeles clar că modelele de comportament care funcționează la un nivel social mai complex nu sunt reductibile la suma manifestărilor comportamentale la un nivel inferior de organizare. Este necesar un concept complementar separat pentru a explica fenomenul comportamental la fiecare nivel. Astfel, interacțiunile agresive dintre frați sunt analizate ținând cont de stimulentele imediate care stau la baza acestui comportament, în timp ce caracterul agresiv al relațiilor dintre frați poate fi considerat din punctul de vedere al conceptului de „competiție între frați”.

Comportamentul unui individ în cadrul acestei abordări este considerat ca o consecință a interacțiunii sale cu ceilalți membri ai grupului. Se presupune că fiecare dintre indivizii care interacționează are anumite idei despre comanda probabilă a partenerului într-o situație dată. Individul primește ideile necesare pe baza experienței anterioare de comunicare cu alți reprezentanți ai speciei sale. Contactele dintre doi indivizi necunoscuti, care sunt în mod clar ostili în natură, sunt adesea limitate doar la o serie de demonstrații. O astfel de comunicare este adesea suficientă pentru ca unul dintre parteneri să admită înfrângerea și să demonstreze supunerea. Dacă anumiți indivizi au interacționat de multe ori, atunci apar anumite relații între ei, care se desfășoară pe fundal general contactele sociale. Mediul social atât pentru oameni, cât și pentru animale este un fel de carapace” care înconjoară indivizii și transformă impactul mediului fizic asupra lor. Socialitatea la animale poate fi considerată ca o adaptare universală la mediu. Cu cât organizarea socială este mai complexă și mai flexibilă, cu atât mai mult mare rol joacă un rol în protejarea indivizilor unei specii date. Plasticitatea organizării sociale ar putea servi ca o adaptare de bază a strămoșilor noștri comuni cu cimpanzei și bonobo, care au furnizat premisele inițiale pentru hominizare [Butovskaya, Fainberg, 1993].

Cea mai importantă problemă a etologiei moderne este căutarea motivelor pentru care sistemele sociale ale animalelor și ale oamenilor sunt întotdeauna structurate, cel mai adesea după un principiu ierarhic. Rolul real al conceptului de dominanță pentru înțelegerea esenței legăturilor sociale în societate este dezbătut constant. Rețelele de relații dintre indivizi sunt descrise la animale și la oameni în termeni de rudenie și legături de reproducere, sisteme de dominanță și selectivitate individuală. Ele se pot suprapune (de exemplu, rang, rudenie și relații de reproducere), dar pot exista și independent unele de altele (de exemplu, rețele de relații între un adolescent din familie și școală cu semenii din societatea umană modernă).

Desigur, trebuie să fim foarte atenți atunci când folosiți paralele directe într-o analiză comparativă a comportamentului animal și uman, deoarece toate nivelurile de complexitate socială se influențează reciproc. Multe tipuri de activitate umană sunt de natură specifică și simbolică, ceea ce poate fi înțeles doar prin cunoașterea experienței sociale a unui individ dat și a caracteristicilor structurii socio-culturale a societății [Eibl-Eibesfeldt, 1989]. Avantajul incontestabil al abordării etologice atunci când se discută problemele de continuitate a principiilor de organizare socială este unificarea metodelor de evaluare și descriere a comportamentului primatelor, inclusiv a oamenilor, ceea ce face posibilă evaluarea obiectivă a parametrilor de bază ai asemănării și diferenței. Schema lui R. Hinde ne permite să eliminăm principalele neînțelegeri dintre reprezentanții științelor biologice și sociale cu privire la posibilitățile de analiză comparativă a comportamentului uman și animal și să prezicem la ce niveluri de organizare pot fi căutate asemănări reale.

Activitati organizatorice. Paradigma alternative ale procesului organizațional.

Întreaga varietate de abordări ale activităților organizaționale poate fi prezentată sub forma a două paradigme alternative (Tabelul 5.1). Paradigmele de mai sus reflectă două abordări fundamental diferite ale activităților organizaționale. Prima poate fi numită aproximativ abordarea coerciției, atunci când este necesar un efort pentru a crea și a menține. De îndată ce aceste eforturi încetează, sistemul revine la starea inițială. Puteți construi câte scheme organizaționale artificiale doriți, dar acestea vor fi fragile și ineficiente. Istoria cunoaște multe astfel de exemple: ferme colective, consilii economice, asociații de producție etc.

Tabelul 5.1

Paradigma alternative ale procesului organizațional

A doua abordare este axată pe procesele naturale ale organizației, dezvoltându-se suficient de mult pentru a da loc voinței umane. Obiectivele umane care nu se încadrează în domeniul dezvoltării naturale (de exemplu, crearea de ferme colective) sunt sortite eșecului, indiferent de resursele folosite pentru a le atinge. În același timp, nu există fatalism aici - o persoană cu stabilirea obiectivelor și activitatea sa volitivă nu este exclusă din procesul de dezvoltare, trebuie doar să îndeplinească condiția: spațiul obiectivelor unei persoane trebuie să coincidă cu gama de direcții. de dezvoltare naturală (posibilă în principiu). O orientare spre dezvoltarea naturală se regăsește și în studiile lui A. Smith, care a susținut că pentru dezvoltarea socio-economică a societății sunt necesare pacea, impozitele ușoare și toleranța în management, iar restul se va face pe cursul natural. de lucruri.

Sistem de control – abordare cibernetică. Principii de control: principiu de control în buclă deschisă; principiul de control în buclă deschisă cu compensare a perturbațiilor; principiul controlului în buclă închisă; principiul de control dintr-o singură lovitură.

Organizarea ca proces de organizare este una dintre funcțiile principale ale managementului. Funcția de management este înțeleasă ca un ansamblu de acțiuni de management repetitive, unite prin unitatea de conținut. Întrucât organizația (ca proces) servește ca funcție de management, orice management este o activitate organizațională, deși nu se limitează la aceasta.

Controlul este o influență special orientată asupra unui sistem, asigurând că acestuia i se oferă proprietățile sau stările necesare. Unul dintre atributele statului este structura.

A organiza înseamnă, în primul rând, a crea (sau a schimba) o structură.

În ciuda diferențelor de abordări ale sistemelor de control al clădirilor, există principii generale dezvoltate în cibernetică. Din perspectiva abordării cibernetice, un sistem de control este un ansamblu integral al unui subiect de control (sistem de control), al unui obiect de control (sistem gestionat), precum și al conexiunilor directe și de feedback între ele. De asemenea, se presupune că sistemul de control interacționează cu mediul extern.

Caracteristica de bază de clasificare pentru construirea sistemelor de control, care determină tipul de sistem și capacitățile sale potențiale, este metoda de organizare a buclei de control. Potrivit acestuia din urmă, sunt identificate mai multe principii de organizare a buclei de control.

Principiul controlului în buclă deschisă (software). Acest principiu se bazează pe ideea influenței autonome asupra sistemului, indiferent de condițiile de funcționare ale acestuia. În mod evident, domeniul de aplicare practică a acestui principiu presupune fiabilitatea cunoașterii stării mediului și a sistemului pe întreaga gamă de funcționare a acestuia. Apoi este posibil să predeterminați răspunsul sistemului la impactul calculat, care este preprogramat sub forma unei funcții (Fig. 5.1).

Orez. 5.1. Principiul de control în buclă deschisă

Dacă acest efect este diferit de cel așteptat, vor urma imediat abaterile în natura modificării coordonatelor de ieșire, adică. sistemul va fi neprotejat de perturbări în sensul original al cuvântului. Prin urmare, un principiu similar este utilizat atunci când există încredere în fiabilitatea informațiilor despre condițiile de funcționare ale sistemului. De exemplu, pentru sistemele organizaționale o astfel de încredere este acceptabilă cu disciplină executivă înaltă, când ordinul dat nu necesită control ulterior. Uneori, acest tip de management se numește management directiv. Avantajul incontestabil al acestei scheme de control este simplitatea organizării manageriale.

Principiul controlului în buclă deschisă cu compensare a perturbațiilor. Conținutul abordării este dorința de a elimina limitările primei scheme, i.e. impactul nereglementat al perturbărilor asupra funcționării sistemului. Posibilitatea compensării perturbațiilor și, prin urmare, a eliminării nesiguranței informațiilor a priori, se bazează pe accesibilitatea perturbațiilor la măsurători (Fig. 5.2).


Orez. 5.2. Principiul managementului compensației

Măsurarea perturbațiilor face posibilă determinarea unui control compensator care contracarează consecințele perturbărilor. De obicei, împreună cu controlul corectiv, sistemul este supus influenței software. Cu toate acestea, în practică, nu este întotdeauna posibilă înregistrarea informațiilor despre perturbațiile externe, ca să nu mai vorbim de monitorizarea abaterilor în parametrii sistemului sau modificările structurale neașteptate. Dacă sunt disponibile informații despre perturbări, principiul compensării acestora prin introducerea controlului compensator este de interes practic.

Principiul de control în buclă închisă. Principiile discutate mai sus aparțin clasei buclelor de control deschise: cantitatea de control nu depinde de comportamentul obiectului, ci este o funcție de timp sau de perturbare. Clasa buclelor de control închise este formată din sisteme cu feedback negativ, întruchipând principiu de bază cibernetică.

În astfel de sisteme, nu efectul de intrare este programat în prealabil, ci starea necesară a sistemului, de exemplu. o consecință a impactului asupra obiectului, inclusiv controlul. În consecință, este posibilă o situație în care o perturbare are un efect pozitiv asupra dinamicii sistemului dacă își apropie starea de cea dorită. Pentru implementarea principiului, se găsește a priori o lege program pentru modificarea stării sistemului în timp Spr(t), iar sarcina sistemului este formulată ca să asigure că starea reală se apropie de cea dorită (Fig. 5.3). Soluția la această problemă se obține prin determinarea diferenței dintre starea dorită și cea reală:

∆С(t) = Ср(t) – С(t).


Fig 5. 3 Principiul controlului în buclă închisă

Această diferență este utilizată pentru control pentru a minimiza nepotrivirea detectată. Acest lucru asigură că coordonatele controlate se apropie de funcția programului, indiferent de motivele care au cauzat diferența, fie că este vorba de perturbări de diverse origini sau erori de control. Calitatea controlului afectează natura procesului tranzitoriu și eroarea stabilită - discrepanța dintre stările finale programate și cele reale.

În funcție de semnalul de intrare, teoria controlului distinge:

■ sisteme de control al programului (cazul luat în considerare);

■ sisteme de stabilizare, când cpr(t) = 0;

■ sisteme de urmărire când semnalul de intrare este a priori necunoscut.

Acest detaliu nu afectează în niciun fel implementarea principiului, ci introduce specificitate în tehnica de construire a sistemului.

Distribuția largă a acestui principiu în sistemele naturale și artificiale se explică prin productivitatea organizării circuitului: problema de control este rezolvată eficient la nivel conceptual datorită introducerii feedback-ului negativ.

Se are în vedere cazul modificărilor de programare în timp a stării sistemului Ср(t), ceea ce înseamnă calcul preliminar al traiectoriei în spațiul stărilor. Dar întrebarea cum să faci asta a dispărut din vedere. Răspunsul este limitat de două cerințe pentru traiectorie, care trebuie:

1) trece prin țintă;

2) satisface extremul criteriului de calitate, i.e. fi optim.

În sistemele dinamice formalizate, pentru a găsi o astfel de traiectorie, se folosește aparatul de calcul al variațiilor sau modificările sale moderne: principiul maxim al lui L. Pontryagin sau programarea dinamică a lui R. Bellman. În cazul în care problema se rezumă la căutarea parametrilor (coeficienților) necunoscuți ai sistemului, se folosesc metode de programare matematică pentru a o rezolva - este necesar să se găsească extremul funcției de calitate (indicator) în spațiul parametrilor. Pentru a rezolva probleme slab formalizate, se poate baza doar pe soluții euristice bazate pe previziuni futurologice sau pe rezultatele modelării simulării matematice. Este dificil de evaluat acuratețea unor astfel de decizii.

Să revenim la problema de programare. Dacă există o modalitate de a calcula traiectoria programului pentru sarcinile formalizate, atunci este firesc să se ceară sistemului de control să se mulțumească cu desemnarea țintei și schimbare de software a găsit starea sistemului direct în timpul procesului de control (control terminal). O astfel de organizare a sistemului, desigur, va complica algoritmul de control, dar va permite ca informațiile inițiale să fie minimizate, ceea ce înseamnă că va face controlul mai eficient. O sarcină similară în anii 1960. a fost rezolvată teoretic de profesorul E. Gorbatov pentru controlul mișcării rachete balisticeși nave spațiale.

În ceea ce privește formularea și soluționarea problemei de control optim, trebuie luată în considerare următoarea circumstanță fundamentală.

Este posibil să se aleagă comportamentul optim al sistemului numai dacă sunt cunoscute în mod fiabil comportamentul obiectului studiat pe întreg intervalul de control și condițiile în care se produce mișcarea.

Soluțiile optime pot fi obținute prin îndeplinirea altor ipoteze suplimentare, dar ideea este că fiecare caz trebuie specificat separat; soluția va fi valabilă „până la condiții”.

Să ilustrăm poziția declarată folosind exemplul comportamentului unui alergător care se străduiește să obțină un rezultat ridicat. Dacă vorbim de o distanță scurtă (100, 200 m), atunci un sportiv antrenat își stabilește scopul de a asigura viteza maximă în fiecare moment de timp. La alergarea pe distanțe mai mari, succesul este determinat de capacitatea sa de a distribui corect forțele pe traseu, iar pentru aceasta trebuie să-și înțeleagă clar capacitățile, terenul traseului și caracteristicile adversarilor săi. În condiții de resurse limitate, nr viteza maximaîn fiecare moment nu poate exista vorbire.

Este destul de evident că restricția de mai sus este satisfăcută numai în cadrul unei formulări deterministe a problemei, i.e. când totul este cunoscut cu certitudine a priori. Astfel de condiții se dovedesc a fi excesive pentru probleme reale: patul de determinism procustean nu corespunde condițiilor reale de funcționare ale sistemului. Natura a priori a cunoștințelor noastre este extrem de îndoielnică atât în ​​raport cu sistemul însuși și cu mediul înconjurător, cât și cu interacțiunea acestuia cu cutare sau cutare obiect. Cu cât sistemul este mai complex, cu atât informațiile a priori sunt mai puțin fiabile, ceea ce nu adaugă optimism cercetătorilor care efectuează procedura de sinteză.

O astfel de incertitudine a condus la apariția unei întregi direcții în teoria controlului, bazată pe luarea în considerare a condițiilor stocastice de existență a sistemului. Cele mai constructive rezultate au fost obținute în dezvoltarea principiilor sistemelor adaptative și autoajustabile.

Optimizarea managementului. Sisteme adaptive și auto-ajustabile.

Sistemele adaptive fac posibilă facerea față incertitudinii prin obținerea de informații suplimentare despre starea obiectului și interacțiunea acestuia cu mediul în timpul procesului de control, urmată de restructurarea structurii sistemului și modificarea parametrilor acestuia atunci când condițiile de funcționare deviază de la a priori cunoscute. cele (Fig. 5.4). În acest caz, de regulă, scopul transformărilor este de a aduce caracteristicile sistemului mai aproape de cele a priori utilizate în sinteza controlului. Astfel, adaptarea se concentrează pe menținerea homeostaziei sistemului în condiții de perturbări.


Orez. 5.4. Sistem adaptiv

Una dintre cele mai dificile componente de proiectare ale acestei sarcini este obținerea de informații despre starea mediului, fără de care este dificil să se realizeze adaptarea.

Un exemplu de achiziție cu succes a informațiilor despre starea mediului este inventarea tubului Pitot, care este echipat cu aproape toate avioane. Tubul vă permite să măsurați viteza capului - cea mai importantă caracteristică, de care depind direct toate forțele aerodinamice. Rezultatele măsurătorilor sunt folosite pentru a configura pilotul automat. Un rol similar în sistemele sociale anchetele sociologice joacă un rol în a ajuta la ajustarea soluțiilor la problemele de politică internă și externă.

O tehnică eficientă pentru studierea dinamicii unui obiect de control este metoda controlului dual, propusă cândva de A. Feldbaum. Esența sa este că, împreună cu comenzile de control, sunt trimise obiectului semnale speciale de testare, a căror reacție este prestabilită pentru modelul a priori. Pe baza abaterii reacției obiectului de la cea standard, se judecă interacțiunea modelului cu mediul extern.

O tehnică similară a fost folosită de contrainformații rusești în timpul Primului Război Mondial pentru a identifica un spion. A fost identificat un cerc de angajați suspectați de trădare, iar fiecăruia din acest cerc li sa „încredințat” informații importante, dar false, de natură unică. S-a observat reacția inamicului, prin care a fost identificat trădătorul.

Clasa sistemelor cu autoajustare se distinge de sistemele adaptive. Acestea din urmă sunt ajustate în timpul procesului de adaptare. Cu toate acestea, la nivelul de generalitate acceptat, structura unui sistem de auto-ajustare este similară cu structura unui sistem adaptiv (vezi Fig. 5.4).

În ceea ce privește procesele de adaptare și autotuning, se poate observa că posibilitatea acestora în cazuri specifice este determinată în principal de scopul sistemului și implementarea sa tehnică. O astfel de teorie a sistemelor este plină de ilustrații, dar nu pare să conțină realizări generalizatoare.

O altă modalitate de a depăși insuficiența datelor a priori privind procesul de control este combinarea procesului de control cu ​​procedura de sinteză a acestuia. În mod tradițional, un algoritm de control este rezultatul unei sinteze bazate pe presupunerea unei descrieri deterministe a modelului de mișcare. Dar este evident că abaterile în mișcarea modelului adoptat afectează acuratețea atingerii scopului și calitatea proceselor, i.e. conduce la abaterea de la extremul criteriului. Rezultă că controlul trebuie construit ca un control terminal, calculând traiectoria în timp real și actualizând informații despre modelul obiectului și condițiile de trafic. Desigur, în în acest caz, este necesar să extrapolați condițiile de conducere pentru întregul interval de control rămas, dar pe măsură ce vă apropiați de țintă, acuratețea extrapolării crește, ceea ce înseamnă că calitatea controlului se îmbunătățește.

Aceasta arată o analogie cu acțiunile unui guvern care nu poate îndeplini obiectivele planificate, cum ar fi cele bugetare. Condițiile de funcționare ale economiei se schimbă într-un mod neplanificat, cu încălcarea previziunilor, de aceea este necesară ajustarea constantă a planului planificat în efortul de a atinge indicatorii finali, în special, pentru a efectua sechestrarea. Abaterile de la ipotezele a priori pot fi atât de mari încât resursele disponibile și măsurile de management luate nu mai pot asigura atingerea scopului. Apoi trebuie să „apropiați” obiectivul, plasându-l în noua zonă de realizabilitate. Rețineți că schema descrisă este valabilă numai pentru un sistem stabil. De calitate inferioară organizarea managementului poate duce la destabilizare și, în consecință, la distrugerea întregului sistem.

Să ne oprim asupra încă un principiu de management care stă la baza teoriei dezvoltate a cercetării operaționale.

Principiul de control unic. O gamă largă de sarcini practic semnificative presupune necesitatea de a efectua un act unic de management, și anume, de a lua o decizie, ale cărei consecințe afectează perioadă lungă de timp. Desigur, managementul tradițional poate fi interpretat și ca o succesiune de decizii unice. Aici ne confruntăm din nou cu problema discretității și continuității, granița dintre care este la fel de neclară ca și între sistemele statice și cele dinamice. Cu toate acestea, încă există o diferență: în teoria clasică a controlului se presupune că impactul asupra sistemului este un proces, o funcție a parametrilor de timp sau de stare și nu o procedură unică.

O alta trăsătură distinctivă cercetarea operațională este că această știință funcționează cu controale - constante, parametri de sistem. Atunci, dacă în problemele dinamice se folosește ca criteriu o construcție matematică - o funcționalitate care evaluează mișcarea sistemului, atunci în studiul operațiilor criteriul are forma unei funcții definite pe setul de parametri ai sistemului studiat. .

Zona problemelor practice acoperite de cercetarea operațională este foarte extinsă și include activități precum alocarea resurselor, selecția rutei, planificarea, gestionarea stocurilor, gestionarea cozilor în problemele de așteptare etc. La rezolvarea problemelor relevante, metodologia descrisă mai sus pentru descrierea acestora este utilizat, luând în considerare categoriile de model, stare, scopuri, criterii, management. Se formulează și se rezolvă și problema de optimizare, care constă în găsirea extremului funcției criteriu în spațiul parametrilor. Problemele sunt rezolvate atât în ​​formulări deterministe cât și stocastice.

Deoarece procedura de operare cu constante este mult mai simplă decât operarea cu funcții, teoria cercetării operaționale s-a dovedit a fi mai avansată decât teorie generală sisteme și, în special, teoria controlului sistemelor dinamice. Cercetarea operațională oferă un arsenal mai mare instrumente matematice, uneori foarte sofisticat, pentru a rezolva o gamă largă de probleme practic semnificative. Întregul set de metode matematice care servesc cercetării operaționale se numește programare matematică. Astfel, în cadrul cercetării operaționale se dezvoltă teoria luării deciziilor – un domeniu extrem de relevant.

Teoria luării deciziilor, în esență, are în vedere procedura de optimizare a condițiilor pentru o descriere detaliată a unui criteriu vectorial și caracteristicile stabilirii valorii sale extreme. Astfel, formularea unei probleme se caracterizează printr-un criteriu format din mai multe componente, i.e. problema multicriteriala.

Pentru a sublinia subiectivitatea criteriului și a procesului de luare a deciziilor, este introdus în considerare un factor de decizie (DDM) cu o viziune individuală asupra problemei. La studierea soluțiilor folosind metode formale, aceasta se manifestă printr-un sistem de preferințe atunci când se evaluează una sau alta componentă a criteriului.

De regulă, pentru a lua o decizie, decidentul primește mai multe opțiuni de acțiune, fiecare dintre acestea fiind evaluată. Această abordare se apropie cât mai mult de condițiile reale de acțiune a unui subiect responsabil într-un sistem organizatoric la alegerea uneia dintre opțiunile pregătite de aparat. În spatele fiecăruia dintre ele se află un studiu (analitic, simulare modelare matematică) posibilă mutare desfasurarea evenimentelor cu analiza rezultatelor finale – scenariu. Pentru comoditatea luării deciziilor critice, sunt organizate săli de situație, dotate cu mijloace vizuale de afișare a scenariilor pe afișaje sau ecrane. În acest scop sunt implicați specialiști (operaționaliști) care sunt pricepuți nu numai în metodele matematice de analiză a situațiilor și de pregătire a deciziilor, ci și în domeniul de specialitate.

Este clar că rezultatul aplicării teoriei cercetării operaționale, în special, și a teoriei luării deciziilor, la un obiect este un anumit plan optim de acțiune. În consecință, intrarea unui anumit bloc, „umplut” cu un algoritm de optimizare și construit folosind metoda adecvată de programare matematică a unui model de situație, este furnizată cu informații: stare inițială, scop, criteriu de calitate, listă de parametri variați, restricții. (Modelul de sistem este utilizat la construirea algoritmului.) Ieșirea blocului este planul dorit. Din punctul de vedere al ciberneticii, o astfel de construcție este clasificată ca o buclă de control deschisă, deoarece informațiile de ieșire nu afectează semnalul de intrare.

În principiu, abordarea luată în considerare poate fi aplicată și în cazul controlului în buclă închisă. Pentru a face acest lucru, este necesar să organizați un proces iterativ în timp: după implementarea planului, introduceți o nouă stare a sistemului ca condiție inițială și repetați ciclul. Dacă sarcina permite, puteți scurta perioada de planificare prin apropierea obiectivului de starea inițială a sistemului. Apoi există o analogie între acțiunile propuse și procedura iterativă de control terminal discutată mai sus, care se bazează și pe actualizarea periodică a informațiilor inițiale. Mai mult, o problemă dinamică care operează cu procese poate fi redusă la aproximarea funcțiilor prin serii funcționale. În acest caz, variabilele variabile vor fi deja parametrii unor astfel de serii, ceea ce înseamnă că va fi aplicabil aparatul teoriei cercetării operaționale. (Acest lucru se face în teoria probabilității, când procesele aleatoare sunt descrise prin expansiune canonică.)

Metodologia schițată a început să-și găsească aplicație în teoria inteligenței artificiale în sinteza managementului situațional.

Trebuie subliniat pericolul asociat cu aplicarea practică a teoriei decizionale de către persoane insuficient competente în teoria sistemelor. Astfel, adesea în sistemele organizaționale ( institutii guvernamentale, firme, organizații financiare) luarea deciziilor este absolutizată și redusă la operarea cu numeroși indicatori și implementarea optimă a unui act de management unic. În același timp, ei pierd din vedere consecințele acțiunii întreprinse pentru sistem, uită că gestionează nu criteriul, ci sistemul, neținând cont de natura în mai multe etape a procesului închis - din sistem. la starea sa, apoi prin indicatori la soluție și din nou la sistem. Desigur, pe acest drum lung, se fac multe greșeli, obiective și subiective, care sunt deja suficiente pentru o abatere serioasă de la rezultatele planificate.

În CONDIȚIA Cq -^ O

Studiul soluției problemei pentru valori mici ale factorului de greutate în funcțional (6.6) prezintă un interes semnificativ din punctul de vedere al evaluării preciziei maxime realizabile a unui sistem în buclă închisă atunci când restricții asupra intensității controlului (puterea) sunt neimportante. În plus, pare important să evaluăm asta nivel maxim puterea acțiunii de control, depășirea acesteia nu duce la o creștere suplimentară a preciziei de control.

Prezentăm principalele prevederi ale studiului comportamentului limitativ al sistemului optim în condiția c 0 -»0 sub forma următoarei afirmații.

Teorema 6.3. Pentru un sistem închis (6.4), (6.7), care este optim din punct de vedere al funcționalității (6.6), relatiile sunt valabile

Următoarea notație suplimentară este utilizată aici:

iar polinomul B*(e) este Hurwitz și numere complexe(3, Р 2 ,..., Р p sunt rădăcinile comune ale polinoamelor M(s) și B*(-s).

Dovada. Să introducem notația și, prin analogie cu formulele (6.26), (6.27), scriem relațiile

Unde gj (i = l,n)- rădăcinile polinomului G‘(-s,7.).

Ținând cont de (6.42)-(6.44), formulele (6.13)-(6.15) pot fi prezentate în următoarea formă:

Este evident că luarea în considerare a comportamentului limitativ al unui sistem în buclă închisă în condiție de la 0 -> 0 echivalent luarea în considerare a comportamentului său limitativ în condiție X-> syu.

Înainte de a trece la demonstrarea directă a teoremei, luăm în considerare comportamentul limitativ al rădăcinilor polinomului G*(-s,X) în identitate (6.43) în condiția specificată.

În acest scop, vom folosi afirmația binecunoscută prezentată în lucrare, conform căreia, atunci când ne străduim X-> 00 m rădăcini ale polinomului G*(-s,X) tind spre rădăcinile polinomului B*(-s)-Rezultatul factorizării Negurwitz:

Odihnă (P - T) rădăcinile polinomului G*(-s,X) dat fiind X-> °о merge la infinit, apropiindu-se asimptotic de linii drepte care se intersecteaza la originea coordonatelor si formeaza unghiuri cu axa reala, determinate de expresia

iar toate aceste rădăcini sunt situate pe un cerc de rază

Ținând cont de considerentele de mai sus, avem
unde se folosesc notații

și coeficienți constanți /с, (/ =,p-t-) nu depind de valoarea lui X,

Acum să ne uităm la două succesiv opțiuni posibileîn raport cu polinomulMpb(-s)în expansiune (6.41), respectiv caracterizată prin condiţiiM rb=1 șiM rb F 1.

Opțiunea 1. Să presupunem că condiția este îndeplinităM p b(~ s) =1, care este echivalent cu egalitatea Г) = 0. Aceasta înseamnă că polinomulÎN"(-s) nu are rădăcini comune cu polinomul M(s) = B"(-

Să luăm în considerare comportamentul limitativ al polinomuluiR(s,X)(6.47) prevăzutX ->°°, după ce a notat anterior că

Din (6.50) rezultă căTrădăcinile polinomului limG f (-s,X)coincid cu rădăcinile (3, (/ = 1,m) ale polinomuluiB*(-s), si restul(p - t)

rădăcini - cu rădăcini p g (g =t + 1,p)polinomP(-s,X)(6.53), care sunt definite prin următoarele expresii:

În acest caz, relațiile sunt în mod evident satisfăcute

Ținând cont de relațiile (6.50) și (6.54)-(6.56), polinomul limităR(s, X)poate fi reprezentat ca suma a două polinoame limităR^SyX)ȘiR2(s,X):

Primul dintre aceste polinoame este conectat numai cu rădăcinile (3, iar al doilea - numai cu rădăcinile p,:

Conform (6.56) avem lim Р(-|3-Д) = VulturX1, deci expresia

(6.57) poate fi reprezentat sub forma sau

întrucât, conform formulelor (6.51), (6.53),

Rețineți că polinomul B,*(s) are coeficienți finiți care sunt nenuli datorită condiției M(P,.)*0 și independent de X.

Acum transformăm relația (6.58), amintind următoarele egalități: deg A(s) =P, Sj(s) =N(e)/T(s), degN(s) =p, degT(s) =q. În plus, ținem cont de faptul că condiția degB"(-s) = degB“(s) =T,asa cum este usor de aratat, atrage dupa sine indeplinirea relatiei

Atunci noi avem

Dar din formula (6.55) luând în considerare relația (6.60) rezultă: și conform (6.56), (6.51):

UndeG*ȘiG**(/ = m + 1,н) - numere complexe cu module finite diferite de zero. Apoi primim

și în mod corespunzător

În virtutea (6.50)-(6.53) și (6.55) avem:

și numere complexe constante r; , r u , r 2i , k i , k 2i , ... , k(n - m -2 )i (i= + 1,i) nu depind de valoarea lui A.

Apoi, având în vedere validitatea inegalității p-t> 1 (altfel Pj(s,X) = const), avem lim ?)(s,A)/A = 0 și conform formulei (6.61)

Dar apoi, în conformitate cu identitățile (6.59) și (6.62), obținem

În acest caz, în conformitate cu (6.45) și (6.46), avem următoarele formule pentru matricele de transfer limită ale sistemului închis optim:

Opțiunea 2. Acum luați în considerare a doua situație, când identitatea M b (-s) = 1 nu este îndeplinită, adică. în acest caz presupunem că polinoamele ÎN"(-s)și M(s) = B"(-s)RC(s) au D) rădăcini comune.

În acest caz, polinomul B-s) este reprezentat de produsul unde

Spre deosebire de cazul precedent, când se consideră comportamentul limitativ al polinomului R(s,X) să o reprezentăm ca o sumă Trei termeni:

și vom construi primul polinom doar cu folosind rădăcinile (3, (/ = 1,Г)) polinomului Mpb(-s), al doilea - rădăcinile lui P g (I = T) +1, w) ale polinomului B" Q (-s) iar a treia - rădăcini c g (i = m + l,n) polinom P(e).

În acest caz, pentru al doilea și al treilea polinoame, în totală analogie cu versiunea anterioară, obținem

Pentru un polinom R x avem

întrucât M(RD = 0 Vie .

Din formulele date (6.67)-(6.69) rezultă lim de identitate Kj(s,A,) = B*2(e), și, înlocuind în (6.64) polinomul B[(e) pe B* 2 (s),

obţinem a doua versiune a matricelor de transfer limitatoare pentru sistemul optim în buclă închisă. Combinând ambele opțiuni cu o singură notație, obținem relații (6.37)-(6.41).

Teorema este complet demonstrată. ?

Să dăm un corolar natural din teorema 6.3, care are semnificație independentă.

Teorema 6.4.Dacă toate rădăcinile polinomului B*(-s)sunt și rădăcini ale polinomului M(s) =B"(-s)RC(e),şi în acelaşi timp egalitatea este îndeplinităRyR = 0,atunci eu x0= Nsh1 x (cu 0) = 0, acestea.

cu condiția ca limitarea puterii acțiunii de control să nu fie mai mică de 1 și 0 =Nsh7 1((de la 0),formă definită-

loy (6.37 a), precizia controlului absolută (cu eroare zero) este realizabilă.

Dovada. Conform condiţiilor teoremei, bazată pe identitate (6.41), relaţia G) =T,dar apoi din formula (6.40) urmează identitateaR"(s) = 0 .

În acest caz, îndeplinirea egalității RyR = 0 în conformitate cu formulele (6.38), (6.39) și (6.37), (6.37a) și luând în considerare (6.41) dă

Unde . Teorema a fost demonstrată. ?

Să luăm în considerare următoarea situație particulară.

Teorema 6.5.Dacă matriceaReste diagonală cu un singur element diferit de zero r pp = 1, adică se determină precizia sistemului în buclă închisă dispersie p-th componente vectorialeX,atunci sunt valabile următoarele relații:

A)dacă polinomul В р(e)este Hurwitz sau toate rădăcinile sale „dreapte” sunt incluse în spectrul rădăcinilor polinomului C p (s), atunci

b)dacă polinomul B p (s) are cel puțin o rădăcină în semiplanul drept care nu este o rădăcină a polinomului C p (s), atunci

iar aici se iau în calcul formulele (6.37a) și (6.39)-(6.41) (în acest caz avem r

Dovada. Din formula (6.18) rezultă că matricea 7(5) = }

 

Ar putea fi util să citiți: