|
Extreme conditionate. Metoda multiplicatorilor lui Lagrange.
Am analizat, pana acum, problema determinarii punctelor de extreme ale functiilor de clasa C1, cand aceste puncte sunt interioare multimii de definitie a functiei.
In practica, apare insa si situatia determinarii uoor pouncte de extreme ale functiei,pe enumite submultimi ale multimii de definitie, aceste puncte nemaifiind interioare submultimii respective.
In acest sens, sa analizam urmatoarea problema care intervine frecvent in practica:
Sa presupunem ca D este un deschis din RnRm (n≥1,m≥1), f:DR si g:DRm (sau, echivalent, g=(g1,g2,.,gm) sunt functii de clasa C1 pe D ).
Am dori sa detreminam punctele de extreme ale functiei f supuse la conditia suplimentara
(8)g(x,y)=0
sau echivalent,
(8')
Unde x=(x1,x2,.xn)Rn si y=(y1,y2,.,ym)Rm.
Notand cu A= si tinand seama ca g sete continua (g este de claca C1 pe D), rezulta ca A este inchisa.
Prin urmare, in problema de mai sus se cere, in fond, determinarea punctelor de extreme ale restrictiei functiei f la multimea A. Observam ca, in general, metoda prezentata pana acum nu poate fi utilizata in acest caz, intrucat punctele lui A vor fin interioare lui A daca si numai daca g este identic nula, situatie nesemnificativa in practica.
Sa vedem cum s-ar putea rezolva totusi problema enuntata.
Observam ca daac am putea rezolva ecuatia (8) in raport cu y , scotand y=, atunci am putea introduce aceasta functie in f, obtinand f(x,) functie de xRn,iar pentru aceasta functie, definite pe o submultime din Rn,am putea studia punctele de extreme prin procedeele cunoscute.
Procedeul acesta este insa greu de aplicat in practica, intrcat, in general, ecuatia (8) nu poate fi rezolvata in raport cu x si chiar daca theoretic se poate rezolva , de cele mai multe ori este freu de pus in evidenta forma explicita a fucntiei.
In continuare, vom cauta sa prezentam o metoda, numita metoda multiplicatorilor lui Lagrange, pentru rezolvarea problemei anuntate, metoda care se aplica, in special, in cazul in care nu poate fi gasita, im mod explicit, forma functiei
Metoda aceasta consta , in realitate, in a asocial functiei f o functie convenabila, nimita functia lui Lagrange, careia sa I se poata determina punctele de xetrem prin metodele deja cunoscute,astfel incat punctele de extreme ale resctrictiei functiei f la A sa poata fi gasite cu ajutorul punctelor obisnuite de extreme pentru funtia asociata.
Pentru a raspunde la aceasta problema, sa dam , mai intai, urmatoarel;e definitii:
Definitia1
Spunem ca un punct (x0,y0) este punct de extreme local al functiei f cu restriuctiile (8) sau punct de extrem local conditionat, daca exista o vecinatate V D a punctului (x0,y0) a.i. f(x,y)-f(x0,y0) sa pastreze semn constant pentru si anume: daca f(x,y)-f(x0,y0)≥0, , vom spune ca (x0,y0) este punct de minim conditionat, iar daca f(x,y)-f(x0,y0)≤0, , vom spune ca (x0,y0) este punct de maxim conditionat.
Cu alte cuvinte, spunem ca punctual (x0,y0)este punct de extreme conditionat pentru functia f daca (x0,y0) este punct de extreme pentru restrictia functiei f la multimea A.
Definitia2
Spunem ca un punct (x0,y0) este punct stationar conditionat sau punct critic conditionat al functiei f daca (x0,y0) este un punct stationar al restrictiei fucntiei f la multimea A.
In continuare, vom pune in evidenta conditii necesare pentru ca un punct sa fie punct de extrem local conditionat.
Teorema1 (Existenta multiplicatorilor lui Lagrange)
Fie D u deschis din RnRm, f:DR si g:DRm, adica g=(g1,.,gm)cu gi:DR (i=) functii de clasa C1 pe D, iar (x0,y0) un punct de extrem local al lui f cu restrictia (8) .Daca
(9) ,
Atunci exista m numere reale a.i. daca se considera functia
(10) L=f+
punctul (x0,y0) sa verifice sistemul de ecuatii:
(11)
Adica (x0,y0) sa fie punct critic al functiei L.
Dem.
Fie functia F(x)=f(x,
Cum (x0,y0) este punct de extrem local cu restrictiile (8) pentru f iar (x, , rezulta ca punctul x0 este punct de extreme local, neconditionat, pentru F pe U.
Tinand seama de teorema lui Fermat (11.6.4), rezulta ca
, i=1,2.,n,
Ceea ce antreneaza
(13)
Intrucat , rezulta ca sistemul liniar
(14) , j=1,2,.,m
Are solutie unica .sa notam aceasta solutie cu Sa artam acum ca pentru functia L=f+sunt indeplinite conditiile (11).
Cum (x0,y0) rezulta ca gk(x0,y0)=0, pentru orice k=1,2.,m.
Sa calculam derivatele partiale ale lui L in raport cu xi.
Avem
Tinand seama de (12), obtinem
=
De unde, cum () este solutia sistemului (14), rezulta ca
Ceea ce antreneaza conform cu (13) ca
, i=1,2.,n.
Pe de alta parte , derivand in raport cu yj si tinand seama din nou , ca () este solutia sistemului (14) obtinem:
Prin urmare, conditiile (11) fiind satisfacute, teorema este complet demonstrata.
Observatii!
1. Numerele reale obtinute in teorema precedenta se numesc multiplicatorii lui Lagrange.
2. Punctele de extreme ale functiei f cu restrictiile (8) se gasesc printer punctele critice conditionate ale functiei f, adica printer punctele critice ale functiei associate L=f+
Prin urmare, orice punct de extreme conditionat este un punct critic conditionat al functiei f.Reciproca acestei afirmatii nu este adevarata, intrucat exista puncte critice conditionate care nu sunt puncte de extreme conditionat.
Cu alte cuvinte, conditia ca uin punct sa fie punct critic conditionat este o conditie necesara nu insa si suficienta pentru ca punctual respective sa fie punct de extrem conditionat.
3. Daca in formula (10) presupunem ca si sunt variabile, atunci functia (x,y, L(x,y, DRm, poarta numele de Lagrangian sau functia lui Lagrange.
4. In practica, pentru determinarea punctelor critice conditionate se procedeaza astfel: se asociaza functia lui Lagrange L=f+ pe DRm, se anuleaza toate derivatele partiale ale lui L, in numar de n+2m, si se rezolva sistemul astfel format in necunoscutele x1,x2,.,xn,y1,y2,.,ym ,.Orice solutie a sistemului conduce la un punct stationar ()pentru f, iar corespunzatori sunt multiplicatorii lui Lagrange.
Ex4.
Fie functia f(x,y)=cos(x+y) , R2.Sa se determine eventualele puncte de extreme al eacestei functii cu conditia x2+y2=1.In acest caz, g(x,y)=x2+y2-1, R2.
Fie functia L(x,y)=cos(x+y)+(x2+y2-1).Observam ca
Sa rezolvam sistemul:
Daca , atunci sin si deci x+y este un intreg.Intrucat x2+y2=1 singurele posibilitati sunt (x,y)=(), (x,y)=( ), pentru care x+y=0 si f(x,y)=1 sau (x,y)=(0,), (x,y)=() , pentru care x+y=si f(x,y)=-1.Daca , atunci x=Cum x2+y2=1, rezulta ca y=.Pentru (x,y)= () si (x,y)= (),f(x,y)=cos.Deci -1<f(x,y)<1.Prin urmare, punctele stationare sunt ( ), (0,
Deocamdata nu am stability conditii sufuciente care sa asigure ca unele dintre aceste puncte sunt de extremum.
Totusi, tinand seama de valorile lui f, vom putea spune ca punctele ( ) sunt puncte de maxim iar punctele de forma (0,) sau () sunt puncte de minim.
In continuare, vom pune in evidenta conditii suficiente pentru ca un punct stationar conditionat (x0,y0) sa fie punct de extreme conditionat
Pentru aceasta este normal sa cercetam semnul diferentei
(15) f(x,y)-f(x0,y0)
Pentru punctele (x,y) ce verifica (8).
Daca sunt multiplicatoriii lui Lagrange, atunci a cerceta semnul diferentei (15) este echivalent cu a cerceta semnul diferentei L(x,y)-L(x0,y0) intrucat
(16) f(x,y)-f(x0,y0)=L(x,y)-L(x0,y0),
Vom presupune, in continuare , ca f,gC2(D). Aplicand formula lui Taylor functiei L cu restul de ordin 2 si tinand seama ca dL(x0,y0)=0 avem
L(x,y)-L(x0,y0)=
=
Rationand exact la fel ca in demonstratia teoremei 11.6.8, se vede ca semnul diferentei L(x,y)-L(x0,y0) este dat de semnul formei patratice d2L(x0,y0).
Intrucat variabilele x1,x2,.,xn, y1,y2,.,ym nu sunt independente (satisfac conditiile (8)), rezulta ca nici diferentialele dxi, dyk, i=1,2,.,n, y1,y2,.,ym nu sunt independente, deci vom putea determina dyk (k=) in functie de dxi (i=
In adevar, diferntiind sistemul (8') obtinem
+++
.+.+
.+.
Cum , utilizand regula lui Cramer, putem determina dy1,.,dym in functie de dx1,.,dxn , care inlocuiti in d2L(x0,y0) ne vor conduce la o forma patratica d2L(x0,y0)=.
Aplicand aceleasi consideratii algebrice pe care le-am utilizat in demonstratia teoremei 11.6.10, obtinem urmatoarele rezultate:
I. Daca toti determinantii
Sunt pozitivi, atunci forma patratica d2L(x0,y0) este pozitiv definite , deci f(x,y)-f(x0,y0)≥0 pentru , unde V este o vecinatate a punctului (x0,y0) .
In acest caz , (x0,y0) este punct de minim conditionat.
II. Daca este indeplinita conditia
(-1)k>0,
Atunci forma patratica d2L(x0,y0) este negative definita,
f(x,y)-f(x0,y0)≤0 ,
si (x0,y0) este punct de maxim local conditionat.
Metoda de mai sus, utilizata pentru determinarea punctelor de extreme conditionat se numeste metoda multiplicatorilor lui Lagrange.
Observatie!
Daca functia f este convexa si de clasa C2 pe D, atunci conditiile cuprinse in teorema 11.6.13 sunt si suficiente pentru ca punctual critic conditionat (x0,y0 ) sa fie punct de extreme conditionat.Dupa cum se observa cu usurinta, in acest caz, forma patratica d2L(x0,y0) fiind pozitiv definita, punctul (x0,y0 )va fi punct de minim conditionat pentru f.
Ex5.
Sa se determine extremele functiei f(x,y)=xy cu legatura x2+y2=a2.
Fie functia L(x,y)=xy+(x2+y2-a2)
Sa se determine punctele stationare.Observam ca
x2+y2-a2
Sa rezolvam sistemul
Sistemul
Nu trebuie sa aiba numai solutia nula si deci
=0,
De unde si
Daca rezulta ca x=-y si atunci, din x2+y2=a2 obtinem x1=, y1=-, x2=-, y2=
Daca rezulta ca x=y si atunci, din ecuatia x2+y2=a2 obtinem x3==y3 ,
x4=-=y4 .
Avem patru puncte stationare.
Pentru avem L1(x,y)=xy+(x2+y2-a2).
Dar , de unde
Prin urmare, d2L1(xi,yi)=dx2+dy2+2dxdy=(dx+dy)2, i=1,2, ceea ce antreneaza ca punctele stationare (x1,y1) si (x2,y2) sunt puncte de minim.
Pentru , obtinem L2(x,y)=xy-(x2+y2-a2).
Cum y-x , x-y, rezulta =-1, =-1,
In acest caz, d2L2(xi,yi)=-dx2-dy2+2dxdy=-(dx-dy)2, i=3,4, adica aceasta forma patratica este negative definite si, in consecinta, punctele stationare (x3,y3) si (x4,y4) sunt puncte de maxim.
Daca f este o functie convexa de o variabila, atunci (Lf) indica transformata Legendre a lui f.(Lf) se va dovedi ca este tot o functie convexa.Este definite de:
(Lf)(p)=(xp-f(x))
Geometric, (Lf)(p) este distanta maxima pe verticala dintre o linie a pantei p prin origine si f.
Fig1.
Functia convexa y=f(x), o parabola in acest caz, este desenata albastru.Linia y=px este desenata verde.Distanta pe verticala xp-f(x) este desenata rosu.distanta este maxima de la punctual xp , unde tangenta la f(x)are panta p.
Daca f este diferentiabila, atunci clar maximul este atins la valoarea lui xp , ce rezolva p=f'(xp).
Solutia xp este unica datorita monotoniei lui f'.Atunci, transformata Legendre este:
(Lf)(p)= xp p-f(xp)
Observatie!
1. Daca f este o functie concava atunci transformata legendre este -(L(-f)).
2. Doua functii care sunt transformate Legendre a inselor sunt parabola si logaritmul.
Ex1.
Aratati ca, daca f(x)= atunci (Lf)(p)=.In particular, pentru m=1/2, o parabola este transformata Legendre a ei insasi.
Ex2.
Aratati ca, transformata Legendre a functiei f(x)=alog(x) este (Lf)(p)=alog(), unde loge=1.
In particular, pentru a=e, functia logarithm este insusi transformata Legendre.
Este remarcabil ca transformata Legendre a unei functii usoare, are nevoie sa nufie usoara.De fapt, pentru f(x)=a|x|n , (Lf)(p)=a(n-1)||n/n-1 . In particular, daca n este un numar intreg, sa zicem 4, f este usoara de rezolvat, dar Lf are o putere fractionala 4/3.
Fig2.
Ex3.
Aratati ca transformata Legendre a functiei f(x)=aex/b este (Lf)(p)=(bp)log() , unde loge=1
Propozitia1
Transformata Legendre duce functii convexe in functii convexe.
Propozitia2
tdhj
Aici este o dovata geometrica a primei exprimari (P1):
Conform definitiei, pentru x, (Lf)(p)≥xp-f(x). descrieo linie dreapta in p si inegalitatea spun ca transformata Legendre in jumatatea planului deasupra acestei linii, si pentru un x special de pe linie.din moment ce aceasta este adevarata pentru toti x-icsi, aceasta arata ca transformata Legendre la intersectia la ½ planului. Deci este convexa.
Transformata Legendre este.aceasta inseamna ca L(Lf)=f,.Pentru a vedea asta luati g=(Lf).atunci de la definitie g(p)=p xp -f( xp ), p=f '(xp ) , in timp ce (Lg)(x)=xpx-g(px ), x=g'(px).
Vrem sa aratam ca f=(Lg).
Propozitia3
Daca p si x sunt legati de p=f'(x), atunci este de asemenea adevarat ca x=(Lf)'(p).In primul caz, p este dat ca o functie expicita a lui x si in celalalt. X este dat ca o functie explicita de p.
Intradevar, daca xp rezolva p=f'(xp ) atunci px care rezolva x=g'(p), trebuie sa coincide cu functia inverse a lui xp.Aceasta este vazut de la inserarea definitiei transformatei Lagrange.
x=g'(px)=(p xp-f(xp))'= xp+(p-f'(xp)) x'p = xp
Acum inlocuieste definitia lui g in ecuatia pentru Lg:
(Lg)(x)=xpx-g(px)=xf'(x)-(xpx-f(x))=x(f'(x)-px)+f(x)=f(x).
Transformata legendre de mai multe variabile
Notiunea de transformata Legendre se extinde la cazul de mai multe variabile unde xRn.
Ex.
Luati f a fi un paraboloid, adica f(x)= xAx
Notatia din dreapta este ca x este un vector si A este o matrice.Cand p este un vector p=f=ax si transformata legendre este de asemenea un paraboloid
(Lf)(p)=pxp-f(xp)=pA-1p-pa-1p= pA-1p
Ex
Gasiti transformata Legendre a ax-b
Transformata Legendre este un punct.Pentru p=a ia valoarea b, in timp ce pentru toti ceilalti p ia valoarea
Transformata Legendre partiala
Presupunem ca f(x,y)este convexa si o transformata Legendre cu privire la x singur:
g(p,y)=(px-f(x,y))
cu siguranta, g(p,y) este convexa in p.Dar despre y? In caz ca f(x,y)=f1(x)+f2(y) este clar atunci g(p,y)este concava in y.Este intotdeauna adevarat?Din fericire raspunsul este da.
Luati x=x(p,y) a fi solutie a lui p=f(x,y)
Atunci
g(p,y)=px-f(x,y)
Sa aratam ca g(p,y)este concave in y.
Luati 2u=x+z, 2v=x-z atunci
g(p,y1)+g(p,y2)=(xp-f(x,y1)+zp-f(z,y2))=(2up-f(u+v,y1)-f(u-v,y2))≤2(up-f(u,))=2g(p,
Transformata Legendre a functiei cu segmente liniare
Am vazut ca transformata Legendre a unei functii linire este o constanta.Aceasta inseamna ca daca o functie convexa are puncte liniare in regiunea punctelor liniare va trasa la un singur punct(sau ocazional, o parte orizontala).