|
TEORIA PROBABILITATILOR
Evolutia sistemului catre o stare particulara se numeste experiment.
Rezultatul unui experiment (deci realizarea unei stari posibile) se numeste eveniment.
Probabilitatea, p, de producere a unui eveniment este raportul intre numarul de evenimente favorabile si numarul total de evenimentea.
Clasificarea ecenimentelor:
A. considerand valoarea probabilitatii:
i) sigur: se produce intotdeauna, p = 1.
ii) probabil (posibil): se poate intampla, 0 p 1
iii) imposibil: nu se produce niciodata, p = 0.
B. considerand posibilitatea de a apare impreuna:
i) compatibile: cand nu sunt mutual exclusive. Aceasta inseamna ca probabilitatea intersectiei (adica probabilitatea de a apare simultan) nu este zero.
ii) incompatibile: cand sunt mutual exclusive.
C. considerand legatura dintre evenimente:
i) independente: aparitia unuia nu afecteaza aparitia celuilalt.
ii) dependente: cand nu se respecta conditia de mai sus.
D. considerand complementaritatea evenimentelor:
i) complementare (sau opuse): daca reunirea lor este evenimentul cert E si intersectia este evenimentul imposibil 0. Complementul evenimentului A (inclus in E) se noteaza
|
ii) non-complementare: cand nu este satisfacuta cel putin una din conditiile evenimentelor complementare.
|
PROBABILITATI CONDITIONATE
R evenimentul ca un om luat la intamplare sa aiba o anumita afectiune, R* - evenimentul complementar, om neinfestat; S evenimentul de obtinere unui test pozitiv de identificare (seropozitiv), S* - complemetul sau, seronegativ.
Evident nici un test nu este perfect. Din aceasta cauza nu toti oamenii infestati vor fi detectati ca seropozitivi, si nu toti cei detectati seropozitivi sunt neaparat infestati. Intotdeauna veti gasi fals-seropozitivi si fals-seronegativi. Ambele greseli sunt foarte periculoase. Sa presupunem ca am examinat la intamplare n persoane si am obtinut urmatoarele date:
- a persoane infestate au dat test pozitiv, deci eveniment: R S
- b persoane infestate au dat test negativ, eveniment: R S*
- c persoane neinfestate au dat test pozitiv, eveniment: R* S
- d persoane neinfestate au dat test negativ, eveniment: R* S*
Evident: a + b + c + d = n.
Probabilitatile (in acest caz frecventele relative de aparitie ale) diverselor evenimente sau asociatii de evenimente sunt:
|
|
|
|
p(R) se numeste prevalenta afectiunii.
Probabilitatea de a obtine un test pozitiv, stiind ca este vorba de o persoana infestata, (probabilitatea conditionata) este:
|
Aceasta probabilitate, notata cu Se, se numeste sensibilitate a testului Valoarea ideala este 1 (100%). Intr-o astfel de situatie, toate persoanele infestate pe care le investigam sunt detectate de test. Sensibilitatea testului trebuie completata de specificitatea testului, Sp:
|
Valoarea ideala a specificitatii este de asemenea 1 (100%), insemnand ca nici o persoana neinfestata sa fie gasita seropozitiva. Niciun test clinic nu este perfect. Deci nu veti avea niciodata la dispozitie un test cu valorile: Se = 100% si Sp = 100%. Orice jurnal medical serios cere autorilor cercetarilor clinice sa precizeze sensibilitatea si specificitatea testelor clinice utilizate. Testele afectiunilor foarte grave (cum este SIDA) trebuie sa aiba valori ridicate ale sensibilitatii si specificitatii. De exemplu testul ELISA are Se = 97%, Sp = 99,8%, iar testul Western-Blot are Se = 95%, Sp = 99,99%.
Se pot obtine usor probabilitatile conditionate inversate ale celor doi indicatori. Acestea sunt: probabilitatea ca un test pozitiv sa indice o persoana infestata, numita valoare pozitiva predictiva, VPP, si probabilitatea ca un test negativ sa indice o persoana neinfestata, numita valoare predictiva negativa, VPN. Atat VPP cat si VPN, exprima confidenta (increderea) in testul clinic.
|
|
|
|
|
In mod analog se deduce:
|
Se numeste eficienta a testului, Ef, probabilitatea de a obtine o concluzie adevarata, care este:
Ef s p(R S) + p(R* S*)
Testul clinic este de interes daca, si numai daca,
Se + Sp > 1
Aceasta concluzie vine din faptul ca orice test trebuie sa aduca informatii superioare despre statutul pacientului, adica:
VPP > p(R) si VPN > p(R*), altfel folosirea sa nu ar avea nici un sens.
Din expresia VPP se obtine:
|
|
Daca prevalenta bolii este foarte mica, atunci chiar si in cazul unor teste cu valori foarte mari ale Se si Sp (peste 90 %), VPP nu este satisfacator.
In cazul unei afectiuni rare, (prevalenta sub 1%), testul este concludent pentru rezultatul negativ, dar trebuie intotdeauna repetat pentru un rezultat pozitiv!
DISTRIBUTII
Variabila aleatorie: variabila ce ia o valoare numerica unica pentru fiecare rezultat posibil in spatiul experimentului probabilistic.
Functia de probabilitate: o regula ce asociaza probabilitati valorilor variabilei aleatorii. Este practic campul de evenimente pentru o variabila discreta sau o functie continua si marginita, f(x), numita densitate de probabilitate. Pentru o variabila discreta, functia de probabilitate este reprezentata de:
|
In cazul unei variabile continui se foloseste densitatea de probabilitate, functie reala de variabila reala, continua si marginita, care indeplineste conditia de normare la unitate:
|
Intrucat densitatea de probabilitate este nula in afara domeniului de definitie al functiei de densitate, se poate folosi conditia mai generala:
|
Probabilitatea P de a obtine o valoare intr-un interval particular [a,b) din domeniul de definitie este evident integrala densitatii de probabilitate pe acest interval:
|
Distributia unei variabile: setul total de valori a unei caracteristici particulare, divizat in grupe dupa anumite criterii.
Propietatile distributiilor:
i) distributia ψ a unei combinatii liniare a doua variabile aleatorii este o combinatie liniara a distributiilor variabilelor independente:
|
unde x1 si x2 sunt doua variabile aleatorii, iar λ1 si λ2 doua constante reale. Aceasta permite analiza pe componente a unor distributii complexe ce aproximeaza fenomenele din organismul uman, ceea ce permite simplificarea considerabila a calculelor.
ii) distributia poate fi translatata sau transformata omotetic prin transformarea corespunzatoare a variabilei aleatorii.
Toti indicatorii de tendinta centrala, de pozitie si de variabilitate a setului de date pot fi redefiniti in termeni probabilistici. Astfel:
1) media aritmetica de ordin q: |
2) momentul centrat de ordinul q:
|
Ipoteza ergodica: functia de probabilitate a unui experiment, repetat identic de foarte multe ori pe acelasi sistem, este identica cu functia de probabilitate a aceluiasi experiment realizat simultan pe foarte multe sisteme identice.
Principalele caracteristici ale oricarei distributii de probabilitate sunt: valoarea asteptata si deviatia/varianta standard.
Valoarea asteptata, E(X), a unui experiment efectuat pe o variabila aleatorie particulara X, este media aritmetica a distributiei teoretice a datelor.
|
Proprietatile valorii asteptate:
a) valoarea asteptata este un operator E ce asociaza o cantitate precisa unei variabile aleatorii X; aceasta valoare nu este in mod necesar un rezultat posibil al experimentului (din campul de evenimente); de exemplu un camp cu doua evenimente disjuncte (baiat sau fata la nasterea unui copil) va avea drept valoare asteptata media celor doua evenimente (aici un hermafrodit);
b) daca variabila aleatorie contine numai un eveniment atunci valoarea asteptata este chiar acel eveniment;
c) E este un operator liniar, adica:
E(aX + bY) = aE(X) + bE(Y)
unde X si Y sunt doua campuri de evenimente, iar a si b doua numere reale; aceasta deriva din proprietatea (i) a distributiilor.
d) daca X si Y sunt doua campuri independente de evenimente atunci valoarea asteptata pentru produsul cartezian X*Y este produsul valorilor asteptate ale fiecarui camp.
E(X*Y) = E(X).E(Y)
Proprietatile variantei, V, si ale deviatiei standard, σ
a) V(X), σ(X) iau valori nenegative;
b) V(X) = E([X - E(X)]2) = E(X2) - [E(X)]2;
c) daca X contine numai un eveniment, atunci V(X) = 0;
d) V(aX) = a2V(X);
e) V(X + Y) = V(X) + V(Y),daca X si Y sunt independente;
f) V(X - Y) = V(X) + V(-Y) = V(X) + (-1)2V(Y) = V(X) + V(Y) daca X si Y sunt independente;
Functia de repartitie, F(x) este probabilitatea cumulata de la cea mai mica valoare posibila (uzual considerata - pentru o variabila continua) pana la valoarea actuala x.
|
Functia de repartitie este foarte utila in aplicatii deoarece este tabelata. Aceasta permite inlocuirea integrarii densitatii de probabilitate printr-o simpla scadere a doua numere luate din tabel.:
|
FUNCTIA HEAVISIDE
Functia Heaviside (functia unitate sau functia treapta):
|
este folosita pentru a exprima legea fundamentala a excitabilitatii totul sau nimic, ca si orice tranzitii cuantice. Functia poate lua fie valori cantitative (aici numerele 0 si 1) fie calitative (ex. alb-negru; inchis-deschis, etc.).
|
Functia treapta a lui Heviside.
Functia Heaviside poate fi translatata astfel incat saltul sa se produca in orice alt punct xo:
Θ(x) = Θ(x - 0) T Θ(x - xo
Saltul poate avea orice alta amplitudine diferita de 1, de exemplu a. Functia se poate generaliza pentru mai multe trepte, de diverse amplitudini, la mai multe abscise.
|
sau, tot pentru o treapta dar in spatiul poli-dimensional, Rn:
|
DISTRIBUTIA DIRAC
Derivata de ordinul intai a distributiei (functiei) Heaviside este distributia Dirac:
|
Distributia Dirac se foloseste la descrierea pozitiei unor puncte sau pentru a transforma o variabila continua intr-una discreta. Ea poata fi translatata in orice alt punct de pe axa numerelor reale, sau generalizata in spatiul polidimensional.
|
|
Proprietati:
1) este o distributie para, ceea ce face ca valoarea sa sa nu se modifice la schimbarea semnului variabilei:
δ(- x) = δ(+ x), ( ) x ε Rn;
2) multiplicarea variabilei cu o constanta transforma distributia dupa cum urmeaza:
δ αx) = δ(x)/│α│, x ε R;
ce poate fi generalizata in spatiul polidimensional:
δ α1x1, , αnxn) = δ(x1, , xn)/(│α1│ │αn│
3) adunarea unei constante:
δ αx + ß) = δ(x + ß/α │α│n, x ε Rn.