Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Distributia hipergeometrica, distributia poisson, distributia normala (laplace - gauss)

DISTRIBUTIA HIPERGEOMETRICA

Definitie: variabila aleatorie hipergeometrica este o succesiune de n variabile aleatorii Bernoulli, corespunzatoare la n extractii succe­sive ­fara reintroducerea obiectului extras. Din aceasta cauza fiecare extractie modifica marimea populatiei (care se reduce cu o unitate), prin aceasta modificand si probabili­tatea de succes.

Probabilitatea de a obtine r succese in n extractii fara reintroducerea obiectelor extrase, dintr-o populatie ce contine N indivizi de doua tipuri diferite este dat de formula Laplace:



unde p este probabilitatea de succes in prima extractie.

Caracteristici:

1) n N;

2) Np + Nq = N(p + q) = N.1 = N

3) valoarea asteptata a distributiei hipergeometrice este identica cu cea a distributiei binomiale, adica E(X) = np;

Varianta distributiei hipergeometrice este intodeauna mai mica decat cea a distributiei binomiale (cu exceptia cazului neinteresant n = 1); cand n/N 0 (populatie mare, numar de extractii mic), distributia hipergeo­metrica tinde catre distributia binomiala.

Factorul (N - n)/(N - 1) se numeste coeficient de evacuare iar raportul n/N este numit sarcina de incercare.

DISTRIBUTIA POISSON

Distributia binomiala poate fi aproximata cu distributia Poisson (numita si legea evenimentelor rare­, sau legea numerelor mici) pentru probabili­tati de succes foarte mici (p 0) si numere mari de incercari (n ), daca produsul intre probabilitatea succesului si numarul de incercari tinde spre o valoare finita, pozitiva (np α

Se obtine succesiv­:





Exemple de distributii Poisson:

- probabilitatea ca un receptor din placa motorie a unei sinapse neuromusculare­ sa lege ­intr-un interval precizat o molecula de mediator chimic (de exemplu, acetilcolina

- proba­bilitatea de a gasi o bacterie intr-un volum mic, bine precizat de lichid, etc.

Proprietatile distributiei Poisson:

1) aparitiile evenimentelor sunt independente;

2) teoretic este posibila aparitia unui numar oricat de mare de evenimente in intervalul dat;

3) probabilitatea unei singure aparitii a evenimentului in intervalul dat este proportionala cu largimea intervalului;

4) valoarea asteptata este E(x) = α

5) varianta este V(x) = α

distributia satisface conditia de normalitate

Distributia Poisson pentru valorile 1, 2, 5, 10 ale parametrului α




Frecventele Poisson cumuate­

DISTRIBUTIA NORMALA (LAPLACE - GAUSS)

Orice distributie reala, indiferent de tipul de variabila (continu­a sau discreta), devine tot mai simetri­ca, tinzand spre o curba in forma de clopot, pe masura ce numarul de incercari creste. Studiind aceasta tendinta naturala in diferite fenome­ne, Gauss, Laplace, Boltzmann, Maxwell, si multi altii, au ajuns la urmatoarea lege continua de distributie (numita de aici inainte legea distributiei normale):



unde μ este media aritmetica (sau valoarea asteptata) iar σ deviatia standard.

Functia este o densitate de probabilitate deoarece f(x) (numita si functie Γ) este pozitiva peste tot, iar integrala sa pe axa reala este 1.Caracteristicile distributiei normale:

1.reprezentata de o curba in forma de clopot (asa numitul 'clopot al lui Gauss');

2.simetrica fata de valoarea asteptata (= media aritmetica = mediana = modul);

3.continua (numar infinit de rezultate posibile);

4.tinde asimptotic spre abscisa la ambele extreme; nici un rezultat nu are densitate de probabilitate zero;

5.probabilitatea de a obtine un rezultat in intervalul (a, b), este dat de aria de sub graficul densitatii limitata de abscisele corespun­zatoare:

6.probabilitatea de a obtine un rezultat intre (μ σ μ σ este aproximativ 68%;

7.probabilitatea de a obtine un rezultat in intervalul (μ - 2σ μ + 2σ este de aproximativ 95% (exact 95% se obtine in (μ - 1,96σ μ + 1,96σ

8.probabilitatea de a obtine un rezultat in intervalul (μ - 3σ μ + 3σ este de aproximativ 99,7 %;

9. x = μ σ si x = μ σ sunt puncte de inflexiune (in care se schimba semnul derivativatei a doua, deci curba de distributie devine din convexa concava si vice versa).

Distributia normala depinde de doi parametri (μ si σ); din aceasta cauza relatia defineste o familie de distributii. Modificarea valorii asteptate μ are efectul de 'translatare' a distri­butiei in lungul axei Ox fara a i se schimba forma, in timp ce modificarea deviatiei σ duce fie la aplatizarea distributiei (daca σ creste) fie la ascutirea sa (daca σ scade).

Aceasta schimbare de variabila duce la transformarea oricarei distributii reale, de tip Gauss, intr-una identica pentru toate situatiile, numita distributie standard. Pentru aceasta noua distributie valoarea asteptata este μ = 0 iar deviatia standard este σ = 1. Schimbarea de variabila nu afecteaza proprietatile distributiei normale dar reduce considerabil efortul de calcul. Odata determinat intervalul standard [za,zb] corespunzator intervalului 'natural' [a,b], nu avem altceva de facut decat sa cautam valorile necesare in tabel

Distributia standard. Valoarea asteptata este μ = 0 iar deviatia standard este σ = 1. Functia de repartitie pentru un scor negativ = 1 - functia de repartitie pentru scorul pozitiv egal ca valoare absoluta.

DISTRIBUTIA χ2

Consideram distributia normala a unei anumite caracteristici cantitative (sau scor) x a populatiei (exprimata prin numere reale), cu valoarea asteptata μ si varianta σ2 . Din scorul aleatoriu x al acestei distribu­tii formam scorul standard z dupa procedura uzuala:



Cum sunt distribuite patratele scorurilor standard?

Putem formula intuitiv o serie de proprietati ale acestei distributii:

- intrucat z2 este patratul unui numar real, el nu poate fi negativ, dar poate fi oricat de mare;

- este pozitiv inclinat (adica ac > 0, orientat spre stanga);

- aproape 68% din rezultate 'cad' intre 0 si 1.

Folosind pro­prietatile repartitiei standard si cautand in tabele putem fi oricat de precisi dorim in formularea caracteristicilor modului de repartizare in clase a scorurilor z2.

Distributia scorurilor z2 se numeste distributie χ2 (hi patrat) cu un grad de libertate. Valoarea asteptata (sau media) acesteia este μ = 1, iar varianta (standard) este σ2 = 2

In general, pentru r scoruri aleatorii (xi , i = 1, , r) ale unor distributii normale (identi­ce sau nu), suma patratelor scorurilor standard z:

r

χ2(r) = Σ zi2

este χ2 distribuit cu r grade de libertate

CARACTERISTICILE DISTRIBUTIEI χ2

Distributia χ2 are urmatoarele caracteristici principale:

1) valoarea asteptata:

2) varianta:      V(χ2) = 2r

3) are proprietatea de aditivitate. Aceasta inseamna ca suma a doua distributii χ2, una cu r1 si cealalta cu r2 grade de libertate, este tot o distributie χ2 cu r = r1 + r2 grade de libertate:

X2(r1) + X2(r2) = X2(r1 + r2)

Functia de repartitie a scorurilor χ2 este tabelata. In tabel, fiecare linie corespunde unui numar particular de grade de libertate si fiecare coloana reprezinta o anumita parte (superioara) a distributiei pe care dorim sa o izolam. Aceasta inseamna ca fiecare element din tabel este, pentru un anumit numar de grade de libertate r si o probabilitate α, valoarea c care satisface relatia:

P(χ2 > c) = α

Densitatea de probabilitate pentru distributii χ2 ­cu 1, 2, 5 sau 20 de grade delibertate. DISTRIBUTIA 't' (STUDENT)

Asanumita distributie 't' a fost propusa in 1908 intr-o lucrare publicata de catre W.S.Gosset, un irlandez angajat al unei fabrici de bere, sub pseudonimul 'Student'. In deducerea distributiei t, Gosset a presupus ca esantioanele se extrag aleatoriu dintr-o populatie normal distribuita. Se obtin insa rezultate satisfacatoare si daca populatia de origine nu este distribuita normal. Aceasta distributie se foloseste intotdeauna cand avem esantioane cu mai putin de 30 de elemente.

t este distributia unei variabile aleatorii obtinute prin impartirea unui scor standard z la radacina patrata a raportului dintre o variabila χ2 si numarul acesteia de grade de libertate (v. paragraful precedent):

CARACTERISTICILE DISTRIBUTIEI t

1) variabila t ia valori pe intreaga axa reala;

2) t desemneaza de fapt o familie de distributii, fiecare definita prin numarul de grade de libertate r;

3) valoarea asteptata este zero;

4) este simetrica in raport cu media;

5) varianta este mai mare decat 1 (valoarea pentru distributia standard); ea descreste spre 1 cand numarul de grade de libertate creste;

6) distributia t tinde spre distributia standard pentru numere mari de grade de libertate;



7) distributia t este mai aplatizata decat cea standard (are 'varful' mai mic si 'cozile' mai inalte);

Functia de repartitie a scorurilor t este tabelata. Fiecare linie a tabelului corespunde anui numar particular de grade de libertate, iar fiecare coloana reprezinta o anumita portiune superioara a distributiei pe care o izolam. Deci fiecare element al tabelului reprezinta (pentru r grade de libertate si probabilitatea α) valoarea c care satisface relatia:

P(t > c) = α

Datorita simetriei fata de origine a distributiei Student, α-cuantilele satisfac relatia:

DISTRIBUTIA FISHER - SNEDECOR

Fie X si Y doua variabile aleatorii independente, ambele distribuite χ2 cu r1, respectiv r2 grade de libertate; raportul:

defineste variabila aleatorie (sau scorul) Fisher - Snedecor cu r1 si r2 grade de libertate.

CARACTERISTICI

1) F ia valori nenegative; F poate fi zero sau pozitiv;


2) distributia F este asimetrica (pozitiv inclinata, adica orientata spre stanga);

3) sunt tot atatea distributii F, cate perechi de numere de grade de libertate se pot forma;

4) dacar1, r2 ,atunciF 1

5) daca r1 = 1 variabila aleatorie F este distribuita la fel ca si patratul unei variabile t cu r2 grade de libertate;

6) daca r1 = 1 si r2 , atunci radacina patrata a lui F este chiar distributia standard;

7) daca r2 atunci distributia F tinde catre distributia χ2 ­cu r1 grade de libertate;

8) daca X = (X1, , Xr1) si Y = (Y1, , Yr2) sunt doua esantioane de distributii normale cu variante identice, σ2, dar cu valori asteptate diferite, μ1 si μ2, si marimi diferite ale numarului de distributii, r1 si r2, distributii notate cu N(μ1 σ , N(μ2 σ , atunci variantele de ­selectie sunt:

iar scorul F devine: F = s12/s22

TEOREMA DE LIMITA CENTRALA

Fie A o populatie numerabila si X distributia a r variabile aleatorii identice, care sunt seturi de cate n rezultate cu reintoarcerea elementului extras in urna. ­Prin definitie obiectul matematic Xi (i = 1, , r) este distribu­tia celui de al ilea rezultat in toate seturile. Numarul r de variabile este numit numar de grade de libertate.

Daca se iau in mod intamplator toate esantioanele posibile, fiecare de dimensiune r, dintr-o populatie cu valoarea asteptata μ si deviatia standard σ, atunci distributia de selectie a valorilor asteptate din esantioane:

a) are valoarea asteptata μx = μ;

b) are varianta Erf s σx2 = σ2/r;

c) este distribuita normal daca popula­tia de origine este normal distribuita sau poate fi aproximata cu o distributie normala pentru esantioane cu mai mult de 30 de elemente.

OBSERVATII:

1) aproximatia cu distributia normala se imbunatateste pentru esatioane mari;

2) teorema de limita centrala se refera la distributia de selectie a valorilor asteptate in esantioanele de dimensiune constanta r, precizand tipul de distributie (normala), centrul acesteia, si cat de dispersate sunt valorile ce se pot obtine­;

3) deoarece distributia valorilor asteptate in esantioane poate fi aproximata cu cea normala, putem utiliza tabelul valorilor functiei de repartitie stan­dard F(z) dupa transformarea scorului normal in scor standard.

Cele mai importante distributii de selectie ­sunt: χ2 (hi-patrat), Student si Fisher - Snedecor si care pot fi utilizate pentru a verifica ipotezele statistice.

asigurari

comert






Upload!

Trimite cercetarea ta!
Trimite si tu un document!
NU trimiteti referate, proiecte sau alte forme de lucrari stiintifice, lucrari pentru examenele de evaluare pe parcursul anilor de studiu, precum si lucrari de finalizare a studiilor universitare de licenta, masterat si/sau de doctorat. Aceste documente nu vor fi publicate.