Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Statistica descriptiva

STATISTICA DESCRIPTIVA


Orice cercetare stiintifica presupune colectarea si clasificarea datelor folosind criterii bine precizate. Volumul de date pe care il obtinem in mod uzual este foarte mare, ceea ce face dificila procesarea si interpretarea rezultatelor. Prima necesitate este organizarea datelor in (asa numitele) tabele statistice si reprezentarea grafica a distri­bu­tiei lor. Desigur, reprezentarea grafica a datelor nu aduce informatii suplimentare, dar constituie un bun suport al imaginatiei.

INDICATORI DE TENDINA

Indicatorii de tendinta centrala sunt valori ce localizeaza intr-un fel oarecare mijlocul setului de date. In cele ce urmeaza se prezinta cativa indicatori de tendinta centrala (modul, mijlocul, mediana, si cateva tipuri de medie), precum si oportunitatea utilizarii lor.



MOD: valoarea care ap­are cel mai frecvent

Un set de date poate fi non-modal (distributie uniforma­) daca toate valorile posibile apar cu aceeasi frecventa, mono-modal (o singura valoare maximala), sau multi-modal (cu mai multe valori ce apar cu aceeasi frecventa maximala).

MIJLOC: media aritmetica a valorilor extreme ale setului de date obtinute.

MEDIANA: valoarea ce imparte datele in doua grupe egal populat­e (7 in exemplul dat).

Pentru un numar impar de date, n = 2k+1, mediana este valoarea cu numarul de ordine k+1 din sirul crescator al datelor. Pentru un numar par de date, n = 2k, mediana este egala cu media aritmetica a valorilor cu numerele de ordine k si k+1 din sirul crescator al datelor.

MEDIA: poate fi de mai multe tipuri. Mai folosite sunt: media aritmetica, geometrica, armonica si cuadratica. Media aritmetica se refera in mod normal la puterea intai a datelor (daca nu se precizeaza altfel). La modul general este media puterilor de exponent q a datelor. Fiecare tip de medie poate fi aplicat atat datelor discrete cat si celor continui. Diferenta este in utilizarea calculului algebric sau a celui diferential si integral.

unde xj apare cu frecventa absoluta nj (n este numarul total de date).

Media aritmetica pentru o variabila continua si marginita x, cu densitatea de frecventa f(x), este:

Media geometrica a unei variabile discrete este:

INDICATORI DE POZITIE

Indicatorii de pozitie sunt folositi pentru a descrie localizarea unui anumit subgrup de date in relatie cu restul esantionului. Numiti α-cuantile, acesti indicatori impart esantionul in α (numar natural nenul) parti egal populate. Prima α-cuantila delimiteaza superior cele mai mici n/α entitati, a doua cele mai mici 2 n/α, s.a.m.d. Pe baza lor se fac clasificari ale datelor pe care le avem.

Cele mai folosite cuantile in aplicatii sunt: cvartila, decila si (per)centila. Cvartilele, decilele, si (per)centilele sunt valori numerice care impart datele obtinute in parti continand respectiv o patrime, o zecime, sau o sutime din elemente.

INDICATORI DE DISPERSIE




Indicatorii de imprastiere (sau dispersie) descriu variabilitatea datelor. Cele grupate strans au valori mici pentru indicatorii de dispersie, in timp ce datele imprastiate ­au valori mari. Evident avem mai multa incredere in datele grupate decat in cele imprastiate, intrucat ne asteptam ca o noua masuratoare sa duca la o valoare apropiata. Cand datele sunt foarte imprastiate este foarte greu sa spunem ce va urma.

Principalii indicatori de imprastiere sunt: domeniul, varian­ta, deviatia, si momentele.

Domeniul: intervalul de valori al datelor: Δ = (xmin, xmax); uneori se indica largimea domeniului (sau amplitudinea imprastierii): Δx =(xmax - xmin).

Toate deviatiile medii fata de un indicator de tendinta centrala (media arit­metica, geomet­rica, armonica, cuadratica, sau modul, sau mediana, notate generic prin <x>) se definesc in acelasi fel ca medii ale diferentei intre valoarea masurata si indicatorul respectiv.

Mai general este momentul centrat de ordin q, mq(x) fata de media x.

sau fata de orice alta valoare importanta xo, Mq(xo):

m2(x) se numeste varianta (V); radacina patrata a variantei se numeste deviatie patratica (notata de obicei cuσ). Ambele marimi arata imprastierea datelor.

Orice rezultat experimental trebuie prezentat prin media aritmetica ± deviatia. Intervalul (<x> - σ, <x> + σ) se numeste interval de incredere (sau de confidenta).

Intrucat biologul si medicul au in general putine date de procesat, trebuie sa inlocuiasca varianta V cu varianta standard SV si deviatia σn cu deviatia stan­dard (notata SD­ sau σn-1):



Nota: indicatorii standard trebuie utilizati cand n < 30. Ratiunea este foarte simpla: cu ajutorul deviatiei (patratice) se exprima intervalul de confidenta care arata eroarea de masura. Marind deviatia, creste si increderea noastra ca rezultatul real se afla in intervalul precizat.

3) m3 este numit inclinare/oblicitate si se utilizeaza la definirea coefi­cientului de asimetrie, ac, (numit in engleza skewness si notat SKEW):

4) m4 se numeste exces si arata cat de aplatizata este distributia. Se foloseste la definirea coeficientului de aplatizare/boltire, τ (numit in engleza kurtosis, notat prin KURT):

INDICATORI VITALI

Aceasta sectiune introduce cateva din cele mai importante rate si rapoarte folosite in analiza starii de sanatate a populatiei. Toti indicatorii (sau indicii) vitali se refera la populatia dintr-un teritoriu bine precizat si la o perioada predeterminata. Rata este frecventa relativa de aparitie a evenimentului de interes, in timp ce raportul este rezultatul impartirii a doua cantitati uneori diferite (cum ar fi numarul de doctori la mia de locuitori). Atat rata cat si raportul sunt multiplicate de obicei printr-un factor k, pentru a nu opera cu numere zecimale prea mici.

unde:

k este un multiplu de 10 ca: 10, 100, 1.000, 10.000 sau 100.000, mai rar 1.000.000,



a este frecventa de aparitie a unui eveniment intr-o perioada de timp specificata,

a + b numarul de persoane expuse riscului acelui eveniment in aceeasi perioada,

c, d frecvente de aparitie a anumitor evenimente sau elemente; spre deosebire de rata, numaratorul nu mai este o parte componenta a numitorului.

In terminologia romaneasca cuvantul rata se subintelege. Astfel, rata mortalitatii de exemplu, se numeste simplu mortalitate.

MORTALITATEA

Ratele mortalitatii exprima frecventa relativa de survenire a decesului intr-un interval specificat de timp pentru o anumita populatie. Cei mai importanti indicatori de mortalitate sunt:

- mortalitatea bruta anuala = (numarul total de decese intr-un an)/ (populatia totala la 1 Iulie) * 1.000;

- mortalitatea specifica anuala = (numarul total de decese intr-un subgrup specific pe parcursul unui an) / (populatia totala a subgrupului specificat) * 1.000;

- rata ajustata/standardizata de mortalitate se obtine considerand un esantion standard care reprezinta populatia reala; de obicei 1.000, sau 1.000.000;

- mortalitatea materna = (numarul de decese ale mamelor din cauze puerperale intr-un an) / (numarul total de nasteri dintr-un an) * 100.000;

- mortalitatea infantila = (numarul anual de decese ale copiilor sub 1 an) / (numarul total de nascuti vii intr-un an) * 1.000;

- mortalitatea neonatala = (numarul de decese in primele 28 zile de viata intr-un an) / (numarul total de nascuti vii intr-un an) * 1.000;

- mortalitate fetala = (numarul total de decese fetale pe an) / (numarul total de treceri ale fatului si placentei din canalul genital in lumea externa, pe an) * 1.000;

- raportul de mortalitate fetala = (numarul total de decese fetale pe an)/ (numarul total de nascuti vii pe an) * 100;

- mortalitate perinatala = (numarul anual de decese fetale cu cel putin 28 de saptamani de gestatie + numarul anual de decese ale copiilor in primele 7 zile de viata) / (numarul anual de decese fetale cu cel putin 28 de saptamani de gestatie + numarul anual de nascuti vii) * 1.000;

- mortalitatea specifica = (numarul anual de decese datorita unei anumite afectiuni specifice) / (numarul anual de decese datorita tuturor cauzelor posibile) * 100; mortalitatea diferentiala = este mortalitatea specifica a unei subpopulatii;

- mortalitatea comparabila (raport) este utilizata pentru a compara doua populatii cu structuri diferite pe grupe de varsta, sex, profesie, etc., din teritorii diferite.

INDICATORI DE FERTILITATE

Fertilitatea se refera la producerea reala de copii, spre deosebire de fecunditate, care reprezinta capacitatea de a avea copii. Perioada normala de fertilitate se considera intre 15 si 49 de ani, chiar daca pot apare nasteri si in afara acestui interval. Cei mai importanti indicatori de fertilitate sunt:

- natalitatea (bruta) = (numarul total de nasteri vii intr-un an)/ (populatia totala la 1 Iulie) * 1.000;

- fertilitatea generala = (numarul anual de nasteri vii) / (numarul total de femei la varsta fertila) * 1.000;

- fertilitate specifica pe grupe de varsta = (numarul anual de nasteri la femeile dintr-o anumita categorie de varsta) / (numarul total de femei din categoria respectiva) * 1.000;

- fertilitate totala = suma tuturor fertilitatilor specifice pe grupe de varsta. Reprezinta estimarea numarului de copii pe care 1.000 de femei l-ar putea avea in total;

- fertilitatea cumulativa este o parte a fertilitatii totale pentru o perioada particulara de fertilitate;

- fertilitatea standardizata se refera la un esantion standardizat din populatie.

INDICATORI DE MORBIDITATE

Morbiditatea arata sensibilitatea colectivitatii la imbolnavire. Cele mai folosite masuri ale morbiditatii sunt:

- incidenta = (numarul anual de cazuri noi cu o afectiune specifica) / (populatia totala la 1 Iulie) * k (k = 100 pentru afectiuni comune, k = 10.000 sau 100.000 pentru afectiuni rare);

- prevalenta = (numarul total de cazuri, noi sau vechi, existente la un anumit moment) / (populatia totala la acel moment) * k;

- raportul de fatalitate = (numarul total de decese datorita­ bolii) / (numarul total de bolnavi cu afectiunea respectiva) * 100;

- raportul de imaturitate = (numarul de nascuti vii sub 2500 grame intr-un an) / (numarul anual de nascuti vii) * 100;

- rata celui de al doilea atac (transmisibilitatea) = (numarul aditional de cazuri ca urmare a contactului cu o persoana bolnava in merioada maxima de incubar­e) / (numarul total de contacte susceptibile)