Formula este intervalul de încredere al tuturor valorilor. Estimarea erorii aleatoare

Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță ...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu pot fi calculate din cauza inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care, cu un anumit grad de probabilitate, se află valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci media generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t - valoarea tabelară a criteriului Student pt α =0,05 și f= n-1

Poate fi găsit și 99% CI, în acest caz t ales pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mare în medie și, în consecință, un CI mai larg. Și acesta este motivul pentru a reveni la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI evaluează dacă rezultatele vor fi semnificative clinic

Să ne oprim mai în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Amintiți-vă că sarcina statisticilor este de a detecta cel puțin unele diferențe în populația generală, pe baza datelor din eșantion. Este sarcina clinicianului să găsească astfel de diferențe (nu orice) care să ajute la diagnostic sau tratament. Și nu întotdeauna concluziile statistice stau la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă o problemă din corpul uman nu are un caracter de masă la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Vom lua în considerare această poziție în exemplu.

Cercetătorii s-au întrebat dacă băieții care au avut un fel de boală infecțioasă au rămas în urmă față de semenii lor în creștere. În acest scop, a fost realizat un studiu selectiv, la care au participat 10 băieți care aveau această boală. Rezultatele sunt prezentate în tabelul 23.

Tabelul 23. Rezultate statistice

limita inferioara

Limita superioară

Specificații (cm)

mijloc

Din aceste calcule rezultă că înălțimea medie selectivă a băieților de 10 ani care au avut un fel de boală infecțioasă este aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „statură mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

Probabilități, recunoscute ca fiind suficiente pentru a judeca cu încredere parametrii generali pe baza caracteristicilor eșantionului, sunt numite fiduciar .

De obicei, valorile de 0,95 sunt alese ca probabilități de încredere; 0,99; 0,999 (de obicei sunt exprimate ca procent - 95%, 99%, 99,9%). Cu cât este mai mare gradul de responsabilitate, cu atât mai mult nivel inalt nivelul de încredere: 99% sau 99,9%.

Un nivel de încredere de 0,95 (95%) este considerat suficient în cercetare științificăîn zona cultura fizica si sport.

Intervalul în care se găsește media aritmetică a eșantionului a populației generale cu o probabilitate de încredere dată se numește interval de încredere .

Nivelul de semnificație al evaluării este un număr mic α, a cărui valoare implică probabilitatea ca acesta să fie în afara intervalului de încredere. În conformitate cu probabilitățile de încredere: α 1 = (1-0,95) = 0,05; α 2 \u003d (1 - 0,99) \u003d 0,01 etc.

Interval de încredere pentru medie ( așteptări matematice) A distributie normala:

,

unde este fiabilitatea (probabilitatea de încredere) a estimării; - medie eșantionului; s - abaterea standard corectată; n este dimensiunea eșantionului; t γ este valoarea determinată din tabelul de distribuție a lui Student (vezi Anexa, Tabelul 1) pentru n și γ dat.

Pentru a găsi limitele intervalului de încredere a valorii medii a populației generale, este necesar:

1. Calculați și s.

2. Este necesar să se stabilească probabilitatea de încredere (fiabilitatea) γ a estimării 0,95 (95%) sau nivelul de semnificație α 0,05 (5%)

3. Conform tabelului t - Distribuțiile lui Student (Anexă, Tabelul 1) găsiți valorile la limită ale lui t γ .

Deoarece distribuția t este simetrică față de punctul zero, este suficient să cunoaștem doar valoarea pozitivă a lui t. De exemplu, dacă dimensiunea eșantionului este n=16, atunci numărul de grade de libertate (grade de libertate, df) t– distribuții df=16 - 1=15 . Conform tabelului 1 aplicare t 0,05 = 2,13 .

4. Găsim limitele intervalului de încredere pentru α = 0,05 și n=16:

Limitele încrederii:

Pentru dimensiuni mari ale eșantionului (n ≥ 30) t – Distribuția elevului devine normală. Prin urmare, intervalul de încredere pentru pentru n ≥ 30 poate fi scris după cum urmează:

Unde u sunt punctele procentuale ale distribuției normale normalizate.

Pentru probabilitățile standard de încredere (95%, 99%; 99,9%) și nivelurile de semnificație valori α ( u) sunt date în tabelul 8.

Tabelul 8

Valori pentru nivelurile de încredere standard α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Pe baza datelor din exemplul 1, definim limitele celor 95% interval de încredere (α = 0,05) pentru rezultatul mediu al săriturii în sus de la fața locului.În exemplul nostru, dimensiunea eșantionului este n = 65, apoi recomandările pentru o dimensiune mare a eșantionului pot fi utilizate pentru a determina limitele intervalului de încredere.

De multe ori evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află obiectul de evaluare. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, prin urmare, pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu este întotdeauna omogen, uneori este necesar să îl curățați de extreme - oferte de piață prea mari sau prea scăzute. În acest scop, se aplică interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a alege cea mai bună opțiune de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Interval de încredere - calculat pe baza eșantionului, intervalul de valori ale caracteristicii, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Sensul calculării intervalului de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere cu o anumită probabilitate conține valoarea necunoscută a cantității estimate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol, vom lua în considerare 2 moduri:

  • prin abaterea mediană și standard;
  • prin valoarea critică a statisticii t (coeficientul Student).

Etape analiza comparativa căi diferite calcul CI:

1. formați un eșantion de date;

2. procesează-l metode statistice: calculați media, mediana, varianța etc.;

3. calculăm intervalul de încredere în două moduri;

4. Analizați probele curățate și intervalele de încredere obținute.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte de vânzare 1 apartamente cu camereîn a 3-a zonă de preț cu tipul de aspect „Hrușciov”.

Tabelul 1. Proba inițială

Pretul de 1 mp, c.u.

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei initiale

Prelucrarea probelor prin metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediană - un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate este mai mică decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosit pentru a estima mai precis variatia datelor

5. Abaterea standard pentru eșantion (denumită în continuare RMS) este cel mai comun indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de dispersie a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul mediei

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem afirma că eșantionul original nu este omogen, deci să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calculul prin mediană și abaterea standard.

Intervalul de încredere se determină astfel: valoarea minimă - abaterea standard se scade din mediană; valoarea maximă - la mediană se adaugă abaterea standard.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere prin valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea „Metode matematice pentru evaluarea valorii proprietății” descrie o metodă de calcul a intervalului de încredere prin coeficientul Student. La calcularea prin această metodă, estimatorul însuși trebuie să stabilească nivelul de semnificație ∝, care determină probabilitatea cu care se va construi intervalul de încredere. Nivelurile de semnificație de 0,1 sunt utilizate în mod obișnuit; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, adevăratele valori ale așteptării și varianței matematice sunt considerate practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de evaluare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuții Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care este determinat de tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDRASPOBR);

∝ - nivelul de semnificație, luăm ∝=0,01.

Orez. 2. Valori în intervalul de încredere 2.

Pasul 4. Analiza diferitelor moduri de calculare a intervalului de încredere

Două moduri de a calcula intervalul de încredere - prin mediană și coeficientul Student - au condus la valori diferite intervale. În consecință, au fost obținute două probe purificate diferite.

Tabelul 3. Indicatori statistici pentru trei eșantioane.

Index

Proba inițială

1 opțiune

Opțiunea 2

Rău

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, se poate spune că metode diferite valorile intervalelor de încredere se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere, în funcție de gradul de dezvoltare a pieței:

  • dacă piața nu este dezvoltată, aplicați metoda de calcul prin mediană și deviația standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de apreciere a valorii proprietatii. Moscova, 2014

2. Date din sistemul estimatica.pro

Una dintre metodele de rezolvare a problemelor statistice este calculul intervalului de încredere. Este utilizat ca alternativă preferată la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere este destul de complicat. Dar instrumentele programului Excel vă permit să îl simplificați oarecum. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată în estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru a efectua calcule aceasta metoda: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule NORMA DE ÎNCREDERE, iar în al doilea ÎNCREDERE.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator NORMA DE ÎNCREDERE, care se referă la grupul statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc omologul său ÎNCREDERE. Sarcina acestui operator este de a calcula un interval de încredere cu o distribuție normală pentru media populației.

Sintaxa sa este următoarea:

NORMĂ DE ÎNCREDERE(alpha, standard_dev, size)

"Alfa" este un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard" este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Marimea" este un argument care determină mărimea eșantionului.

Toate argumentele operator dat sunt obligatorii.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_dev, size)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Această caracteristică a fost păstrată în Excel 2010 și versiunile mai noi într-o categorie specială din motive de compatibilitate. "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind formula următoarei forme:

X+(-)INCREDERE NORM

Unde X este media eșantionului, care se află la mijlocul intervalului selectat.

Acum să ne uităm la cum să calculăm intervalul de încredere folosind un exemplu specific. Au fost efectuate 12 teste, rezultând rezultate diferite, care sunt enumerate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

  1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Făcând clic pe butonul „Inserare funcție”.
  2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „ÎNCREDERE.NORMĂ”. După aceea faceți clic pe butonul O.K.
  3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
    Setați cursorul pe primul câmp - "Alfa". Aici ar trebui să precizăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

    (1-nivel de încredere)/100

    Adică, înlocuind valoarea, obținem:

    Prin calcule simple, aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

    După cum știți, abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" notează doar acel număr.

    În câmp "Marimea" trebuie să introduceți numărul de elemente ale testelor efectuate. După cum ne amintim, ei 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când se efectuează un nou test, să setăm această valoare nu la un număr obișnuit, ci folosind operatorul VERIFICA. Deci, punem cursorul în câmp "Marimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

    Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA folosit recent de tine, ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, atunci mergi la subiect "Mai multe trăsături...".

  4. Ne pare deja familiar Expertul de funcții. Înapoi la grup "Statistic". Selectăm numele acolo "VERIFICA". Faceți clic pe butonul O.K.
  5. Apare fereastra de argumente pentru operatorul de mai sus. Această funcție este concepută pentru a calcula numărul de celule din intervalul specificat care conțin valori numerice. Sintaxa sa este următoarea:

    COUNT(valoare1, valoare2,...)

    Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. În total, pot exista până la 255 de astfel de argumente, dar în cazul nostru avem nevoie doar de unul.

    Setați cursorul în câmp „Valoare 1”și, ținând apăsat butonul stâng al mouse-ului, selectați intervalul de pe foaia care conține populația noastră. Apoi adresa sa va fi afișată în câmp. Faceți clic pe butonul O.K.

  6. După aceea, aplicația va efectua calculul și va afișa rezultatul în celula în care se află ea însăși. În cazul nostru particular, formula s-a dovedit astfel:

    NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

    Rezultatul general al calculelor a fost 5,011609 .

  7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea din valoarea medie a eșantionului a rezultatului calculului NORMA DE ÎNCREDERE. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.

    Acest operator este conceput pentru a calcula media aritmetică a intervalului de numere selectat. Are următoarea sintaxă destul de simplă:

    MEDIE (număr1, număr2,...)

    Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

    Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

  8. se deschide Expertul de funcții. Înapoi la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul O.K.
  9. Fereastra de argumente este lansată. Setați cursorul în câmp "Numărul 1"și cu butonul stâng al mouse-ului apăsat, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul O.K.
  10. După aceea IN MEDIE redă rezultatul calculului către un element de foaie.
  11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată, puneți semnul «=» si se adauga continutul elementelor fisei in care se afla rezultatele calculului functiilor IN MEDIEși NORMA DE ÎNCREDERE. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:

    Rezultatul calculului: 6,953276

  12. În același mod, calculăm limita din stânga a intervalului de încredere, doar că de această dată din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului NORMA DE ÎNCREDERE. Rezultă formula pentru exemplul nostru de următorul tip:

    Rezultatul calculului: -3,06994

  13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris în detaliu fiecare formulă. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

    MEDIE(B2:B13)+INCREDERE(0,03,8,NUMĂRĂ(B2:B13))

  14. Un calcul similar al marginii din stânga ar arăta astfel:

    MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția TRUST.STUDENT

În plus, există o altă funcție în Excel care este legată de calcularea intervalului de încredere - ÎNCREDERE.STUDENT. A apărut abia din Excel 2010. Acest operator efectuează calculul intervalului de încredere a populației folosind distribuția t a lui Student. Este foarte convenabil să îl utilizați în cazul în care varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

TRUST.STUDENT(alpha,standard_dev,size)

După cum puteți vedea, numele operatorilor în acest caz au rămas neschimbate.

Să vedem cum se calculează limitele intervalului de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Nivelul de încredere, ca și data trecută, vom lua 97%.

  1. Selectați celula în care se va face calculul. Faceți clic pe butonul „Inserare funcție”.
  2. În deschis Expertul de funcții mergi la categorie "Statistic". Alegeți un nume „ÎNCREDERE.STUDENT”. Faceți clic pe butonul O.K.
  3. Fereastra de argumente pentru operatorul specificat este lansată.

    În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . A doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

    După aceea, setați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.B. Pentru a apela fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol "Mai multe trăsături...".

  4. rulează Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele „STDEV.B”. Apoi faceți clic pe butonul O.K.
  5. Se deschide fereastra de argumente. sarcina operatorului STDEV.B este definiția abaterii standard în eșantionare. Sintaxa sa arată astfel:

    STDEV.V(număr1,număr2,…)

    Este ușor de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci folosind un singur argument, puteți da un link către acest interval.

    Setați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați setul. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul O.K deoarece rezultatul va fi incorect. Mai întâi trebuie să revenim la fereastra de argumente operator ÎNCREDERE.STUDENT pentru a face argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

  6. Fereastra de argumente a funcției deja familiare se deschide din nou. Setați cursorul în câmp "Marimea". Din nou, faceți clic pe triunghiul deja familiar pentru a merge la alegerea operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
  7. Intrarea în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul O.K.
  8. După aceea, programul calculează și afișează valoarea intervalului de încredere.
  9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
  10. Însumarea rezultatelor calculului IN MEDIEși ÎNCREDERE.STUDENT, obținem limita dreaptă a intervalului de încredere.
  11. Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ÎNCREDERE.STUDENT, avem limita stângă a intervalului de încredere.
  12. Dacă calculul este scris într-o singură formulă, atunci calculul marginii din dreapta în cazul nostru va arăta astfel:

    MEDIE(B2:B13)+ÎNCREDEREA STUDENTULUI(0,03,STDV(B2:B13),NUMĂR (B2:B13))

  13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

    MEDIE(B2:B13)-INCREDEREA STUDENTULUI(0,03,STDV(B2:B13),NUMĂR (B2:B13))

După cum puteți vedea, instrumentele programului Excel fac posibilă facilitarea semnificativă a calculului intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

Konstantin Krawchik explică clar ce este un interval de încredere în cercetarea medicală și cum să-l folosească

„Katren-Style” continuă să publice un ciclu al lui Konstantin Kravchik despre statisticile medicale. În două articole anterioare, autorul a atins explicația unor concepte precum și.

Constantin Kravcik

Matematician-analist. Specialist în domeniul cercetării statistice în medicină și umaniste

Orașul Moscova

Foarte des în articolele despre studiile clinice poți găsi o frază misterioasă: „interval de încredere” (95% CI sau 95% CI - interval de încredere). De exemplu, un articol ar putea spune: „Testul studentului a fost folosit pentru a evalua semnificația diferențelor, cu un interval de încredere de 95% calculat”.

Care este valoarea „intervalului de încredere 95%” și de ce să-l calculăm?

Ce este un interval de încredere? - Acesta este intervalul în care se încadrează adevăratele valori medii în populație. Și ce, există medii „neadevărate”? Într-un fel, da, o fac. În am explicat că este imposibil să se măsoare parametrul de interes în întreaga populație, așa că cercetătorii se mulțumesc cu un eșantion limitat. În această probă (de exemplu, după greutatea corporală) există o valoare medie (o anumită greutate), după care judecăm valoarea medie în întreaga populație generală. Cu toate acestea, este puțin probabil ca ponderea medie în eșantion (în special una mică) să coincidă cu ponderea medie în populația generală. Prin urmare, este mai corect să se calculeze și să se utilizeze intervalul de valori medii ale populației generale.

De exemplu, să presupunem că intervalul de încredere de 95% (IC 95%) pentru hemoglobină este între 110 și 122 g/L. Aceasta înseamnă că, cu o probabilitate de 95 %, adevărata valoare medie a hemoglobinei în populația generală va fi în intervalul de la 110 la 122 g/l. Cu alte cuvinte, nu cunoaștem hemoglobina medie în populația generală, dar putem indica intervalul de valori pentru această caracteristică cu o probabilitate de 95%.

Intervalele de încredere sunt deosebit de relevante pentru diferența de medii între grupuri sau ceea ce se numește mărimea efectului.

Să presupunem că am comparat eficacitatea a două preparate de fier: unul care este pe piață de mult timp și unul care tocmai a fost înregistrat. După cursul terapiei, a fost evaluată concentrația de hemoglobină în grupurile studiate de pacienți, iar programul statistic a calculat pentru noi că diferența dintre valorile medii ale celor două grupuri cu o probabilitate de 95% este în intervalul de la 1,72 până la 14,36 g/l (Tabelul 1).

Tab. 1. Criteriu pentru probe independente
(grupurile sunt comparate în funcție de nivelul hemoglobinei)

Acest lucru ar trebui interpretat după cum urmează: la o parte dintre pacienții din populația generală care iau un medicament nou, hemoglobina va fi mai mare în medie cu 1,72-14,36 g/l decât la cei care au luat un medicament deja cunoscut.

Cu alte cuvinte, în populația generală, diferența dintre valorile medii ale hemoglobinei în grupuri cu o probabilitate de 95% se află în aceste limite. Va rămâne la latitudinea cercetătorului să judece dacă este mult sau puțin. Ideea tuturor acestor lucruri este că nu lucrăm cu o valoare medie, ci cu o gamă de valori, prin urmare, estimăm mai fiabil diferența unui parametru între grupuri.

În pachetele statistice, la discreția cercetătorului, se pot îngusta sau extinde în mod independent granițele intervalului de încredere. Scăzând probabilitățile intervalului de încredere, restrângem intervalul de medii. De exemplu, la 90% IC, intervalul de medii (sau diferențele medii) va fi mai restrâns decât la 95% IC.

În schimb, creșterea probabilității la 99% mărește gama de valori. Când se compară grupuri, limita inferioară a CI poate depăși marcajul zero. De exemplu, dacă am extins limitele intervalului de încredere la 99 %, atunci limitele intervalului au variat între –1 și 16 g/L. Aceasta înseamnă că în populația generală există grupuri, diferența dintre mediile între care pentru trăsătura studiată este 0 (M=0).

Intervalele de încredere pot fi folosite pentru a testa ipotezele statistice. Dacă intervalul de încredere depășește valoarea zero, atunci ipoteza nulă, care presupune că grupurile nu diferă în parametrul studiat, este adevărată. Un exemplu este descris mai sus, când am extins limitele la 99%. Undeva în populația generală, am găsit grupuri care nu diferă în niciun fel.

Interval de încredere de 95% al ​​diferenței de hemoglobină, (g/l)


Figura arată intervalul de încredere de 95% al ​​diferenței medii de hemoglobină dintre cele două grupuri ca o linie. Linia trece de marcajul zero, prin urmare, există o diferență între medii egală cu zero, ceea ce confirmă ipoteza nulă că grupurile nu diferă. Diferența dintre grupuri variază de la -2 la 5 g/l, ceea ce înseamnă că hemoglobina poate fie să scadă cu 2 g/l, fie să crească cu 5 g/l.

Intervalul de încredere este un indicator foarte important. Datorită acesteia, puteți vedea dacă diferențele dintre grupuri s-au datorat într-adevăr diferenței de medii sau datorită unui eșantion mare, deoarece la un eșantion mare, șansele de a găsi diferențe sunt mai mari decât la unul mic.

În practică, ar putea arăta așa. Am luat un eșantion de 1000 de persoane, am măsurat nivelul hemoglobinei și am constatat că intervalul de încredere pentru diferența de medii este de la 1,2 la 1,5 g/L. Nivelul semnificației statistice în acest caz p

Vedem că concentrația de hemoglobină a crescut, dar aproape imperceptibil, prin urmare, semnificația statistică a apărut tocmai datorită dimensiunii eșantionului.

Intervalele de încredere pot fi calculate nu numai pentru medii, ci și pentru proporții (și rapoarte de risc). De exemplu, ne interesează intervalul de încredere al proporțiilor de pacienți care au obținut remisie în timp ce luau medicamentul dezvoltat. Să presupunem că IC de 95% pentru proporții, adică pentru proporția de astfel de pacienți, este în intervalul 0,60-0,80. Astfel, putem spune că medicamentul nostru are un efect terapeutic în 60 până la 80% din cazuri.