Ang formula ay ang confidence interval ng lahat ng value. Pagtatantya ng random na error

Ang anumang sample ay nagbibigay lamang ng tinatayang ideya ng pangkalahatang populasyon, at ang lahat ng sample na istatistikal na katangian (mean, mode, variance ...) ay ilang pagtatantya o sabihin ang pagtatantya ng pangkalahatang mga parameter, na sa karamihan ng mga kaso ay hindi makalkula dahil sa ang kawalan ng access ng pangkalahatang populasyon (Figure 20).

Figure 20. Sampling error

Ngunit maaari mong tukuyin ang agwat kung saan, na may isang tiyak na antas ng posibilidad, ay namamalagi sa tunay na (pangkalahatan) na halaga ng istatistikal na katangian. Ang agwat na ito ay tinatawag d agwat ng kumpiyansa (CI).

Kaya ang pangkalahatang average na may posibilidad na 95% ay nasa loob

mula hanggang, (20)

saan t - tabular na halaga ng pamantayan ng Mag-aaral para sa α =0.05 at f= n-1

Maaaring matagpuan at 99% CI, sa kasong ito t pinili para sa α =0,01.

Ano ang praktikal na kahalagahan ng isang confidence interval?

    Ang isang malawak na agwat ng kumpiyansa ay nagpapahiwatig na ang sample mean ay hindi tumpak na sumasalamin sa ibig sabihin ng populasyon. Ito ay kadalasang dahil sa hindi sapat na laki ng sample, o sa heterogeneity nito, i.e. malaking pagpapakalat. Parehong nagbibigay ng malaking error sa mean at, nang naaayon, isang mas malawak na CI. At ito ang dahilan upang bumalik sa yugto ng pagpaplano ng pananaliksik.

    Tinatasa ng mga limitasyon sa itaas at mas mababang CI kung ang mga resulta ay magiging makabuluhan sa klinikal

Isaalang-alang natin nang mas detalyado ang tanong ng istatistikal at klinikal na kahalagahan ng mga resulta ng pag-aaral ng mga katangian ng grupo. Alalahanin na ang gawain ng mga istatistika ay tuklasin ang hindi bababa sa ilang mga pagkakaiba sa pangkalahatang populasyon, batay sa sample na data. Tungkulin ng clinician na maghanap ng mga ganoong (hindi anumang) pagkakaiba na makakatulong sa pagsusuri o paggamot. At hindi palaging mga istatistikal na konklusyon ang batayan para sa mga klinikal na konklusyon. Kaya, ang makabuluhang pagbaba ng hemoglobin ng 3 g/l ayon sa istatistika ay hindi isang dahilan para sa pag-aalala. At, sa kabaligtaran, kung ang ilang problema sa katawan ng tao ay walang mass character sa antas ng buong populasyon, hindi ito isang dahilan upang hindi harapin ang problemang ito.

Isasaalang-alang namin ang posisyon na ito sa halimbawa.

Ang mga mananaliksik ay nagtaka kung ang mga batang lalaki na may ilang uri ng nakakahawang sakit ay nahuhuli sa kanilang mga kapantay sa paglaki. Para sa layuning ito, isang piling pag-aaral ang isinagawa, kung saan 10 batang lalaki na may ganitong sakit ang nakibahagi. Ang mga resulta ay ipinakita sa talahanayan 23.

Talahanayan 23. Mga resulta ng istatistika

mababang limitasyon

itaas na limitasyon

Mga Detalye (cm)

gitna

Mula sa mga kalkulasyong ito, sumusunod na ang pumipili na average na taas ng 10 taong gulang na mga batang lalaki na nagkaroon ng ilang uri ng nakakahawang sakit ay malapit sa normal (132.5 cm). Gayunpaman, ang mas mababang limitasyon ng agwat ng kumpiyansa (126.6 cm) ay nagpapahiwatig na mayroong 95% na posibilidad na ang tunay na average na taas ng mga batang ito ay tumutugma sa konsepto ng "maiksing tangkad", i.e. ang mga batang ito ay bansot.

Sa halimbawang ito, klinikal na makabuluhan ang mga resulta ng mga kalkulasyon ng agwat ng kumpiyansa.

Mga probabilidad, na kinikilala bilang sapat upang kumpiyansa na hatulan ang mga pangkalahatang parameter batay sa mga katangian ng sample, ay tinatawag katiwala .

Karaniwan, ang mga halaga ng 0.95 ay pinipili bilang mga probabilidad ng kumpiyansa; 0.99; 0.999 (karaniwang ipinahayag ang mga ito bilang isang porsyento - 95%, 99%, 99.9%). Kung mas mataas ang antas ng responsibilidad, mas marami mataas na lebel antas ng kumpiyansa: 99% o 99.9%.

Ang antas ng kumpiyansa na 0.95 (95%) ay itinuturing na sapat sa siyentipikong pananaliksik sa lugar ng pisikal na kultura at palakasan.

Tinatawag ang pagitan kung saan ang sample na arithmetic mean ng pangkalahatang populasyon na may ibinigay na probabilidad ng kumpiyansa agwat ng kumpiyansa .

Antas ng Kahalagahan ng Pagtatasa ay isang maliit na bilang na α, ang halaga nito ay nagpapahiwatig ng posibilidad na ito ay nasa labas ng agwat ng kumpiyansa. Alinsunod sa mga probabilidad ng kumpiyansa: α 1 = (1-0.95) = 0.05; α 2 \u003d (1 - 0.99) \u003d 0.01, atbp.

Ang pagitan ng kumpiyansa para sa mean ( inaasahan sa matematika) a normal na pamamahagi:

,

nasaan ang pagiging maaasahan (probabilidad ng kumpiyansa) ng pagtatantya; - sample ibig sabihin; s - naitama ang karaniwang paglihis; n ay ang sample size; Ang t γ ay ang halaga na tinutukoy mula sa talahanayan ng pamamahagi ng Estudyante (tingnan ang Appendix, Talahanayan 1) para sa ibinigay na n at γ.

Upang mahanap ang mga hangganan ng agwat ng kumpiyansa ng average na halaga ng pangkalahatang populasyon, kinakailangan:

1. Kalkulahin at s.

2. Kinakailangang itakda ang probability ng kumpiyansa (reliability) γ ng pagtatantya na 0.95 (95%) o ang antas ng kabuluhan α 0.05 (5%)

3. Ayon sa talahanayan t - Mga pamamahagi ng mag-aaral (Appendix, Talahanayan 1) hanapin ang mga halaga ng hangganan ng t γ .

Dahil ang t-distribution ay simetriko tungkol sa zero point, sapat na upang malaman lamang ang positibong halaga ng t. Halimbawa, kung ang laki ng sample ay n=16, kung gayon ang bilang ng mga antas ng kalayaan (mga antas ng kalayaan, df) t– mga pamamahagi df=16 - 1=15 . Ayon sa talahanayan 1 aplikasyon t 0.05 = 2.13 .

4. Nahanap namin ang mga hangganan ng agwat ng kumpiyansa para sa α = 0.05 at n=16:

Mga limitasyon ng pagtitiwala:

Para sa malalaking sukat ng sample (n ≥ 30) t – Nagiging normal ang distribusyon ng mag-aaral. Samakatuwid, ang agwat ng kumpiyansa para sa para sa n ≥ 30 ay maaaring isulat tulad ng sumusunod:

saan u ay ang mga porsyentong puntos ng normalized na normal distribution.

Para sa mga karaniwang probabilidad ng kumpiyansa (95%, 99%; 99.9%) at mga antas ng kabuluhan α values ​​( u) ay ibinibigay sa Talahanayan 8.

Talahanayan 8

Mga halaga para sa karaniwang antas ng kumpiyansa α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Batay sa data ng halimbawa 1, tinukoy namin ang mga hangganan ng 95% agwat ng kumpiyansa (α = 0.05) para sa average na resulta ng paglukso mula sa lugar. Sa aming halimbawa, ang laki ng sample ay n = 65, pagkatapos ay maaaring gamitin ang mga rekomendasyon para sa isang malaking sukat ng sample upang matukoy ang mga hangganan ng agwat ng kumpiyansa.

Kadalasan ang appraiser ay kailangang suriin ang real estate market ng segment kung saan matatagpuan ang appraisal object. Kung ang merkado ay binuo, maaaring mahirap pag-aralan ang buong hanay ng mga ipinakita na bagay, samakatuwid, ang isang sample ng mga bagay ay ginagamit para sa pagsusuri. Ang sample na ito ay hindi palaging homogenous, kung minsan ay kinakailangan na alisin ito sa mga sukdulan - masyadong mataas o masyadong mababa ang mga alok sa merkado. Para sa layuning ito, inilapat ito agwat ng kumpiyansa. Ang layunin ng pag-aaral na ito ay magsagawa ng comparative analysis ng dalawang pamamaraan para sa pagkalkula ng confidence interval at piliin ang pinakamahusay na opsyon sa pagkalkula kapag nagtatrabaho sa iba't ibang sample sa estimatica.pro system.

Agwat ng kumpiyansa - kinakalkula batay sa sample, ang agwat ng mga halaga ng katangian, na may kilalang posibilidad ay naglalaman ng tinantyang parameter ng pangkalahatang populasyon.

Ang kahulugan ng pagkalkula ng agwat ng kumpiyansa ay ang pagbuo ng ganoong agwat batay sa sample na data upang ito ay maigiit na may ibinigay na posibilidad na ang halaga ng tinantyang parameter ay nasa pagitan na ito. Sa madaling salita, ang agwat ng kumpiyansa na may tiyak na posibilidad ay naglalaman ng hindi kilalang halaga ng tinantyang dami. Kung mas malawak ang pagitan, mas mataas ang kamalian.

Mayroong iba't ibang mga pamamaraan para sa pagtukoy ng agwat ng kumpiyansa. Sa artikulong ito, isasaalang-alang natin ang 2 paraan:

  • sa pamamagitan ng median at standard deviation;
  • sa pamamagitan ng kritikal na halaga ng t-statistic (koepisyent ng mag-aaral).

Mga yugto paghahambing na pagsusuri iba't ibang paraan Pagkalkula ng CI:

1. bumuo ng sample ng data;

2. iproseso ito paraang istatistikal: kalkulahin ang mean, median, variance, atbp.;

3. kinakalkula namin ang pagitan ng kumpiyansa sa dalawang paraan;

4. Suriin ang mga nalinis na sample at ang nakuhang confidence interval.

Stage 1. Data sampling

Ang sample ay nabuo gamit ang estimatica.pro system. Kasama sa sample ang 91 alok sa pagbebenta 1 mga apartment sa silid sa 3rd price zone na may uri ng layout na "Khrushchev".

Talahanayan 1. Paunang sample

Ang presyo ng 1 sq.m., c.u.

Fig.1. Paunang sample



Stage 2. Pagproseso ng unang sample

Ang pagpoproseso ng sample sa pamamagitan ng mga istatistikal na pamamaraan ay nangangailangan ng pagkalkula ng mga sumusunod na halaga:

1. Arithmetic mean

2. Median - isang numero na nagpapakilala sa sample: eksaktong kalahati ng mga elemento ng sample ay mas malaki kaysa sa median, ang isa pang kalahati ay mas mababa sa median

(para sa isang sample na may kakaibang bilang ng mga halaga)

3. Saklaw - ang pagkakaiba sa pagitan ng maximum at minimum na halaga sa sample

4. Variance - ginagamit upang mas tumpak na matantya ang variation sa data

5. Ang karaniwang paglihis para sa sample (simula dito ay tinutukoy bilang RMS) ay ang pinakakaraniwang tagapagpahiwatig ng pagpapakalat ng mga halaga ng pagsasaayos sa paligid ng arithmetic mean.

6. Coefficient of variation - sumasalamin sa antas ng dispersion ng mga halaga ng pagsasaayos

7. oscillation coefficient - sumasalamin sa kamag-anak na pagbabagu-bago ng mga matinding halaga ng mga presyo sa sample sa paligid ng average

Talahanayan 2. Mga tagapagpahiwatig ng istatistika ng orihinal na sample

Ang coefficient ng variation, na nagpapakilala sa homogeneity ng data, ay 12.29%, ngunit ang coefficient ng oscillation ay masyadong malaki. Kaya, maaari nating sabihin na ang orihinal na sample ay hindi homogenous, kaya magpatuloy tayo sa pagkalkula ng agwat ng kumpiyansa.

Stage 3. Pagkalkula ng agwat ng kumpiyansa

Paraan 1. Pagkalkula sa pamamagitan ng median at standard deviation.

Ang agwat ng kumpiyansa ay tinutukoy bilang mga sumusunod: ang pinakamababang halaga - ang karaniwang paglihis ay ibabawas mula sa median; ang pinakamataas na halaga - ang karaniwang paglihis ay idinagdag sa median.

Kaya, ang agwat ng kumpiyansa (47179 CU; 60689 CU)

kanin. 2. Mga halaga sa loob ng pagitan ng kumpiyansa 1.



Paraan 2. Pagbuo ng agwat ng kumpiyansa sa pamamagitan ng kritikal na halaga ng t-statistics (Koepisyent ng mag-aaral)

S.V. Gribovsky sa aklat na "Mga pamamaraan ng matematika para sa pagtatasa ng halaga ng ari-arian" ay naglalarawan ng isang paraan para sa pagkalkula ng agwat ng kumpiyansa sa pamamagitan ng koepisyent ng Mag-aaral. Kapag nagkalkula sa pamamagitan ng pamamaraang ito, ang estimator mismo ay dapat magtakda ng antas ng kahalagahan ∝, na tumutukoy sa posibilidad na mabuo ang pagitan ng kumpiyansa. Ang mga antas ng kahalagahan ng 0.1 ay karaniwang ginagamit; 0.05 at 0.01. Tumutugma sila sa mga probabilidad ng kumpiyansa na 0.9; 0.95 at 0.99. Sa pamamaraang ito, ang mga tunay na halaga ng inaasahan at pagkakaiba-iba ng matematika ay itinuturing na halos hindi alam (na halos palaging totoo kapag nilutas ang mga problema sa praktikal na pagsusuri).

Formula sa pagitan ng kumpiyansa:

n - laki ng sample;

Ang kritikal na halaga ng t-statistics (Mga distribusyon ng Mag-aaral) na may antas ng kahalagahan ∝, ang bilang ng mga antas ng kalayaan n-1, na tinutukoy ng mga espesyal na talahanayan ng istatistika o gamit ang MS Excel (→"Statistical"→ STUDRASPOBR);

∝ - antas ng kahalagahan, kinukuha namin ang ∝=0.01.

kanin. 2. Mga halaga sa loob ng pagitan ng kumpiyansa 2.

Hakbang 4. Pagsusuri ng iba't ibang paraan upang makalkula ang pagitan ng kumpiyansa

Dalawang paraan upang makalkula ang pagitan ng kumpiyansa - sa pamamagitan ng median at koepisyent ng Mag-aaral - na humantong sa iba't ibang halaga mga pagitan. Alinsunod dito, nakuha ang dalawang magkakaibang purified sample.

Talahanayan 3. Mga tagapagpahiwatig ng istatistika para sa tatlong sample.

Index

Paunang sample

1 opsyon

Opsyon 2

ibig sabihin

Pagpapakalat

Coef. mga pagkakaiba-iba

Coef. mga oscillations

Bilang ng mga retiradong bagay, mga pcs.

Batay sa mga isinagawang kalkulasyon, masasabing ang iba't ibang pamamaraan ang mga halaga ng mga agwat ng kumpiyansa ay nagsalubong, kaya maaari mong gamitin ang alinman sa mga paraan ng pagkalkula sa pagpapasya ng evaluator.

Gayunpaman, naniniwala kami na kapag nagtatrabaho sa estimatica.pro system, ipinapayong pumili ng paraan para sa pagkalkula ng agwat ng kumpiyansa, depende sa antas ng pag-unlad ng merkado:

  • kung ang merkado ay hindi binuo, ilapat ang paraan ng pagkalkula sa pamamagitan ng median at standard deviation, dahil ang bilang ng mga retiradong bagay sa kasong ito ay maliit;
  • kung ang merkado ay binuo, ilapat ang pagkalkula sa pamamagitan ng kritikal na halaga ng t-statistics (estudyante's coefficient), dahil posible na bumuo ng isang malaking paunang sample.

Sa paghahanda ng artikulo ay ginamit:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Mga pamamaraan ng matematika para sa pagtatasa ng halaga ng ari-arian. Moscow, 2014

2. Data mula sa estimatica.pro system

Ang isa sa mga pamamaraan para sa paglutas ng mga problema sa istatistika ay ang pagkalkula ng agwat ng kumpiyansa. Ito ay ginagamit bilang isang ginustong alternatibo sa point estimation kapag ang sample size ay maliit. Dapat tandaan na ang proseso ng pagkalkula ng agwat ng kumpiyansa ay medyo kumplikado. Ngunit ang mga tool ng Excel program ay nagbibigay-daan sa iyo na medyo pasimplehin ito. Alamin natin kung paano ito ginagawa sa pagsasanay.

Ang pamamaraang ito ay ginagamit sa pagtatantya ng pagitan ng iba't ibang istatistikal na dami. Ang pangunahing gawain ng pagkalkula na ito ay upang mapupuksa ang mga kawalan ng katiyakan ng pagtatantya ng punto.

Sa Excel, mayroong dalawang pangunahing opsyon para magsagawa ng mga kalkulasyon gamit ang pamamaraang ito: kapag alam ang pagkakaiba at kapag hindi alam. Sa unang kaso, ang function ay ginagamit para sa mga kalkulasyon NORM NG tiwala sa sarili, at sa pangalawa MAGTIWALA.ESTUDYANTE.

Paraan 1: function ng CONFIDENCE NORM

Operator NORM NG tiwala sa sarili, na tumutukoy sa pangkat ng istatistika ng mga pag-andar, unang lumitaw sa Excel 2010. Ginagamit ng mga naunang bersyon ng program na ito ang katapat nito TIWALA. Ang gawain ng operator na ito ay kalkulahin ang isang agwat ng kumpiyansa na may normal na distribusyon para sa average ng populasyon.

Ang syntax nito ay ang mga sumusunod:

CONFIDENCE NORM(alpha, standard_dev, size)

"Alpha" ay isang argumentong nagsasaad ng antas ng kahalagahan na ginagamit upang kalkulahin ang antas ng kumpiyansa. Ang antas ng kumpiyansa ay katumbas ng sumusunod na expression:

(1-"Alpha")*100

"Karaniwang lihis" ay isang argumento, ang kakanyahan nito ay malinaw sa pangalan. Ito ang karaniwang paglihis ng iminungkahing sample.

"Ang sukat" ay isang argumento na tumutukoy sa laki ng sample.

Lahat ng argumento ibinigay na operator ay sapilitan.

Function TIWALA ay may eksaktong parehong mga argumento at posibilidad tulad ng nauna. Ang syntax nito ay:

TRUST(alpha, standard_dev, laki)

Tulad ng nakikita mo, ang mga pagkakaiba ay nasa pangalan lamang ng operator. Ang tampok na ito ay pinanatili sa Excel 2010 at mga mas bagong bersyon sa isang espesyal na kategorya para sa mga dahilan ng pagiging tugma. "Pagkatugma". Sa mga bersyon ng Excel 2007 at mas maaga, ito ay naroroon sa pangunahing pangkat ng mga istatistikal na operator.

Ang hangganan ng agwat ng kumpiyansa ay tinutukoy gamit ang formula ng sumusunod na anyo:

X+(-)NORMA NG PAGTITIWALA

saan X ay ang sample mean, na matatagpuan sa gitna ng napiling hanay.

Ngayon tingnan natin kung paano kalkulahin ang agwat ng kumpiyansa gamit ang isang partikular na halimbawa. 12 mga pagsubok ang isinagawa, na nagresulta sa iba't ibang mga resulta, na nakalista sa talahanayan. Ito ang ating kabuuan. Ang standard deviation ay 8. Kailangan nating kalkulahin ang confidence interval sa 97% confidence level.

  1. Piliin ang cell kung saan ipapakita ang resulta ng pagproseso ng data. Ang pag-click sa pindutan "Insert Function".
  2. Lumilitaw Function Wizard. Pumunta sa kategorya "Istatistika" at i-highlight ang pangalan "CONFIDENCE.NORM". Pagkatapos nito, mag-click sa pindutan OK.
  3. Bubukas ang window ng mga argumento. Ang mga patlang nito ay natural na tumutugma sa mga pangalan ng mga argumento.
    Itakda ang cursor sa unang field - "Alpha". Dito dapat nating tukuyin ang antas ng kahalagahan. Sa ating natatandaan, ang ating antas ng pagtitiwala ay 97%. Kasabay nito, sinabi namin na ito ay kinakalkula sa ganitong paraan:

    (1-level ng tiwala)/100

    Iyon ay, sa pamamagitan ng pagpapalit ng halaga, makakakuha tayo ng:

    Sa pamamagitan ng mga simpleng kalkulasyon, nalaman namin na ang argumento "Alpha" katumbas 0,03 . Ilagay ang value na ito sa field.

    Tulad ng alam mo, ang standard deviation ay katumbas ng 8 . Samakatuwid, sa larangan "Karaniwang lihis" isulat lang ang numerong iyan.

    Sa field "Ang sukat" kailangan mong ipasok ang bilang ng mga elemento ng mga pagsubok na isinagawa. As we remember, sila 12 . Ngunit para ma-automate ang formula at hindi ito i-edit sa tuwing may gagawing bagong pagsubok, itakda natin ang value na ito hindi sa ordinaryong numero, ngunit gamit ang operator. SURIIN. Kaya, itinakda namin ang cursor sa field "Ang sukat", at pagkatapos ay mag-click sa tatsulok, na matatagpuan sa kaliwa ng formula bar.

    Lumilitaw ang isang listahan ng mga kamakailang ginamit na function. Kung ang operator SURIIN ginamit mo kamakailan, dapat itong nasa listahang ito. Sa kasong ito, kailangan mo lamang i-click ang pangalan nito. Kung hindi, kung hindi mo mahanap ito, pagkatapos ay pumunta sa punto "Higit pang mga tampok...".

  4. Parang pamilyar na sa amin Function Wizard. Lumipat pabalik sa grupo "Istatistika". Pipili kami ng pangalan doon "SURIIN". Mag-click sa pindutan OK.
  5. Lumilitaw ang window ng argumento para sa operator sa itaas. Ang function na ito ay idinisenyo upang kalkulahin ang bilang ng mga cell sa tinukoy na hanay na naglalaman ng mga numerong halaga. Ang syntax nito ay ang sumusunod:

    COUNT(value1, value2,…)

    Grupo ng argumento "Mga halaga" ay isang reference sa hanay kung saan mo gustong kalkulahin ang bilang ng mga cell na puno ng numeric data. Sa kabuuan, maaaring magkaroon ng hanggang 255 ganoong mga argumento, ngunit sa aming kaso kailangan lang namin ng isa.

    Itakda ang cursor sa field "Halaga1" at, pagpindot sa kaliwang pindutan ng mouse, piliin ang hanay sa sheet na naglalaman ng aming populasyon. Pagkatapos ang address nito ay ipapakita sa field. Mag-click sa pindutan OK.

  6. Pagkatapos nito, gagawin ng application ang pagkalkula at ipapakita ang resulta sa cell kung saan ito mismo. Sa aming partikular na kaso, ang formula ay naging ganito:

    CONFIDENCE NORM(0.03,8,COUNT(B2:B13))

    Ang kabuuang resulta ng mga kalkulasyon ay 5,011609 .

  7. Ngunit hindi lang iyon. Tulad ng naaalala namin, ang hangganan ng agwat ng kumpiyansa ay kinakalkula sa pamamagitan ng pagdaragdag at pagbabawas mula sa average na sample na halaga ng resulta ng pagkalkula. NORM NG tiwala sa sarili. Sa ganitong paraan, kinakalkula ang kanan at kaliwang mga hangganan ng agwat ng kumpiyansa, ayon sa pagkakabanggit. Ang sample mean mismo ay maaaring kalkulahin gamit ang operator AVERAGE.

    Ang operator na ito ay idinisenyo upang kalkulahin ang arithmetic mean ng napiling hanay ng mga numero. Mayroon itong sumusunod na medyo simpleng syntax:

    AVERAGE(number1, number2,…)

    Pangangatwiran "Numero" maaaring maging isang solong numeric na halaga o isang reference sa mga cell o kahit na buong hanay na naglalaman ng mga ito.

    Kaya, piliin ang cell kung saan ipapakita ang pagkalkula ng average na halaga, at mag-click sa pindutan "Insert Function".

  8. nagbubukas Function Wizard. Bumalik sa kategorya "Istatistika" at pumili ng pangalan mula sa listahan "AVERAGE". Gaya ng nakasanayan, mag-click sa pindutan OK.
  9. Inilunsad ang window ng mga argumento. Itakda ang cursor sa field "Number1" at kapag pinindot ang kaliwang pindutan ng mouse, piliin ang buong hanay ng mga halaga. Matapos ipakita ang mga coordinate sa field, mag-click sa pindutan OK.
  10. Pagkatapos noon AVERAGE output ang resulta ng pagkalkula sa isang elemento ng sheet.
  11. Kinakalkula namin ang tamang hangganan ng agwat ng kumpiyansa. Upang gawin ito, pumili ng isang hiwalay na cell, ilagay ang sign «=» at idagdag ang mga nilalaman ng mga elemento ng sheet kung saan matatagpuan ang mga resulta ng pagkalkula ng mga function AVERAGE at NORM NG tiwala sa sarili. Upang maisagawa ang pagkalkula, pindutin ang pindutan Pumasok. Sa aming kaso, nakuha namin ang sumusunod na formula:

    Resulta ng pagkalkula: 6,953276

  12. Sa parehong paraan, kinakalkula namin ang kaliwang hangganan ng agwat ng kumpiyansa, sa pagkakataong ito lamang mula sa resulta ng pagkalkula AVERAGE ibawas ang resulta ng pagkalkula ng operator NORM NG tiwala sa sarili. Lumalabas ang formula para sa aming halimbawa ng sumusunod na uri:

    Resulta ng pagkalkula: -3,06994

  13. Sinubukan naming ilarawan nang detalyado ang lahat ng mga hakbang para sa pagkalkula ng agwat ng kumpiyansa, kaya inilarawan namin nang detalyado ang bawat formula. Ngunit maaari mong pagsamahin ang lahat ng mga aksyon sa isang formula. Ang pagkalkula ng tamang hangganan ng pagitan ng kumpiyansa ay maaaring isulat tulad ng sumusunod:

    AVERAGE(B2:B13)+CONFIDENCE(0.03,8,COUNT(B2:B13))

  14. Ang isang katulad na pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Paraan 2: TRUST.STUDENT function

Bilang karagdagan, mayroong isa pang function sa Excel na nauugnay sa pagkalkula ng agwat ng kumpiyansa - MAGTIWALA.ESTUDYANTE. Ito ay lumitaw lamang mula noong Excel 2010. Ginagawa ng operator na ito ang pagkalkula ng pagitan ng kumpiyansa ng populasyon gamit ang t-distribution ng Mag-aaral. Ito ay napaka-maginhawang gamitin ito sa kaso kapag ang pagkakaiba at, nang naaayon, ang karaniwang paglihis ay hindi alam. Ang operator syntax ay:

TRUST.STUDENT(alpha,standard_dev,size)

Tulad ng nakikita mo, ang mga pangalan ng mga operator sa kasong ito ay nanatiling hindi nagbabago.

Tingnan natin kung paano kalkulahin ang mga hangganan ng agwat ng kumpiyansa na may hindi kilalang standard deviation gamit ang halimbawa ng parehong populasyon na isinasaalang-alang namin sa nakaraang pamamaraan. Yung level of confidence, like last time, kukuha tayo ng 97%.

  1. Piliin ang cell kung saan gagawin ang pagkalkula. Mag-click sa pindutan "Insert Function".
  2. Sa binuksan Function Wizard pumunta sa kategorya "Istatistika". Pumili ng pangalan "TIWALA. MAG-AARAL". Mag-click sa pindutan OK.
  3. Ang window ng argumento para sa tinukoy na operator ay inilunsad.

    Sa field "Alpha", dahil ang antas ng kumpiyansa ay 97%, isinusulat namin ang numero 0,03 . Sa pangalawang pagkakataon ay hindi tayo magtatagal sa mga prinsipyo ng pagkalkula ng parameter na ito.

    Pagkatapos nito, itakda ang cursor sa field "Karaniwang lihis". Sa pagkakataong ito, ang tagapagpahiwatig na ito ay hindi alam sa amin at kailangan itong kalkulahin. Ginagawa ito gamit ang isang espesyal na function - STDEV.B. Upang tawagan ang window ng operator na ito, mag-click sa tatsulok sa kaliwa ng formula bar. Kung hindi namin mahanap ang nais na pangalan sa listahan na bubukas, pagkatapos ay pumunta sa item "Higit pang mga tampok...".

  4. ay tumatakbo Function Wizard. Lumipat sa kategorya "Istatistika" at markahan ang pangalan "STDEV.B". Pagkatapos ay mag-click sa pindutan OK.
  5. Bubukas ang window ng mga argumento. gawain ng operator STDEV.B ay ang kahulugan ng standard deviation sa sampling. Mukhang ganito ang syntax nito:

    STDEV.V(number1,number2,…)

    Ito ay madaling hulaan na ang argumento "Numero" ay ang address ng elemento ng pagpili. Kung ang pagpili ay inilagay sa isang array, pagkatapos ay gumagamit lamang ng isang argumento, maaari kang magbigay ng isang link sa hanay na ito.

    Itakda ang cursor sa field "Number1" at, gaya ng nakasanayan, pagpindot sa kaliwang pindutan ng mouse, piliin ang set. Matapos ang mga coordinate ay nasa field, huwag magmadali upang pindutin ang pindutan OK dahil mali ang magiging resulta. Una kailangan nating bumalik sa window ng mga argumento ng operator MAGTIWALA.ESTUDYANTE upang gawin ang pangwakas na argumento. Upang gawin ito, mag-click sa naaangkop na pangalan sa formula bar.

  6. Ang window ng argumento ng pamilyar na function ay bubukas muli. Itakda ang cursor sa field "Ang sukat". Muli, mag-click sa tatsulok na pamilyar sa amin upang pumunta sa pagpili ng mga operator. Tulad ng naiintindihan mo, kailangan namin ng isang pangalan "SURIIN". Dahil ginamit namin ang function na ito sa mga kalkulasyon sa nakaraang pamamaraan, naroroon ito sa listahang ito, kaya i-click lamang ito. Kung hindi mo ito mahanap, pagkatapos ay sundin ang algorithm na inilarawan sa unang paraan.
  7. Pagpasok sa window ng mga argumento SURIIN, ilagay ang cursor sa field "Number1" at habang pinipigilan ang pindutan ng mouse, piliin ang koleksyon. Pagkatapos ay mag-click sa pindutan OK.
  8. Pagkatapos nito, kinakalkula at ipinapakita ng programa ang halaga ng agwat ng kumpiyansa.
  9. Upang matukoy ang mga hangganan, kakailanganin nating kalkulahin muli ang sample mean. Ngunit, ibinigay na ang pagkalkula algorithm gamit ang formula AVERAGE katulad ng sa nakaraang pamamaraan, at kahit na ang resulta ay hindi nagbago, hindi namin ito tatalakayin nang detalyado sa pangalawang pagkakataon.
  10. Pagdaragdag ng mga resulta ng pagkalkula AVERAGE at MAGTIWALA.ESTUDYANTE, nakuha namin ang tamang hangganan ng agwat ng kumpiyansa.
  11. Pagbabawas mula sa mga resulta ng pagkalkula ng operator AVERAGE resulta ng pagkalkula MAGTIWALA.ESTUDYANTE, mayroon kaming left bound ng confidence interval.
  12. Kung ang pagkalkula ay nakasulat sa isang formula, kung gayon ang pagkalkula ng tamang hangganan sa aming kaso ay magiging ganito:

    AVERAGE(B2:B13)+TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. Alinsunod dito, ang formula para sa pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

Tulad ng nakikita mo, ginagawang posible ng mga tool ng Excel program na makabuluhang mapadali ang pagkalkula ng agwat ng kumpiyansa at mga hangganan nito. Para sa mga layuning ito, ang mga hiwalay na operator ay ginagamit para sa mga sample na ang pagkakaiba ay kilala at hindi alam.

Malinaw na ipinaliwanag ni Konstantin Krawchik kung ano ang agwat ng kumpiyansa sa medikal na pananaliksik at kung paano ito gamitin

Ang "Katren-Style" ay patuloy na naglalathala ng isang cycle ng Konstantin Kravchik sa mga medikal na istatistika. Sa dalawang nakaraang artikulo, hinawakan ng may-akda ang paliwanag ng mga konseptong gaya ng at.

Konstantin Kravchik

Mathematician-analyst. Espesyalista sa larangan ng istatistikal na pananaliksik sa medisina at humanities

lungsod ng Moscow

Kadalasan sa mga artikulo sa mga klinikal na pagsubok ay makakahanap ka ng mahiwagang parirala: "interval ng kumpiyansa" (95% CI o 95% CI - agwat ng kumpiyansa). Halimbawa, maaaring sabihin ng isang artikulo: "Ginamit ang t-test ng mag-aaral upang masuri ang kahalagahan ng mga pagkakaiba, na may 95% na agwat ng kumpiyansa na kinakalkula."

Ano ang halaga ng "95% confidence interval" at bakit ito kinakalkula?

Ano ang confidence interval? - Ito ang hanay kung saan bumagsak ang totoong mean na mga halaga sa populasyon. At ano, may mga "hindi totoo" na average? Sa isang kahulugan, oo, ginagawa nila. Sa aming ipinaliwanag na imposibleng sukatin ang parameter ng interes sa buong populasyon, kaya ang mga mananaliksik ay kontento sa isang limitadong sample. Sa sample na ito (halimbawa, ayon sa timbang ng katawan) mayroong isang average na halaga (isang tiyak na timbang), kung saan hinuhusgahan namin ang average na halaga sa buong pangkalahatang populasyon. Gayunpaman, hindi malamang na ang average na timbang sa sample (lalo na ang isang maliit) ay magkakasabay sa average na timbang sa pangkalahatang populasyon. Samakatuwid, mas tama na kalkulahin at gamitin ang hanay ng mga average na halaga ng pangkalahatang populasyon.

Halimbawa, ipagpalagay na ang 95% confidence interval (95% CI) para sa hemoglobin ay nasa pagitan ng 110 at 122 g/L. Nangangahulugan ito na may 95 % na posibilidad, ang totoong mean na halaga para sa hemoglobin sa pangkalahatang populasyon ay nasa hanay mula 110 hanggang 122 g/L. Sa madaling salita, hindi namin alam ang average na hemoglobin sa pangkalahatang populasyon, ngunit maaari naming ipahiwatig ang hanay ng mga halaga para sa tampok na ito na may 95% na posibilidad.

Ang mga agwat ng kumpiyansa ay partikular na nauugnay sa pagkakaiba sa mga paraan sa pagitan ng mga grupo, o kung ano ang tinatawag na laki ng epekto.

Ipagpalagay na inihambing natin ang pagiging epektibo ng dalawang paghahanda ng bakal: ang isa na matagal nang nasa merkado at ang isa na kakarehistro pa lang. Matapos ang kurso ng therapy, ang konsentrasyon ng hemoglobin sa mga pinag-aralan na grupo ng mga pasyente ay nasuri, at ang programa ng istatistika ay kinakalkula para sa amin na ang pagkakaiba sa pagitan ng mga average na halaga ng dalawang grupo na may posibilidad na 95% ay nasa saklaw mula sa 1.72 hanggang 14.36 g/l (Talahanayan 1).

Tab. 1. Pamantayan para sa mga independiyenteng sample
(ang mga pangkat ay inihambing sa antas ng hemoglobin)

Dapat itong bigyang kahulugan bilang mga sumusunod: sa isang bahagi ng mga pasyente sa pangkalahatang populasyon na umiinom ng bagong gamot, ang hemoglobin ay magiging mas mataas sa average ng 1.72–14.36 g/l kaysa sa mga umiinom na ng kilalang gamot.

Sa madaling salita, sa pangkalahatang populasyon, ang pagkakaiba sa mga average na halaga para sa hemoglobin sa mga pangkat na may 95% na posibilidad ay nasa loob ng mga limitasyong ito. Bahala na ang mananaliksik kung ito ay marami o kaunti. Ang punto ng lahat ng ito ay hindi kami nagtatrabaho sa isang average na halaga, ngunit sa isang hanay ng mga halaga, samakatuwid, mas mapagkakatiwalaan naming tinatantya ang pagkakaiba sa isang parameter sa pagitan ng mga pangkat.

Sa mga pakete ng istatistika, sa pagpapasya ng mananaliksik, ang isang tao ay maaaring nakapag-iisa na paliitin o palawakin ang mga hangganan ng agwat ng kumpiyansa. Sa pamamagitan ng pagpapababa ng mga probabilidad ng agwat ng kumpiyansa, pinaliit namin ang hanay ng mga paraan. Halimbawa, sa 90% CI, ang hanay ng mga paraan (o mga pagkakaiba sa ibig sabihin) ay magiging mas makitid kaysa sa 95% CI.

Sa kabaligtaran, ang pagtaas ng posibilidad sa 99% ay nagpapalawak sa hanay ng mga halaga. Kapag naghahambing ng mga grupo, ang mas mababang limitasyon ng CI ay maaaring tumawid sa zero mark. Halimbawa, kung pinahaba namin ang mga hangganan ng agwat ng kumpiyansa sa 99 %, ang mga hangganan ng agwat ay mula sa -1 hanggang 16 g/L. Nangangahulugan ito na sa pangkalahatang populasyon ay may mga pangkat, ang pagkakaiba sa pagitan ng mga average na kung saan para sa pinag-aralan na katangian ay 0 (M=0).

Maaaring gamitin ang mga pagitan ng kumpiyansa upang subukan ang mga istatistikal na hypotheses. Kung ang pagitan ng kumpiyansa ay tumawid sa zero na halaga, kung gayon ang null hypothesis, na ipinapalagay na ang mga pangkat ay hindi naiiba sa pinag-aralan na parameter, ay totoo. Ang isang halimbawa ay inilarawan sa itaas, noong pinalawak namin ang mga hangganan sa 99%. Sa isang lugar sa pangkalahatang populasyon, nakakita kami ng mga grupo na hindi naiiba sa anumang paraan.

95% confidence interval ng pagkakaiba sa hemoglobin, (g/l)


Ipinapakita ng figure ang 95% confidence interval ng mean hemoglobin difference sa pagitan ng dalawang grupo bilang isang linya. Ang linya ay pumasa sa zero mark, samakatuwid, mayroong pagkakaiba sa pagitan ng mga ibig sabihin na katumbas ng zero, na nagpapatunay sa null hypothesis na ang mga grupo ay hindi naiiba. Ang pagkakaiba sa pagitan ng mga pangkat ay mula -2 hanggang 5 g/l, na nangangahulugan na ang hemoglobin ay maaaring bumaba ng 2 g/l o tumaas ng 5 g/l.

Ang agwat ng kumpiyansa ay isang napakahalagang tagapagpahiwatig. Salamat dito, makikita mo kung ang mga pagkakaiba sa mga grupo ay talagang dahil sa pagkakaiba sa mga paraan o dahil sa isang malaking sample, dahil sa isang malaking sample, ang mga pagkakataon na makahanap ng mga pagkakaiba ay mas malaki kaysa sa isang maliit na sample.

Sa pagsasagawa, maaaring ganito ang hitsura nito. Kumuha kami ng sample ng 1000 katao, sinukat ang antas ng hemoglobin at nalaman na ang agwat ng kumpiyansa para sa pagkakaiba sa mga ibig sabihin ay mula 1.2 hanggang 1.5 g/L. Ang antas ng istatistikal na kahalagahan sa kasong ito p

Nakikita namin na ang konsentrasyon ng hemoglobin ay tumaas, ngunit halos hindi mahahalata, samakatuwid, ang istatistikal na kahalagahan ay lumitaw nang tumpak dahil sa laki ng sample.

Ang mga agwat ng kumpiyansa ay maaaring kalkulahin hindi lamang para sa mga average, kundi pati na rin para sa mga proporsyon (at mga ratio ng panganib). Halimbawa, interesado kami sa agwat ng kumpiyansa ng mga proporsyon ng mga pasyente na nakamit ang pagpapatawad habang umiinom ng binuong gamot. Ipagpalagay na ang 95% CI para sa mga proporsyon, ibig sabihin, para sa proporsyon ng mga naturang pasyente, ay nasa hanay na 0.60–0.80. Kaya, maaari nating sabihin na ang ating gamot ay may therapeutic effect sa 60 hanggang 80% ng mga kaso.