La formula è l'intervallo di confidenza di tutti i valori. Stima dell'errore casuale

Qualsiasi campione fornisce solo un'idea approssimativa della popolazione generale e tutte le caratteristiche statistiche del campione (media, moda, varianza ...) sono un'approssimazione o diciamo una stima dei parametri generali, che nella maggior parte dei casi non possono essere calcolati a causa di l'inaccessibilità della popolazione generale (Figura 20) .

Figura 20. Errore di campionamento

Ma puoi specificare l'intervallo in cui, con un certo grado di probabilità, si trova il valore vero (generale) della caratteristica statistica. Questo intervallo è chiamato d intervallo di confidenza (CI).

Quindi la media generale con una probabilità del 95% si trova all'interno

da a, (20)

dove t - valore tabulare del criterio di Student per α =0,05 e f= n-1

Può essere trovato e IC 99%, in questo caso t scelto per α =0,01.

Qual è il significato pratico di un intervallo di confidenza?

    Un ampio intervallo di confidenza indica che la media campionaria non riflette accuratamente la media della popolazione. Ciò è solitamente dovuto a una dimensione del campione insufficiente o alla sua eterogeneità, ad es. grande dispersione. Entrambi danno un grande errore nella media e, di conseguenza, un IC più ampio. Ed è questo il motivo per tornare alla fase di progettazione della ricerca.

    I limiti di CI superiore e inferiore valutano se i risultati saranno clinicamente significativi

Soffermiamoci più in dettaglio sulla questione del significato statistico e clinico dei risultati dello studio delle proprietà dei gruppi. Ricordiamo che il compito della statistica è quello di rilevare almeno alcune differenze nelle popolazioni generali, sulla base di dati campionari. È compito del medico trovare tali (non eventuali) differenze che aiutino la diagnosi o il trattamento. E non sempre le conclusioni statistiche sono alla base delle conclusioni cliniche. Pertanto, una diminuzione statisticamente significativa dell'emoglobina di 3 g/l non è motivo di preoccupazione. E, al contrario, se qualche problema nel corpo umano non ha un carattere di massa a livello dell'intera popolazione, questo non è un motivo per non affrontare questo problema.

Considereremo questa posizione in esempio.

I ricercatori si sono chiesti se i ragazzi che avevano qualche tipo di malattia infettiva fossero in ritardo di crescita rispetto ai loro coetanei. A tale scopo è stato condotto uno studio selettivo, al quale hanno preso parte 10 ragazzi affetti da questa malattia. I risultati sono presentati nella tabella 23.

Tabella 23. Risultati statistici

limite inferiore

limite superiore

Specifiche (cm)

mezzo

Da questi calcoli, ne consegue che l'altezza media selettiva dei ragazzi di 10 anni che hanno avuto qualche tipo di malattia infettiva è vicina alla norma (132,5 cm). Tuttavia, il limite inferiore dell'intervallo di confidenza (126,6 cm) indica che esiste una probabilità del 95% che la vera altezza media di questi bambini corrisponda al concetto di "bassa statura", cioè questi bambini sono rachitici.

In questo esempio, i risultati dei calcoli dell'intervallo di confidenza sono clinicamente significativi.

Probabilità, riconosciute sufficienti per giudicare con sicurezza i parametri generali sulla base delle caratteristiche del campione fiduciario .

Solitamente si scelgono valori di 0,95 come probabilità di confidenza; 0,99; 0,999 (di solito sono espressi in percentuale - 95%, 99%, 99,9%). Più alto è il grado di responsabilità, più alto livello livello di confidenza: 99% o 99,9%.

Un livello di confidenza di 0,95 (95%) è considerato sufficiente ricerca scientifica nell'area di educazione fisica e sport.

Viene chiamato l'intervallo in cui si trova la media aritmetica campionaria della popolazione generale con una data probabilità di confidenza intervallo di confidenza .

Valutazione del livello di significativitàè un piccolo numero α, il cui valore implica la probabilità che sia al di fuori dell'intervallo di confidenza. In accordo con le probabilità di confidenza: α 1 = (1-0,95) = 0,05; α 2 \u003d (1 - 0,99) \u003d 0,01, ecc.

Intervallo di confidenza per la media ( aspettativa matematica) un distribuzione normale:

,

dove è l'affidabilità (probabilità di confidenza) della stima; - campione medio; s - deviazione standard corretta; n è la dimensione del campione; t γ è il valore determinato dalla tabella di distribuzione di Student (vedi Appendice, Tabella 1) per dati n e γ.

Per trovare i limiti dell'intervallo di confidenza del valore medio della popolazione generale, è necessario:

1. Calcola e s.

2. È necessario impostare la probabilità di confidenza (affidabilità) γ di stima 0,95 (95%) o il livello di significatività α 0,05 (5%)

3. Secondo la tabella t - Distribuzioni di Student (Appendice, Tabella 1) trova i valori al contorno di t γ .

Poiché la distribuzione t è simmetrica rispetto al punto zero, è sufficiente conoscere solo il valore positivo di t. Ad esempio, se la dimensione del campione è n=16, allora il numero di gradi di libertà (gradi di libertà, df) t– distribuzioni df=16 - 1=15 . Secondo la tabella 1 applicazione t 0,05 = 2,13 .

4. Troviamo i limiti dell'intervallo di confidenza per α = 0,05 e n=16:

Limiti di fiducia:

Per campioni di grandi dimensioni (n ≥ 30) t – La distribuzione degli studenti diventa normale. Pertanto, l'intervallo di confidenza per per n ≥ 30 si può scrivere come segue:

dove tu sono i punti percentuali della distribuzione normale normalizzata.

Per le probabilità di confidenza standard (95%, 99%; 99,9%) e livelli di significatività valori α ( tu) sono riportati nella tabella 8.

Tabella 8

Valori per livelli di confidenza standard α

α tu
0,05 1,96
0,01 2,58
0,001 3,28

Sulla base dei dati dell'esempio 1, definiamo i limiti del 95% intervallo di confidenza (α = 0,05) per il risultato medio del salto dal dischetto. Nel nostro esempio, la dimensione del campione è n = 65, quindi è possibile utilizzare le raccomandazioni per una dimensione del campione ampia per determinare i limiti dell'intervallo di confidenza.

Spesso il perito deve analizzare il mercato immobiliare del segmento in cui si trova l'oggetto della stima. Se il mercato è sviluppato, può essere difficile analizzare l'intero insieme di oggetti presentati, pertanto per l'analisi viene utilizzato un campione di oggetti. Questo campione non è sempre omogeneo, a volte è necessario liberarlo dagli estremi: offerte di mercato troppo alte o troppo basse. A tale scopo viene applicato intervallo di confidenza. Lo scopo di questo studio è condurre un'analisi comparativa di due metodi per calcolare l'intervallo di confidenza e scegliere l'opzione di calcolo migliore quando si lavora con diversi campioni nel sistema estima.pro.

Intervallo di confidenza - calcolato sulla base del campione, l'intervallo di valori della caratteristica, che con una probabilità nota contiene il parametro stimato della popolazione generale.

Il significato del calcolo dell'intervallo di confidenza è costruire un tale intervallo sulla base dei dati del campione in modo che si possa affermare con una data probabilità che il valore del parametro stimato sia in questo intervallo. In altre parole, l'intervallo di confidenza con una certa probabilità contiene il valore incognito della quantità stimata. Più ampio è l'intervallo, maggiore è l'imprecisione.

Esistono diversi metodi per determinare l'intervallo di confidenza. In questo articolo considereremo 2 modi:

  • attraverso la mediana e la deviazione standard;
  • attraverso il valore critico della statistica t (coefficiente di Student).

Fasi analisi comparativa diversi modi Calcolo CI:

1. formare un campione di dati;

2. elaborarlo metodi statistici: calcola la media, la mediana, la varianza, ecc.;

3. calcoliamo l'intervallo di confidenza in due modi;

4. Analizzare i campioni puliti e gli intervalli di confidenza ottenuti.

Fase 1. Campionamento dei dati

Il campione è stato formato utilizzando il sistema stima.pro. Il campione includeva 91 offerte di vendita 1 bilocali nella 3a zona di prezzo con il tipo di layout "Krusciov".

Tabella 1. Campione iniziale

Il prezzo di 1 mq, c.u.

Fig. 1. Campione iniziale



Fase 2. Elaborazione del campione iniziale

L'elaborazione del campione con metodi statistici richiede il calcolo dei seguenti valori:

1. Media aritmetica

2. Mediana - un numero che caratterizza il campione: esattamente la metà degli elementi del campione è maggiore della mediana, l'altra metà è minore della mediana

(per un campione con un numero dispari di valori)

3. Intervallo: la differenza tra i valori massimo e minimo nel campione

4. Varianza: utilizzata per stimare in modo più accurato la variazione dei dati

5. La deviazione standard per il campione (di seguito denominata RMS) è l'indicatore più comune della dispersione dei valori di aggiustamento attorno alla media aritmetica.

6. Coefficiente di variazione - riflette il grado di dispersione dei valori di aggiustamento

7. coefficiente di oscillazione: riflette la fluttuazione relativa dei valori estremi dei prezzi nel campione attorno alla media

Tabella 2. Indicatori statistici del campione originario

Il coefficiente di variazione, che caratterizza l'omogeneità dei dati, è del 12,29%, ma il coefficiente di oscillazione è troppo grande. Pertanto, possiamo affermare che il campione originale non è omogeneo, quindi passiamo al calcolo dell'intervallo di confidenza.

Fase 3. Calcolo dell'intervallo di confidenza

Metodo 1. Calcolo tramite la mediana e la deviazione standard.

L'intervallo di confidenza è determinato come segue: il valore minimo - la deviazione standard viene sottratta dalla mediana; il valore massimo - la deviazione standard viene aggiunta alla mediana.

Pertanto, l'intervallo di confidenza (47179 CU; 60689 CU)

Riso. 2. Valori entro l'intervallo di confidenza 1.



Metodo 2. Costruire un intervallo di confidenza attraverso il valore critico della statistica t (coefficiente di Student)

SV Gribovsky nel libro "Metodi matematici per valutare il valore della proprietà" descrive un metodo per calcolare l'intervallo di confidenza attraverso il coefficiente di Student. Quando calcola con questo metodo, lo stimatore stesso deve impostare il livello di significatività ∝, che determina la probabilità con cui verrà costruito l'intervallo di confidenza. Sono comunemente usati livelli di significatività di 0,1; 0,05 e 0,01. Corrispondono a probabilità di confidenza di 0,9; 0,95 e 0,99. Con questo metodo, i veri valori dell'aspettativa matematica e della varianza sono considerati praticamente sconosciuti (il che è quasi sempre vero quando si risolvono problemi pratici di valutazione).

Formula dell'intervallo di confidenza:

n - dimensione del campione;

Il valore critico della statistica t (distribuzioni di Student) con un livello di significatività ∝, il numero di gradi di libertà n-1, che è determinato da apposite tabelle statistiche o utilizzando MS Excel (→"Statistico"→ STUDRASPOBR);

∝ - livello di significatività, prendiamo ∝=0,01.

Riso. 2. Valori entro l'intervallo di confidenza 2.

Passaggio 4. Analisi di diversi modi per calcolare l'intervallo di confidenza

Due modi per calcolare l'intervallo di confidenza - attraverso la mediana e il coefficiente di Student - portati a valori diversi intervalli. Di conseguenza, sono stati ottenuti due diversi campioni purificati.

Tabella 3. Indicatori statistici per tre campioni.

Indice

Campione iniziale

1 opzione

opzione 2

Significare

Dispersione

Cof. variazioni

Cof. oscillazioni

Numero di oggetti ritirati, pz.

Sulla base dei calcoli effettuati, si può affermare che il metodi diversi i valori degli intervalli di confidenza si intersecano, quindi è possibile utilizzare qualsiasi metodo di calcolo a discrezione del valutatore.

Tuttavia, riteniamo che quando si lavora nel sistema estima.pro, sia consigliabile scegliere un metodo per il calcolo dell'intervallo di confidenza, a seconda del grado di sviluppo del mercato:

  • se il mercato non è sviluppato, applicare il metodo di calcolo tramite la mediana e la deviazione standard, poiché il numero di oggetti ritirati in questo caso è piccolo;
  • se il mercato è sviluppato, applicare il calcolo attraverso il valore critico della statistica t (coefficiente di Student), poiché è possibile formare un ampio campione iniziale.

Nella preparazione dell'articolo sono stati utilizzati:

1. Gribovsky S.V., Sivets SA, Levykina I.A. Metodi matematici per la valutazione del valore di un immobile. Mosca, 2014

2. Dati dal sistema stima.pro

Uno dei metodi per risolvere problemi statistici è il calcolo dell'intervallo di confidenza. Viene utilizzato come alternativa preferita alla stima puntuale quando la dimensione del campione è piccola. Va notato che il processo di calcolo dell'intervallo di confidenza è piuttosto complicato. Ma gli strumenti del programma Excel ti consentono di semplificarlo in qualche modo. Scopriamo come si fa in pratica.

Questo metodo viene utilizzato nella stima a intervalli di varie grandezze statistiche. Il compito principale di questo calcolo è eliminare le incertezze della stima puntuale.

In Excel, ci sono due opzioni principali per eseguire calcoli utilizzando questo metodo: quando la varianza è nota e quando è sconosciuta. Nel primo caso, la funzione viene utilizzata per i calcoli NORMA DI FIDUCIA, e nel secondo STUDENTE DI FIDUCIA.

Metodo 1: funzione NORMA DI FIDUCIA

Operatore NORMA DI FIDUCIA, che si riferisce al gruppo statistico di funzioni, è apparso per la prima volta in Excel 2010. Le versioni precedenti di questo programma utilizzano la sua controparte FIDUCIA. Il compito di questo operatore è calcolare un intervallo di confidenza con una distribuzione normale per la media della popolazione.

La sua sintassi è la seguente:

NORMA DI FIDUCIA(alpha, standard_dev, size)

"Alfa"è un argomento che indica il livello di significatività utilizzato per calcolare il livello di confidenza. Il livello di confidenza è uguale alla seguente espressione:

(1-"Alfa")*100

"Deviazione standard"è un argomento, la cui essenza è chiara dal nome. Questa è la deviazione standard del campione proposto.

"La dimensione"è un argomento che determina la dimensione del campione.

Tutti gli argomenti dato operatore sono obbligatori.

Funzione FIDUCIA ha esattamente gli stessi argomenti e possibilità del precedente. La sua sintassi è:

FIDUCIA(alfa, dev_standard, dimensione)

Come puoi vedere, le differenze sono solo nel nome dell'operatore. Questa funzionalità è stata mantenuta in Excel 2010 e versioni successive in una categoria speciale per motivi di compatibilità. "Compatibilità". Nelle versioni di Excel 2007 e precedenti, è presente nel gruppo principale di operatori statistici.

Il limite dell'intervallo di confidenza è determinato utilizzando la formula della seguente forma:

X+(-)CONFIDENZA NORM

Dove Xè la media campionaria, che si trova al centro dell'intervallo selezionato.

Ora diamo un'occhiata a come calcolare l'intervallo di confidenza utilizzando un esempio specifico. Sono state effettuate 12 prove, con risultati differenti, che sono riportati in tabella. Questa è la nostra totalità. La deviazione standard è 8. Dobbiamo calcolare l'intervallo di confidenza al livello di confidenza del 97%.

  1. Selezionare la cella in cui verrà visualizzato il risultato dell'elaborazione dei dati. Cliccando sul pulsante "Inserisci funzione".
  2. Appare Procedura guidata di funzione. Vai alla categoria "statistico" ed evidenziare il nome "CONFIDENZA.NORMA". Dopo di che fare clic sul pulsante OK.
  3. Si apre la finestra degli argomenti. I suoi campi corrispondono naturalmente ai nomi degli argomenti.
    Posiziona il cursore sul primo campo - "Alfa". Qui dovremmo specificare il livello di significatività. Come ricordiamo, il nostro livello di fiducia è del 97%. Allo stesso tempo, abbiamo detto che si calcola in questo modo:

    (1 livello di affidabilità)/100

    Cioè, sostituendo il valore, otteniamo:

    Con semplici calcoli, scopriamo che l'argomento "Alfa"è uguale a 0,03 . Immettere questo valore nel campo.

    Come sai, la deviazione standard è uguale a 8 . Pertanto, in campo "Deviazione standard" basta scrivere quel numero.

    In campo "La dimensione"è necessario inserire il numero di elementi dei test eseguiti. Come ricordiamo, loro 12 . Ma per automatizzare la formula e non modificarla ogni volta che viene eseguito un nuovo test, impostiamo questo valore non su un numero ordinario, ma utilizzando l'operatore DAI UN'OCCHIATA. Quindi, impostiamo il cursore nel campo "La dimensione", quindi fare clic sul triangolo che si trova a sinistra della barra della formula.

    Viene visualizzato un elenco delle funzioni utilizzate di recente. Se l'operatore DAI UN'OCCHIATA usato da te di recente, dovrebbe essere in questo elenco. In questo caso, devi solo fare clic sul suo nome. Altrimenti, se non lo trovi, vai al punto "Più funzioni...".

  4. Ci appare già familiare Procedura guidata di funzione. Tornando al gruppo "statistico". Selezioniamo il nome lì "DAI UN'OCCHIATA". Fare clic sul pulsante OK.
  5. Viene visualizzata la finestra degli argomenti per l'operatore precedente. Questa funzione è progettata per calcolare il numero di celle nell'intervallo specificato che contengono valori numerici. La sua sintassi è la seguente:

    COUNT(valore1, valore2,...)

    Gruppo di argomenti "I valori"è un riferimento all'intervallo in cui si desidera calcolare il numero di celle riempite con dati numerici. In totale, possono esserci fino a 255 di questi argomenti, ma nel nostro caso ne basta uno solo.

    Posizionare il cursore nel campo "Valore1" e, tenendo premuto il tasto sinistro del mouse, selezioniamo l'intervallo sul foglio che contiene la nostra popolazione. Quindi il suo indirizzo verrà visualizzato nel campo. Fare clic sul pulsante OK.

  6. Successivamente, l'applicazione eseguirà il calcolo e visualizzerà il risultato nella cella in cui si trova. Nel nostro caso particolare, la formula è risultata così:

    NORMA DI FIDUCIA(0.03,8,CONTEGGIO(B2:B13))

    Il risultato complessivo dei calcoli è stato 5,011609 .

  7. Ma non è tutto. Come ricordiamo, il limite dell'intervallo di confidenza viene calcolato sommando e sottraendo dal valore medio campionario il risultato del calcolo NORMA DI FIDUCIA. In questo modo vengono calcolati rispettivamente i limiti destro e sinistro dell'intervallo di confidenza. La stessa media campionaria può essere calcolata utilizzando l'operatore MEDIA.

    Questo operatore è progettato per calcolare la media aritmetica dell'intervallo di numeri selezionato. Ha la seguente sintassi piuttosto semplice:

    MEDIA(numero1, numero2,...)

    Discussione "Numero" può essere un singolo valore numerico o un riferimento a celle o anche interi intervalli che li contengono.

    Quindi, seleziona la cella in cui verrà visualizzato il calcolo del valore medio e fai clic sul pulsante "Inserisci funzione".

  8. si apre Procedura guidata di funzione. Torna alla categoria "statistico" e selezionare un nome dall'elenco "MEDIA". Come sempre, clicca sul pulsante OK.
  9. Viene avviata la finestra degli argomenti. Posizionare il cursore nel campo "Numero 1" e con il tasto sinistro del mouse premuto, selezionare l'intera gamma di valori. Dopo che le coordinate sono state visualizzate nel campo, fare clic sul pulsante OK.
  10. Successivamente MEDIA restituisce il risultato del calcolo a un elemento del foglio.
  11. Calcoliamo il limite destro dell'intervallo di confidenza. Per fare ciò, seleziona una cella separata, metti il ​​segno «=» e aggiungi il contenuto degli elementi del foglio in cui si trovano i risultati del calcolo delle funzioni MEDIA e NORMA DI FIDUCIA. Per eseguire il calcolo, premere il pulsante accedere. Nel nostro caso abbiamo ottenuto la seguente formula:

    Risultato del calcolo: 6,953276

  12. Allo stesso modo, calcoliamo il limite sinistro dell'intervallo di confidenza, solo questa volta dal risultato del calcolo MEDIA sottrarre il risultato del calcolo dell'operatore NORMA DI FIDUCIA. Risulta la formula per il nostro esempio del seguente tipo:

    Risultato del calcolo: -3,06994

  13. Abbiamo cercato di descrivere in dettaglio tutti i passaggi per il calcolo dell'intervallo di confidenza, quindi abbiamo descritto ogni formula in dettaglio. Ma puoi combinare tutte le azioni in un'unica formula. Il calcolo del limite destro dell'intervallo di confidenza può essere scritto come segue:

    MEDIA(B2:B13)+FIDUCIA(0.03,8,CONTEGGIO(B2:B13))

  14. Un calcolo simile del bordo sinistro sarebbe simile a questo:

    MEDIA(B2:B13)-CONFIDENZA.NORM(0.03,8,CONTEGGIO(B2:B13))

Metodo 2: funzione FIDUCIA.STUDENTE

Inoltre, esiste un'altra funzione in Excel correlata al calcolo dell'intervallo di confidenza: STUDENTE DI FIDUCIA. È apparso solo da Excel 2010. Questo operatore esegue il calcolo dell'intervallo di confidenza della popolazione utilizzando la distribuzione t di Student. È molto conveniente utilizzarlo nel caso in cui la varianza e, di conseguenza, la deviazione standard siano sconosciute. La sintassi dell'operatore è:

TRUST.STUDENT(alpha,standard_dev,size)

Come potete vedere, i nomi degli operatori in questo caso sono rimasti invariati.

Vediamo come calcolare i limiti dell'intervallo di confidenza con una deviazione standard sconosciuta utilizzando l'esempio della stessa popolazione che abbiamo considerato nel metodo precedente. Il livello di fiducia, come l'ultima volta, lo prenderemo al 97%.

  1. Selezionare la cella in cui verrà effettuato il calcolo. Fare clic sul pulsante "Inserisci funzione".
  2. Nell'aperto Procedura guidata di funzione vai alla categoria "statistico". Scegli un nome "STUDENTE DI FIDUCIA". Fare clic sul pulsante OK.
  3. Viene avviata la finestra degli argomenti per l'operatore specificato.

    In campo "Alfa", dato che il livello di confidenza è del 97%, scriviamo il numero 0,03 . La seconda volta non ci soffermeremo sui principi del calcolo di questo parametro.

    Successivamente, posiziona il cursore nel campo "Deviazione standard". Questa volta, questo indicatore ci è sconosciuto e deve essere calcolato. Questo viene fatto usando una funzione speciale - STDEV.B. Per chiamare la finestra di questo operatore, fare clic sul triangolo a sinistra della barra della formula. Se non troviamo il nome desiderato nell'elenco che si apre, vai alla voce "Più funzioni...".

  4. è in esecuzione Procedura guidata di funzione. Passando alla categoria "statistico" e segna il nome "STDEV.B". Quindi fare clic sul pulsante OK.
  5. Si apre la finestra degli argomenti. compito dell'operatore STDEV.Bè la definizione di deviazione standard nel campionamento. La sua sintassi è simile a questa:

    STDEV.V(numero1,numero2,…)

    È facile intuire che l'argomento "Numero"è l'indirizzo dell'elemento di selezione. Se la selezione viene inserita in un unico array, utilizzando un solo argomento, puoi fornire un collegamento a questo intervallo.

    Posizionare il cursore nel campo "Numero 1" e, come sempre, tenendo premuto il tasto sinistro del mouse, selezionare l'insieme. Dopo che le coordinate sono sul campo, non affrettarti a premere il pulsante OK perché il risultato non sarà corretto. Per prima cosa dobbiamo tornare alla finestra degli argomenti dell'operatore STUDENTE DI FIDUCIA per fare l'ultima argomentazione. Per fare ciò, fare clic sul nome appropriato nella barra della formula.

  6. La finestra degli argomenti della già familiare funzione si apre di nuovo. Posizionare il cursore nel campo "La dimensione". Ancora una volta, cliccate sul triangolo a noi già familiare per passare alla scelta degli operatori. Come capisci, abbiamo bisogno di un nome "DAI UN'OCCHIATA". Poiché abbiamo utilizzato questa funzione nei calcoli nel metodo precedente, è presente in questo elenco, quindi fai clic su di essa. Se non lo trovi, segui l'algoritmo descritto nel primo metodo.
  7. Entrare nella finestra degli argomenti DAI UN'OCCHIATA, posizionare il cursore nel campo "Numero 1" e tenendo premuto il pulsante del mouse selezionare la collezione. Quindi fare clic sul pulsante OK.
  8. Successivamente, il programma calcola e visualizza il valore dell'intervallo di confidenza.
  9. Per determinare i limiti, dovremo nuovamente calcolare la media campionaria. Ma, dato che l'algoritmo di calcolo utilizza la formula MEDIA lo stesso del metodo precedente, e anche il risultato non è cambiato, non ci soffermeremo su questo in dettaglio una seconda volta.
  10. Sommando i risultati del calcolo MEDIA e STUDENTE DI FIDUCIA, otteniamo il limite destro dell'intervallo di confidenza.
  11. Sottraendo dai risultati di calcolo dell'operatore MEDIA risultato del calcolo STUDENTE DI FIDUCIA, abbiamo il limite sinistro dell'intervallo di confidenza.
  12. Se il calcolo è scritto in una formula, il calcolo del bordo destro nel nostro caso sarà simile al seguente:

    MEDIA(B2:B13)+FIDUCIA DELLO STUDENTE(0.03,STDV(B2:B13),CONTEGGIO(B2:B13))

  13. Di conseguenza, la formula per calcolare il bordo sinistro sarà simile a questa:

    MEDIA(B2:B13)-FIDUCIA DELLO STUDENTE(0.03,STDV(B2:B13),CONTEGGIO(B2:B13))

Come puoi vedere, gli strumenti del programma Excel consentono di facilitare notevolmente il calcolo dell'intervallo di confidenza e dei suoi limiti. A tal fine, vengono utilizzati operatori separati per campioni la cui varianza è nota e sconosciuta.

Konstantin Krawchik spiega chiaramente cos'è un intervallo di confidenza nella ricerca medica e come usarlo

"Katren-Style" continua a pubblicare un ciclo di Konstantin Kravchik sulle statistiche mediche. In due articoli precedenti, l'autore ha toccato la spiegazione di concetti come e.

Konstantin Kravčik

Matematico-analista. Specialista nel campo della ricerca statistica in medicina e umanistiche

Città di Mosca

Molto spesso negli articoli sugli studi clinici è possibile trovare una frase misteriosa: "intervallo di confidenza" (IC 95% o IC 95% - intervallo di confidenza). Ad esempio, un articolo potrebbe dire: "Il test t dello studente è stato utilizzato per valutare la significatività delle differenze, con un intervallo di confidenza del 95% calcolato".

Qual è il valore dell'"intervallo di confidenza al 95%" e perché calcolarlo?

Che cos'è un intervallo di confidenza? - Questo è l'intervallo in cui cadono i veri valori medi nella popolazione. E cosa, ci sono medie "false"? In un certo senso sì, lo fanno. In abbiamo spiegato che è impossibile misurare il parametro di interesse nell'intera popolazione, quindi i ricercatori si accontentano di un campione limitato. In questo campione (per esempio, per peso corporeo) c'è un valore medio (un certo peso), in base al quale giudichiamo il valore medio nell'intera popolazione generale. Tuttavia, è improbabile che il peso medio nel campione (soprattutto piccolo) coincida con il peso medio nella popolazione generale. Pertanto, è più corretto calcolare e utilizzare l'intervallo dei valori medi della popolazione generale.

Ad esempio, supponiamo che l'intervallo di confidenza del 95% (IC 95%) per l'emoglobina sia compreso tra 110 e 122 g/L. Ciò significa che con una probabilità del 95 %, il vero valore medio dell'emoglobina nella popolazione generale sarà compreso tra 110 e 122 g/l. In altre parole, non conosciamo l'emoglobina media nella popolazione generale, ma possiamo indicare l'intervallo di valori per questa caratteristica con una probabilità del 95%.

Gli intervalli di confidenza sono particolarmente rilevanti per la differenza di media tra i gruppi, o ciò che viene chiamato la dimensione dell'effetto.

Supponiamo di confrontare l'efficacia di due preparati a base di ferro: uno sul mercato da molto tempo e uno appena registrato. Dopo il corso della terapia, è stata valutata la concentrazione di emoglobina nei gruppi di pazienti studiati e il programma statistico ha calcolato per noi che la differenza tra i valori medi dei due gruppi con una probabilità del 95% è nell'intervallo da Da 1,72 a 14,36 g/l (Tabella 1).

Tab. 1. Criterio per campioni indipendenti
(i gruppi vengono confrontati in base al livello di emoglobina)

Questo dovrebbe essere interpretato come segue: in una parte dei pazienti della popolazione generale che assumono un nuovo farmaco, l'emoglobina sarà mediamente più alta di 1,72–14,36 g/l rispetto a quelli che hanno assunto un farmaco già noto.

In altre parole, nella popolazione generale, la differenza dei valori medi dell'emoglobina nei gruppi con una probabilità del 95% rientra in questi limiti. Spetterà al ricercatore giudicare se questo è molto o poco. Il punto di tutto questo è che non stiamo lavorando con un valore medio, ma con un intervallo di valori, quindi stimiamo in modo più affidabile la differenza in un parametro tra i gruppi.

Nei pacchetti statistici, a discrezione del ricercatore, è possibile restringere o ampliare indipendentemente i confini dell'intervallo di confidenza. Abbassando le probabilità dell'intervallo di confidenza, restringiamo l'intervallo delle medie. Ad esempio, a IC 90%, l'intervallo delle medie (o differenze medie) sarà più ristretto rispetto a IC 95%.

Al contrario, aumentando la probabilità al 99% si amplia la gamma di valori. Quando si confrontano i gruppi, il limite inferiore dell'IC può superare la tacca di zero. Ad esempio, se estendessimo i limiti dell'intervallo di confidenza al 99 %, i limiti dell'intervallo variavano da –1 a 16 g/L. Ciò significa che nella popolazione generale sono presenti dei gruppi, la differenza tra le medie tra cui per il carattere studiato è 0 (M=0).

Gli intervalli di confidenza possono essere utilizzati per verificare ipotesi statistiche. Se l'intervallo di confidenza supera il valore zero, allora l'ipotesi nulla, che presuppone che i gruppi non differiscano nel parametro studiato, è vera. Un esempio è descritto sopra, quando abbiamo ampliato i confini al 99%. Da qualche parte nella popolazione generale, abbiamo trovato gruppi che non differivano in alcun modo.

Intervallo di confidenza della differenza di emoglobina al 95%, (g/l)


La figura mostra l'intervallo di confidenza del 95% della differenza media di emoglobina tra i due gruppi come una linea. La linea supera lo zero, quindi c'è una differenza tra le medie pari a zero, il che conferma l'ipotesi nulla che i gruppi non differiscano. La differenza tra i gruppi varia da -2 a 5 g/l, il che significa che l'emoglobina può diminuire di 2 g/l o aumentare di 5 g/l.

L'intervallo di confidenza è un indicatore molto importante. Grazie ad esso, puoi vedere se le differenze nei gruppi erano davvero dovute alla differenza delle medie oa un campione ampio, perché con un campione ampio le possibilità di trovare differenze sono maggiori rispetto a uno piccolo.

In pratica, potrebbe assomigliare a questo. Abbiamo preso un campione di 1000 persone, abbiamo misurato il livello di emoglobina e abbiamo scoperto che l'intervallo di confidenza per la differenza delle medie è compreso tra 1,2 e 1,5 g/L. Il livello di significatività statistica in questo caso p

Vediamo che la concentrazione di emoglobina è aumentata, ma in modo quasi impercettibile, quindi, la significatività statistica è apparsa proprio a causa della dimensione del campione.

Gli intervalli di confidenza possono essere calcolati non solo per le medie, ma anche per le proporzioni (e i rapporti di rischio). Ad esempio, siamo interessati all'intervallo di confidenza delle proporzioni di pazienti che hanno raggiunto la remissione durante l'assunzione del farmaco sviluppato. Si supponga che l'IC al 95% per le proporzioni, cioè per la proporzione di tali pazienti, sia compreso tra 0,60 e 0,80. Pertanto, possiamo dire che la nostra medicina ha un effetto terapeutico nel 60-80% dei casi.