La fórmula es el intervalo de confianza de todos los valores. Estimación del error aleatorio

Cualquier muestra da solo una idea aproximada de la población general, y todas las características estadísticas de la muestra (media, moda, varianza...) son una aproximación o una estimación de los parámetros generales, que en la mayoría de los casos no se pueden calcular debido a la inaccesibilidad de la población en general (Figura 20) .

Figura 20. Error de muestreo

Pero puede especificar el intervalo en el que, con un cierto grado de probabilidad, se encuentra el verdadero valor (general) de la característica estadística. Este intervalo se llama d intervalo de confianza (IC).

Entonces, el promedio general con una probabilidad del 95% se encuentra dentro de

de a, (20)

dónde t - valor tabular del criterio de Student para α =0.05 y F= norte-1

Se puede encontrar y el IC del 99%, en este caso t elegido para α =0,01.

¿Cuál es el significado práctico de un intervalo de confianza?

    Un intervalo de confianza amplio indica que la media de la muestra no refleja con precisión la media de la población. Esto suele deberse a un tamaño de muestra insuficiente o a su heterogeneidad, es decir, gran dispersión. Ambos dan un gran error en la media y, en consecuencia, un IC más amplio. Y esta es la razón para volver a la etapa de planificación de la investigación.

    Los límites de IC superior e inferior evalúan si los resultados serán clínicamente significativos

Detengámonos con más detalle en la cuestión de la importancia estadística y clínica de los resultados del estudio de las propiedades del grupo. Recuerde que la tarea de la estadística es detectar al menos algunas diferencias en las poblaciones generales, con base en datos de muestra. Es tarea del médico encontrar esas (no ninguna) diferencias que ayuden al diagnóstico o al tratamiento. Y no siempre las conclusiones estadísticas son la base de las conclusiones clínicas. Por lo tanto, una disminución estadísticamente significativa en la hemoglobina de 3 g/l no es motivo de preocupación. Y, por el contrario, si algún problema en el cuerpo humano no tiene un carácter masivo a nivel de toda la población, esto no es razón para no tratar este problema.

Consideraremos esta posición en ejemplo.

Los investigadores se preguntaron si los niños que padecían algún tipo de enfermedad infecciosa estaban rezagados respecto de sus compañeros en el crecimiento. Para ello, se realizó un estudio selectivo, en el que participaron 10 niños que padecían esta enfermedad. Los resultados se presentan en la tabla 23.

Tabla 23. Resultados estadísticos

límite inferior

limite superior

Especificaciones (cm)

medio

De estos cálculos se deduce que la talla media selectiva de los niños de 10 años que han tenido algún tipo de enfermedad infecciosa es próxima a la normalidad (132,5 cm). Sin embargo, el límite inferior del intervalo de confianza (126,6 cm) indica que existe un 95% de probabilidad de que la verdadera estatura promedio de estos niños corresponda al concepto de "baja estatura", es decir, estos niños están atrofiados.

En este ejemplo, los resultados de los cálculos del intervalo de confianza son clínicamente significativos.

probabilidades, reconocidos como suficientes para juzgar con confianza los parámetros generales basados ​​en las características de la muestra, se denominan fiduciario .

Por lo general, se eligen valores de 0,95 como probabilidades de confianza; 0,99; 0,999 (normalmente se expresan en porcentaje: 95 %, 99 %, 99,9 %). Cuanto mayor sea el grado de responsabilidad, más nivel alto nivel de confianza: 99% o 99,9%.

Un nivel de confianza de 0,95 (95%) se considera suficiente en investigación científica en el área de educación Física y deportes

El intervalo en el que se encuentra la media aritmética muestral de la población general con una probabilidad de confianza dada se denomina intervalo de confianza .

Nivel de significación de la evaluación es un pequeño número α, cuyo valor implica la probabilidad de que esté fuera del intervalo de confianza. De acuerdo con las probabilidades de confianza: α 1 = (1-0.95) = 0.05; α 2 \u003d (1 - 0.99) \u003d 0.01, etc.

Intervalo de confianza para la media ( expectativa matemática) a distribución normal:

,

donde está la confiabilidad (probabilidad de confianza) de la estimación; - muestra promedio; s - desviación estándar corregida; n es el tamaño de la muestra; t γ es el valor determinado a partir de la tabla de distribución de Student (ver Apéndice, Tabla 1) para n y γ dados.

Para encontrar los límites del intervalo de confianza del valor medio de la población general, es necesario:

1. Calcular y s.

2. Es necesario establecer la probabilidad de confianza (fiabilidad) γ de estimación 0,95 (95%) o el nivel de significancia α 0,05 (5%)

3. De acuerdo con la tabla t - Distribuciones de Student (Apéndice, Tabla 1) encuentre los valores límite de t γ .

Dado que la distribución t es simétrica con respecto al punto cero, es suficiente conocer solo el valor positivo de t. Por ejemplo, si el tamaño de la muestra es n=16, entonces el número de grados de libertad (grados de libertad, d.f.) t– distribuciones d.f.=16 - 1=15 . Según la tabla 1 aplicación t 0,05 = 2,13 .

4. Encontramos los límites del intervalo de confianza para α = 0.05 y n=16:

Límites de confianza:

Para tamaños de muestra grandes (n ≥ 30) t – La distribución de Student se vuelve normal. Por lo tanto, el intervalo de confianza para para n ≥ 30 se puede escribir de la siguiente manera:

dónde tu son los puntos porcentuales de la distribución normal normalizada.

Para probabilidades de confianza estándar (95%, 99%; 99,9%) y niveles de significancia valores α ( tu) se dan en la Tabla 8.

Tabla 8

Valores para niveles de confianza estándar α

α tu
0,05 1,96
0,01 2,58
0,001 3,28

Con base en los datos del ejemplo 1, definimos los límites del 95% intervalo de confianza (α = 0.05) para el resultado promedio de saltar desde el lugar. En nuestro ejemplo, el tamaño de la muestra es n = 65, luego se pueden usar recomendaciones para un tamaño de muestra grande para determinar los límites del intervalo de confianza.

Muchas veces el tasador tiene que analizar el mercado inmobiliario del segmento en el que se encuentra el objeto de tasación. Si el mercado está desarrollado, puede ser difícil analizar todo el conjunto de objetos presentados, por lo tanto, se utiliza una muestra de objetos para el análisis. Esta muestra no siempre es homogénea, a veces es necesario despejarla de extremos: ofertas de mercado demasiado altas o demasiado bajas. Para ello, se aplica intervalo de confianza. El propósito de este estudio es realizar un análisis comparativo de dos métodos para calcular el intervalo de confianza y elegir la mejor opción de cálculo cuando se trabaja con diferentes muestras en el sistema estimatica.pro.

Intervalo de confianza: calculado sobre la base de la muestra, el intervalo de valores de la característica, que con una probabilidad conocida contiene el parámetro estimado de la población general.

El significado de calcular el intervalo de confianza es construir un intervalo de este tipo basado en los datos de la muestra para que se pueda afirmar con una probabilidad determinada que el valor del parámetro estimado se encuentra en este intervalo. En otras palabras, el intervalo de confianza con cierta probabilidad contiene el valor desconocido de la cantidad estimada. Cuanto mayor sea el intervalo, mayor será la inexactitud.

Existen diferentes métodos para determinar el intervalo de confianza. En este artículo, consideraremos 2 formas:

  • a través de la mediana y la desviación estándar;
  • a través del valor crítico del estadístico t (coeficiente de Student).

Etapas análisis comparativo diferentes caminos Cálculo del IC:

1. formar una muestra de datos;

2. procesarlo métodos de estadística: calcular la media, la mediana, la varianza, etc.;

3. calculamos el intervalo de confianza de dos maneras;

4. Analizar las muestras limpias y los intervalos de confianza obtenidos.

Etapa 1. Muestreo de datos

La muestra se conformó utilizando el sistema estimatica.pro. La muestra incluyó 91 ofertas de venta 1 habitaciones apartamentos en la 3ra zona de precios con el tipo de diseño "Khrushchev".

Tabla 1. Muestra inicial

El precio de 1 m2, u.m.

Figura 1. Muestra inicial



Etapa 2. Procesamiento de la muestra inicial

El procesamiento de muestras por métodos estadísticos requiere el cálculo de los siguientes valores:

1. Media aritmética

2. Mediana - un número que caracteriza la muestra: exactamente la mitad de los elementos de la muestra son mayores que la mediana, la otra mitad es menor que la mediana

(para una muestra con un número impar de valores)

3. Rango: la diferencia entre los valores máximo y mínimo en la muestra

4. Varianza: se utiliza para estimar con mayor precisión la variación de los datos

5. La desviación estándar de la muestra (en adelante, RMS) es el indicador más común de la dispersión de los valores de ajuste alrededor de la media aritmética.

6. Coeficiente de variación: refleja el grado de dispersión de los valores de ajuste

7. coeficiente de oscilación: refleja la fluctuación relativa de los valores extremos de los precios en la muestra alrededor del promedio

Tabla 2. Indicadores estadísticos de la muestra original

El coeficiente de variación, que caracteriza la homogeneidad de los datos, es del 12,29%, pero el coeficiente de oscilación es demasiado grande. Así, podemos afirmar que la muestra original no es homogénea, así que pasemos al cálculo del intervalo de confianza.

Etapa 3. Cálculo del intervalo de confianza

Método 1. Cálculo a través de la mediana y desviación estándar.

El intervalo de confianza se determina de la siguiente manera: el valor mínimo: la desviación estándar se resta de la mediana; el valor máximo: la desviación estándar se agrega a la mediana.

Por lo tanto, el intervalo de confianza (47179 CU; 60689 CU)

Arroz. 2. Valores dentro del intervalo de confianza 1.



Método 2. Construcción de un intervalo de confianza a través del valor crítico del estadístico t (coeficiente de Student)

S.V. Gribovsky en el libro "Métodos matemáticos para evaluar el valor de la propiedad" describe un método para calcular el intervalo de confianza a través del coeficiente de Student. Al calcular por este método, el propio estimador debe establecer el nivel de significación ∝, que determina la probabilidad con la que se construirá el intervalo de confianza. Los niveles de significancia de 0.1 se usan comúnmente; 0,05 y 0,01. Corresponden a probabilidades de confianza de 0,9; 0,95 y 0,99. Con este método, los valores verdaderos de la esperanza matemática y la varianza se consideran prácticamente desconocidos (lo que casi siempre es cierto cuando se resuelven problemas prácticos de evaluación).

Fórmula del intervalo de confianza:

n - tamaño de la muestra;

El valor crítico de las estadísticas t (distribuciones de Student) con un nivel de significación ∝, el número de grados de libertad n-1, que se determina mediante tablas estadísticas especiales o utilizando MS Excel (→"Estadístico"→ STUDRASPOBR);

∝ - nivel de significancia, tomamos ∝=0.01.

Arroz. 2. Valores dentro del intervalo de confianza 2.

Paso 4. Análisis de diferentes formas de calcular el intervalo de confianza

Dos formas de calcular el intervalo de confianza, a través de la mediana y el coeficiente de Student, llevaron a valores diferentes intervalos En consecuencia, se obtuvieron dos muestras purificadas diferentes.

Tabla 3. Indicadores estadísticos para tres muestras.

Índice

Muestra inicial

1 opción

opcion 2

Significar

Dispersión

coef. variaciones

coef. oscilaciones

Número de objetos retirados, uds.

Con base en los cálculos realizados, se puede decir que la diferentes métodos los valores de los intervalos de confianza se cruzan, por lo que se puede utilizar cualquiera de los métodos de cálculo a criterio del evaluador.

Sin embargo, creemos que al trabajar en el sistema estimatica.pro, es recomendable elegir un método para calcular el intervalo de confianza, dependiendo del grado de desarrollo del mercado:

  • si el mercado no está desarrollado, aplicar el método de cálculo a través de la mediana y la desviación estándar, ya que el número de objetos retirados en este caso es pequeño;
  • si el mercado es desarrollado, aplicar el cálculo a través del valor crítico del estadístico t (coeficiente de Student), ya que es posible formar una muestra inicial grande.

En la elaboración del artículo se utilizaron:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Métodos matemáticos para evaluar el valor de la propiedad. Moscú, 2014

2. Datos del sistema estimatica.pro

Uno de los métodos para resolver problemas estadísticos es el cálculo del intervalo de confianza. Se utiliza como una alternativa preferida a la estimación puntual cuando el tamaño de la muestra es pequeño. Cabe señalar que el proceso de cálculo del intervalo de confianza es bastante complicado. Pero las herramientas del programa Excel te permiten simplificarlo un poco. Veamos cómo se hace esto en la práctica.

Este método se utiliza en la estimación de intervalos de varias cantidades estadísticas. La tarea principal de este cálculo es deshacerse de las incertidumbres de la estimación puntual.

En Excel, hay dos opciones principales para realizar cálculos usando este método: cuando se conoce la varianza y cuando se desconoce. En el primer caso, la función se utiliza para los cálculos. NORMA DE CONFIANZA, y en el segundo ESTUDIANTE DE CONFIANZA.

Método 1: Función NORMA DE CONFIANZA

Operador NORMA DE CONFIANZA, que se refiere al grupo estadístico de funciones, apareció por primera vez en Excel 2010. Las versiones anteriores de este programa usan su contraparte CONFIANZA. La tarea de este operador es calcular un intervalo de confianza con una distribución normal para la media poblacional.

Su sintaxis es la siguiente:

NORMA DE CONFIANZA(alfa, estándar_desv, tamaño)

"Alfa" es un argumento que indica el nivel de significación que se utiliza para calcular el nivel de confianza. El nivel de confianza es igual a la siguiente expresión:

(1-"Alfa")*100

"Desviación Estándar" es un argumento, cuya esencia se desprende del nombre. Esta es la desviación estándar de la muestra propuesta.

"El tamaño" es un argumento que determina el tamaño de la muestra.

Todos los argumentos operador dado son obligatorios.

Función CONFIANZA tiene exactamente los mismos argumentos y posibilidades que el anterior. Su sintaxis es:

CONFIANZA(alfa, desarrollo_estándar, tamaño)

Como puede ver, las diferencias están solo en el nombre del operador. Esta función se ha conservado en Excel 2010 y versiones más recientes en una categoría especial por motivos de compatibilidad. "Compatibilidad". En versiones de Excel 2007 y anteriores, está presente en el grupo principal de operadores estadísticos.

El límite del intervalo de confianza se determina utilizando la fórmula de la siguiente forma:

X+(-)NORMA DE CONFIANZA

Dónde X es la media muestral, que se encuentra en el medio del rango seleccionado.

Ahora veamos cómo calcular el intervalo de confianza usando un ejemplo específico. Se realizaron 12 pruebas, dando como resultado diferentes resultados, que se enumeran en la tabla. Esta es nuestra totalidad. La desviación estándar es 8. Necesitamos calcular el intervalo de confianza al 97% de nivel de confianza.

  1. Seleccione la celda donde se mostrará el resultado del procesamiento de datos. Haciendo clic en el botón "Función de inserción".
  2. aparece Asistente de funciones. ir a la categoría "Estadístico" y resalta el nombre "CONFIANZA.NORMA". Después de eso, haga clic en el botón OK.
  3. Se abre la ventana de argumentos. Sus campos corresponden naturalmente a los nombres de los argumentos.
    Coloque el cursor en el primer campo - "Alfa". Aquí debemos especificar el nivel de significación. Como recordamos, nuestro nivel de confianza es del 97%. Al mismo tiempo, dijimos que se calcula de esta manera:

    (1 nivel de confianza)/100

    Es decir, sustituyendo el valor, obtenemos:

    Por simples cálculos, encontramos que el argumento "Alfa" es igual 0,03 . Introduzca este valor en el campo.

    Como sabes, la desviación estándar es igual a 8 . Por lo tanto, en el campo "Desviación Estándar" simplemente anote ese número.

    en campo "El tamaño" debe ingresar el número de elementos de las pruebas realizadas. Como recordamos, ellos 12 . Pero para automatizar la fórmula y no editarla cada vez que se realiza una nueva prueba, establezcamos este valor no en un número ordinario, sino usando el operador CONTROLAR. Entonces, colocamos el cursor en el campo. "El tamaño" y luego haga clic en el triángulo, que se encuentra a la izquierda de la barra de fórmulas.

    Aparece una lista de funciones usadas recientemente. Si el operador CONTROLAR usado por usted recientemente, debería estar en esta lista. En este caso, solo necesita hacer clic en su nombre. De lo contrario, si no lo encuentra, vaya al punto. "Más características...".

  4. ya nos parece familiar Asistente de funciones. Volviendo al grupo "Estadístico". Seleccionamos el nombre allí "CONTROLAR". Haga clic en el botón OK.
  5. Aparece la ventana de argumentos para el operador anterior. Esta función está diseñada para calcular el número de celdas en el rango especificado que contienen valores numéricos. Su sintaxis es la siguiente:

    CONTAR(valor1, valor2,…)

    grupo de argumentos "Valores" es una referencia al rango en el que desea calcular el número de celdas llenas de datos numéricos. En total, puede haber hasta 255 argumentos de este tipo, pero en nuestro caso solo necesitamos uno.

    Coloque el cursor en el campo "Valor1" y, manteniendo pulsado el botón izquierdo del ratón, seleccionar en la hoja el rango que contiene nuestra población. Entonces su dirección se mostrará en el campo. Haga clic en el botón OK.

  6. Después de eso, la aplicación realizará el cálculo y mostrará el resultado en la celda donde se encuentra. En nuestro caso particular, la fórmula resultó así:

    NORMA DE CONFIANZA(0.03,8,CONTADOR(B2:B13))

    El resultado global de los cálculos fue 5,011609 .

  7. Pero eso no es todo. Como recordamos, el límite del intervalo de confianza se calcula sumando y restando del valor de muestra promedio del resultado del cálculo NORMA DE CONFIANZA. De esta forma, se calculan los límites derecho e izquierdo del intervalo de confianza, respectivamente. La media de la muestra en sí se puede calcular usando el operador PROMEDIO.

    Este operador está diseñado para calcular la media aritmética del rango de números seleccionado. Tiene la siguiente sintaxis bastante simple:

    PROMEDIO(número1, número2,…)

    Argumento "Número" puede ser un solo valor numérico o una referencia a celdas o incluso rangos completos que los contienen.

    Entonces, seleccione la celda en la que se mostrará el cálculo del valor promedio y haga clic en el botón "Función de inserción".

  8. abre Asistente de funciones. volver a la categoría "Estadístico" y seleccione un nombre de la lista "PROMEDIO". Como siempre, haz clic en el botón OK.
  9. Se abre la ventana de argumentos. Coloque el cursor en el campo "Numero 1" y con el botón izquierdo del ratón pulsado, seleccionar todo el rango de valores. Después de que las coordenadas se muestren en el campo, haga clic en el botón OK.
  10. Después de eso PROMEDIO envía el resultado del cálculo a un elemento de hoja.
  11. Calculamos el límite derecho del intervalo de confianza. Para hacer esto, seleccione una celda separada, ponga el signo «=» y agregue el contenido de los elementos de la hoja en la que se encuentran los resultados del cálculo de funciones PROMEDIO y NORMA DE CONFIANZA. Para realizar el cálculo, presione el botón Ingresar. En nuestro caso, obtuvimos la siguiente fórmula:

    Resultado del cálculo: 6,953276

  12. De la misma manera, calculamos el límite izquierdo del intervalo de confianza, solo que esta vez a partir del resultado del cálculo PROMEDIO restar el resultado del cálculo del operador NORMA DE CONFIANZA. Resulta la fórmula para nuestro ejemplo del siguiente tipo:

    Resultado del cálculo: -3,06994

  13. Intentamos describir en detalle todos los pasos para calcular el intervalo de confianza, por lo que describimos cada fórmula en detalle. Pero puedes combinar todas las acciones en una fórmula. El cálculo del límite derecho del intervalo de confianza se puede escribir de la siguiente manera:

    PROMEDIO(B2:B13)+CONFIANZA(0.03,8,CONTAR(B2:B13))

  14. Un cálculo similar del borde izquierdo se vería así:

    PROMEDIO(B2:B13)-CONFIANZA.NORMAL(0.03,8,CONTADOR(B2:B13))

Método 2: Función TRUST.STUDENT

Además, hay otra función en Excel que está relacionada con el cálculo del intervalo de confianza: ESTUDIANTE DE CONFIANZA. Ha aparecido solo desde Excel 2010. Este operador realiza el cálculo del intervalo de confianza de la población utilizando la distribución de Student. Es muy conveniente usarlo en el caso de que se desconozcan la varianza y, en consecuencia, la desviación estándar. La sintaxis del operador es:

CONFIANZA.ESTUDIANTE(alfa,desv_estándar,tamaño)

Como puede ver, los nombres de los operadores en este caso permanecieron sin cambios.

Veamos cómo calcular los límites del intervalo de confianza con una desviación estándar desconocida utilizando el ejemplo de la misma población que consideramos en el método anterior. El nivel de confianza, como la última vez, lo llevaremos al 97%.

  1. Seleccione la celda en la que se realizará el cálculo. Haga clic en el botón "Función de inserción".
  2. en el abierto Asistente de funciones ir a la categoría "Estadístico". Escoge un nombre "CONFIANZA.ESTUDIANTE". Haga clic en el botón OK.
  3. Se abre la ventana de argumentos para el operador especificado.

    en campo "Alfa", dado que el nivel de confianza es del 97%, anotamos el número 0,03 . La segunda vez no nos detendremos en los principios de cálculo de este parámetro.

    Después de eso, coloque el cursor en el campo. "Desviación Estándar". Esta vez, este indicador es desconocido para nosotros y necesita ser calculado. Esto se hace usando una función especial - DESVEST.B. Para abrir la ventana de este operador, haga clic en el triángulo a la izquierda de la barra de fórmulas. Si no encontramos el nombre deseado en la lista que se abre, vaya al elemento "Más características...".

  4. Esta corriendo Asistente de funciones. Moviéndose a la categoría "Estadístico" y marcar el nombre "DESVEST.B". Luego haga clic en el botón OK.
  5. Se abre la ventana de argumentos. tarea del operador DESVEST.B es la definición de desviación estándar en el muestreo. Su sintaxis se ve así:

    DESVEST.V(número1,número2,…)

    Es fácil adivinar que el argumento "Número" es la dirección del elemento de selección. Si la selección se coloca en una sola matriz, entonces usando solo un argumento, puede dar un enlace a este rango.

    Coloque el cursor en el campo "Numero 1" y, como siempre, manteniendo pulsado el botón izquierdo del ratón, seleccione el conjunto. Después de que las coordenadas estén en el campo, no se apresure a presionar el botón OK porque el resultado será incorrecto. Primero tenemos que volver a la ventana de argumentos del operador. ESTUDIANTE DE CONFIANZA para hacer el argumento final. Para hacer esto, haga clic en el nombre apropiado en la barra de fórmulas.

  6. La ventana de argumentos de la función ya familiar se abre de nuevo. Coloque el cursor en el campo "El tamaño". Nuevamente, haga clic en el triángulo que ya nos es familiar para ir a la elección de operadores. Como usted entiende, necesitamos un nombre "CONTROLAR". Dado que usamos esta función en los cálculos del método anterior, está presente en esta lista, así que simplemente haga clic en ella. Si no lo encuentra, siga el algoritmo descrito en el primer método.
  7. Entrar en la ventana de argumentos CONTROLAR, pon el cursor en el campo "Numero 1" y con el botón del mouse presionado, seleccione la colección. Luego haga clic en el botón OK.
  8. Después de eso, el programa calcula y muestra el valor del intervalo de confianza.
  9. Para determinar los límites, nuevamente necesitaremos calcular la media muestral. Pero, dado que el algoritmo de cálculo usando la fórmula PROMEDIO lo mismo que en el método anterior, e incluso el resultado no ha cambiado, no nos detendremos en esto en detalle por segunda vez.
  10. Sumando los resultados del cálculo. PROMEDIO y ESTUDIANTE DE CONFIANZA, obtenemos el límite derecho del intervalo de confianza.
  11. Restar de los resultados de cálculo del operador PROMEDIO resultado del calculo ESTUDIANTE DE CONFIANZA, tenemos el límite izquierdo del intervalo de confianza.
  12. Si el cálculo está escrito en una fórmula, entonces el cálculo del borde derecho en nuestro caso se verá así:

    PROMEDIO (B2: B13) + CONFIANZA DEL ESTUDIANTE (0.03, STDV (B2: B13), CONTEO (B2: B13))

  13. En consecuencia, la fórmula para calcular el borde izquierdo se verá así:

    PROMEDIO (B2: B13) - CONFIANZA DEL ESTUDIANTE (0.03, STDV (B2: B13), CONTEO (B2: B13))

Como puede ver, las herramientas del programa Excel permiten facilitar significativamente el cálculo del intervalo de confianza y sus límites. Para estos fines, se utilizan operadores separados para muestras cuya varianza es conocida y desconocida.

Konstantin Krawchik explica claramente qué es un intervalo de confianza en la investigación médica y cómo usarlo

"Katren-Style" sigue publicando un ciclo de Konstantin Kravchik sobre estadísticas médicas. En dos artículos anteriores, el autor se refirió a la explicación de conceptos como y.

Konstantin Kravchik

Matemático-analista. Especialista en el campo de la investigación estadística en medicina y humanidades

Moscú

Muy a menudo, en los artículos sobre ensayos clínicos, puede encontrar una frase misteriosa: "intervalo de confianza" (95% IC o 95% IC - intervalo de confianza). Por ejemplo, un artículo podría decir: "Se usó la prueba t de Student para evaluar la importancia de las diferencias, con un intervalo de confianza del 95 % calculado".

¿Cuál es el valor del "intervalo de confianza del 95%" y por qué calcularlo?

¿Qué es un intervalo de confianza? - Este es el rango en el que caen los verdaderos valores medios en la población. ¿Y qué, hay promedios "falsos"? En cierto sentido, sí, lo hacen. En explicamos que es imposible medir el parámetro de interés en toda la población, por lo que los investigadores se conforman con una muestra limitada. En esta muestra (por ejemplo, por peso corporal) hay un valor promedio (un cierto peso), por el cual juzgamos el valor promedio en toda la población general. Sin embargo, es poco probable que el peso medio de la muestra (especialmente si es pequeña) coincida con el peso medio de la población general. Por lo tanto, es más correcto calcular y utilizar el rango de valores promedio de la población general.

Por ejemplo, suponga que el intervalo de confianza del 95 % (IC del 95 %) para la hemoglobina está entre 110 y 122 g/L. Esto significa que con una probabilidad del 95 %, el verdadero valor medio de hemoglobina en la población general estará en el rango de 110 a 122 g/L. En otras palabras, no conocemos la hemoglobina promedio en la población general, pero podemos indicar el rango de valores para esta característica con un 95% de probabilidad.

Los intervalos de confianza son particularmente relevantes para la diferencia de medias entre grupos, o lo que se denomina el tamaño del efecto.

Supongamos que comparamos la eficacia de dos preparados de hierro: uno que lleva mucho tiempo en el mercado y otro que acaba de ser registrado. Después del curso de la terapia, se evaluó la concentración de hemoglobina en los grupos de pacientes estudiados y el programa estadístico calculó para nosotros que la diferencia entre los valores promedio de los dos grupos con una probabilidad del 95% está en el rango de 1,72 a 14,36 g/l (Tabla 1).

Pestaña. 1. Criterio para muestras independientes
(los grupos se comparan por el nivel de hemoglobina)

Esto debe interpretarse de la siguiente manera: en una parte de los pacientes de la población general que toman un nuevo fármaco, la hemoglobina será de media 1,72-14,36 g/l más alta que en aquellos que toman un fármaco ya conocido.

En otras palabras, en la población general, la diferencia en los valores promedio de hemoglobina en grupos con un 95% de probabilidad está dentro de estos límites. Corresponderá al investigador juzgar si esto es mucho o poco. El punto de todo esto es que no estamos trabajando con un valor promedio, sino con un rango de valores, por lo tanto, estimamos de manera más confiable la diferencia en un parámetro entre grupos.

En los paquetes estadísticos, a discreción del investigador, se pueden reducir o ampliar de forma independiente los límites del intervalo de confianza. Al reducir las probabilidades del intervalo de confianza, reducimos el rango de medias. Por ejemplo, con un IC del 90 %, el rango de medias (o diferencias de medias) será más estrecho que con un IC del 95 %.

Por el contrario, aumentar la probabilidad al 99% amplía el rango de valores. Al comparar grupos, el límite inferior del IC puede cruzar la marca cero. Por ejemplo, si ampliamos los límites del intervalo de confianza al 99 %, entonces los límites del intervalo oscilaron entre –1 y 16 g/L. Esto significa que en la población general existen grupos cuya diferencia entre las medias para el rasgo estudiado es 0 (M = 0).

Los intervalos de confianza se pueden utilizar para probar hipótesis estadísticas. Si el intervalo de confianza cruza cero, entonces la hipótesis nula, que supone que los grupos no difieren en el parámetro estudiado, es verdadera. Un ejemplo se describe arriba, cuando ampliamos los límites al 99%. En algún lugar de la población general, encontramos grupos que no diferían de ninguna manera.

Intervalo de confianza del 95% de diferencia en hemoglobina, (g/l)


La figura de línea muestra el intervalo de confianza del 95% para la diferencia en los valores medios de hemoglobina entre los dos grupos. La línea pasa la marca cero, por lo tanto, existe una diferencia entre las medias igual a cero, lo que confirma la hipótesis nula de que los grupos no difieren. La diferencia entre grupos oscila entre -2 y 5 g/l, lo que significa que la hemoglobina puede disminuir en 2 g/l o aumentar en 5 g/l.

El intervalo de confianza es un indicador muy importante. Gracias a ella se puede ver si las diferencias en los grupos se deben realmente a la diferencia de medias oa una muestra grande, ya que con una muestra grande las posibilidades de encontrar diferencias son mayores que con una pequeña.

En la práctica, podría verse así. Tomamos una muestra de 1000 personas, medimos el nivel de hemoglobina y encontramos que el intervalo de confianza para la diferencia de medias se encuentra entre 1,2 y 1,5 g/L. El nivel de significación estadística en este caso p

Vemos que la concentración de hemoglobina aumentó, pero de manera casi imperceptible, por lo tanto, la significancia estadística apareció precisamente por el tamaño de la muestra.

Los intervalos de confianza se pueden calcular no solo para promedios, sino también para proporciones (y razones de riesgo). Por ejemplo, estamos interesados ​​en el intervalo de confianza de las proporciones de pacientes que alcanzaron la remisión mientras tomaban el fármaco desarrollado. Suponga que el IC del 95% para las proporciones, es decir, para la proporción de tales pacientes, está en el rango de 0,60 a 0,80. Así, podemos decir que nuestro medicamento tiene un efecto terapéutico en un 60 a 80% de los casos.