Prueba T

¿Qué es una prueba T?

Una prueba t es un tipo de estadística inferencial utilizada para determinar si hay una diferencia significativa entre las medias de dos grupos, que pueden estar relacionadas en ciertas características. Se usa principalmente cuando los conjuntos de datos, como el conjunto de datos registrado como resultado de lanzar una moneda 100 veces, seguirían una distribución normal y pueden tener variaciones desconocidas. Una prueba t se usa como una herramienta de prueba de hipótesis, que permite probar una suposición aplicable a una población.

Una prueba t analiza el estadístico t, los valores de distribución t y los grados de libertad para determinar la probabilidad de diferencia entre dos conjuntos de datos. Para realizar una prueba con tres o más variables, uno debe usar un análisis de varianza.

1:38

Prueba T

Explicando la prueba T

Esencialmente, una prueba t nos permite comparar los valores promedio de los dos conjuntos de datos y determinar si provienen de la misma población. En los ejemplos anteriores, si tomáramos una muestra de estudiantes de la clase A y otra muestra de estudiantes de la clase B, no esperaríamos que tuvieran exactamente la misma media y desviación estándar. Del mismo modo, las muestras tomadas del grupo de control alimentado con placebo y las tomadas del grupo de medicamentos recetados deberían tener una media y una desviación estándar ligeramente diferentes.

Matemáticamente, la prueba t toma una muestra de cada uno de los dos conjuntos y establece el enunciado del problema asumiendo una hipótesis nula de que las dos medias son iguales. Según las fórmulas aplicables, se calculan ciertos valores y se comparan con los valores estándar, y la hipótesis nula asumida se acepta o rechaza en consecuencia.

Si la hipótesis nula califica para ser rechazada, indica que las lecturas de datos son fuertes y no son casuales. La prueba t es solo una de las muchas pruebas utilizadas para este propósito. Los estadísticos también deben usar pruebas distintas de la prueba t para examinar más variables y pruebas con muestras de mayor tamaño. Para un gran tamaño de muestra, los estadísticos usan una prueba z. Otras opciones de prueba incluyen la prueba de chi-cuadrado y la prueba f.

Hay tres tipos de pruebas t, y se clasifican como pruebas t dependientes e independientes.

Para llevar clave

Una prueba t es un tipo de estadística inferencial utilizada para determinar si hay una diferencia significativa entre las medias de dos grupos, que pueden estar relacionadas en ciertas características.
La prueba t es una de las muchas pruebas utilizadas con el propósito de probar hipótesis en estadística.
Calcular una prueba t requiere tres valores de datos clave. Incluyen la diferencia entre los valores medios de cada conjunto de datos (llamada diferencia media), la desviación estándar de cada grupo y el número de valores de datos de cada grupo.
Existen varios tipos diferentes de prueba t que se pueden realizar según los datos y el tipo de análisis requerido.

Resultados de prueba ambiguos

Considere que un fabricante de medicamentos quiere probar un medicamento recién inventado. Sigue el procedimiento estándar de probar el medicamento en un grupo de pacientes y administrar un placebo a otro grupo, llamado grupo de control. El placebo administrado al grupo de control es una sustancia sin valor terapéutico previsto y sirve como punto de referencia para medir cómo responde el otro grupo, al que se le administra el medicamento real.

Después del ensayo farmacológico, los miembros del grupo de control alimentado con placebo informaron un aumento en la esperanza de vida promedio de tres años, mientras que los miembros del grupo a quienes se les recetó el nuevo medicamento informaron un aumento en la esperanza de vida promedio de cuatro años. La observación instantánea puede indicar que el medicamento realmente está funcionando, ya que los resultados son mejores para el grupo que lo usa. Sin embargo, también es posible que la observación se deba a una casualidad, especialmente a una suerte sorprendente. Una prueba t es útil para concluir si los resultados son realmente correctos y aplicables a toda la población.

En una escuela, 100 estudiantes en la clase A obtuvieron un promedio de 85% con una desviación estándar de 3%. Otros 100 estudiantes pertenecientes a la clase B obtuvieron un promedio de 87% con una desviación estándar del 4%. Si bien el promedio de la clase B es mejor que el de la clase A, puede no ser correcto llegar a la conclusión de que el rendimiento general de los estudiantes en la clase B es mejor que el de los estudiantes en la clase A. Esto se debe a que, junto con el es decir, la desviación estándar de la clase B también es más alta que la de la clase A. Indica que sus porcentajes extremos, en los lados inferior y superior, estaban mucho más dispersos en comparación con los de la clase A. Una prueba t puede ayudar a determinar a qué clase le fue mejor.

Supuestos de la prueba T

La primera suposición hecha con respecto a las pruebas t se refiere a la escala de medición. La suposición para una prueba t es que la escala de medición aplicada a los datos recopilados sigue una escala continua u ordinal, como los puntajes para una prueba de coeficiente intelectual.
La segunda suposición hecha es la de una muestra aleatoria simple, que los datos se recopilan de una parte representativa, seleccionada al azar de la población total.
El tercer supuesto es que los datos, cuando se trazan, dan como resultado una distribución normal, curva de distribución en forma de campana.
El cuarto supuesto es que se utiliza un tamaño de muestra razonablemente grande. Un tamaño de muestra más grande significa que la distribución de resultados debe acercarse a una curva en forma de campana normal.
El supuesto final es la homogeneidad de la varianza. Existe una varianza homogénea o igual cuando las desviaciones estándar de las muestras son aproximadamente iguales.

Cálculo de pruebas T

Calcular una prueba t requiere tres valores de datos clave. Incluyen la diferencia entre los valores medios de cada conjunto de datos (llamada diferencia media), la desviación estándar de cada grupo y el número de valores de datos de cada grupo.

El resultado de la prueba t produce el valor t. Este valor t calculado se compara con un valor obtenido de una tabla de valores críticos (llamada tabla de distribución T). Esta comparación ayuda a determinar la probabilidad de que la diferencia entre las medias ocurriera por casualidad o si los conjuntos de datos realmente tienen diferencias intrínsecas. La prueba t cuestiona si la diferencia entre los grupos representa una verdadera diferencia en el estudio o si es probable que sea una diferencia estadística sin sentido.

Tablas de distribución en T

La tabla de distribución T está disponible en formatos de una cola y dos colas. El primero se utiliza para evaluar casos que tienen un valor fijo o rango con una dirección clara (positiva o negativa). Por ejemplo, ¿cuál es la probabilidad de que el valor de salida permanezca por debajo de -3 u obtenga más de siete al tirar un par de dados? Este último se utiliza para el análisis de límite de rango, como preguntar si las coordenadas caen entre -2 y +2.

Los cálculos se pueden realizar con programas de software estándar que admiten las funciones estadísticas necesarias, como las que se encuentran en MS Excel.

Valores T y grados de libertad

La prueba t produce dos valores como salida: valor t y grados de libertad. El valor t es una relación de la diferencia entre la media de los dos conjuntos de muestras y la diferencia que existe dentro de los conjuntos de muestras. Si bien el valor del numerador (la diferencia entre la media de los dos conjuntos de muestras) es fácil de calcular, el denominador (la diferencia que existe dentro de los conjuntos de muestras) puede volverse un poco complicado dependiendo del tipo de valores de datos involucrados. El denominador de la relación es una medida de la dispersión o variabilidad. Los valores más altos del valor t, también llamado puntaje t, indican que existe una gran diferencia entre los dos conjuntos de muestras. Cuanto menor es el valor t, existe más similitud entre los dos conjuntos de muestras.

Una puntuación t grande indica que los grupos son diferentes.
Una pequeña puntuación t indica que los grupos son similares.

Grados de libertad se refiere a los valores en un estudio que tiene la libertad de variar y son esenciales para evaluar la importancia y la validez de la hipótesis nula. El cálculo de estos valores generalmente depende de la cantidad de registros de datos disponibles en el conjunto de muestras.

Prueba T correlacionada (o emparejada)

La prueba t correlacionada se realiza cuando las muestras consisten típicamente en pares coincidentes de unidades similares, o cuando hay casos de medidas repetidas. Por ejemplo, puede haber casos de los mismos pacientes que se prueban repetidamente, antes y después de recibir un tratamiento particular. En tales casos, cada paciente se está utilizando como muestra de control contra sí mismo.

Este método también se aplica a los casos en que las muestras están relacionadas de alguna manera o tienen características coincidentes, como un análisis comparativo que involucra a niños, padres o hermanos. Las pruebas t correlacionadas o pareadas son de un tipo dependiente, ya que implican casos en los que los dos conjuntos de muestras están relacionados.

La fórmula para calcular el valor t y los grados de libertad para una prueba t emparejada es:

Mean1 y mean2 son los valores promedio de cada uno de los conjuntos de muestras, mientras que var1 y var2 representan la varianza de cada uno de los conjuntos de muestras.

Los dos tipos restantes pertenecen a las pruebas t independientes. Las muestras de estos tipos se seleccionan independientemente unas de otras, es decir, los conjuntos de datos en los dos grupos no se refieren a los mismos valores. Incluyen casos como un grupo de 100 pacientes divididos en dos conjuntos de 50 pacientes cada uno. Uno de los grupos se convierte en el grupo control y recibe un placebo, mientras que el otro grupo recibe el tratamiento prescrito. Esto constituye dos grupos de muestra independientes que no están emparejados entre sí.

Prueba T de varianza igual (o agrupada)

La prueba t de varianza igual se usa cuando el número de muestras en cada grupo es el mismo, o la varianza de los dos conjuntos de datos es similar. La siguiente fórmula se utiliza para calcular el valor t y los grados de libertad para la prueba t de igual varianza:

Valor T = mean1 − mean2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 donde: mean1 y mean2 = Valores promedio de cada uno de los conjuntos de muestrasvar1 y var2 = Varianza de cada conjuntos de muestras n1 y n2 = Número de registros en cada conjunto de muestras \ begin {alineado} & \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { donde:} \\ & mean1 \ text {y} mean2 = \ text {Valores promedio de cada uno} \\ & \ text {de los conjuntos de muestras} \\ & var1 \ text {y} var2 = \ text {Variación de cada uno de los conjuntos de muestras} \\ & n1 \ text {y} n2 = \ text {Número de registros en cada conjunto de muestras} \\ \ end {alineado} Valor T = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 mean1 − mean2 donde: mean1 y mean2 = Valores promedio de cada uno de los conjuntos de muestrasvar1 y var2 = Varianza de cada uno de los conjuntos de muestras n1 y n2 = Número de registros en cada muestra establecer

Grados de libertad = n1 + n2−2 donde: n1 y n2 = Número de registros en cada conjunto de muestra \ begin {alineado} y \ text {Grados de libertad} = n1 + n2 - 2 \\ & \ textbf {donde:} \\ & n1 \ text {and} n2 = \ text {Número de registros en cada conjunto de muestras} \\ \ end {alineado} Grados de libertad = n1 + n2−2 donde: n1 y n2 = Número de registros en cada conjunto de muestras

Prueba T de varianza desigual

La prueba t de varianza desigual se usa cuando el número de muestras en cada grupo es diferente, y la varianza de los dos conjuntos de datos también es diferente. Esta prueba también se llama prueba t de Welch. La siguiente fórmula se utiliza para calcular el valor t y los grados de libertad para una prueba t de varianza desigual:

Valor T = mean1 − mean2var12n1 + var22n2 donde: mean1 y mean2 = Valores promedio de cada uno de los conjuntos de muestrasvar1 y var2 = Varianza de cada uno de los conjuntos de muestras n1 y n2 = Número de registros en cada conjunto de muestras \ begin {alineado} & \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {donde:} \ \ & mean1 \ text {and} mean2 = \ text {Valores promedio de cada uno} \\ & \ text {de los conjuntos de muestras} \\ & var1 \ text {y} var2 = \ text {Variación de cada uno de los conjuntos de muestras} \ \ & n1 \ text {and} n2 = \ text {Número de registros en cada conjunto de muestras} \\ \ end {alineado} Valor T = n1var12 + n2var22 mean1 − mean2 donde: mean1 y mean2 = Valores promedio de cada uno de los conjuntos de muestras var1 y var2 = Varianza de cada uno de los conjuntos de muestras n1 y n2 = Número de registros en cada conjunto de muestras

Grados de libertad = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 donde: var1 y var2 = Variación de cada uno de los conjuntos de muestras n1 y n2 = Número de registros en cada conjunto de muestras \ begin {alineado } & \ text {Grados de libertad} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {donde:} \\ & var1 \ text {y} var2 = \ text {Variación de cada uno de los conjuntos de muestras} \\ & n1 \ text {y} n2 = \ text {Número de registros en cada conjunto de muestras } \\ \ end {alineado} Grados de libertad = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 donde: var1 y var2 = Varianza de cada uno de los conjuntos de muestras n1 y n2 = Número de registros en cada conjunto de muestras

Determinación de la prueba T correcta para usar

El siguiente diagrama de flujo se puede usar para determinar qué prueba t debe usarse en función de las características de los conjuntos de muestras. Los elementos clave a considerar incluyen si los registros de muestra son similares, el número de registros de datos en cada conjunto de muestras y la varianza de cada conjunto de muestras.

Imagen de Julie Bang © Investopedia 2019

Ejemplo de prueba T de varianza desigual

Supongamos que estamos tomando una medida diagonal de las pinturas recibidas en una galería de arte. Un grupo de muestras incluye 10 pinturas, mientras que el otro incluye 20 pinturas. Los conjuntos de datos, con los valores medios y de varianza correspondientes, son los siguientes:

	Serie 1	Set 2
	19, 7	28, 3
	20, 4	26, 7
	19, 6	20, 1
	17, 8	23, 3
	18, 5	25, 2
	18, 9	22, 1
	18, 3	17, 7
	18, 9	27, 6
	19, 5	20, 6
	21, 95	13, 7
		23, 2
		17, 5
		20, 6
		18 años
		23, 9
		21, 6
		24, 3
		20, 4
		23, 9
		13, 3
Media	19, 4	21, 6
Diferencia	1.4	17, 1

Aunque la media del Conjunto 2 es mayor que la del Conjunto 1, no podemos concluir que todas las pinturas tienen una longitud promedio de alrededor de 21.6 unidades, ya que la varianza del Conjunto 2 es significativamente mayor que la del Conjunto 1. ¿Es esto por casualidad o realmente existen diferencias? en la población general de todas las pinturas recibidas en la galería de arte ">

Dado que el número de registros de datos es diferente (n1 = 10 y n2 = 20) y la varianza también es diferente, el valor t y los grados de libertad se calculan para el conjunto de datos anterior utilizando la fórmula mencionada en la Prueba T de varianza desigual sección.

El valor t es -2.24787. Dado que el signo menos se puede ignorar al comparar los dos valores t, el valor calculado es 2.24787.

El valor de grados de libertad es 24.38 y se reduce a 24, debido a que la definición de la fórmula requiere redondear el valor al menor valor entero posible.

Siempre que se supone una distribución normal, se puede especificar un nivel de probabilidad (nivel alfa, nivel de significación, p ) como criterio de aceptación. En la mayoría de los casos, se puede suponer un valor del 5%.

Usando el valor del grado de libertad como 24 y un nivel de significación del 5%, una mirada a la tabla de distribución del valor t da un valor de 2.064. La comparación de este valor con el valor calculado de 2.247 indica que el valor t calculado es mayor que el valor de la tabla a un nivel de significancia del 5%. Por lo tanto, es seguro rechazar la hipótesis nula de que no hay diferencia entre las medias. El conjunto de la población tiene diferencias intrínsecas, y no son por casualidad.

Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.

Términos relacionados

Cómo funciona el Análisis de varianza (ANOVA) El Análisis de varianza (ANOVA) es una herramienta de análisis estadístico que separa la variabilidad total encontrada dentro de un conjunto de datos en dos componentes: factores aleatorios y sistemáticos. más Comprensión de la distribución T La distribución AT es un tipo de función de probabilidad apropiada para estimar los parámetros de población para tamaños de muestra pequeños o variaciones desconocidas. más Grados de libertad Definición Grados de libertad se refiere al número máximo de valores lógicamente independientes, que son valores que tienen la libertad de variar, en la muestra de datos. más Cómo funciona la desviación estándar residual La desviación estándar residual es un término estadístico utilizado para describir la diferencia en las desviaciones estándar de los valores observados versus los valores pronosticados, como se muestra en un análisis de regresión. más Cómo funciona la estadística de chi cuadrado Una estadística de chi cuadrado (χ2) es una prueba que mide cómo se comparan las expectativas con los datos observados reales (o los resultados del modelo). Los datos utilizados en el cálculo de una estadística de chi cuadrado deben ser aleatorios, crudos, mutuamente excluyentes, extraídos de variables independientes y extraídos de una muestra lo suficientemente grande. más Cómo se usa la prueba de Wilcoxon La prueba de Wilcoxon, que se refiere a la prueba de suma de rango o la prueba de rango firmado, es una prueba no paramétrica que compara dos grupos emparejados. más enlaces de socios

← Vehículo de Inversión Estructurado (SIV)

El estilo importa en el modelado financiero →

Recomendado

Deja Tu Comentario