Principal » comercio algorítmico » Prueba de hipótesis en finanzas: concepto y ejemplos

Prueba de hipótesis en finanzas: concepto y ejemplos

Su asesor de inversiones le propone un plan de inversión de ingresos mensual que promete un rendimiento variable cada mes. Invertirá en él solo si tiene asegurado un ingreso mensual promedio de $ 180. Su asesor también le dice que durante los últimos 300 meses, el esquema tuvo retornos de inversión con un valor promedio de $ 190 y una desviación estándar de $ 75. ¿Deberías invertir en este esquema? Las pruebas de hipótesis son útiles para la toma de decisiones.

Este artículo asume que los lectores están familiarizados con los conceptos de una tabla de distribución normal, fórmula, valor p y conceptos básicos de estadística relacionados.

¿Qué es la prueba de hipótesis?

La prueba de hipótesis o significación es un modelo matemático para probar una afirmación, idea o hipótesis sobre un parámetro de interés en un conjunto de población dado, utilizando datos medidos en un conjunto de muestra. Los cálculos se realizan en muestras seleccionadas para recopilar información más decisiva sobre las características de toda la población, lo que permite una forma sistemática de probar afirmaciones o ideas sobre todo el conjunto de datos.

Aquí hay un ejemplo simple: la directora de una escuela informa que los estudiantes en su escuela obtienen un promedio de 7 de 10 en los exámenes. Para probar esta "hipótesis", registramos marcas de, digamos, 30 estudiantes (muestra) de toda la población estudiantil de la escuela (digamos 300) y calculamos la media de esa muestra. Luego podemos comparar la media de la muestra (calculada) con la media de la población (informada) e intentar confirmar la hipótesis.

Para tomar otro ejemplo, el rendimiento anual de un fondo mutuo en particular es del 8%. Suponga que el fondo mutuo existe desde hace 20 años. Tomamos una muestra aleatoria de los rendimientos anuales del fondo mutuo por, digamos, cinco años (muestra) y calculamos su media. Luego comparamos la media de la muestra (calculada) con la media de la población (reclamada) para verificar la hipótesis.

Los criterios de toma de decisiones deben basarse en ciertos parámetros de conjuntos de datos.

Existen diferentes metodologías para la prueba de hipótesis, pero están involucrados los mismos cuatro pasos básicos:

Paso 1: definir la hipótesis

Por lo general, el valor informado (o las estadísticas de reclamo) se establece como la hipótesis y se presume que es cierto. Para los ejemplos anteriores, la hipótesis será:

Ejemplo A: Los estudiantes en la escuela obtienen un promedio de 7 de 10 en los exámenes.
Ejemplo B: El rendimiento anual del fondo mutuo es del 8% anual.

Esta descripción declarada constituye la " Hipótesis nula (H ₀ ) " y se supone que es cierta: la forma en que un acusado en un juicio por jurado se presume inocente hasta que la evidencia presentada en el tribunal demuestre su culpabilidad. Del mismo modo, la prueba de hipótesis comienza declarando y asumiendo una "hipótesis nula", y luego el proceso determina si la suposición es verdadera o falsa.

El punto importante a tener en cuenta es que estamos probando la hipótesis nula porque hay un elemento de duda sobre su validez. Cualquier información que esté en contra de la hipótesis nula establecida se captura en la Hipótesis alternativa (H ₁ ). Para los ejemplos anteriores, la hipótesis alternativa será:

Los estudiantes obtienen un promedio que no es igual a 7.
El rendimiento anual del fondo mutuo no es igual al 8% anual.

En otras palabras, la hipótesis alternativa es una contradicción directa de la hipótesis nula.

Como en un juicio, el jurado asume la inocencia del acusado (hipótesis nula). El fiscal tiene que demostrar lo contrario (hipótesis alternativa). Del mismo modo, el investigador tiene que demostrar que la hipótesis nula es verdadera o falsa. Si el fiscal no prueba la hipótesis alternativa, el jurado debe dejar ir al acusado (basando la decisión en la hipótesis nula). Del mismo modo, si el investigador no puede probar una hipótesis alternativa (o simplemente no hace nada), se supone que la hipótesis nula es verdadera.

Paso 2: establecer los criterios

Los criterios de toma de decisiones deben basarse en ciertos parámetros de los conjuntos de datos y aquí es donde entra en juego la conexión a la distribución normal.

Según el postulado estadístico estándar sobre la distribución muestral, "para cualquier tamaño de muestra n, la distribución muestral de X̅ es normal si la población X de la cual se extrae la muestra está normalmente distribuida". Por lo tanto, las probabilidades de todas las demás muestras posibles significan que uno podría seleccionar se distribuyen normalmente.

Por ejemplo, determinar si el rendimiento diario promedio de cualquier acción que cotiza en el mercado de valores XYZ, alrededor del día de Año Nuevo es mayor al 2%.

H ₀ : hipótesis nula: media = 2%

H ₁ : Hipótesis alternativa: media> 2% (esto es lo que queremos demostrar)

Tome la muestra (digamos de 50 acciones de un total de 500) y calcule la media de la muestra.

Para una distribución normal, el 95% de los valores se encuentran dentro de dos desviaciones estándar de la media de la población. Por lo tanto, esta distribución normal y el supuesto de límite central para el conjunto de datos de la muestra nos permite establecer un 5% como nivel de significancia. Tiene sentido ya que, bajo esta suposición, hay menos de un 5% de probabilidad (100-95) de obtener valores atípicos que están más allá de dos desviaciones estándar de la media de la población. Dependiendo de la naturaleza de los conjuntos de datos, se pueden tomar otros niveles de significancia al 1%, 5% o 10%. Para los cálculos financieros (incluidas las finanzas conductuales), el límite generalmente aceptado es el 5%. Si encontramos algún cálculo que vaya más allá de las dos desviaciones estándar habituales, entonces tenemos un caso fuerte de valores atípicos para rechazar la hipótesis nula.

Gráficamente, se representa de la siguiente manera:

En el ejemplo anterior, si la media de la muestra es mucho mayor que 2% (digamos 3.5%), entonces rechazamos la hipótesis nula. Se acepta la hipótesis alternativa (media> 2%), que confirma que el rendimiento diario promedio de las existencias es superior al 2%.

Sin embargo, si no es probable que la media de la muestra sea significativamente mayor al 2% (y se mantiene en, digamos, alrededor del 2.2%), NO PODEMOS rechazar la hipótesis nula. El desafío está en cómo decidir sobre casos tan cercanos. Para llegar a una conclusión a partir de muestras y resultados seleccionados, se debe determinar un nivel de significancia que permita llegar a una conclusión sobre la hipótesis nula. La hipótesis alternativa permite establecer el nivel de significancia o el concepto de "valor crítico" para decidir sobre estos casos de corto alcance.

Según la definición estándar del libro de texto, “Un valor crítico es un valor de corte que define los límites más allá de los cuales se puede obtener menos del 5% de las medias de muestra si la hipótesis nula es verdadera. Las medias de muestra obtenidas más allá de un valor crítico darán como resultado la decisión de rechazar la hipótesis nula ". En el ejemplo anterior, si hemos definido el valor crítico como 2.1%, y la media calculada llega a 2.2%, entonces rechazamos la hipótesis nula Un valor crítico establece una clara demarcación sobre aceptación o rechazo.

Paso 3: calcular la estadística

Este paso implica calcular la (s) figura (s) requerida (s), conocidas como estadísticas de prueba (como media, puntaje z, valor p, etc.), para la muestra seleccionada. (Llegaremos a esto en una sección posterior).

Paso 4: llegar a una conclusión

Con los valores calculados, decida sobre la hipótesis nula. Si la probabilidad de obtener una media muestral es inferior al 5%, entonces la conclusión es rechazar la hipótesis nula. De lo contrario, acepte y conserve la hipótesis nula.

Tipos de errores

Puede haber cuatro resultados posibles en la toma de decisiones basada en muestras, con respecto a la aplicabilidad correcta a toda la población:

Decisión de retener

Decisión de rechazar

Se aplica a toda la población.

Correcto

Incorrecto

(Error de TIPO 1 - a)

No se aplica a toda la población.

Incorrecto

(Error de TIPO 2 - b)

Correcto

Los casos "correctos" son aquellos en los que las decisiones tomadas sobre las muestras son realmente aplicables a toda la población. Los casos de errores surgen cuando uno decide retener (o rechazar) la hipótesis nula basada en los cálculos de la muestra, pero esa decisión realmente no se aplica a toda la población. Estos casos constituyen errores de Tipo 1 (alfa) y Tipo 2 (beta), como se indica en la tabla anterior.

Seleccionar el valor crítico correcto permite eliminar los errores alfa de tipo 1 o limitarlos a un rango aceptable.

Alfa denota el error en el nivel de significación y lo determina el investigador. Para mantener el nivel estándar de significancia o confianza del 5% para los cálculos de probabilidad, esto se mantiene al 5%.

De acuerdo con los puntos de referencia y definiciones de toma de decisiones aplicables:

“Este criterio (alfa) generalmente se establece en 0.05 (a = 0.05), y comparamos el nivel alfa con el valor p. Cuando la probabilidad de un error de Tipo I es inferior al 5% (p <0.05), decidimos rechazar la hipótesis nula; de lo contrario, conservamos la hipótesis nula ".
El término técnico utilizado para esta probabilidad es el valor p . Se define como “la probabilidad de obtener un resultado muestral, dado que el valor establecido en la hipótesis nula es verdadero. El valor p para obtener un resultado muestral se compara con el nivel de significación ".
Un error tipo II, o error beta, se define como "la probabilidad de retener incorrectamente la hipótesis nula, cuando de hecho no es aplicable a toda la población".

Algunos ejemplos más demostrarán este y otros cálculos.

Ejemplo 1

Existe un esquema de inversión de ingresos mensuales que promete rendimientos mensuales variables. Un inversor invertirá en él solo si tiene asegurado un ingreso mensual promedio de $ 180. Tiene una muestra de retornos de 300 meses que tiene una media de $ 190 y una desviación estándar de $ 75. ¿Debería él o ella invertir en este esquema ">

Arreglemos el problema. El inversor invertirá en el esquema si tiene asegurado el rendimiento promedio deseado de $ 180.

H ₀ : hipótesis nula: media = 180

H ₁ : Hipótesis alternativa: media> 180

Método 1: enfoque de valor crítico

Identifique un valor crítico X _L para la media de la muestra, que es lo suficientemente grande como para rechazar la hipótesis nula, es decir, rechazar la hipótesis nula si la media de la muestra> = valor crítico X _L

P (identificar un error alfa de Tipo I) = P (rechazar H ₀ dado que H ₀ es verdadero),

Esto se lograría cuando la media de la muestra exceda los límites críticos.

= P (dado que H ₀ es verdadero) = alfa

Gráficamente, aparece de la siguiente manera:

Tomando alfa = 0.05 (es decir, nivel de significancia del 5%), Z _0.05 = 1.645 (de la tabla Z o la tabla de distribución normal)

=> X _L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Dado que la media muestral (190) es mayor que el valor crítico (187.12), se rechaza la hipótesis nula, y la conclusión es que el rendimiento mensual promedio es de hecho mayor que $ 180, por lo que el inversor puede considerar invertir en este esquema.

Método 2: uso de estadísticas de prueba estandarizadas

También se puede usar el valor estandarizado z.

Estadística de prueba, Z = (media muestral - media poblacional) / (std-dev / sqrt (no. De muestras).

Entonces, la región de rechazo se convierte en lo siguiente:

Z = (190-180) / (75 / sqrt (300)) = 2.309

Nuestra región de rechazo al nivel de significancia del 5% es Z> Z _0.05 = 1.645.

Como Z = 2.309 es mayor que 1.645, la hipótesis nula puede rechazarse con una conclusión similar mencionada anteriormente.

Método 3: Cálculo del valor P

Nuestro objetivo es identificar P (media muestral> = 190, cuando media = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

La siguiente tabla para inferir los cálculos del valor p concluye que hay evidencia confirmada de que los rendimientos mensuales promedio son superiores a 180:

valor p

Inferencia

menos que 1%

Evidencia confirmada que respalda hipótesis alternativas

entre 1% y 5%

Evidencia sólida que respalda hipótesis alternativas

entre 5% y 10%

Evidencia débil que respalda hipótesis alternativas

mayor al 10%

No hay evidencia que respalde hipótesis alternativas

Ejemplo 2

Un nuevo corredor de bolsa (XYZ) afirma que sus tarifas de corretaje son más bajas que las de su corredor de bolsa actual (ABC). Los datos disponibles de una firma de investigación independiente indican que la media y el desarrollo estándar de todos los clientes de corredores ABC son de $ 18 y $ 6, respectivamente.

Se toma una muestra de 100 clientes de ABC y se calculan los cargos de corretaje con las nuevas tarifas del corredor XYZ. Si la media de la muestra es $ 18.75 y std-dev es la misma ($ 6), ¿puede hacerse alguna inferencia sobre la diferencia en la factura promedio de corretaje entre el corredor ABC y XYZ ">

H ₀ : Hipótesis nula: media = 18

H ₁ : Hipótesis alternativa: media 18 (Esto es lo que queremos probar).

Región de rechazo: Z <= - Z _2.5 y Z> = Z _2.5 (suponiendo un nivel de significancia del 5%, dividir 2.5 cada uno a cada lado).

Z = (muestra media - media) / (std-dev / sqrt (no. De muestras))

= (18.75 - 18) / (6 / (sqrt (100)) = 1.25

Este valor Z calculado se encuentra entre los dos límites definidos por:

- Z _2.5 = -1.96 y Z _2.5 = 1.96.

Esto concluye que no hay evidencia suficiente para inferir que hay alguna diferencia entre las tasas de su corredor actual y el nuevo corredor.

Alternativamente, el valor p = P (Z1.25)

= 2 * 0.1056 = 0.2112 = 21.12% que es mayor que 0.05 o 5%, lo que lleva a la misma conclusión.

Gráficamente, está representado por lo siguiente:

Puntos críticos para el método de prueba hipotética:

Un método estadístico basado en suposiciones.
Propenso a errores como se detalla en términos de errores alfa y beta
La interpretación del valor p puede ser ambigua y generar resultados confusos.

La línea de fondo

La prueba de hipótesis permite que un modelo matemático valide un reclamo o idea con un cierto nivel de confianza. Sin embargo, como la mayoría de las herramientas y modelos estadísticos, está sujeto a algunas limitaciones. El uso de este modelo para tomar decisiones financieras debe considerarse con un ojo crítico, teniendo en cuenta todas las dependencias. También vale la pena explorar métodos alternativos como la inferencia bayesiana para un análisis similar.

Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.

← Razones para las garantías bancarias y cómo obtener una

Cómo funcionan los beneficios para sobrevivientes de la Seguridad Social →

Recomendado

Deja Tu Comentario