Sobreajuste

comercio algorítmico : Sobreajuste
¿Qué es el sobreajuste?

El sobreajuste es un error de modelado que ocurre cuando una función se ajusta demasiado a un conjunto limitado de puntos de datos. El sobreajuste del modelo generalmente toma la forma de hacer un modelo demasiado complejo para explicar las idiosincrasias en los datos en estudio.

En realidad, los datos a menudo estudiados tienen algún grado de error o ruido aleatorio dentro de ellos. Por lo tanto, intentar hacer que el modelo se ajuste demasiado a datos ligeramente inexactos puede infectar el modelo con errores sustanciales y reducir su poder predictivo.

[Importante: los profesionales financieros siempre deben ser conscientes de los peligros de sobreajustar un modelo basado en datos limitados].

Comprender el sobreajuste

Por ejemplo, un problema común es usar algoritmos informáticos para buscar bases de datos extensas de datos históricos del mercado para encontrar patrones. Dado el estudio suficiente, a menudo es posible desarrollar teoremas elaborados que parecen predecir cosas como los rendimientos en el mercado de valores con gran precisión.

Sin embargo, cuando se aplica a los datos fuera de la muestra, es probable que tales teoremas resulten ser simplemente el ajuste excesivo de un modelo a lo que en realidad eran solo casos fortuitos. En todos los casos, es importante probar un modelo contra datos que están fuera de la muestra utilizada para desarrollarlo.

Para llevar clave

  • El sobreajuste es un error de modelado que ocurre cuando una función se ajusta demasiado a un conjunto limitado de puntos de datos.
  • Los profesionales financieros siempre deben ser conscientes de los peligros de sobreajustar un modelo basado en datos limitados.
Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.

Términos relacionados

Por qué es importante la significación estadística La significación estadística se refiere a un resultado que no es probable que ocurra de manera aleatoria, sino que es atribuible a una causa específica. más Cómo funciona el suavizado de datos El suavizado de datos se realiza mediante el uso de un algoritmo para eliminar el ruido de un conjunto de datos. Esto permite que patrones importantes se destaquen. El ajuste de datos se puede utilizar para ayudar a predecir tendencias, como las que se encuentran en los precios de los valores. más Muestra Una muestra es una versión más pequeña y manejable de un grupo más grande. Las muestras se utilizan en pruebas estadísticas cuando el tamaño de la población es demasiado grande. más Heteroscedasticidad En estadística, la heteroscedasticidad ocurre cuando las desviaciones estándar de una variable, monitoreadas durante un período de tiempo específico, no son constantes. más Lectura en muestreo aleatorio estratificado El muestreo aleatorio estratificado es un método de muestreo que implica la división de una población en grupos más pequeños conocidos como estratos. más Cómo funcionan las muestras aleatorias simples Una muestra aleatoria simple es un subconjunto de una población estadística en la que cada miembro del subconjunto tiene la misma probabilidad de ser elegido. Una muestra aleatoria simple está destinada a ser una representación imparcial de un grupo. más enlaces de socios
Recomendado
Deja Tu Comentario