Principal » comercio algorítmico » Definición de desviación estándar residual

Definición de desviación estándar residual

comercio algorítmico : Definición de desviación estándar residual
¿Cuál es la desviación estándar residual?

La desviación estándar residual es un término estadístico utilizado para describir la diferencia en las desviaciones estándar de los valores observados frente a los valores pronosticados, como lo muestran los puntos en un análisis de regresión. El análisis de regresión es un método utilizado en estadísticas para mostrar una relación entre dos variables diferentes y para describir qué tan bien puede predecir el comportamiento de una variable a partir del comportamiento de otra.

La desviación estándar residual también se conoce como la desviación estándar de puntos alrededor de una línea ajustada o el error estándar de estimación.

Las fórmulas para la desviación estándar residual y residual son

Residual = (Y − Yest) Sres = ∑ (Y − Yest) 2n − 2 donde: Sres = Desviación estándar residualY = Valor observadoYest = Valor estimado o proyectadon = Puntos de datos en la población \ begin {alineado} & \ text {Residual} = \ left (Y-Y_ {est} \ right) \\ & S_ {res} = \ sqrt {\ frac {\ sum \ left (Y-Y_ {est} \ right) ^ 2} {n-2}} \\ & \ textbf {donde:} \\ & S_ {res} = \ text {Desviación estándar residual} \\ & Y = \ text {Valor observado} \\ & Y_ {est} = \ text {Valor estimado o proyectado} \\ & n = \ text {Puntos de datos en la población} \\ \ end {alineado} Residual = (Y − Yest) Sres = n − 2∑ (Y − Yest) 2 donde: Sres = Desviación estándar residual Y = Observado valueYest = Valor estimado o proyectadon = Puntos de datos en la población

Cómo calcular la desviación estándar residual

Para calcular la desviación estándar residual, primero se debe calcular la diferencia entre los valores pronosticados y los valores reales formados alrededor de una línea ajustada. Esta diferencia se conoce como el valor residual o, simplemente, los residuos o la distancia entre los puntos de datos conocidos y los puntos de datos predichos por el modelo.

Para calcular la desviación estándar residual, inserte los residuos en la ecuación de desviación estándar residual para resolver la fórmula.

¿Qué le dice la desviación estándar residual?

La desviación estándar residual es una medida de bondad de ajuste que se puede utilizar para analizar qué tan bien se ajusta un conjunto de puntos de datos con el modelo real. En un entorno empresarial, por ejemplo, después de realizar un análisis de regresión en múltiples puntos de datos de costos a lo largo del tiempo, la desviación estándar residual puede proporcionar al propietario de la empresa información sobre la diferencia entre los costos reales y los costos proyectados y una idea de cuánto costos proyectados podría variar de la media de los datos de costos históricos.

Para llevar clave

  • La desviación estándar residual es simplemente la desviación estándar de los valores residuales, o la diferencia entre un conjunto de valores observados y pronosticados.
  • La desviación estándar de los residuos calcula cuánto se extienden los puntos de datos alrededor de la línea de regresión.
  • El resultado se usa para medir el error de la previsibilidad de la línea de regresión.

Ejemplo de cómo calcular la desviación estándar residual

Comience calculando valores residuales. Por ejemplo, suponiendo que tiene un conjunto de cuatro valores observados para un experimento sin nombre, la tabla a continuación muestra los valores y observados y registrados para valores dados de x :

X


y


1


1


2


4 4


3


6 6


4 4


7 7


Si la ecuación lineal o la pendiente de la línea predicha por los datos en el modelo se da como y est = 1x + 2 donde y est = valor y pronosticado, se puede encontrar el residuo para cada observación.

El residual es igual a (y - y est ), por lo que para el primer conjunto, el valor real de y es 1 y el valor de yest pronosticado dado por la ecuación es y est = 1 (1) + 2 = 3. El valor residual es, por lo tanto, 1 - 3 = -2, un valor residual negativo.

Para el segundo conjunto de puntos de datos x e y, el valor predicho de y cuando x es 2 e y es 4 puede calcularse como 1 (2) + 2 = 4.

En este caso, los valores reales y predichos son los mismos, por lo que el valor residual será cero. Usaría el mismo proceso para llegar a los valores pronosticados para y en los dos conjuntos de datos restantes.

Una vez que haya calculado los residuos para todos los puntos usando la tabla o un gráfico, use la fórmula de desviación estándar residual.

Expandiendo la tabla anterior, calcule la desviación estándar residual:

X

y

y est

Residual (yy est )

Suma de cada residuo al cuadrado, o Σ (aa est ) 2

1

1

3

-2

4 4

2

4 4

4 4

0 0

0 0

3

6 6

5 5

1

1

4 4

7 7

6 6

1

1

Observe que la suma de los residuos al cuadrado = 6, que representa el numerador de la ecuación de la desviación estándar residual.

Para la parte inferior o denominador de la ecuación de desviación estándar residual, n = el número de puntos de datos, que es 4 en este caso. Calcule el denominador de la ecuación como:

  • (Número de residuos - 2) = (4 - 2) = 2

Finalmente, calcule la raíz cuadrada de los resultados:

  • Desviación estándar residual: √ (6/2) = √3 ≈ 1.732

La magnitud de un residuo típico puede darle una idea general de cuán cercanas están sus estimaciones. Cuanto más pequeña es la desviación estándar residual, más se acerca el ajuste de la estimación a los datos reales. En efecto, cuanto más pequeña es la desviación estándar residual en comparación con la desviación estándar de la muestra, más predictivo o útil es el modelo.

La desviación estándar residual se puede calcular cuando se ha realizado un análisis de regresión, así como un análisis de varianza (ANOVA). Al determinar un límite de cuantificación (LoQ), se permite el uso de una desviación estándar residual en lugar de la desviación estándar.

Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.

Términos relacionados

¿Qué es un término de error? Un término de error se define como una variable en un modelo estadístico, que se crea cuando el modelo no representa completamente la relación real entre las variables independientes y dependientes. más Cómo funciona el método de mínimos cuadrados El método de mínimos cuadrados es una técnica estadística para determinar la línea de mejor ajuste para un modelo, especificada por una ecuación con ciertos parámetros a los datos observados. más Comprensión de la estadística de Durbin Watson La estadística de Durbin Watson es un número que prueba la autocorrelación en los residuos de un análisis de regresión estadística. más Cómo funciona la técnica estadística de suma de cuadrados La suma de cuadrados es una técnica estadística utilizada en el análisis de regresión para determinar la dispersión de los puntos de datos a partir de su valor medio. En un análisis de regresión, el objetivo es determinar qué tan bien se puede ajustar una serie de datos a una función que podría ayudar a explicar cómo se generó la serie de datos. más Cómo funciona la regresión lineal múltiple La regresión lineal múltiple (MLR) es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta. más Definición de desviación estándar La desviación estándar es una estadística que mide la dispersión de un conjunto de datos en relación con su media y se calcula como la raíz cuadrada de la varianza. Se calcula como la raíz cuadrada de la varianza determinando la variación entre cada punto de datos en relación con la media. más enlaces de socios
Recomendado
Deja Tu Comentario