Principal » comercio algorítmico » Conceptos básicos de regresión para el análisis empresarial

Conceptos básicos de regresión para el análisis empresarial

comercio algorítmico : Conceptos básicos de regresión para el análisis empresarial

Si alguna vez se ha preguntado cómo se relacionan dos o más datos entre sí (por ejemplo, cómo se ve afectado el PIB por los cambios en el desempleo y la inflación), o si alguna vez su jefe le ha pedido que cree un pronóstico o analice predicciones basadas en las relaciones entre variables, entonces aprender el análisis de regresión bien valdría su tiempo.

En este artículo, aprenderá los conceptos básicos de la regresión lineal simple, a veces llamada 'mínimos cuadrados ordinarios' o regresión OLS, una herramienta comúnmente utilizada en pronósticos y análisis financieros. Comenzaremos aprendiendo los principios básicos de la regresión, primero aprendiendo sobre la covarianza y la correlación, y luego avanzando hacia la construcción e interpretación de una salida de regresión. Un software comercial popular como Microsoft Excel puede hacer todos los cálculos y resultados de regresión por usted, pero aún es importante aprender la mecánica subyacente.

Variables

En el corazón de un modelo de regresión está la relación entre dos variables diferentes, llamadas variables dependientes e independientes. Por ejemplo, suponga que desea pronosticar las ventas de su empresa y ha concluido que las ventas de su empresa suben y bajan dependiendo de los cambios en el PIB.

Las ventas que pronostica serían la variable dependiente porque su valor "depende" del valor del PIB y el PIB sería la variable independiente. Luego deberá determinar la fuerza de la relación entre estas dos variables para pronosticar las ventas. Si el PIB aumenta / disminuye en un 1%, ¿cuánto aumentarán o disminuirán sus ventas?

Covarianza

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {alineado} y Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {alineado} Cov (x, y) = ∑N (xn −xu) (yn −yu)

La fórmula para calcular la relación entre dos variables se llama covarianza. Este cálculo le muestra la dirección de la relación. Si una variable aumenta y la otra variable tiende a aumentar también, la covarianza sería positiva. Si una variable sube y la otra tiende a bajar, entonces la covarianza sería negativa.

El número real que obtienes al calcular esto puede ser difícil de interpretar porque no está estandarizado. Una covarianza de cinco, por ejemplo, puede interpretarse como una relación positiva, pero solo se puede decir que la fuerza de la relación es más fuerte que si el número fuera cuatro o más débil que si el número fuera seis.

Coeficiente de correlación

Correlación = ρxy = Covxysxsy \ begin {alineado} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {alineado} Correlación = ρxy = sx sy Covxy

Necesitamos estandarizar la covarianza para permitirnos interpretarla mejor y usarla en el pronóstico, y el resultado es el cálculo de la correlación. El cálculo de la correlación simplemente toma la covarianza y la divide por el producto de la desviación estándar de las dos variables. Esto unirá la correlación entre un valor de -1 y +1.

Una correlación de +1 puede interpretarse para sugerir que ambas variables se mueven perfectamente positivamente entre sí y un -1 implica que están perfectamente correlacionadas negativamente. En nuestro ejemplo anterior, si la correlación es +1 y el PIB aumenta un 1%, las ventas aumentarían un 1%. Si la correlación es -1, un aumento del 1% en el PIB daría como resultado una disminución del 1% en las ventas, exactamente lo contrario.

Ecuación de regresión

Ahora que sabemos cómo se calcula la relación relativa entre las dos variables, podemos desarrollar una ecuación de regresión para pronosticar o predecir la variable que deseamos. A continuación se muestra la fórmula para una regresión lineal simple. La "y" es el valor que estamos tratando de pronosticar, la "b" es la pendiente de la línea de regresión, la "x" es el valor de nuestro valor independiente y la "a" representa la intersección en y. La ecuación de regresión simplemente describe la relación entre la variable dependiente (y) y la variable independiente (x).

y = bx + a \ begin {alineado} & y = bx + a \\ \ end {alineado} y = bx + a

La intersección, o "a", es el valor de y (variable dependiente) si el valor de x (variable independiente) es cero y, por lo tanto, a veces simplemente se denomina "constante". Por lo tanto, si no hubiera cambios en el PIB, su empresa aún realizaría algunas ventas; este valor, cuando el cambio en el PIB es cero, es la intercepción. Eche un vistazo al gráfico a continuación para ver una representación gráfica de una ecuación de regresión. En este gráfico, solo hay cinco puntos de datos representados por los cinco puntos en el gráfico. La regresión lineal intenta estimar una línea que mejor se ajusta a los datos (una línea de mejor ajuste) y la ecuación de esa línea da como resultado la ecuación de regresión.

Figura 1: línea de mejor ajuste

Fuente: Investopedia

Regresiones en Excel

Ahora que comprende algunos de los antecedentes que se incluyen en un análisis de regresión, hagamos un ejemplo simple usando las herramientas de regresión de Excel. Nos basaremos en el ejemplo anterior de tratar de pronosticar las ventas del próximo año en función de los cambios en el PIB. La siguiente tabla enumera algunos puntos de datos artificiales, pero estos números pueden ser fácilmente accesibles en la vida real.

AñoVentasPIB
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Simplemente mirando la tabla, se puede ver que habrá una correlación positiva entre las ventas y el PIB. Ambos tienden a subir juntos. Con Excel, todo lo que tiene que hacer es hacer clic en el menú desplegable Herramientas, seleccionar Análisis de datos y desde allí elegir Regresión . El cuadro emergente es fácil de completar desde allí; su rango de entrada Y es su columna "Ventas" y su rango de entrada X es el cambio en la columna del PIB; elija el rango de salida para el lugar donde desea que se muestren los datos en su hoja de cálculo y presione OK. Debería ver algo similar a lo que se da en la tabla a continuación:

Coeficientes de estadísticas de regresión

R múltiple0.8292243Interceptar34, 58409

R Plaza


0.687613PIB88.15552
Equilibrado
R Plaza


0.583484

-


-


Error estándar51.021807-

-


Observaciones5 5

-


-


Interpretación

Los principales resultados de los que debe preocuparse por la regresión lineal simple son el R cuadrado, la intersección (constante) y el coeficiente beta (b) del PIB. El número R cuadrado en este ejemplo es 68.7%; esto muestra cuán bien nuestro modelo predice o pronostica las ventas futuras, lo que sugiere que las variables explicativas en el modelo predijeron el 68.7% de la variación en la variable dependiente. A continuación, tenemos una intersección de 34.58, que nos dice que si el cambio en el PIB se pronosticara en cero, nuestras ventas serían de aproximadamente 35 unidades. Y, por último, el coeficiente de correlación beta o 88.15 del PIB nos dice que si el PIB aumenta en un 1%, las ventas probablemente aumentarán en aproximadamente 88 unidades.

La línea de fondo

Entonces, ¿cómo utilizaría este modelo simple en su negocio ">

Por supuesto, esto es solo una regresión simple y hay modelos que puede construir que utilizan varias variables independientes llamadas regresiones lineales múltiples. Pero las regresiones lineales múltiples son más complicadas y tienen varios problemas que necesitarían otro artículo para discutir.

Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.
Recomendado
Deja Tu Comentario