Pronósticos

Tamaño

Producción

1.1 ANÁLISIS DE REGRESIÓN

El objetivo es pronosticar la variable dependiente (por ejemplo, la demanda) en función de una o más variables independientes (por ejemplo: precio, ingreso per cápita, crecimiento de la población, etc.). Cuando se incluye una sola variable independiente se denomina modelo de regresión simple y en el caso de intervenir do o más variables independientes, modelo de regresión múltiple. En función de la tendencia los modelos de regresión pueden ser lineales o no lineales.

1.1 ANÁLISIS DE REGRESIÓN

Caso N°1.1.1 Regresión Simple

Caso N°1.1.2 Regresión Lineal Múltiple

Ir a Estudio Mercado

Pronosticos

Pronósticos

Análisis Regresión

1.1 ANÁLISIS DE REGRESIÓN

El éxito de un emprendimiento depende de cuán bien se anticipe el futuro y desarrolle las estrategias apropiadas. El buen juicio y la intuición pueden dar a un emprendedor una idea aproximada de lo que probablemente suceda en el futuro. Sin embargo, le será muy difícil convertir esa idea en un número que pueda usarse, como el volumen de ventas esperado durante el primer año de operación.

Al inicio del emprendimiento no existen datos históricos sobre las ventas, por esta razón se recomienda aplicar un análisis de regresión sobre la base de la relación entre dos o más variables. Por ejemplo, está demostrado que la inversión en una buena publicidad influye en el volumen de ventas, de manera que un análisis de regresión puede utilizarse para desarrollar una ecuación que muestre cómo se relacionan estas dos variables. Según la terminología que se emplea en un análisis de regresión, a la variable que se va a predecir se le llama variable dependiente y se la denota por la letra "Y". A la variable o variables que se usan para predecir el valor de la variable dependiente se les llama variables independientes y se las denota por la letra "X" o "X1, X2; ...". En nuestro ejemplo, el volumen de ventas es la variable dependiente y la inversión en publicidad, la variable independiente.

Para una aplicación correcta del análisis de regresión es necesario considerar lo siguiente:

Calcular el coeficiente de determinación para determinar la proporción de la variación total en la variable dependiente que se explica por la variación en la variable independiente. Si la proporción que se explica está cerca de 100% ó 1, significa que la variable independiente que se está considerando en el análisis es importante porque sus variaciones inciden significativamente en la variación de la variable dependiente, caso contrario, se trata de una variable independiente que no es significativa y se tiene que identificar otra variable independiente para el análisis de regresión.
En regresión lineal simple, si el coeficiente de determinación es significativo (cerca de 100% o 1), se debe realizar una prueba de significancia para determinar que el coeficiente de la variable independiente es igual o diferente de cero. Si el valor de este coeficiente es diferente de cero se concluirá que las dos variables, dependiente e independiente, están relacionadas en forma significativa. Para este fin, se pueden usar dos tipos de pruebas: prueba "t" y prueba "F". Esta prueba de significancia se realiza mediante el comando Análisis de Datos de Excel.
Si el análisis concluye que existe una relación significativa entre las variables, se puede usar la ecuación de regresión para estimar el valor de la variable dependiente con base en un valor seleccionado del rango de variación de la variable independiente. Además, si el análisis considera relaciones lineales y no lineales, el proceso se simplifica ajustando la tendencia a un gráfico de dispersión con Excel, tal como se explica en los casos siguientes.

Ir al Menú

Caso N°1.1.1 Regresión Simple

CASO N°1.1.1: REGRESIÓN SIMPLE

En un nuevo emprendimiento sobre un restaurante para estudiantes universitarios, el equipo emprendedor cree que las ventas están relacionadas con la población de estudiantes de la universidad vecina. Empíricamente, se supone que los restaurantes localizados cerca de universidades grandes generan más ventas que los localizados cerca de universidades pequeñas. Si se puede establecer una relación entre ventas y población de la universidad, el emprendimiento puede utilizar la población de la universidad para predecir las ventas del nuevo restaurante. Para este propósito, se reunió la siguiente información:

Tabla N°1

Se supone que existe una relación entre las ventas y la población de estudiantes. En este sentido, se requiere elaborar un pronóstico de ventas para una localización cerca de una universidad que tiene una población de 1,750 estudiantes.

AJUSTE DE LÍNEAS DE TENDENCIA A UN GRÁFICO DE DISPERSIÓN CON EXCEL

Seleccionar el rango de celdas que contienen los datos X e Y.
En la barra de opciones, seleccionar Insertar y luego, dentro de las opciones de Gráficos, elegir Dispersión.
Un nuevo objeto flotante se mostrará sobre la hoja de cálculo, conteniendo el gráfico seleccionado sobre el cual se debe agregar los títulos necesarios. Hacer clic, con el botón derecho del mouse, sobre cualquiera de los puntos del gráfico de dispersión y elegir Agregar línea de tendencia...
En el cuadro de diálogo Formato de línea de tendencia, seleccionar la opción Lineal y marcar las casillas Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico.
Eligiendo cerrar, el gráfico se mostrará con la correspondiente línea de tendencia, la ecuación de regresión y el valor de R2.

El proceso se repite variando en el paso 4, la selección de las opciones de línea de tendencia: Exponencial, y Polinómica Grado 2. Finalmente, elegir la línea de tendencia de mejor ajuste que debe corresponder a la que tiene el mayor valor R2.

Para el caso que estamos desarrollando, las líneas de tendencia de los modelos seleccionados se muestran en las siguientes figuras:

SELECCIÓN DEL MODELO DE MEJOR AJUSTE

Coeficiente de determinación del Modelo Lineal : 0.9548

Coeficiente de determinación del Modelo Exponencial : 0.926

Coeficiente de determinación del Modelo Polinómico Grado 2 : 0.9556

El modelo de mejor ajuste es el que tiene el mayor coeficiente de determinación (R2) que en este caso corresponde al modelo polinómico de grado 2.

PRONÓSTICO CON EL MODELO DE MEJOR AJUSTE

El pronóstico con el modelo polinómico de grado 2 se calcula tal como se indica a continuación:

Para un restaurante localizado cerca de una universidad con una población de 1,750 estudiantes, se espera una venta anual de S/176,986.

Para fines de planeamiento, calculamos la venta promedio trimestral que en este caso es igual a S/.44,247 (176,986/4). Además, si consideramos que en el primer trimestre las ventas disminuirán en un 40% por estar de vacaciones los estudiantes, con excepción de aquellos que estudian cursos vacacionales o de cargo, y que luego se incrementarán en 5%, 15% y 20% durante los trimestres 2, 3 y 4, respectivamente, el pronóstico trimestral de ventas es el siguiente:

PRONÓSTICO CON EL MODELO LINEAL APLICANDO EL COMANDO ANÁLISIS DE DATOS DE EXCEL

Casi siempre el modelo polinómico de grado 2 proporciona un mejor ajuste que la función lineal, la cual es un caso especial de una función cuadrática; en este sentido, la mejor función cuadrática debe ser por lo menos tan buena como la mejor función lineal. Sin embargo, es necesario precisar que los pronósticos con funciones polinómicas deben hacerse hasta el grado 3 (funciones polinómicas cúbicas) y para periodos de corto plazo (por ejemplo un trimestre), toda vez que se ha demostrado que las funciones polinómicas de grados elevados producen pronósticos erráticos mucho más para periodos de largo plazo, debido a que se "disparan" en sus extremos.

Por lo expuesto y considerando que con frecuencia los pronósticos se realizan para periodos de mediano y largo plazo, existe una marcada preferencia por el uso del modelo lineal para el pronóstico, sin embargo en las aplicaciones se observa un abundante uso y abuso de esta técnica, razón por la cual vamos a desarrollar este caso aplicando el comando de Análisis de datos de Excel para señalar el cuidado que se debe tener para realizar correctamente un pronóstico con el modelo lineal.

Procedimiento:

Seleccione Datos de la barra de herramientas.
Elija la opción Análisis de datos.
En el cuadro de diálogo que se abrirá, seleccione la opción Regresión y marque Aceptar.
En el cuadro de diálogo Regresión, use el casillero Rango Y de entrada para seleccionar la posición de los datos de la variable dependiente (ventas) incluyendo el título.
Use el casillero de Rango X de entrada para especificar la posición de los datos de la variable independiente (población de estudiantes) incluyendo el título
Como en los paso 4 y 5 se incluyeron los títulos de los rangos de celdas que contienen los datos de cada una de las variables, marque el casillero Rótulos.
Seleccione el casillero Nivel de confianza e ingrese el número 99, porque por defecto ya viene marcado el nivel de confianza de 95%.
Utilice las Opciones de salida para especificar el lugar donde quiere ubicar los resultados.
Finalmente, elija Aceptar para que Excel muestre los resultados según la opción de salida elegida en el paso 8.

Para nuestro ejemplo, los resultados se muestran en la siguiente figura en la cual los valores de interés se han sombreado.

Regresion Comando Analisis Datos Excel.p

INTERPRETACIÓN DE LOS RESULTADOS DEL ANÁLISIS DE REGRESIÓN CON EXCEL

Con los nombres de "Intercepción" y "Población (miles de estudiantes) aparecen los valores de los parámetros "a" y "b" de la recta de regresión, respectivamente. El coeficiente de determinación igual a 0.954810493 indica que aproximadamente el 95.48% de la variación puede ser explicada por el comportamiento de la variable independiente. Mientras más cercano a 1 esté este valor, se considera un mejor ajuste.

Prueba t

Regla de rechazo por el método del valor crítico: El valor del estadístico t = 7.96160118 es mayor que el valor crítico obtenido de las tablas estadísticas o calculado con Excel igual a tc = 3.182446305 para 95.5% y tc = 5.84090931 para 99% de confianza, se rechaza H0 y se concluye que entre "X" e "Y" existe una relación significativa al 95% y de 99% de confianza.
Regla de rechazo por el método de la probabilidad: Deseamos tener una probabilidad menor que 0.05, en este sentido, dado que la probabilidad 0.004133693 < 0.05, se rechaza H0 y se concluye que entre las variables "X" e "Y" existe una relación significativa al 95% de confianza.

Esto representa que tenemos un intervalo de confianza de por los menos 95% y 99% de que el parámetro "b" es, en términos estadísticos, significativamente diferente de cero (una pendiente igual a cero sería una línea plana e indicaría que no hay relación entre X e Y).

De hecho, Excel da dos intervalos de confianza de 95% y 99% para su estimación de "b". En nuestro caso, tenemos una confianza de 95% que el valor real de "b" está entre 68.84466378 y 160.5321908, de igual maner tenemos una confianza de 99% que el valor real de "b" está entre 30.548898254 y 198.8278721; por lo tanto, podemos excluir la posibilidad de que el valor real de "b" sea cero tanto al 95% como al 99% de confianza.

Prueba F

Regla de rechazo por el método del valor crítico: El valor del estadístico de prueba F = 63.38709335 es mayor que el valor crítico obtenido de las tablas estadística igual a Fc = 10.12796448 para 95% de confianza y Fc = 34.11622156 para 99% de confianza, se rechaza H0, es decir el valor de "b" es diferente de cero y por tanto existe una relación significativa entre "X" e "Y" al 95% de confianza.

Regla de rechazo por el método de la probabilidad: Dado que la probabilidad 0.004133693 < 0.05, se rechaza H0 y se concluye que se tiene una relación significante entre las variables "X" e "Y".

La significación F es idéntica al valor P de la estadística t (0.004133693) y siempre será así si sólo hay una variable independiente. En caso de que exista más de una variable X, la significación F pone a prueba la hipótesis de que todos los parámetros de las variables X como grupo son, en términos estadísticos, significativamente diferentes de cero.

Conforme se añada otras variables X, la estadística R2 siempre aumentará, lo que significa que la "suma de regresión de los cuadrados" ha aumentado, por eso se debería estar atento en la estadística R2 ajustada, ya que es un indicador más confiable de la verdadera "bondad de ajuste", pues compensa la reducción de la "suma de errores cuadrados" debida a la adición de más variables independientes. Por lo tanto, podría informar un valor ajustado de R2 menor incluso si R2 ha aumentado, a menos que la mejoras en la "suma de regresión de los cuadrados" esté más compensada por la adición de nuevas variables independientes. En este caso, el valor de R2 ajustado es igual a 0.939747324.

Advertencias acerca de la interpretación de las pruebas de significancia

Cuando se rechaza la hipótesis nula, concluir que la relación que existe entre "X" e "Y" es significativa no permite que se concluya que existe una relación de causa y efecto entre "X" e "Y". Que exista una relación de causa y efecto sólo puede concluirse cuando el analista pueda dar justificaciones teóricas de que en efecto la relación es causal. En nuestro ejemplo, si se considera que el analista creía que el aumento en la población de estudiantes probablemente fuera una causa del aumento en las ventas, el resultado de la prueba de significancia le permite concluir que hay una relación de causa y efecto.
Dada una relación significante, la ecuación de regresión estimada Y=-21.67655786+114.6884273X, se puede usar con 95% o 99% de confianza para pronósticos correspondientes a valores de "X" dentro del rango de los valores de "X" observados en la muestra. A menos que haya otras razones que indiquen que el modelo es válido más allá de este rango, los pronósticos fuera del rango de la variable independiente deben hacerse con cuidado. Esto quiere decir que para una población de 3 mil estudiantes no puede utilizarse esta recta de regresión, se tendría que obtener una nueva recta de regresión con una muestra de datos que incluya este nuevo valor de la población de estudiantes.
Además, el hecho de que se pueda rechazar la hipótesis nula y demostrar que hay significancia estadística no permite afirmar que la relación entre "X" e "Y" sea lineal. Lo único que se puede decir es que "X" e "Y" están relacionadas y que la relación lineal explica una porción significante (95.48%, ver celda B5) de la variabilidad de "Y" sobre el rango de los valores de "X" observados en la muestra.

El pronóstico anual con el modelo lineal se calcula tal como se indica a continuación:

Pronóstico venta promedio por trimestre: S/.44,757 (179,028/3)

El pronóstico trimestral considerando los ajustes de los índices calculados anteriormente, es el siguiente:

Ir al Menú

Caso N°1.1.2 Regresión Lineal Múltiple

CASO N°1.1.2: REGRESIÓN LINEAL MÚLTIPLE

Un emprendedor quiere aprovechar la oportunidad que genera la pandemia del Covid-19 para el servicio de delivery en la ciudad de Lima. El problema por resolver es la estimación del tiempo total de recorrido diario necesario para hacer las entregas. El emprendedor estima que el tiempo total de recorrido diario está estrechamente relacionado con el número de kilómetros recorridos para hacer las entregas y con el número de entregas. En este sentido ha definido 10 rutas o recorridos y ha estimado el número de kilómetros (X1) y de entregas (X2) y el tiempo de duración (Y) de cada recorrido, según se indica en la siguiente tabla:

Tabla N°2

SOLUCIÓN APLICANDO EL COMANDO ANÁLISIS DE DATOS DE EXCEL

Seleccione Datos de la barra de herramientas.
Elija la opción Análisis de datos.
En el cuadro de diálogo que se abrirá, seleccione la opción Regresión y marque Aceptar.
En el cuadro de diálogo Regresión, use el casillero Rango Y de entrada para seleccionar la posición de los datos de la variable dependiente (Y = tiempo recorrido en horas) incluyendo el título.
Use el casillero de Rango X de entrada para especificar la posición de los datos de las variables independientes (X1 = kilómetros recorridos y X2 = número de entregas) incluyendo los títulos.
Como en los paso 4 y 5 se incluyeron los títulos de los rangos de celdas que contienen los datos de cada una de las variables, marque el casillero Rótulos.
Seleccione el casillero Nivel de confianza, por defecto ya viene marcado el nivel de confianza de 95%.
Utilice las Opciones de salida para especificar el lugar donde quiere ubicar los resultados.
Finalmente, elija Aceptar para que Excel muestre los resultados según la opción de salida elegida en el paso 8.

Los resultados se muestran en la siguiente figura en la cual los valores de interés se han sombreado.

Ecuación de regresión múltiple

Y = -0.8687 + 0.0611X1 + 0.9234X2

Según el valor de R2 ajustado al número de variables independientes, aproximadamente el 87.6% de la variabilidad en el tiempo se explica por la variabilidad en los kilómetros recorridos y en el número de entregas realizadas.

Interpretación de los coeficientes

b1 = 0.0611 horas, es la estimación del aumento esperado en el tiempo de recorrido que corresponde al aumento en un kilómetro en la distancia recorrida cuando el número de entregas permaneces constante.

b2 = 0.9234 horas, es la estimación del aumento esperado en el tiempo de recorrido que corresponde al aumento de una entrega permaneciendo constante el número de kilómetros recorridos.

Prueba de significancia al 95% de confianza

Prueba t: Regla de rechazo por el método de la probabilidad

Dado que las probabilidades 0.000452961 y 0.004156622 que corresponden a los coeficientes b1 y b2, respectivamente, son menores que 0.05, se rechaza H0, es decir que b1 y b2 son diferentes de cero, y se concluye que entre las variables "X" e "Y" existe una relación significativa al 95% de confianza.

Prueba F: Regla de rechazo por el método de la probabilidad

La prueba F se usa para determinar si existe una relación de significancia entre la variable dependiente y el conjunto de todas las variables independientes; a esta prueba F se le llama prueba de significancia global.
Se observa que la probabilidad (valor crítico) de F = 0.00027624 < 0.05, por tanto, se concluye que existe una relación significativa entre el tiempo de recorrido y las dos variables independientes, kilómetros recorridos y número de entregas.
Excel da los intervalos de confianza de 95%: el valor real de b1 está entre 0.037752025 y 0.084517173 y el valor real de b2 está entre 0.400575115 y 1.446275618 y, por lo tanto, podemos excluir la posibilidad de que los valores reales de b1 y b2 sean ceros.

Pronóstico

Según los resultados de la prueba de significancia al 95% de confianza se puede utilizar la ecuación de regresión para el pronóstico. Por ejemplo, ¿Cuál es el tiempo que empleará un repartidor considerando la siguiente información?

Kilómetros que tendrá que recorrer X1:95

Entregas por realizar X2:4

Y = -0.8687 + 0.0611X1 + 0.9234X2 = -0.8687 + 0.0611(95) + 0.9234(4) = 8.6 horas

Ir al Menú

1.2 SERIES DE TIEMPO

En los modelos de series de tiempo se considera como variable independiente al tiempo, en este sentido se asume que la variable que explica la demanda futura es el paso del tiempo.

Estos modelos se aplican sobre la base de datos históricos en función de cuyas fluctuaciones observadas en el pasado pueden diferenciarse cuatro componentes que se combinan para dar valores de una serie de tiempo: de tendencia, cíclico, estacional e irregular.

Para una aplicación correcta del análisis de regresión es necesario considerar lo siguiente:

Componente tendencia. La tendencia de una serie de tiempo es el desplazamiento o movimiento gradual hacia valores relativamente altos o bajos a través de un periodo largo, debido a factores de largo plazo como variaciones en las características demográficas de la población, en la tecnología o en las preferencias del público.
Componente cíclico. Toda sucesión recurrente de puntos que caiga abajo y arriba de la línea de tendencia y que dure más de un año puede atribuirse al componente cíclico de la serie de tiempo. Este comportamiento cíclico es debido a movimientos cíclicos multianuales de la economía. Por ejemplo, periodos de inflación moderada seguidos de periodos de inflación rápida pueden hacer que la serie de tiempo alterne hacia arriba y hacia debajo de la línea general de tendencia.
Componente estacional. La variabilidad en los datos debida a la influencia estacional se le conoce como componente estacional. Aunque por lo general se considera que las variaciones estacionales se presentan durante el lapso de un año (semestral, trimestral, mensual), el componente estacional también se usa para representar cualquier variación que se presente con regularidad en un lapso menor que un año. Por ejemplo, en el volumen de tráfico diario, en el lapso de un día, se observa una conducta estacional, en donde los valores máximos se presentan en las horas pico, y durante el resto del día y al comienzo de la noche un flujo moderado, y un flujo ligero desde la media noche hasta las primeras horas de la mañana siguiente.
Componente irregular. El componente irregular de una serie de tiempo es el factor residual o el factor que da cuenta de las desviaciones de los valores reales de la serie de tiempo respecto de los valores que se esperan al considerar los efectos de los componentes d tendencia, cíclicos y estacionales. Este componente irregular es ocasionado por factores a corto plazo, imprevistos y no recurrentes que afectan a la serie de tiempo. Dado que este componente da cuenta de la variabilidad aleatoria, no es posible predecir su efecto sobre la serie de tiempo.

De estos cuatro componentes, para el emprendimiento son de gran importancia la estacionalidad y la tendencia, por esta razón en los siguientes casos veremos cómo elaborar pronósticos de venta considerando la incidencia de estos dos componentes de la serie de tiempo.

Serie Tiempo

Ir al Menú

AJUSTE DE LA TENDENCIA

El ajuste de la tendencia consiste en estimar un modelo de regresión que explique la evolución temporal de una variable, por ejemplo, la evolución de la demanda de un producto en función del tiempo. El referido modelo ajusta sólo el componente tendencia de la serie, por tanto, los otros componentes deben ser tratados de forma independiente. Los modelos más utilizados para el ajuste de la tendencia son: lineal. exponencial y polinómico de grado 2.

Para determinar el mejor modelo de proyección puede aplicarse el método de ajuste de la tendencia a un gráfico de dispersión mediante Excel explicado anteriormente en el análisis de regresión y elegir aquel que arroja el mayor valor de r2. Sin embargo, considerando que la proyección supone que las condiciones que explicaron la demanda en el pasado se mantendrán en el futuro, es necesario conocer y comprender las causas que determinaron la tendencia pasada para aplicar el criterio o el sentido común e introducir ajustes a futuro o definir posibles escenarios.

Cuando no existen datos en el área de influencia del proyecto, es posible recurrir al método analógico, el cual se basa en el estudio de otro mercado en el que se haya desarrollado un negocio similar al propuesto por el proyecto. Sin embargo, se debe tener presente que la información sólo es referencial, porque las condiciones futuras, probablemente, no serán iguales a las observadas, siendo necesario incorporar los ajustes necesarios o realizar un análisis de escenarios.

Finalmente, debemos precisar que todos los modelos de series de tiempo desagregan los datos históricos en función de tendencias y estacionalidades para luego replicarlos en la proyección futura, asumiendo que los factores que condicionaron en el pasado tanto el comportamiento de la tendencia como el de la estacionalidad se mantendrán durante todo el periodo de planeamiento. En este sentido, considerando que siempre el futuro será diferente al pasado, la referida réplica requiere ser ajustada mediante técnicas cualitativas de pronósticos o según los resultados de un análisis de escenarios.

Caso N°1.2.1Ajuste Tendencia

CASO N°1.2.1: AJUSTE DE LA TENDENCIA

Un emprendedor está evaluando la viabilidad de producir y vender un detergente para lavadoras en la ciudad de Lima a partir del año 11. De acuerdo con lo señalado por el estudio del mercado, la siguiente es la cantidad de lavadoras vendidas en los últimos 10 años.

Tabla N°3

Para el pronóstico se debe considerar la siguiente información del estudio de mercado:

40% de personas/familias están dispuestas a comprar el nuevo detergente.
Cada caja contendrá un litro de detergente cuya duración se estima para dos meses.
Precio de venta estimado de caja caja del nuevo detergentes: S/20 por caja.
Año para el pronóstico: 11

AJUSTE DE LÍNEAS DE TENDENCIA A UN GRÁFICO DE DISPERSIÓN CON EXCEL

Para el caso que estamos desarrollando, las líneas de tendencia de los modelos seleccionados se muestran en las siguientes figuras:

SELECCIÓN DEL MODELO DE MEJOR AJUSTE

Modelo Lineal:

Ecuación : Y = 4898X + 24188

Coeficiente de Determinación : R^2 = 0.9961

Modelo Exponencial:

Ecuación : Y = 28315e^0.1001X

Coeficiente de Determinación : R^2 = 0.9846

Modelo Polinómico Grado 2:

Ecuación : Y = 25.072X^2 + 4622.2X + 24740

Coeficiente de Determinación : R^2 = 0.9963

En este caso, se debe elegir el modelo Polinómico Grado 2, porque tiene el mayor valor R2 igual a .9963. Con este modelo la tendencia de ventas para el año 11 es la siguiente:

Y = 25.072(11)^2 + 4622.2(11) + 24740 = 78,618 cajas de detergente

El pronóstico de ventas para el año 11 se presenta en la siguiente tabla:

Como se explicó en el análisis de regresión, el modelo polinómico es adecuado para pronósticos de corto plazo, en este sentido si se requiere elaborar pronósticos para varios años es mejor hacerlo con el modelo lineal.

Ir al Menú

AJUSTE DE LA ESTACIONALIDAD

En esta sección se muestra cómo desarrollar pronósticos para una serie de tiempo que tiene un patrón estacional. En la medida en que la estacionalidad existe, se debe incorporar a los modelos de pronósticos para garantizar un pronóstico más confiable y exacto. Se comenzará por considerar una serie de tiempo estacional sin tendencia y después se estudiará cómo modelar la estacionalidad con la tendencia.

CASO N°1.2.2: AJUSTE DE LA ESTACIONALIDAD

Se tiene pensado introducir en el mercado de una ciudad "A" una prenda de vestir siendo necesario estimar las ventas para este producto. Actualmente esta prenda de vestir no existe en dicho mercado, pero se tiene conocimiento que se comercializa con éxito en otra ciudad "B" de características similares a la ciudad "A", razón por la cual el encargado del pronóstico ha logrado reunir información de las ventas históricas de esta prenda en una tienda de ropa de la ciudad "B" en los últimos cinco años. La tabla y figura siguientes muestran esta serie de tiempo.

Tabla N°4

Caso N°1.2.2 Ajuste Estacionlidad

En la figura se observa un patrón horizontal de las ventas, por tanto, un promedio simple podría utilizarse para pronosticar las ventas. Pero una inspección más minuciosa a la gráfica de serie de tiempo revela un patrón en los datos. Obsérvese que el primer y tercer trimestres registran ventas moderadas, el segundo tiene las ventas más altas, y el cuarto tiende a ser el trimestre más bajo en volumen de ventas. Por tanto, se podría concluir que existe un patrón estacional trimestral.

Considerando que se trata de un patrón de demanda estacional sin tendencia, el pronóstico para el año 6 se obtiene hallando simplemente el promedio trimestral (PT), según se indica:

Por tanto, se espera una venta anual de 124+152+121+95=492 unidades. Sin embargo, los formuladores del proyecto de inversión, estiman que la futura empresa podría lograr una venta anual de 600 unidades. ¿Cuánto debe producir y vender cada trimestre?

Para responder a esta pregunta, es necesario tener presente que el pronóstico trimestral se puede obtener mediante la siguiente ecuación:

Donde:

Yi = Venta estimada para el trimestre i

Ym = Media de todas las ventas históricas observadas (promedio global)

Ii = Índice estacional del trimestre i

El índice estacional de cada trimestre se determina dividiendo el promedio trimestral entre el promedio global: Ii = PTi/Ym

I1 = 124/123 = 1.008130081

I2 = 152/123 = 1.235772358

I3 = 121/123 = 0.983739837

I4 = 95/123 = 0.772357724

Se verifica que la suma de los índices es igual a 4, también se verifica la relación Yi = Ym * Ii:

Y1 = (123)(1.008130081) = 124

Y2 = (123)(1.235772358) = 152

Y3 = (123)(0.983739837) = 121

Y4 = (123)(0.772357724) = 95

Considerando que se trata de un producto con un patrón de demanda estacional sin tendencia y asumiendo que este patrón continuará en el futuro es posible estimar la demanda trimestral para el proyecto de la siguiente manera:

Demanda anual esperada : 600 unidades

Demanda promedio trimestral: 600/4 = 150 unidades

Y1 = (150)(1.008130081) = 151

Y2 = (150)(1.235772358) = 185

Y3 = (150)(0.983739837) = 148

Y4 = (150)(0.772357724) = 116

Total: 151 + 185 + 148 + 116 = 600 unidades.

PRONÓSTICO USANDO REGRESIÓN MÚLTIPLE CON VARIABLES FICTICIAS

Si se desea información adicional para ser utilizada en la evaluación de la exactitud del pronóstico y determinar la significancia de los resultados, en las series que tienen estacionalidad y tendencia, el método de un promedio simple no funcionará, siendo recomendable utilizar el método de regresión múltiple con variables ficticias.

Modelaremos la serie de tiempo con un patrón estacional tratando la estación como variable cualitativa categórica. Cuando esta variable tiene k niveles, se necesitan k-1 variables ficticias. Por tanto, si hay 4 estaciones, se requieren 3 variables ficticias, las cuales pueden ser codificadas de la siguiente manera:

La forma general de la ecuación de regresión estimada con base en el trimestre en que las ventas ocurren es la siguiente:

Al utilizar estos datos y el procedimiento de regresión múltiple, mediante Excel, se obtienen los siguientes resultados:

La ecuación de regresión múltiple estimada es:

Esta ecuación se utiliza para pronosticar las ventas trimestrales para el próximo año:

El pronóstico obtenido mediante regresión múltiple con variables ficticias es igual al obtenido con el método anterior.

Ir al Menú

CASO N°1.2.3: AJUSTE DE LA ESTACIONALIDAD Y TENDENCIA

El objetivo es introducir en el mercado de Lima un nuevo néctar elaborado a base de Camu Camu. El problema es que no existen estadísticas en Lima sobre la demanda de este producto, razón por la cual los formuladores del proyecto han recolectado información estadística del consumo de este producto en la ciudad de Iquitos donde se consume en forma frecuente. La tabla y el gráfico siguientes muestran el comportamiento de la demanda.

Tabla N°5

Caso N°1.2.3 Ajuste Estacionalidad y Tendencia

Los formuladores del proyecto consideran que esta información puede usarse para el pronóstico de la demanda de néctar de Camu Camu en Lima, la cual se estima será 1.5 veces mayor.

La figura indica que las ventas son bajas en el segundo trimestre de cada año y aumentan en los trimestres 3 y 4. Por tanto, se concluye que existe un patrón estacional para las ventas de este producto. Pero, la serie de tiempo tiene también una tendencia ascendente que tendrá que tomarse en cuenta para obtener pronósticos exactos de las ventas trimestrales.

MÉTODO 1: MODELO MULTIPLICATIVO DE DESCOMPOSICIÓN DE LA SERIE DE TIEMPO

La tendencia se mide en las unidades de producto de la serie que se pronostica. Sin embargo, los componentes estacional e irregular se miden en términos relativos con valores superiores a 1 indicando los efectos por arriba de la tendencia y con valores menores a 1 indicando los efectos por debajo de la tendencia..

El modelo multiplicativo es adecuado cuando las fluctuaciones estacionales cambian en el tiempo y son cada vez mayores a medida que aumenta el volumen de ventas debido a una tendencia lineal a largo plazo. Muchas series de tiempo para las empresas y para la economía siguen este patrón. La aplicación de este modelo a la serie de tiempo del caso que estamos tratando se explica a continuación:

Paso 1: Cálculo de los Índices Estacionales

El procedimiento utilizado para determinar la influencia estacional de cada trimestre empieza por calcular un promedio móvil para separar los componentes estacional e irregular de los datos, lo que deja una serie de tiempo que contiene sólo la tendencia y cualquier variación aleatoria restante que no fue eliminada por los cálculos del promedio móvil. Como cada estación comprende cuatro trimestres, calculamos los promedios móviles de tamaño cuatro.

Para el segundo promedio móvil se agrega el valor 5,800 correspondiente al primer trimestre del año 2 y se elimina el 4,800 del primer trimestre del año 1. Por tanto, el segundo promedio móvil es:

De manera similar se calculan el resto de promedios móviles y luego se procede a centrarlos de la siguiente manera: El promedio móvil 5,350 corresponde a los periodos 1, 2, 3 y 4, por tanto, debe estar centrado en el periodo 2.5. El siguiente promedio móvil de 5,600 corresponde a los periodos 2, 3, 4 y 5 y debe estar centrado en 3.5. Repetimos este proceso con los promedios móviles restantes y los ubicamos en las posiciones centradas que le corresponden. Luego, debemos hacer que estos valores vuelvan o coincidir con los periodos. Para hacer esto, promediamos los valores adyacentes. Al promediar 5,350 y 5,600 se obtiene 5,475 que corresponde al promedio de periodos 2.5 y 3.5 que es 3. Se repite este proceso para los otros valores obteniéndose promedios móviles centrados para el resto de periodos. Asimismo, se calcula el valor estacional-irregular dividiendo la venta real entre el promedio móvil centrado, por ejemplo para el tercer trimestre del primer año: 6,000/5475 = 1.096. Los resultados se presentan en la siguiente tabla:

La figura muestra los valores reales de la serie de tiempo y los valores de los promedios móviles centrados. Observe, sobre todo, cómo estos últimos tienden a "suavizar" tanto las fluctuaciones estacionales como las irregulares de la serie de tiempo. Los promedios móviles centrados representan la tendencia en los datos y cualquier variación aleatoria que no se ha eliminado con el uso de los promedios móviles para suavizar los datos.

Considere los valores del componente estacional-irregular para el tercer trimestre: 1.096, 1.075 y 1.109. Los valores de la parte estacional-irregular mayores de 1 indican efectos por encima de la tendencia estimada, y los valores menores de 1 indican efectos por debajo de la tendencia estimada. Así, los tres valores del componente estacional-irregular para el trimestre 3 muestran un efecto por encima del promedio en el tercer trimestre. Ya que año con año las fluctuaciones en los valores estacional-irregulares se deben principalmente al error aleatorio se pueden promediar los valores calculados para eliminar la influencia irregular y obtener una estimación de la influencia estacional del tercer trimestre.

Al número 1.09 se le conoce como factor estacional para el tercer trimestre. La tabla siguiente resume los cálculos necesarios para obtener los factores estacionales de la serie de tiempo para los cuatro trimestres: 0.93, 0.84, 1.09 y 1.14.

La interpretación de los factores estacionales ofrece una idea sobre el componente estacional de las ventas. El mejor trimestre de ventas es el cuarto, con ventas promedio de 14% por encima de la tendencia estimada. El peor, o más bajo, es el segundo trimestre; su factor estacional de 0.84 indica que el promedio de ventas está 16% por debajo de la tendencia estimada. El componente estacional se corresponde claramente con la expectativa intuitiva de que el interés por el producto y, por tanto, los patrones de compra tienden a alcanzar el punto máximo en el cuarto trimestre debido a la próxima temporada de invierno. Las bajas ventas del segundo trimestre reflejan un menor interés por el producto en primavera y antes del verano de los clientes potenciales.

Obsérvese que la suma de los factores es igual al número de estaciones (4 trimestres). Cuando la suma de los factores no es igual al número de estaciones se requiere un último ajuste para obtener los factores estacionales. Para realizarlo, se multiplica cada factor estacional por el número de estaciones, dividido entre la suma de los factores estacionales sin ajustar. Esto es:

Supongamos que los factores estacionales hubieran sido los siguientes: 0.92, 0.83, 1.09 y 1.14. En este caso la suma es igual a 3.98, por tanto, se necesita ajustar los factores estacionales de la siguiente manera:

Paso 2: Desestacionalización de la serie de tiempo

Desestacionalizar la serie de tiempo consiste en eliminar los efectos estacionales. En el modelo de descomposición multiplicativa se desestacionaliza una serie de tiempo dividiendo cada observación entre el factor estacional correspondiente. En nuestro caso, la venta desestacionalizada para el primer trimestre del año 1 es igual a 4,800/0.93 = 5,161. La serie de tiempo desestacionalizada se muestra en la siguiente tabla:

Paso 3: Determinación de la tendencia de la serie desestacionalizada

Graficamos la serie desestacionalizada y realizamos un análisis de la tendencia con Excel. Los modelos de tendencia que mejor se ajustan a los datos de la serie de tiempo son el polinómico de grado 2 (pronóstico corto plazo) y el lineal (pronóstico largo plazo):

Cualquiera de los modelos puede ser utilizado para el pronóstico de la tendencia, sin embargo, según el valor de R2 el modelo polinómico de grado 2 proporciona un mejor ajuste y podría emplearse para un pronóstico de corto plazo (por ejemplo, 1 año). Para periodos mayores (largo plazo) es preferible utilizar el modelo lineal.

Modelo Polinómico de Grado 2:

Modelo Lineal:

En este caso, se debe elegir el modelo Polinómico Grado 2, porque tiene el mayor valor R2 igual a 0.9461. Con este modelo el pronóstico de la tendencia para un año de la serie desestacionalizada es el siguiente:

Como se explicó en el análisis de regresión, el modelo polinómico es adecuado para pronósticos de corto plazo (por ejemplo, 1 año), en este sentido si se requiere elaborar pronósticos para varios años es mejor hacerlo con el modelo lineal.

Paso 4: Ajustes estacionales

Los ajustes estacionales se realizan multiplicando los pronósticos de tendencia (determinados en el paso 3) por sus correspondientes factores estacionales (calculados en el paso 1) y finalmente se realiza el ajuste según el juicio racional que indica que la demanda en Lima será 1.5 veces la demanda de Iquitos. Los resultados se muestran en las siguientes tablas:

Pronósticos trimestrales para el año 5 con el modelo polinómico de grado 2

Pronósticos trimestrales para los años 5, 6 y 7 con el modelo lineal

MÉTODO 2: MODELO DE REGRESIÓN MÚLTIPLE CON VARIABLES FICTICIAS

Para patrones de demanda que contienen tanto el efecto estacional como una tendencia lineal se puede usar el método de regresión múltiple con variables ficticias.

La forma general de la ecuación de regresión múltiple estimada para modelar tanto los efectos estacionales trimestrales como la tendencia lineal en la serie de tiempo es la siguiente:

Donde:

En la tabla siguiente se presenta la serie de tiempo con los valores codificados de las variables ficticias y el periodo.

Con Excel obtenemos los siguientes resultados de la regresión múltiple:

Ecuación de regresión múltiple:

Con esta ecuación se pronostica las ventas trimestrales para los periodos 17, 18, 19 y 20 del año 5.

Como ésta es la demanda esperada en el mercado de Iquitos, ajustamos los pronósticos obtenidos con el factor 1.5 para estimar la demanda en el mercado de Lima:

Ir al Menú

NOTA IMPORTANTE

Para estos casos de métodos cuantitativos contamos con hojas de cálculo inteligentes que te permiten resolver estos y otros casos con gran facilidad solamente cambiando los datos. La hoja de cálculo se encarga de procesar e interpretar automáticamente los resultados obtenidos.

Si estás interesado en obtener estas hojas de cálculo no dudes en ponerte en contacto con nosotros. No te preocupes si tu proyecto de emprendimiento es diferente a los casos aquí resueltos, nosotros diseñaremos una hoja de cálculo según tus necesidades..

No olvides dejar un comentario sobre estos métodos cuantitativos que han sido adaptados para los proyectos de emprendimiento. Gracias por tu atención, estamos a tu disposición.

Ir a Estudio Mercado

CONTACTO

Serie Tiempo y Regresión

PRONÓSTICOS

Tamaño

Producción

1.1 ANÁLISIS DE REGRESIÓN

Pronósticos

​

Para una aplicación correcta del análisis de regresión es necesario considerar lo siguiente:

CASO N°1.1.1: REGRESIÓN SIMPLE

​

Tabla N°1

Se supone que existe una relación entre las ventas y la población de estudiantes. En este sentido, se requiere elaborar un pronóstico de ventas para una localización cerca de una universidad que tiene una población de 1,750 estudiantes.

​

AJUSTE DE LÍNEAS DE TENDENCIA A UN GRÁFICO DE DISPERSIÓN CON EXCEL

​

Seleccionar el rango de celdas que contienen los datos X e Y.

En la barra de opciones, seleccionar Insertar y luego, dentro de las opciones de Gráficos, elegir Dispersión.

En el cuadro de diálogo Formato de línea de tendencia, seleccionar la opción Lineal y marcar las casillas Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico.

Eligiendo cerrar, el gráfico se mostrará con la correspondiente línea de tendencia, la ecuación de regresión y el valor de R2.

El proceso se repite variando en el paso 4, la selección de las opciones de línea de tendencia: Exponencial, y Polinómica Grado 2. Finalmente, elegir la línea de tendencia de mejor ajuste que debe corresponder a la que tiene el mayor valor R2.

Para el caso que estamos desarrollando, las líneas de tendencia de los modelos seleccionados se muestran en las siguientes figuras:

SELECCIÓN DEL MODELO DE MEJOR AJUSTE

​

Coeficiente de determinación del Modelo Lineal : 0.9548

Coeficiente de determinación del Modelo Exponencial : 0.926

Coeficiente de determinación del Modelo Polinómico Grado 2 : 0.9556

​

El modelo de mejor ajuste es el que tiene el mayor coeficiente de determinación (R2) que en este caso corresponde al modelo polinómico de grado 2.

​

PRONÓSTICO CON EL MODELO DE MEJOR AJUSTE

​

El pronóstico con el modelo polinómico de grado 2 se calcula tal como se indica a continuación:

PRONÓSTICO CON EL MODELO LINEAL APLICANDO EL COMANDO ANÁLISIS DE DATOS DE EXCEL

​

​

​

Procedimiento:

Seleccione Datos de la barra de herramientas.

INTERPRETACIÓN DE LOS RESULTADOS DEL ANÁLISIS DE REGRESIÓN CON EXCEL

CASO N°1.1.2: REGRESIÓN LINEAL MÚLTIPLE

​

Tabla N°2

​

SOLUCIÓN APLICANDO EL COMANDO ANÁLISIS DE DATOS DE EXCEL

​

Seleccione Datos de la barra de herramientas.

En los modelos de series de tiempo se considera como variable independiente al tiempo, en este sentido se asume que la variable que explica la demanda futura es el paso del tiempo.

Estos modelos se aplican sobre la base de datos históricos en función de cuyas fluctuaciones observadas en el pasado pueden diferenciarse cuatro componentes que se combinan para dar valores de una serie de tiempo: de tendencia, cíclico, estacional e irregular.

​

Para una aplicación correcta del análisis de regresión es necesario considerar lo siguiente:

​

AJUSTE DE LA TENDENCIA

​

​

​

​

CASO N°1.2.1: AJUSTE DE LA TENDENCIA

​

Un emprendedor está evaluando la viabilidad de producir y vender un detergente para lavadoras en la ciudad de Lima a partir del año 11. De acuerdo con lo señalado por el estudio del mercado, la siguiente es la cantidad de lavadoras vendidas en los últimos 10 años.

Tabla N°3

Para el pronóstico se debe considerar la siguiente información del estudio de mercado:

AJUSTE DE LÍNEAS DE TENDENCIA A UN GRÁFICO DE DISPERSIÓN CON EXCEL

​

Para el caso que estamos desarrollando, las líneas de tendencia de los modelos seleccionados se muestran en las siguientes figuras:

​

SELECCIÓN DEL MODELO DE MEJOR AJUSTE

​

Modelo Lineal:

Ecuación : Y = 4898X + 24188

Coeficiente de Determinación : R^2 = 0.9961

Modelo Exponencial:

Ecuación : Y = 28315e^0.1001X

Coeficiente de Determinación : R^2 = 0.9846

​

Modelo Polinómico Grado 2:

Ecuación : Y = 25.072X^2 + 4622.2X + 24740

Coeficiente de Determinación : R^2 = 0.9963

​

En este caso, se debe elegir el modelo Polinómico Grado 2, porque tiene el mayor valor R2 igual a .9963. Con este modelo la tendencia de ventas para el año 11 es la siguiente:

Y = 25.072(11)^2 + 4622.2(11) + 24740 = 78,618 cajas de detergente

​