Ejecución Automática Media Móvil


Previsión ARIMA con Excel y R Hola Hoy voy a guiarle a través de una introducción al modelo ARIMA y sus componentes, así como una breve explicación del método Box-Jenkins de cómo se especifican los modelos ARIMA. Por último, he creado una implementación de Excel con R, que I8217ll mostrarle cómo configurar y utilizar. Modelos de media móvil automática (ARMA) El modelo de media móvil autoregresiva se utiliza para modelar y pronosticar procesos de series de tiempo estacionarios y estocásticos. Es la combinación de dos técnicas estadísticas previamente desarrolladas, el Autoregressive (AR) y el Moving Average (MA) y fue descrito originalmente por Peter Whittle en 1951. George E. P. Box y Gwilym Jenkins popularizaron el modelo en 1971 especificando pasos discretos para modelar la identificación, la estimación y la verificación. Este proceso se describirá más adelante como referencia. Comenzaremos por introducir el modelo ARMA por sus diversos componentes, los modelos AR y MA y luego presentaremos una popular generalización del modelo ARMA, ARIMA (Media Automática Movible Integrada Autoregrada) y las etapas de predicción y especificación del modelo. Por último, explicaré una implementación de Excel que creé y cómo usarla para hacer sus previsiones de series de tiempo. Modelos Autoregresivos El modelo Autoregresivo se utiliza para describir procesos aleatorios y procesos que varían en el tiempo y especifica que la variable de salida depende linealmente de sus valores anteriores. El modelo se describe como: Donde están los parámetros del modelo, C es constante, y es un término de ruido blanco. Esencialmente, lo que el modelo describe es para cualquier valor dado. Puede explicarse por funciones de su valor anterior. Para un modelo con un parámetro. Se explica por su valor pasado y error aleatorio. Para un modelo con más de un parámetro, por ejemplo. es dado por. Y error aleatorio. Modelo de media móvil El modelo de media móvil (EM) se utiliza a menudo para modelar series temporales univariadas y se define como: es la media de la serie temporal. Son los parámetros del modelo. Son los términos de error de ruido blanco. Es el orden del modelo de media móvil. El modelo de media móvil es una regresión lineal del valor actual de la serie comparado con los términos del período anterior. Por ejemplo, un modelo de MA de. Se explica por el error actual en el mismo período y el valor del error pasado. Para un modelo de orden 2 (), se explica por los últimos dos valores de error, y. Los términos AR () y MA () se utilizan en el modelo ARMA, que ahora se introducirá. Modelo de media móvil autorregresiva Los modelos de media móvil autorregressiva utilizan dos polinomios, AR () y MA () y describen un proceso estocástico estacionario. Un proceso estacionario no cambia cuando se desplaza en tiempo o espacio, por lo tanto, un proceso estacionario tiene media constante y varianza. El modelo ARMA se refiere a menudo en términos de sus polinomios, ARMA (). La notación del modelo se escribe: La selección, estimación y verificación del modelo se describe por el proceso de Box-Jenkins. El método de Box-Jenkins para la identificación del modelo A continuación se muestra más un esquema del método Box-Jenkins, ya que el proceso real de encontrar estos valores puede ser bastante abrumador sin un paquete estadístico. La hoja de Excel incluida en esta página determina automáticamente el modelo que mejor se adapte. El primer paso del método Box-Jenkins es la identificación del modelo. La etapa incluye identificar la estacionalidad, diferenciar si es necesario y determinar el orden de y por trazar las funciones de autocorrelación y autocorrelación parcial. Después de identificar el modelo, el siguiente paso es estimar los parámetros. La estimación de parámetros utiliza paquetes estadísticos y algoritmos de cálculo para encontrar los mejores parámetros de ajuste. Una vez elegidos los parámetros, el último paso es comprobar el modelo. La comprobación del modelo se realiza comprobando si el modelo se ajusta a una serie cronológica univariada estacionaria. También se debe confirmar que los residuos son independientes entre sí y presentan una media y una varianza constante en el tiempo, lo que se puede hacer realizando una prueba de Ljung-Box o trazando nuevamente la autocorrelación y la autocorrelación parcial de los residuos. Observe que el primer paso consiste en verificar la estacionalidad. Si los datos con los que está trabajando contienen tendencias estacionales, para que los datos sean estacionarios. Este paso de diferenciación generaliza el modelo ARMA en un modelo ARIMA, o Media Automática Movible Integrada, donde 8216Integrated8217 corresponde al paso de diferenciación. Modelos de media móvil integrada autoregresiva El modelo ARIMA tiene tres parámetros. Para definir el modelo ARMA para incluir el término de diferenciación, comenzamos por reordenar el modelo ARMA estándar para separarlo de la suma. ¿Dónde está el operador de retraso y. Son parámetros de autorregresión y de media móvil, y los términos de error, respectivamente. Hacemos ahora la suposición de primer polinomio de la función, tiene una raíz unitaria de multiplicidad. Podemos entonces reescribirlo a lo siguiente: El modelo ARIMA expresa la factorización polinómica con y nos da: Por último, generalizamos el modelo añadiendo un término de deriva, que define el modelo ARIMA como ARIMA () con deriva. Con el modelo ahora definido, podemos ver el modelo ARIMA como dos partes separadas, una no estacionaria y la otra de sentido amplio estacionaria (la distribución de probabilidad conjunta no cambia cuando se desplaza en el tiempo o el espacio). El modelo no estacionario: El modelo estacionario de sentido amplio: ahora se pueden hacer pronósticos sobre el uso de un método de pronóstico autorregresivo generalizado. Ahora que hemos hablado de los modelos ARMA y ARIMA, ahora nos referimos a cómo podemos usarlos en aplicaciones prácticas para proporcionar previsiones. Ive construido una implementación con Excel utilizando R para hacer ARIMA pronósticos, así como una opción para ejecutar Monte Carlo simulación en el modelo para determinar la probabilidad de los pronósticos. Implementación de Excel y cómo usar Antes de usar la hoja, debe descargar R y RExcel desde el sitio web de Statconn. Si ya tienes instalado R, solo puedes descargar RExcel. Si no tienes R instalado, puedes descargar RAndFriends que contiene la última versión de R y RExcel. Tenga en cuenta, RExcel sólo funciona en 32 bits Excel para su licencia no comercial. Si tiene instalado Excel de 64 bits, tendrá que obtener una licencia comercial de Statconn. Se recomienda descargar RAndFriends ya que facilita la instalación más rápida y sencilla sin embargo, si ya tiene R y desea instalarla manualmente, siga estos pasos. Instalación manual de RExcel Para instalar RExcel y los otros paquetes para que R funcione en Excel, primero abra R como administrador haciendo clic con el botón derecho en el archivo. exe. En la consola R, instale RExcel escribiendo las siguientes instrucciones: Los comandos anteriores instalarán RExcel en su máquina. El siguiente paso es instalar rcom, que es otro paquete de Statconn para el paquete RExcel. Para instalar esto, escriba los siguientes comandos, que también instalará rscproxy automáticamente a partir de la versión R 2.8.0. Con estos paquetes instalados, puede pasar a configurar la conexión entre R y Excel. Aunque no es necesario para la instalación, un paquete práctico para descargar es Rcmdr, desarrollado por John Fox. Rcmdr crea R menús que pueden convertirse en menús en Excel. Esta característica viene por defecto con la instalación de RAndFriends y hace que varios comandos R estén disponibles en Excel. Escriba los siguientes comandos en R para instalar Rcmdr. Podemos crear el enlace a R y Excel. Nota en las versiones recientes de RExcel esta conexión se realiza con un simple clic doble del archivo. bat proporcionado. ActivateRExcel2010, por lo que sólo debe seguir estos pasos si ha instalado manualmente R y RExcel o si por alguna razón la conexión no se hace durante La instalación de RAndFriends. Crear la conexión entre R y Excel Abra un libro nuevo en Excel y navegue hasta la pantalla de opciones. Haga clic en Opciones y, a continuación, en Complementos. Debería ver una lista de todos los complementos activos e inactivos que tiene actualmente. Haga clic en el botón Ir en la parte inferior. En el cuadro de diálogo Complementos, verá todas las referencias de complemento que ha realizado. Haga clic en Examinar. Vaya a la carpeta RExcel, normalmente ubicada en C: Program FilesRExcelxls o algo similar. Busque el complemento RExcel. xla y haga clic en él. El siguiente paso es crear una referencia para que macros utilizando R funcione correctamente. En su documento de Excel, introduzca Alt F11. Esto abrirá Excels VBA editor. Vaya a Tools - gt References y encuentre la referencia RExcel, RExcelVBAlib. RExcel ahora debe estar listo para usar Usando la Hoja de Excel Ahora que R y RExcel están configurados correctamente, es hora de hacer alguna previsión Abra la hoja de pronóstico y haga clic en Cargar Servidor. Esto es para iniciar el servidor RCom y también cargar las funciones necesarias para hacer la previsión. Se abrirá un cuadro de diálogo. Seleccione el archivo itall. R incluido con la hoja. Este archivo contiene las funciones que utiliza la herramienta de pronóstico. La mayoría de las funciones contenidas fueron desarrolladas por el profesor Stoffer en la Universidad de Pittsburgh. Extienden las capacidades de R y nos dan algunos gráficos útiles de diagnóstico junto con nuestra producción de pronóstico. También existe una función para determinar automáticamente los mejores parámetros de ajuste del modelo ARIMA. Después de cargar el servidor, ingrese sus datos en la columna Datos. Seleccione el rango de los datos, haga clic con el botón derecho y seleccione Rango de nombres. Asigne un nombre al rango como Datos. A continuación, establezca la frecuencia de sus datos en la celda C6. Frecuencia se refiere a los períodos de tiempo de sus datos. Si es semanal, la frecuencia sería 7. Mensual sería 12, mientras que trimestral sería 4, y así sucesivamente. Ingrese los períodos de anticipación para pronosticar. Tenga en cuenta que los modelos ARIMA se vuelven bastante imprecisos después de varias predicciones de frecuencia sucesivas. Una buena regla de oro es no exceder 30 pasos como cualquier cosa pasado que podría ser bastante poco fiable. Esto también depende del tamaño de su conjunto de datos. Si tiene datos limitados disponibles, se recomienda elegir un número de pasos más pequeños. Después de ingresar sus datos, nombrarlos y establecer la frecuencia deseada y los pasos a seguir para pronosticar, haga clic en Ejecutar. Puede tardar un tiempo en procesar el pronóstico. Una vez completado, obtendrá los valores predichos al número especificado, el error estándar de los resultados y dos gráficos. La izquierda es los valores previstos con los datos, mientras que la derecha contiene diagnósticos prácticos con residuos estandarizados, la autocorrelación de los residuos, un gráfico gg de los residuos y un gráfico estadístico de Ljung-Box para determinar si el modelo está bien ajustado. No voy a entrar en demasiados detalles sobre cómo buscar un modelo bien equipado, pero en el gráfico de ACF usted no quiere cualquiera (o mucho) de los picos de lag cruce sobre la línea azul punteada. En la gráfica gg, cuanto más círculos pasan por la línea, más normalizado y mejor ajustado está el modelo. Para conjuntos de datos más grandes esto podría cruzar muchos círculos. Por último, la prueba de Ljung-Box es un artículo en sí mismo, sin embargo, cuanto más círculos están por encima de la línea azul punteada, mejor es el modelo. Si el resultado del diagnóstico no se ve bien, puede intentar agregar más datos o comenzar en un punto diferente más cercano al rango que desea pronosticar. Puede borrar fácilmente los resultados generados haciendo clic en los botones Borrar valores pronosticados. Y thats it Actualmente, la columna de la fecha no hace nada más que para su referencia, pero no es necesario para la herramienta. Si encuentro tiempo, volveré y añadiré que para que el gráfico mostrado muestre la hora correcta. También puede recibir un error al ejecutar el pronóstico. Esto se debe generalmente a la función que encuentra los mejores parámetros es incapaz de determinar el orden adecuado. Puede seguir los pasos anteriores para tratar de organizar mejor sus datos para que la función funcione. Espero que consigas uso de la herramienta Me ha ahorrado mucho tiempo en el trabajo, como ahora todo lo que tengo que hacer es introducir los datos, cargar el servidor y ejecutarlo. También espero que esto le muestra cómo R impresionante puede ser, especialmente cuando se utiliza con un front-end como Excel. Los procesos de error de media móvil (ARMA) y otros modelos que implican retrasos de los términos de error se pueden estimar mediante declaraciones FIT y simular o pronosticar mediante instrucciones SOLVE. Los modelos ARMA para el proceso de error se usan con frecuencia para modelos con residuos autocorrelados. La macro AR se puede utilizar para especificar modelos con procesos de error autorregresivo. La macro MA se puede utilizar para especificar modelos con procesos de error de media móvil. Errores auto-regresivos Un modelo con errores autorregresivos de primer orden, AR (1), tiene la forma mientras que un proceso de error AR (2) tiene la forma y así sucesivamente para los procesos de orden superior. Obsérvese que los s son independientes e idénticamente distribuidos y tienen un valor esperado de 0. Un ejemplo de un modelo con un componente AR (2) es y así sucesivamente para procesos de orden superior. Por ejemplo, puede escribir un modelo de regresión lineal simple con MA (2) errores de media móvil, donde MA1 y MA2 son los parámetros de media móvil. Tenga en cuenta que RESID. Y se define automáticamente por PROC MODEL como La función ZLAG debe utilizarse para que los modelos MA trunquen la recursión de los retrasos. Esto asegura que los errores rezagados empiezan a cero en la fase de cebado y no propagan los valores faltantes cuando faltan las variables del período de cebado y aseguran que los errores futuros son cero en lugar de faltar durante la simulación o la predicción. Para obtener más información sobre las funciones de retraso, consulte la sección Lag Logic. El modelo general ARMA (p, q) tiene la siguiente forma Un modelo ARMA (p, q) se puede especificar de la siguiente manera: donde AR i y MA j representan Los parámetros autorregresivos y de media móvil para los diferentes desfases. Puede utilizar cualquier nombre que desee para estas variables, y hay muchas formas equivalentes de que la especificación podría escribirse. Los procesos ARMA vectoriales también se pueden estimar con PROC MODEL. Por ejemplo, un proceso AR (1) de dos variables para los errores de las dos variables endógenas Y1 e Y2 puede especificarse de la siguiente manera: Problemas de Convergencia con Modelos ARMA Los modelos ARMA pueden ser difíciles de estimar. Si las estimaciones de parámetros no están dentro del intervalo apropiado, los términos residuales de modelos de media móvil crecen exponencialmente. Los residuos calculados para observaciones posteriores pueden ser muy grandes o pueden desbordarse. Esto puede ocurrir ya sea porque se utilizaron valores iniciales incorrectos o porque las iteraciones se alejaron de valores razonables. Se debe tener cuidado al elegir los valores iniciales para los parámetros ARMA. Los valores iniciales de 0,001 para los parámetros ARMA normalmente funcionan si el modelo se ajusta bien a los datos y el problema está bien condicionado. Tenga en cuenta que un modelo de MA a menudo puede ser aproximado por un modelo de AR de alto orden, y viceversa. Esto puede dar como resultado una alta colinealidad en los modelos ARMA mixtos, lo que a su vez puede causar un grave mal acondicionamiento en los cálculos y la inestabilidad de los parámetros estimados. Si tiene problemas de convergencia mientras estima un modelo con procesos de error ARMA, intente estimarlos en pasos. En primer lugar, utilice una sentencia FIT para estimar sólo los parámetros estructurales con los parámetros ARMA mantenidos a cero (o a estimaciones previas razonables si están disponibles). A continuación, utilice otra sentencia FIT para estimar sólo los parámetros ARMA, utilizando los valores de los parámetros estructurales de la primera ejecución. Dado que los valores de los parámetros estructurales es probable que estén cerca de sus estimaciones finales, las estimaciones de los parámetros de ARMA podrían ahora converger. Finalmente, use otra instrucción FIT para producir estimaciones simultáneas de todos los parámetros. Dado que los valores iniciales de los parámetros ahora es probable que estén muy cerca de sus estimaciones conjuntas finales, las estimaciones deben converger rápidamente si el modelo es apropiado para los datos. AR Condiciones iniciales Los retornos iniciales de los términos de error de los modelos AR (p) pueden modelarse de diferentes maneras. Los métodos de arranque de errores autorregresivos soportados por los procedimientos SAS / ETS son los siguientes: mínimos cuadrados condicionales (procedimientos ARMA y MODELO) mínimos cuadrados incondicionales (procedimientos AUTOREG, ARIMA y MODELO) Yule-Walker (Procedimiento AUTOREG solamente) Hildreth-Lu, que elimina las primeras p observaciones (procedimiento MODEL solamente) Consulte el Capítulo 8, Procedimiento AUTOREG, para una explicación y discusión de los méritos de varios métodos de arranque AR (p). Las inicializaciones CLS, ULS, ML y HL pueden realizarse mediante PROC MODEL. Para errores AR (1), estas inicializaciones se pueden producir como se muestra en la Tabla 18.2. Estos métodos son equivalentes en muestras grandes. Tabla 18.2 Inicializaciones realizadas por PROC MODEL: AR (1) ERRORES Los retornos iniciales de los términos de error de los modelos MA (q) también se pueden modelar de diferentes maneras. Los siguientes paradigmas de inicio de error de media móvil son soportados por los procedimientos ARIMA y MODELO: mínimos cuadrados incondicionales mínimos condicionales condicionales El método de mínimos cuadrados condicionales para estimar los términos de error de media móvil no es óptimo porque ignora el problema de inicio. Esto reduce la eficiencia de las estimaciones, aunque siguen siendo imparciales. Los residuos rezagados iniciales, que se extienden antes del inicio de los datos, se supone que son 0, su valor esperado incondicional. Esto introduce una diferencia entre estos residuales y los residuos de mínimos cuadrados generalizados para la covarianza media móvil, que, a diferencia del modelo autorregresivo, persiste a través del conjunto de datos. Por lo general, esta diferencia converge rápidamente a 0, pero para los procesos de media móvil no inversa la convergencia es bastante lenta. Para minimizar este problema, debe tener un montón de datos, y las estimaciones de parámetros del promedio móvil deberían estar dentro del intervalo invertible. Este problema se puede corregir a expensas de escribir un programa más complejo. Las estimaciones de mínimos cuadrados incondicionales para el proceso MA (1) se pueden producir especificando el modelo de la siguiente manera: Los errores de media móvil pueden ser difíciles de estimar. Debe considerar usar una aproximación AR (p) al proceso del promedio móvil. Un proceso de media móvil normalmente puede ser bien aproximado por un proceso autorregresivo si los datos no han sido suavizados o diferenciados. La macro AR La macro AR de SAS genera instrucciones de programación para el MODELO PROC para modelos autorregresivos. La macro AR forma parte del software SAS / ETS y no es necesario configurar ninguna opción especial para utilizar la macro. El proceso autorregresivo puede aplicarse a los errores de la ecuación estructural oa las propias series endógenas. La macro AR puede utilizarse para los siguientes tipos de autorregresión: autorreversión vectorial sin restricciones autorregresión vectorial restringida Autoregresión univariable Para modelar el término de error de una ecuación como un proceso autorregresivo, utilice la siguiente sentencia después de la ecuación: Por ejemplo, supongamos que Y es una Función lineal de X1, X2 y un error AR (2). Escribirías este modelo de la siguiente manera: Las llamadas a AR deben venir después de todas las ecuaciones a las que se aplica el proceso. La invocación de macros anterior, AR (y, 2), produce las declaraciones mostradas en la salida LIST de la Figura 18.58. Figura 18.58 Salida de opción LIST para un modelo AR (2) Las variables prefijadas PRED son variables temporales del programa utilizadas para que los retrasos de los residuos sean los residuos correctos y no los redefinidos por esta ecuación. Tenga en cuenta que esto es equivalente a las declaraciones explícitamente escritas en la sección Formulario General para Modelos ARMA. También puede restringir los parámetros autorregresivos a cero en los retornos seleccionados. Por ejemplo, si desea parámetros autorregresivos en los retornos 1, 12 y 13, puede utilizar las siguientes sentencias: Estas instrucciones generan la salida que se muestra en la Figura 18.59. Figura 18.59 Salida de opción de LIST para un modelo de AR con Lags en 1, 12 y 13 El listado de procedimientos MODEL de la declaración de código de programa compilado como analizado PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y PRED. y - y Hay Variaciones en el método de los mínimos cuadrados condicionales, dependiendo de si las observaciones al comienzo de la serie se utilizan para calentar el proceso AR. De forma predeterminada, el método de mínimos cuadrados condicionales de AR utiliza todas las observaciones y supone ceros para los retardos iniciales de los términos autorregresivos. Utilizando la opción M, puede solicitar que AR utilice el método de mínimos cuadrados incondicionales (ULS) o de máxima verosimilitud (ML). Por ejemplo, las discusiones de estos métodos se proporcionan en la sección AR Condiciones iniciales. Mediante el uso de la opción MCLS n, puede solicitar que las primeras n observaciones se utilicen para calcular las estimaciones de los retrasos autorregresivos iniciales. En este caso, el análisis comienza con la observación n 1. Por ejemplo: Puede utilizar la macro AR para aplicar un modelo autorregresivo a la variable endógena, en lugar del término de error, mediante la opción TYPEV. Por ejemplo, si desea agregar los cinco retrasos anteriores de Y a la ecuación del ejemplo anterior, podría utilizar AR para generar los parámetros y los retrasos mediante las siguientes sentencias: Las sentencias anteriores generan la salida que se muestra en la Figura 18.60. Figura 18.60 Salida de la opción LIST para un modelo AR de Y Este modelo predice Y como una combinación lineal de X1, X2, una intersección y los valores de Y en los cinco períodos más recientes. Autoregresión vectorial sin restricciones Para modelar los términos de error de un conjunto de ecuaciones como un proceso autorregresivo vectorial, utilice la siguiente forma de la macro AR después de las ecuaciones: El valor del nombre del proceso es cualquier nombre que suministre para que AR utilice para crear nombres para el autorregresivo Parámetros. Puede utilizar la macro AR para modelar varios procesos AR diferentes para diferentes conjuntos de ecuaciones utilizando diferentes nombres de proceso para cada conjunto. El nombre del proceso garantiza que los nombres de variable utilizados sean únicos. Utilice un valor de nombre de proceso corto para el proceso si las estimaciones de parámetros se escriben en un conjunto de datos de salida. La macro AR intenta construir nombres de parámetro menores o iguales a ocho caracteres, pero esto está limitado por la longitud de nombreproceso. Que se utiliza como prefijo para los nombres de parámetro AR. El valor de variablelist es la lista de variables endógenas para las ecuaciones. Por ejemplo, supongamos que los errores de las ecuaciones Y1, Y2 e Y3 son generados por un proceso autorregresivo vectorial de segundo orden. Puede utilizar las siguientes sentencias: que generan lo siguiente para Y1 y código similar para Y2 e Y3: Sólo el método de mínimos cuadrados condicionales (MCLS o MCLS n) se puede utilizar para procesos vectoriales. También puede usar el mismo formulario con restricciones de que la matriz de coeficientes sea 0 en retrasos seleccionados. Por ejemplo, las siguientes afirmaciones aplican un proceso vectorial de tercer orden a los errores de ecuación con todos los coeficientes con retraso 2 restringido a 0 y con los coeficientes en los retornos 1 y 3 sin restricciones: Puede modelar las tres series Y1Y3 como un proceso vectorial autorregresivo En las variables en lugar de en los errores mediante la opción TYPEV. Si desea modelar Y1Y3 como una función de valores pasados ​​de Y1Y3 y algunas variables o constantes exógenas, puede usar AR para generar las sentencias para los términos de retraso. Escriba una ecuación para cada variable para la parte no autorregresiva del modelo, y luego llame a AR con la opción TYPEV. Por ejemplo, la parte no autorregresiva del modelo puede ser una función de variables exógenas, o puede ser parámetros de intercepción. Si no hay componentes exógenos en el modelo de autorregresión vectorial, incluyendo no intercepciones, entonces asigne cero a cada una de las variables. Debe haber una asignación a cada una de las variables antes de que AR se llame. Este ejemplo modela el vector Y (Y1 Y2 Y3) como una función lineal solamente de su valor en los dos períodos anteriores y un vector de error de ruido blanco. El modelo tiene 18 (3 3 3 3) parámetros. Sintaxis de la macro AR Hay dos casos de la sintaxis de la macro AR. Cuando no se necesitan restricciones en un proceso AR vectorial, la sintaxis de la macro AR tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarios para definir el proceso AR. Si el endolist no se especifica, la lista endógena tiene por defecto el nombre. Que debe ser el nombre de la ecuación a la que se va a aplicar el proceso de error AR. El valor de nombre no puede superar los 32 caracteres. Es el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Si se da más de un nombre, se crea un proceso vectorial sin restricciones con los residuos estructurales de todas las ecuaciones incluidas como regresores en cada una de las ecuaciones. Si no se especifica, endolist toma el nombre por defecto. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos a intervalos no listados se ponen a 0. Todos los desfases enumerados deben ser menores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación. Los métodos ULS y ML no son compatibles con modelos AR vectoriales por AR. Especifica que el proceso AR debe aplicarse a las variables endógenas en lugar de a los residuos estructurales de las ecuaciones. Autoregresión vectorial restringida Puede controlar qué parámetros se incluyen en el proceso, restringiendo a 0 aquellos parámetros que no incluye. Primero, use AR con la opción DEFER para declarar la lista de variables y definir la dimensión del proceso. A continuación, utilice llamadas AR adicionales para generar términos para las ecuaciones seleccionadas con variables seleccionadas en retrasos seleccionados. Por ejemplo, las ecuaciones de error producidas son las siguientes: Este modelo establece que los errores para Y1 dependen de los errores de Y1 y Y2 (pero no de Y3) en ambos rezagos 1 y 2 y que los errores para Y2 y Y3 dependen de Los errores anteriores para las tres variables, pero sólo con retraso 1. AR Macro Sintaxis para AR Restringido AR Un uso alternativo de AR se permite imponer restricciones en un proceso AR vector llamando a AR varias veces para especificar diferentes términos de AR y rezagos para diferentes Ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarias para definir el proceso vector AR. Especifica el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Especifica que AR no es para generar el proceso AR, sino que es esperar la información adicional especificada en las llamadas AR posteriores para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que deben aplicarse las especificaciones de esta llamada AR. Sólo los nombres especificados en el valor endolist de la primera llamada para el valor de nombre pueden aparecer en la lista de ecuaciones en eqlist. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Solamente los nombres en el endolist de la primera llamada para el valor del nombre pueden aparecer en varlist. Si no se especifica, varlist por defecto es endolist. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos en retrasos no enumerados se establecen en 0. Todos los retornos enumerados deben ser inferiores o iguales al valor de nlag. Y no debe haber duplicados. Si no se especifica, laglist se ajusta por defecto a todos los retornos 1 a nlag. La macro MA La macro MA SAS genera instrucciones de programación para MODELO PROC para modelos de media móvil. La macro MA forma parte del software SAS / ETS y no se necesitan opciones especiales para utilizar la macro. El proceso de error de media móvil puede aplicarse a los errores de la ecuación estructural. La sintaxis de la macro MA es la misma que la macro AR excepto que no hay ningún argumento TYPE. Cuando está utilizando las macros MA y AR combinadas, la macro MA debe seguir la macro AR. Las siguientes instrucciones SAS / IML producen un proceso de error ARMA (1, (1 3)) y lo guardan en el conjunto de datos MADAT2. Las siguientes instrucciones PROC MODEL se usan para estimar los parámetros de este modelo usando la estructura de error de máxima verosimilitud: Las estimaciones de los parámetros producidos por esta ejecución se muestran en la Figura 18.61. Figura 18.61 Estimaciones de un proceso ARMA (1, (1 3)) Hay dos casos de la sintaxis para la macro MA. Cuando no se necesitan restricciones en un proceso MA vectorial, la sintaxis de la macro MA tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA y es el endolist predeterminado. Es el orden del proceso MA. Especifica las ecuaciones a las que se aplica el proceso de MA. Si se da más de un nombre, la estimación CLS se utiliza para el proceso vectorial. Especifica los rezagos en los que se van a agregar los términos MA. Todos los desfases enumerados deben ser inferiores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación en el endolist. MA Sintaxis de macros para movimientos restringidos de medios móviles Un uso alternativo de MA permite imponer restricciones a un proceso de MA vectorial llamando a MA varias veces para especificar diferentes términos de MA y rezagos para diferentes ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA vector. Especifica el orden del proceso MA. Especifica la lista de ecuaciones a las que se aplicará el proceso de MA. Especifica que MA no es para generar el proceso MA sino que es esperar a que la información adicional especificada en las llamadas MA más recientes para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que se aplicarán las especificaciones de esta llamada MA. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Especifica la lista de retrasos en los que se van a agregar los términos MA. Referencia técnica de Algoritmo de Serie de Tiempo de Microsoft Se aplica a: SQL Server 2016 El algoritmo de Serie de Tiempo de Microsoft incluye dos algoritmos separados para analizar series de tiempo: El algoritmo ARTXP, introducido en SQL Server 2005, está optimizado para predecir el próximo valor probable en una serie. El algoritmo ARIMA se agregó en SQL Server 2008 para mejorar la precisión de la predicción a largo plazo. De forma predeterminada, Analysis Services utiliza cada algoritmo por separado para formar el modelo y, a continuación, mezcla los resultados para obtener la mejor predicción para un número variable de predicciones. También puede optar por utilizar sólo uno de los algoritmos, basado en sus datos y requisitos de predicción. En SQL Server 2008 Enterprise, también puede personalizar el punto de corte que controla la combinación de algoritmos durante la predicción. Este tema proporciona información adicional sobre cómo se implementa cada algoritmo y cómo puede personalizar el algoritmo estableciendo parámetros para ajustar el análisis y los resultados de predicción. Microsoft Research desarrolló el algoritmo ARTXP original que se utilizó en SQL Server 2005, basando la implementación en el algoritmo Microsoft Decision Trees. Por lo tanto, el algoritmo ARTXP puede ser descrito como un modelo de árbol autorregresivo para representar datos periódicos de series temporales. Este algoritmo relaciona un número variable de elementos pasados ​​con cada elemento actual que se está prediciendo. El nombre ARTXP deriva del hecho de que el método de árbol autorregresivo (un algoritmo ART) se aplica a múltiples estados desconocidos anteriores. Para una explicación detallada del algoritmo ARTXP, vea Modelos de árbol auto-regresivos para el análisis de series de tiempo. El algoritmo ARIMA se agregó al algoritmo Microsoft Time Series en SQL Server 2008 para mejorar la predicción a largo plazo. Se trata de una implementación del proceso de cálculo de promedios móviles integrados autorregresivos que fue descrito por Box y Jenkins. La metodología ARIMA permite determinar dependencias en observaciones tomadas secuencialmente en el tiempo, y puede incorporar choques aleatorios como parte del modelo. El método ARIMA también soporta estacionalidad multiplicativa. Los lectores que quieran aprender más sobre el algoritmo ARIMA son alentados a leer el trabajo seminal de Box y Jenkins esta sección tiene la intención de proporcionar detalles específicos sobre cómo la metodología ARIMA se ha implementado en el algoritmo Microsoft Time Series. De forma predeterminada, el algoritmo de series de tiempo de Microsoft utiliza ambos métodos, ARTXP y ARIMA y mezcla los resultados para mejorar la precisión de predicción. Si desea utilizar sólo un método específico, puede establecer los parámetros del algoritmo para utilizar sólo ARTXP o sólo ARIMA, o para controlar cómo se combinan los resultados de los algoritmos. Tenga en cuenta que el algoritmo ARTXP soporta la predicción cruzada, pero el algoritmo ARIMA no. Por lo tanto, la predicción cruzada está disponible sólo cuando se utiliza una mezcla de algoritmos, o cuando se configura el modelo para utilizar sólo ARTXP. Esta sección introduce una terminología necesaria para comprender el modelo ARIMA y analiza la implementación específica de la diferenciación en el algoritmo de la serie temporal de Microsoft. Para una explicación completa de estos términos y conceptos, recomendamos una revisión de Box y Jenkins. Un término es un componente de una ecuación matemática. Por ejemplo, un término en una ecuación polinómica puede incluir una combinación de variables y constantes. La fórmula de ARIMA que se incluye en el algoritmo de serie de tiempo de Microsoft utiliza términos de media móvil y autorregresiva. Los modelos de series temporales pueden ser estacionarios o no estacionarios. Los modelos estacionarios son aquellos que vuelven a una media, aunque podrían tener ciclos, mientras que los modelos no estacionarios no tienen un foco de equilibrio y están sujetos a una mayor varianza o cambio introducido por los choques. O variables externas. El objetivo de la diferenciación es hacer que una serie de tiempo se estabilice y se vuelva estacionaria. El orden de diferencia representa el número de veces que se toma la diferencia entre valores para una serie de tiempo. El algoritmo de serie temporal de Microsoft funciona tomando valores en una serie de datos e intentando ajustar los datos a un patrón. Si la serie de datos no está ya estacionaria, el algoritmo aplica un orden de diferencia. Cada incremento en el orden de diferencia tiende a hacer las series temporales más estacionarias. Por ejemplo, si tiene la serie de tiempo (z1, z2,, zn) y realiza cálculos usando un orden de diferencia, se obtiene una nueva serie (y1, y2,.nn-1), donde yi zi1-zi. Cuando el orden de diferencia es 2, el algoritmo genera otra serie (x1, x2,, xn-2), basada en la serie y que se derivó de la ecuación de primer orden. La cantidad correcta de diferenciación depende de los datos. Un único orden de diferenciación es más común en modelos que muestran una tendencia constante un segundo orden de diferenciación puede indicar una tendencia que varía con el tiempo. De forma predeterminada, el orden de diferencia utilizado en el algoritmo de serie temporal de Microsoft es -1, lo que significa que el algoritmo detectará automáticamente el mejor valor para el orden de diferencia. Normalmente, ese mejor valor es 1 (cuando se requiere diferenciar), pero bajo ciertas circunstancias el algoritmo aumentará ese valor hasta un máximo de 2. El algoritmo de Microsoft Time Series determina el orden de diferencia ARIMA óptimo utilizando los valores de autorregresión. El algoritmo examina los valores de AR y establece un parámetro oculto, ARIMAARORDER, que representa el orden de los términos AR. Este parámetro oculto, ARIMAARORDER, tiene un rango de valores de -1 a 8. Con el valor por defecto de -1, el algoritmo seleccionará automáticamente el orden de diferencia apropiado. Siempre que el valor de ARIMAARORDER es mayor que 1, el algoritmo multiplica la serie de tiempo por un término polinomial. Si un término de la fórmula polinómica se resuelve a una raíz de 1 o cercano a 1, el algoritmo intenta preservar la estabilidad del modelo eliminando el término y aumentando el orden de diferencia por 1. Si el orden de diferencia ya está en el máximo, El término se elimina y el orden de diferencia no cambia. Por ejemplo, si el valor de AR 2, el término polinómico resultante de AR podría tener el siguiente aspecto: 1 1.4B .45B2 (1- .9B) (1- 0.5B). Observe el término (1-9B) que tiene una raíz de aproximadamente 0.9. El algoritmo elimina este término de la fórmula polinómica, pero no puede aumentar el orden de diferencia por uno, ya que ya está en el valor máximo de 2. Es importante tener en cuenta que la única manera que se puede forzar un cambio en el orden de diferencia es utilizar el Parámetro no soportado, ARIMADIFFERENCEORDER. Este parámetro oculto controla cuántas veces el algoritmo realiza la diferenciación en la serie de tiempo y puede establecerse escribiendo un parámetro de algoritmo personalizado. Sin embargo, no recomendamos que cambie este valor a menos que esté preparado para experimentar y esté familiarizado con los cálculos involucrados. También tenga en cuenta que actualmente no hay ningún mecanismo, incluidos los parámetros ocultos, para permitirle controlar el umbral en el que se dispara el aumento en el orden de diferencia. Finalmente, tenga en cuenta que la fórmula descrita anteriormente es el caso simplificado, sin indicios de estacionalidad. If seasonality hints are provided, then a separate AR polynomial term is added to the left of the equation for each seasonality hint, and the same strategy is applied to eliminate terms that might destabilize the differenced series.

Comments