Portal educativo IGE

Matemáticas. Series de tempo
Definicións e conceptos teóricos


Introdución ás series de tempo

Unha serie de tempo é unha sucesión de observacións dun fenómeno ordenadas no tempo.

Exemplo: o número de inmigrantes que chegaron a Galicia procedentes do estranxeiro nos últimos quince anos.

En realidade, unha serie de tempo é un caso particular dunha variable bidimensional, na que a variable independente é o tempo (t) e a dependente a variable que estamos estudando (X). As observacións da serie temporal representarémolas por x1, x2, ..., xn

A forma máis habitual de presentar unha serie de tempo é nunha táboa con dúas columnas. Na primeira columna ponse o tempo (t) e na segunda a observación da variable nese instante de tempo (xt).

A repersentación gráfica das series temporais faise do mesmo xeito que na regresión, no eixe de abscisas representase o tempo (t) e no de ordenadas os valores da variable (xt). Unindo os puntos resultantes obtemos unha visión de como evolucionou a variable que estamos estudando ao largo do tempo.

A análise de series temporais ten dous obxectivos fundamentais. Por unha banda, permítenos analizar a evolución dun fenómeno no tempo, e por outra, podemos facer prediccións dos valores futuros da variable. Así, por exemplo, se se pretende predicir o número de inmigrantes procedentes do estranxeiro que chegarán a Galicia nos próximos anos, unha posibilidade é recompilar o número de inmigrantes que chegaron nos últimos anos a Galicia e construír un modelo descritivo que permita extrapolar o comportamento pasado desta variable cara o futuro.

O estudo das series temporais pode abordarse desde dúas perspectivas distintas:

  • A determinística: supón que se poden analizar as series temporais sen ter en conta ningunha compoñente aleatoria. Como veremos a continuación, este análisis supón de os valores que toma a variable ob xecto de estudo ven dado pola combinación de catro compoñentes: tendencia, variacións cíclicas, variacións estacionais e variacións residuais.
  • A aleatoria: supón que a serie temporal é unha observación dun proceso estocástico. Un proceso estocástico é unha colección de variables aleatorias. Entón, a concepción aleatoria dunha serie temporal consiste en considerala como a observación dunha sucesión de variables aleatorias.
Nesta páxina introducirase únicamente o estudo determinístco das series temporais.

Compoñentes dunha serie de tempo

A teoría clásica das series de tempo basease en que toda serie xt está formada polas seguintes compoñentes:
  • Tendencia (ut): é o movemento da serie a longo prazo. Trata de describir o comportamento ou evolución xeral da serie en función do tempo.
  • Variacións cíclicas (ct): son oscilacións que se producen con un período superior ao ano. Normalmente son debidas á alternancia de etapas de prosperidade e depresión económica. Na práctica esta compoñente é moi difícil de determinar xa que resulta moi difícil diferenciar entre a tendencia e o ciclo dunha serie. Por este motivo, en moitos casos estas dúas compoñentes trátanse de maneira conxunta e fálase de compoñente extraestacional.
  • Variacións estacionais (st): son oscilacións que se producen cun período de tempo igual ou inferior ao ano (estacionalidade anual, trimestral, mensual,...). Estas variacións teñen que ser recoñecibles ao longo dos anos. Un exemplo de variacións estacionais son as debidas a causas climatolóxicas.
  • Variacións residuais (rt): tamén se coñecen por residuos, variacións irregulares ou erros. Son movementos que non mostran un carácter periódico recoñecible e que recollen unha morea de causas de variación de pouca importancia individual. Poden considerarse como variables independentes coa mesma distribución. Nunha serie de tempo esta compoñente é practicamente impredicible.

Maneiras de combinar as compoñentes dunha serie de tempo

Dentro dos modelos existentes á hora de combinar as catro compoñentes dunha serie temporal, os máis destacables son:

  • Modelo aditivo: xt=ut+ct+st+rt
  • Modelo multiplicativo: xt=ut·ct·st·rt
    O modelo multiplicativo pódese transformar nun modelo adtitivo sen máis que tomar logaritmos log(xt) = log(ut·ct·st·rt) = log(ut)+log(ct)+log(st)+ log (rt)
  • Modelo multiplicativo mixto: xt=ut·ct·st+rt

Exemplo : no seguinte gráfico móstrase o número de pasaxeiros que utilizaron os aeroportos galegos nos meses dos últimos vinte anos.

Esta serie presenta unha tendencia lixeiramente crecente en todo o período 1986-2005, cuns valores máis altos para os meses de xullo e agosto e uns mínimos para os meses de xaneiro e febreiro.

Análise da tendencia

O obxectivo da análise de series temporais é separar os seus movementos sistemáticos dos residuos. Neste apartado estudarase como illar a tendencia que, como xa se dixo, é a compoñente que marca as pautas evolutivas da variable. Hai que ter en conta que cando se describiron as compoñentes dunha serie definiuse a tendencia como o movemento da serie a longo prazo, pero o concepto de "longo prazo" depende da lonxitude da serie. De feito, pode ocorrer que as observacións das que se dispoña formen parte dun ciclo dunha serie máis longa.
Entre os métodos máis empregados para a determinación da tendencia atópanse: o método de axuste analítico e o método das medias móbiles.

Análise da tendencia. Método do axuste analítico

Este método trata de axustar unha función que relacione a variable estudada (neste caso a tendencia) en función do tempo (ut=f(t)). Esta función debe recoller a evolución xeral da serie.

Entre os modelos máis utilizados atópanse o axuste linear (f(t)=a0+b0·t) e o axuste parabólico (f(t)=a0+b0·t+c0·t2), onde os parámetros determinaranse polo método dos mínimos cadrados.

Determinación dos parámetros para o axuste linear da tendencia

Para axustar a tendencia (ut) a unha recta (a+b·t) polo método dos mínimos cadrados, hai que calcular os parámetros a0 e b0 de tal xeito que a suma dos cadrados das diferenzas entre os valores observados (ut) e os valores estimados (a0+b0·t) sexa mínima. É dicir, hai que atopar uns valores para a e b que minimicen f(a,b) = St (ut - (a+b·t))2. Para isto, calcúlanse as derivadas parciais de f(a,b) con respecto a a e a b e iguálanse a cero. Deste xeito obtéñense os seguintes coeficientes:

Se queres ver todos os pasos de como obter os coeficientes do axuste lineal podes pinchar na seguinte ligazón

Exemplo : neste exemplo calcularase o axuste lineal da tendencia da serie do número de inmigrantes que recibiu Galicia procedentes do estranxeiro no período 1992-2004.

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Inmigrantes 6.308 5.155 4.286 4.354 3.204 5.908 6.850 8.506 12.547 11.395 18.186 17.053 19.366

Os cálculos para obter os coeficientes do axuste lineal veñen dados na seguinte táboa:

Ano t t2 Inmigrantes (ut) t*ut
1992 1 1 6.308 6.308
1993 2 4 5.155 10.310
1994 3 9 4.286 12.858
1995 4 16 4.354 17.416
1996 5 25 3.204 16.020
1997 6 36 5.908 35.448
1998 7 49 6.850 47.950
1999 8 64 8.506 68.048
2000 9 81 12.547 112.923
2001 10 100 11.395 113.950
2002 11 121 18.186 200.046
2003 12 144 17.053 204.636
2004 13 169 19.366 251.758
n=13 (anos) St=91 St2=819 Sut=123.118 St*ut=1.097.671

Polo tanto:

O axuste linear da tendencia ven dado por: f(t) = 400 + 1.296t

Determinación dos parámetros para o axuste parabólico da tendencia

A fórmula do axuste lineal da tendencia polo método dos mínimos cadrados pode xeneralizarse para os modelos polinómicos de calquera grado. En particular para os polinomios de segundo grado os coeficientes veñen dados por:

Se queres ver todos os pasos de como obter os coeficientes do axuste parabólico podes pinchar na seguinte ligazón

Exemplo : No exemplo do número de inmigrantes que chegaron a Galicia procedentes do estranxeiro o axuste parabólico da serie calcúlase do seguinte xeito:

Ano t t2 t3 t4 Inmigrantes (ut) t*ut t2*ut
1992 1 1 1 1 6.308 6.308 6.308
1993 2 4 8 16 5.155 10.310 20.620
1994 3 9 27 81 4.286 12.858 38.574
1995 4 16 64 256 4.354 17.416 69.664
1996 5 25 125 625 3.204 16.020 80.100
1997 6 36 216 1.296 5.908 35.448 212.688
1998 7 49 343 2.401 6.850 47.950 335.650
1999 8 64 512 4.096 8.506 68.048 544.384
2000 9 81 729 6.561 12.547 112.923 1.016.307
2001 10 100 1.000 10.000 11.395 113.950 1.139.500
2002 11 121 1.331 14.641 18.186 200.046 2.200.506
2003 12 144 1.728 20.736 17.053 204.636 2.455.632
2004 13 169 2.197 28.561 19.366 251.758 3.272.854
n=13 (anos) St=91 St2=819 St3=8.281 St4=89.271 Sut=123.118 St*ut=1.097.671 St2*ut=11.392.787

Entón o axuste parabólico da tendencia da serie é: f(t) = 6.248 - 1.043t + 167 t2

Nas seguintes gráficas pódese observar como ao aumentar o grado do polinomio o axuste parece aproximarse mellor aos datos da serie.

Análise da tendencia. Método das medias móbiles

O método das medias móbiles consiste en promediar cada valor da serie temporal cos valores contiguos mediante unha media aritmética. O número de datos a promediar determínase en función do período (p) de oscilacións máis importante que mostra a serie. A serie dos datos así obtida proporciona a tendencia da serie e ten unha distribución con menor dispersión ca serie orixinal.

¿Cómo se calculan as médias móbiles de orden p?
  • Se p é impar. Para cada instante temporal t promédianse os p valores que se sitúan o redor de ut, é dicir, promédianse os datos:

  • .
  • Se p é par. Neste caso, o primeiro paso é calcular as medias móbiles de orden p-1 e p+1 e logo calcular a súa correspondente media aritmética.

Exemplo: cálculo das medias móbiles de orden 4 para a produción de vehículos automóbiles na comunidade galega.

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I Trimestre 72.128 72.292 84.504 91.699 115.216 123.388 130.017 128.863 127.193 113.926
II Trimestre 76.394 75.708 94.254 95.009 119.792 126.130 125.952 133.915 131.007 124.948
III Trimestre 57.041 52.737 69.364 52.820 91.602 105.004 96.853 101.353 93.184 85.596
IV Trimestre 71.078 69.218 90.635 92.989 110.739 115.265 122.851 108.614 107.455 98.476

Esta serie ten estacionalidade trimestral, polo que se considera p=4. Como p é par, primeiro calcúlanse as medias móbiles de orden p-1=3 e p+1=5.

Por exemplo, para o segundo trimestre de 1996 a media móbil de orden 3 calcúlase como a media aritmética do primeiro, segundo e terceiro trimestre de 1996, é dicir como (72.128 + 76.394 + 57.041)/3 = 68.521. Anslogamente para o terceiro trimestre de 1996 a media móbil de orden tres viría dada por (76.394 + 57.041 + 71.078)/3 = 68.171. Operando de maneira similar para todo o período considerado, obtéñense as seguintes medias móbiles de orden 3:

Medias móbiles de orden 3

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I Trimestre - 73.026 82.659 92.448 109.332 120.086 123.745 128.543 122.271 115.443
II Trimestre 68.521 66.912 82.707 79.843 108.870 118.174 117.607 121.377 117.128 108.157
III Trimestre 68.171 65.888 84.751 80.273 107.378 115.466 115.219 114.627 110.549 103.007
IV Trimestre 66.804 68.820 83.899 87.008 108.576 116.762 116.189 112.387 104.855 -

De xeito análogo a como se calcularon as medias móbiles de orden 3 calcúlanse as de orden 5. Por exemplo, para o terceiro trimestre de 1996 esta calcularíase como: (72.128 + 76.394 + 57.041 + 71.078 + 72.292)/5 = 69.787

Medias móbiles de orden 5

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I Trimestre - 65.771 74.015 79.905 94.484 111.373 114.618 116.767 112.270 105.022
II Trimestre - 68.207 81.595 84.630 106.068 116.105 118.188 119.119 113.491 106.080
III Trimestre 69.787 70.892 86.091 89.547 112.147 119.961 120.907 119.988 114.553 -
IV Trimestre 70.503 75.284 88.192 95.165 114.330 120.474 121.687 120.416 114.104 -

Finalmente, para calcular as medias móbiles de orden 4 promédianse, para cada trimestre, as correspondentes medias móbiles de orden 3 e de orden 5. Por exemplo, para o terceiro trimestre de 1996 a media móbil de orden 4 é: (68.171 + 69.787)/2 = 68.979.

Medias móbiles de orden 4

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I Trimestre - 69.399 78.337 86.177 101.908 115.729 119.181 122.655 117.271 110.232
II Trimestre - 67.559 82.151 82.237 107.469 117.140 117.897 120.248 115.309 107.118
III Trimestre 68.979 68.390 85.421 84.910 109.763 117.714 118.063 117.307 112.551 -
IV Trimestre 68.653 72.052 86.046 91.087 111.453 118.618 118.938 116.402 109.480 -

Na representación gráfica da serie resultante pódese observar como a serie das medias móbiles é máis suave que a serie orixinal.

Análise da compoñente estacional

As variacións estacionais son oscilacións que normalmente se producen cun período igual ou inferior ao ano e que son recoñecibles nos diferentes anos. Para estudar o movemento real ou tendencia dunha serie, é necesario eliminar previamente as flutuacións, ou variacións estacionais, presentes na serie e que encobren a evolución real do fenómeno.

Por simplicidade suporemos que a serie de datos é mensual. Denotarase por xij o dato da serie correspondente ao mes j (j=1,2,..., 12) do ano i (i=1,2, ..., n)

Análise da compoñente estacional. Método das relacións de medias mensuais respecto á tendencia

Os pasos a seguir son os seguintes:

  1. Calcular as medias anuais dos datos observados:

  2. Axustar as medias anuais dos datos (x ) a unha recta a+bi polo método dos mínimos cadrados. A pendente desta recta (b) representa o incremento dos valores medios anuais no transcurso dun ano. Polo tanto, supoñendo que o incremento anual se produce uniformemente ao longo de cada ano, b/12 é o incremento debido ao transcurso dun mes.

  3. Calcular as medias mensuais dos datos:

  4. Corrixir as medias mensuais restando a cada unha delas a proporción do incremento anual:

    Como en xaneiro aínda non transcorreu ningún mes , a media mensual corrixida coincide coa media mensual. Porén, en Febreiro hai que descontarlle á media mensual a parte do efecto total do transcurso dun ano correspondente ao mes de xaneiro. É dicir, hai que restarlle á media orixinal a doceava parte do incremento anual (b/12). En marzo habería que restarlle dúas doceavas partes do incremento anual (2b/12) e así sucesivamente.

  5. Calcular a media global corrixida (x'·· ) como a media aritmética das medias mensuais corrixidas.

  6. Obter a compoñente estacional. Neste caso hai que distinguir entre se o modelo aditivo ou multiplicativo
    • Modelo aditivo: neste caso a compoñente estacional calcúlase como sij = x'·j - x'··
    • Modelo multiplicativo: o índice de variación estacional obtense como o cociente entre a media mensual corrixida e a media global corrixida, é dicir:

Exemplo: na seguinte táboa móstranse os matrimonios que tiñan pensado fixar a súa residencia en Galicia nos últimos 8 anos.

1998 1999 2000 2001 2002 2003 2004 2005
Xaneiro 465 442 406 307 273 320 314 290
Febreiro 434 407 342 330 361 342 436 312
Marzo 621 647 566 640 618 610 576 614
Abril 646 636 869 615 674 614 671 782
Maio 1.131 1.137 974 973 1.069 1.203 1.260 1.025
Xuño 958 1.019 1.060 1.204 1.279 1.050 1.088 1.108
Xullo 1.499 1.776 1.848 1.470 1.413 1.412 1.748 1.612
Agosto 2.284 1.990 1.960 1.859 2.192 2.126 1.720 1.537
Setembro 1.511 1.617 1.843 1.794 1.597 1.491 1.545 1.486
Outubro 1.204 1.214 962 960 1.032 918 1.096 1.010
Novembro 470 457 504 472 519 452 434 452
Decembro 670 605 647 558 490 536 485 472
Medias anuais 991 996 998 932 960 923 948 892

A continuación obterase a compoñente estacional polo método das relacións medias mensuais con respecto á tendencia.

Unha vez calculadas as medias anuais dos datos, o seguinte paso é axustalas a unha recta polo método dos mínimos cadrados.

i i2 Medias anuais
(x)
i*x
1998 1 1 991 991
1999 2 4 996 1.991
2000 3 9 998 2.995
2001 4 16 932 3.727
2002 5 25 960 4.799
2003 6 36 923 5.537
2004 7 49 948 6.634
2005 8 64 892 7.133
n=8 (anos) Si=36 Si2=204 Sx=7.639 Six=33.808

Entón a recta de axuste é: 1.016 -13i

A continuación calcúlanse as medias mensuais dos datos e as correspondentes medias mensuais corrixidas:

Mes j media mensual
(x·j )
media mensual
corrixida (x'·j )
Compoñente estacional 
(nodelo aditivo)
Xaneiro 1 352 352 -609
Febreiro 2 371 372 -589
Marzo 3 612 614 -347
Abril 4 688 692 -269
Maio 5 1.097 1.101 140
Xuño 6 1.096 1.101 140
Xullo 7 1.597 1.604 643
Agosto 8 1.959 1.966 1.005
Setembro 9 1.611 1.619 658
Outubro 10 1.050 1.060 99
Novembro 11 470 481 -480
Decembro 12 558 570 -391
x'··= 961

Por exemplo, a media mensual para febreiro a media mensual calcúlase como: x·2 = 1/8(434 + 407 + 342 + 330 + 361 + 342 + 436 +312) = 371 e a media mensual corrixida como x'·2 = x·2 - (1/12)*b = 371 - (1/12)*(-13) = 372

Unha vez calculadas as medias mensuais corrixidas, a media global corrixida obtense como promedio das anteriores, é dicir: x'·· = 1/12 (352 + 372 + 614 + 692 + 1.101 + 1.101 + 1.604 + 1.966 + 1.619 + 1.060 + 481 + 570) = 961

Finalmente para cada mes, e supoñendo que o modelo é aditivo, calcúlase a compoñente estacional como a diferenza entre a correspondente media mensual corrixida e a media global corrixida. Por exemplo, para o mes de febreiro a compoñente estacional ven dada por: si2= x·2 - x'·· = 372 - 961 = -589

A compoñente estacional que se mostra na gráfica anterior ten un marcado balance positivo nos meses de verán, sobre todo en agosto. Porén, os meses de inverno presentan unha compoñente estacional negativa moi forte, é dicir, son os meses nos que se celebra un menor número de matrimonios.

Análise da compoñente estacional. Método das medias móbiles

O método das medias móbiles para a análise da compoñente estacional consiste en:

  1. Obter a compoñente extraestacional da serie (Eij) facendo un axuste da serie orixinal empregando medias móbiles con p=12, sempre e cando a serie dos datos sexa mensual. ¿Cómo calcular as medias móbiles de orden p?
  2. Calcular a compoñente estacional estimada s·j:
    • Se o modelo é aditivo: s·j = x·j - E·j
    • Se o modelo é multiplicativo:

Exemplo: neste exemplo calcularase a compoñente estacional da serie de matrimonios mediante o método das medias móbiles.

Como p=12 é un número par, primeiro hai que calcular as medias móbiles de orden p-1=11 e p+1=13.

Medias móbiles de orden 11

1998 1999 2000 2001 2002 2003 2004 2005
Xaneiro - 948 918 908 902 906 897 856
Febreiro - 902 905 863 861 835 863 846
Marzo - 945 936 865 897 883 884 845
Abril - 983 994 940 955 925 941 880
Maio - 1.050 1.040 982 1.006 961 999 933
Xuño 1.020 1.031 1.030 966 1.002 958 990 930
Xullo 1.039 1.046 1.052 989 1.022 978 1.005 946
Agosto 1.040 1.046 1.049 983 1.018 975 992 -
Setembro 1.020 1.018 1.028 958 993 959 968 -
Outubro 1.020 1.012 1.007 958 988 956 963 -
Novembro 975 987 974 931 946 907 919 -
Decembro 992 983 966 919 939 927 914 -

Medias móbiles de orden 13

1998 1999 2000 2001 2002 2003 2004 2005
Xaneiro - 1.054 1.056 1.023 985 984 1.002 982
Febreiro - 1.092 1.070 1.024 1.040 1.039 1.026 966
Marzo - 1.040 1.059 1.011 1.020 985 981 948
Abril - 1.018 1.008 943 961 933 951 907
Maio - 960 954 906 927 888 914 857
Xuño - 971 968 910 929 890 916 860
Xullo 949 950 945 881 911 876 897 -
Agosto 944 943 939 885 916 885 897 -
Setembro 961 955 962 907 935 903 911 -
Outubro 962 972 966 910 935 908 927 -
Novembro 1.000 998 974 945 975 957 954 -
Decembro 991 992 992 969 974 948 942 -

Medias móbiles de orden 12

1998 1999 2000 2001 2002 2003 2004 2005
Xaneiro - 1.001 987 966 943 945 950 919
Febreiro - 997 988 944 951 937 944 906
Marzo - 993 997 938 959 934 932 897
Abril - 1.000 1.001 942 958 929 946 894
Maio - 1.005 997 944 967 925 956 895
Xuño - 1.001 999 938 966 924 953 895
Xullo 994 998 999 935 966 927 951 -
Agosto 992 994 994 934 967 930 945 -
Setembro 990 986 995 933 964 931 939 -
Outubro 991 992 986 934 961 932 945 -
Novembro 987 993 974 938 961 932 937 -
Decembro 991 988 979 944 957 938 928 -

Unha vez calculadas as medias móbiles de orden p=12 e supoñendo que o modelo é aditivo, calcúlanse a estimación da compoñente estacional como: s·j = x·j - E·j

Por exemplo, para o mes de xaneiro x·1 = 1/8(465 + 442 + 406 + 307 + 273 + 320 + 314 + 290) = 352 e E·1 = 1/7(1.001 + 978 + 966 + 943 + 945 + 950 + 919) = 959, polo que s·1 = 352 - 959 = -606

Media mensual
x·j
E·j s·j
Xaneiro 352 959 -606
Febreiro 371 952 -582
Marzo 612 950 -339
Abril 688 953 -264
Maio 1.097 956 141
Xuño 1.096 954 142
Xullo 1.597 967 630
Agosto 1.959 965 993
Setembro 1.611 963 648
Outubro 1.050 963 86
Novembro 470 960 -490
Decembro 558 961 -403