Portal educativo IGE

ver o mapa do portal

Matemáticas. Series de tempo
Definicións e conceptos teóricos


Introdución ás series de tempo

Unha serie de tempo é unha sucesión de observacións dun fenómeno ordenadas no tempo.

Exemplo: o número de inmigrantes que chegaron a Galicia procedentes do estranxeiro nos últimos quince anos.

En realidade, unha serie de tempo é un caso particular dunha variable bidimensional, na que a variable independente é o tempo (t) e a dependente a variable que estamos estudando (X). As observacións da serie temporal representarémolas por x1, x2, ..., xn

A forma máis habitual de presentar unha serie de tempo é nunha táboa con dúas columnas. Na primeira columna ponse o tempo (t) e na segunda a observación da variable nese instante de tempo (xt).

A repersentación gráfica das series temporais faise do mesmo xeito que na regresión, no eixe de abscisas representase o tempo (t) e no de ordenadas os valores da variable (xt). Unindo os puntos resultantes obtemos unha visión de como evolucionou a variable que estamos estudando ao largo do tempo.

A análise de series temporais ten dous obxectivos fundamentais. Por unha banda, permítenos analizar a evolución dun fenómeno no tempo, e por outra, podemos facer prediccións dos valores futuros da variable. Así, por exemplo, se se pretende predicir o número de inmigrantes procedentes do estranxeiro que chegarán a Galicia nos próximos anos, unha posibilidade é recompilar o número de inmigrantes que chegaron nos últimos anos a Galicia e construír un modelo descritivo que permita extrapolar o comportamento pasado desta variable cara o futuro.

O estudo das series temporais pode abordarse desde dúas perspectivas distintas:

  • A determinística: supón que se poden analizar as series temporais sen ter en conta ningunha compoñente aleatoria. Como veremos a continuación, este análisis supón de os valores que toma a variable ob xecto de estudo ven dado pola combinación de catro compoñentes: tendencia, variacións cíclicas, variacións estacionais e variacións residuais.
  • A aleatoria: supón que a serie temporal é unha observación dun proceso estocástico. Un proceso estocástico é unha colección de variables aleatorias. Entón, a concepción aleatoria dunha serie temporal consiste en considerala como a observación dunha sucesión de variables aleatorias.
Nesta páxina introducirase únicamente o estudo determinístco das series temporais.

Compoñentes dunha serie de tempo

A teoría clásica das series de tempo basease en que toda serie xt está formada polas seguintes compoñentes:
  • Tendencia (ut): é o movemento da serie a longo prazo. Trata de describir o comportamento ou evolución xeral da serie en función do tempo.
  • Variacións cíclicas (ct): son oscilacións que se producen con un período superior ao ano. Normalmente son debidas á alternancia de etapas de prosperidade e depresión económica. Na práctica esta compoñente é moi difícil de determinar xa que resulta moi difícil diferenciar entre a tendencia e o ciclo dunha serie. Por este motivo, en moitos casos estas dúas compoñentes trátanse de maneira conxunta e fálase de compoñente extraestacional.
  • Variacións estacionais (st): son oscilacións que se producen cun período de tempo igual ou inferior ao ano (estacionalidade anual, trimestral, mensual,...). Estas variacións teñen que ser recoñecibles ao longo dos anos. Un exemplo de variacións estacionais son as debidas a causas climatolóxicas.
  • Variacións residuais (rt): tamén se coñecen por residuos, variacións irregulares ou erros. Son movementos que non mostran un carácter periódico recoñecible e que recollen unha morea de causas de variación de pouca importancia individual. Poden considerarse como variables independentes coa mesma distribución. Nunha serie de tempo esta compoñente é practicamente impredicible.

Maneiras de combinar as compoñentes dunha serie de tempo

Dentro dos modelos existentes á hora de combinar as catro compoñentes dunha serie temporal, os máis destacables son:

  • Modelo aditivo: xt=ut+ct+st+rt
  • Modelo multiplicativo: xt=ut·ct·st·rt
    O modelo multiplicativo pódese transformar nun modelo adtitivo sen máis que tomar logaritmos log(xt) = log(ut·ct·st·rt) = log(ut)+log(ct)+log(st)+ log (rt)
  • Modelo multiplicativo mixto: xt=ut·ct·st+rt

Exemplo : no seguinte gráfico móstrase o número de pasaxeiros que utilizaron os aeroportos galegos nos meses dos últimos vinte anos.

Esta serie presenta unha tendencia lixeiramente crecente en todo o período 1996-2016, cuns valores máis altos para os meses de xullo e agosto e uns mínimos para os meses de xaneiro e febreiro.

Análise da tendencia

O obxectivo da análise de series temporais é separar os seus movementos sistemáticos dos residuos. Neste apartado estudarase como illar a tendencia que, como xa se dixo, é a compoñente que marca as pautas evolutivas da variable. Hai que ter en conta que cando se describiron as compoñentes dunha serie definiuse a tendencia como o movemento da serie a longo prazo, pero o concepto de "longo prazo" depende da lonxitude da serie. De feito, pode ocorrer que as observacións das que se dispoña formen parte dun ciclo dunha serie máis longa.
Entre os métodos máis empregados para a determinación da tendencia atópanse: o método de axuste analítico e o método das medias móbiles.

Análise da tendencia. Método do axuste analítico

Este método trata de axustar unha función que relacione a variable estudada (neste caso a tendencia) en función do tempo (ut=f(t)). Esta función debe recoller a evolución xeral da serie.

Entre os modelos máis utilizados atópanse o axuste linear (f(t)=a0+b0·t) e o axuste parabólico (f(t)=a0+b0·t+c0·t2), onde os parámetros determinaranse polo método dos mínimos cadrados.

Determinación dos parámetros para o axuste linear da tendencia

Para axustar a tendencia (ut) a unha recta (a+b·t) polo método dos mínimos cadrados, hai que calcular os parámetros a0 e b0 de tal xeito que a suma dos cadrados das diferenzas entre os valores observados (ut) e os valores estimados (a0+b0·t) sexa mínima. É dicir, hai que atopar uns valores para a e b que minimicen f(a,b) = St (ut - (a+b·t))2. Para isto, calcúlanse as derivadas parciais de f(a,b) con respecto a a e a b e iguálanse a cero. Deste xeito obtéñense os seguintes coeficientes:

Se queres ver todos os pasos de como obter os coeficientes do axuste lineal podes pinchar na seguinte ligazón

Exemplo : neste exemplo calcularase o axuste lineal da tendencia da serie do número de inmigrantes que recibiu Galicia procedentes do estranxeiro no período 2004-2016.

INE. Estatística de variacións residenciais. Elaboración IGE a partir dos ficheiros proporcionados polo INE

Os cálculos para obter os coeficientes do axuste lineal veñen dados na seguinte táboa:

Ano t t2 Inmigrantes (ut) t*ut
2004 1 1 19.366 19.366
2005 2 4 19.833 39.666
2006 3 9 22.948 68.844
2007 4 16 26.386 105.544
2008 5 25 22.165 110.852
2009 6 36 15.135 90.810
2010 7 49 13.878 97.146
2011 8 64 13.847 110.776
2012 9 81 10.322 92.898
2013 10 100 9.268 92.680
2014 11 121 10.377 114.147
2015 12 144 12.094 145.128
2016 13 169 15.736 204.568
n=13 (anos) St=91 St2=819 Sut=211.355 St*ut=1.292.398

Polo tanto:

O axuste linear da tendencia ven dado por: f(t) = 23.453,7 - 1.028,0t

Determinación dos parámetros para o axuste parabólico da tendencia

A fórmula do axuste lineal da tendencia polo método dos mínimos cadrados pode xeneralizarse para os modelos polinómicos de calquera grado. En particular para os polinomios de segundo grado os coeficientes veñen dados por:

Se queres ver todos os pasos de como obter os coeficientes do axuste parabólico podes pinchar na seguinte ligazón

Exemplo : No exemplo do número de inmigrantes que chegaron a Galicia procedentes do estranxeiro o axuste parabólico da serie calcúlase do seguinte xeito:

Ano t t2 t3 t4 Inmigrantes (ut) t*ut t2*ut
2004 1 1 1 1 19.366 19.366 19.366
2005 2 4 8 16 19.833 39.666 79.332
2006 3 9 27 81 22.948 68.844 206.532
2007 4 16 64 256 26.386 105.544 422.176
2008 5 25 125 625 22.165 110.825 554.125
2009 6 36 216 1.296 15.135 90.810 544.860
2010 7 49 343 2.401 13.878 97.146 680.022
2011 8 64 512 4.096 13.847 110.776 886.208
2012 9 81 729 6.561 10.322 92.898 836.082
2013 10 100 1.000 10.000 9.268 92.680 926.800
2014 11 121 1.331 14.641 10.377 114.147 1.255.617
2015 12 144 1.728 20.736 12.094 145.128 1.741.536
2016 13 169 2.197 28.561 15.736 204.568 2.659.384
n=13 (anos) St=91 St2=819 St3=8.281 St4=89.271 Sut=211.355 St*ut=1.292.398 St2*ut=10.812.040

Entón o axuste parabólico da tendencia da serie é: f(t) = 25.479,8 - 1838,4t + 57,9 t2

Nas seguintes gráficas pódese observar como ao aumentar o grado do polinomio o axuste parece aproximarse mellor aos datos da serie.

Análise da tendencia. Método das medias móbiles

O método das medias móbiles consiste en promediar cada valor da serie temporal cos valores contiguos mediante unha media aritmética. O número de datos a promediar determínase en función do período (p) de oscilacións máis importante que mostra a serie. A serie dos datos así obtida proporciona a tendencia da serie e ten unha distribución con menor dispersión ca serie orixinal.

¿Cómo se calculan as médias móbiles de orden p?
  • Se p é impar. Para cada instante temporal t promédianse os p valores que se sitúan o redor de ut, é dicir, promédianse os datos:

  • .
  • Se p é par. Neste caso, o primeiro paso é calcular as medias móbiles de orden p-1 e p+1 e logo calcular a súa correspondente media aritmética.

Exemplo: cálculo das medias móbiles de orden 4 para a produción de vehículos automóbiles na comunidade galega.

2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
I Trimestre 147.410 131.309 76.276 116.061 102.259 85.570 105.949 110.238 110.069 116.617
II Trimestre 157.970 134.353 95.263 95.813 103.022 63.030 119.118 99.463 118.856 124.374
III Trimestre 108.271 94.461 98.600 89.690 65.231 72.637 94.455 85.053 89.765 94.885
IV Trimestre 122.345 77.162 109.403 95.648 85.283 75.971 87.642 84.360 88.403 88.097

Esta serie ten estacionalidade trimestral, polo que se considera p=4. Como p é par, primeiro calcúlanse as medias móbiles de orden p-1=3 e p+1=5.

Por exemplo, para o segundo trimestre de 2007 a media móbil de orden 3 calcúlase como a media aritmética do primeiro, segundo e terceiro trimestre de 2007, é dicir como (147.410 + 157.970 + 108.271)/3 = 137.884. Analogamente para o terceiro trimestre de 2007 a media móbil de orden tres viría dada por (157.970 + 108.271 + 122.345)/3 = 129.529. Operando de maneira similar para todo o período considerado, obtéñense as seguintes medias móbiles de orden 3:

Medias móbiles de orden 3

2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
I Trimestre - 129.336 82.900 107.092 100.310 78.021 100.346 99.114 104.428 109.798
II Trimestre 137.884 120.041 90.046 100.521 90.171 73.806 106.507 98.251 106.230 111.959
III Trimestre 129.529 101.992 101.089 93.717 84.512 70.546 100.405 89.625 99.008 102.452
IV Trimestre 120.642 82.663 108.021 95.866 78.755 84.852 97.445 93.161 98.262 -

De xeito análogo a como se calcularon as medias móbiles de orden 3 calcúlanse as de orden 5. Por exemplo, para o terceiro trimestre de 2007 esta calcularíase como: (147.410 + 157.970 + 108.271 + 122.345 + 131.309)/5 = 133.461

Medias móbiles de orden 5

2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
I Trimestre - 118.148 88.352 101.913 91.170 74.386 93.626 95.370 97.621 102.809
II Trimestre - 111.926 91.341 101.323 90.289 76.534 96.627 93.351 98.291 102.475
III Trimestre 133.641 102.712 99.121 99.894 88.309 80.667 103.480 97.837 104.742 -
IV Trimestre 130.850 95.503 103.028 97.286 80.463 87.341 102.183 99.560 107.603 -

Finalmente, para calcular as medias móbiles de orden 4 promédianse, para cada trimestre, as correspondentes medias móbiles de orden 3 e de orden 5. Por exemplo, para o terceiro trimestre de 2007 a media móbil de orden 4 é: (129.529 + 133.641)/2 = 131.945.

Medias móbiles de orden 4

2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
I Trimestre - 123.742 85.626 104.503 95.740 76.204 96.986 97.242 101.024 106.303
II Trimestre - 115.984 90.694 100.922 90.230 75.170 101.567 95.801 102.260 107.217
III Trimestre 131.495 102.352 100.105 96.806 86.411 75.607 101.943 93.731 101.875 -
IV Trimestre 125.746 89.068 105.525 96.576 79.609 86.097 99.814 96.360 102.932 -

Na representación gráfica da serie resultante pódese observar como a serie das medias móbiles é máis suave que a serie orixinal.

Análise da compoñente estacional

As variacións estacionais son oscilacións que normalmente se producen cun período igual ou inferior ao ano e que son recoñecibles nos diferentes anos. Para estudar o movemento real ou tendencia dunha serie, é necesario eliminar previamente as flutuacións, ou variacións estacionais, presentes na serie e que encobren a evolución real do fenómeno.

Por simplicidade suporemos que a serie de datos é mensual. Denotarase por xij o dato da serie correspondente ao mes j (j=1,2,..., 12) do ano i (i=1,2, ..., n)

Análise da compoñente estacional. Método das relacións de medias mensuais respecto á tendencia

Os pasos a seguir son os seguintes:

  1. Calcular as medias anuais dos datos observados:

  2. Axustar as medias anuais dos datos (x ) a unha recta a+bi polo método dos mínimos cadrados. A pendente desta recta (b) representa o incremento dos valores medios anuais no transcurso dun ano. Polo tanto, supoñendo que o incremento anual se produce uniformemente ao longo de cada ano, b/12 é o incremento debido ao transcurso dun mes.

  3. Calcular as medias mensuais dos datos:

  4. Corrixir as medias mensuais restando a cada unha delas a proporción do incremento anual:

    Como en xaneiro aínda non transcorreu ningún mes, a media mensual corrixida coincide coa media mensual. Porén, en Febreiro hai que descontarlle á media mensual a parte do efecto total do transcurso dun ano correspondente ao mes de xaneiro. É dicir, hai que restarlle á media orixinal a doceava parte do incremento anual (b/12). En marzo habería que restarlle dúas doceavas partes do incremento anual (2b/12) e así sucesivamente.

  5. Calcular a media global corrixida (x'·· ) como a media aritmética das medias mensuais corrixidas.

  6. Obter a compoñente estacional. Neste caso hai que distinguir entre se o modelo aditivo ou multiplicativo
    • Modelo aditivo: neste caso a compoñente estacional calcúlase como sij = x'·j - x'··
    • Modelo multiplicativo: o índice de variación estacional obtense como o cociente entre a media mensual corrixida e a media global corrixida, é dicir:

Exemplo: na seguinte táboa móstranse os matrimonios que tiñan pensado fixar a súa residencia en Galicia nos últimos 8 anos con datos definitivos.

2008 2009 2010 2011 2012 2013 2014 2015
Xaneiro 261 283 254 286 235 277 284 284
Febreiro 352 356 304 307 297 310 374 326
Marzo 533 464 465 431 519 440 400 370
Abril 618 574 582 581 555 469 461 482
Maio 1.333 1.173 1.071 835 827 835 863 948
Xuño 1.125 1.055 1.041 942 1.197 1.002 928 1.024
Xullo 1.376 1.272 1.531 1.546 1.200 1.104 1.120 1.258
Agosto 1.909 1.579 1.361 1.366 1.367 1.397 1.545 1.465
Setembro 1.455 1.358 1.392 1.324 1.468 1.225 1.215 1.292
Outubro 962 951 966 752 799 664 692 832
Novembro 446 428 372 400 467 364 408 412
Decembro 423 360 368 394 489 404 430 451
Medias anuais 899 821 809 764 785 708 727 762

A continuación obterase a compoñente estacional polo método das relacións medias mensuais con respecto á tendencia.

Unha vez calculadas as medias anuais dos datos, o seguinte paso é axustalas a unha recta polo método dos mínimos cadrados.

i i2 Medias anuais
(x)
i*x
2008 1 1 899 899
2009 2 4 821 1.642
2010 3 9 809 2.427
2011 4 16 764 3.055
2012 5 25 785 3.925
2013 6 36 708 4.246
2014 7 49 727 5.087
2015 8 64 762 6.096
n=8 (anos) Si=36 Si2=204 Sx=6.274 Six=27.376

Entón a recta de axuste é: 876 -20i

A continuación calcúlanse as medias mensuais dos datos e as correspondentes medias mensuais corrixidas:

Mes j media mensual
(x·j )
media mensual
corrixida (x'·j )
Compoñente estacional 
(nodelo aditivo)
Xaneiro 1 271 271 -523
Febreiro 2 328 330 -464
Marzo 3 453 456 -338
Abril 4 540 545 -248
Maio 5 986 992 199
Xuño 6 1.039 1.048 254
Xullo 7 1.301 1.311 517
Agosto 8 1.499 1.511 717
Setembro 9 1.341 1.355 561
Outubro 10 827 843 49
Novembro 11 412 429 -365
Decembro 12 415 434 -360
x'··= 794

Por exemplo, a media mensual para febreiro calcúlase como: x·2 = 1/8(352 + 356 + 304 + 307 + 297 + 310 + 374 +326) = 328 e a media mensual corrixida como x'·2 = x·2 - (1/12)*b = 328 - (1/12)*(-20) = 330

Unha vez calculadas as medias mensuais corrixidas, a media global corrixida obtense como promedio das anteriores, é dicir: x'·· = 1/12 (271 + 330 + 456 + 545 + 992 + 1.048 + 1.311 + 1.511 + 1.355 + 843 + 429 + 534) = 794

Finalmente para cada mes, e supoñendo que o modelo é aditivo, calcúlase a compoñente estacional como a diferenza entre a correspondente media mensual corrixida e a media global corrixida. Por exemplo, para o mes de febreiro a compoñente estacional ven dada por: si2= x·2 - x'·· = 330 - 794 = -464

A compoñente estacional que se mostra na gráfica anterior ten un marcado balance positivo nos meses de verán, sobre todo en agosto. Porén, os meses de inverno presentan unha compoñente estacional negativa moi forte, é dicir, son os meses nos que se celebra un menor número de matrimonios.

Análise da compoñente estacional. Método das medias móbiles

O método das medias móbiles para a análise da compoñente estacional consiste en:

  1. Obter a compoñente extraestacional da serie (Eij) facendo un axuste da serie orixinal empregando medias móbiles con p=12, sempre e cando a serie dos datos sexa mensual. ¿Cómo calcular as medias móbiles de orden p?
  2. Calcular a compoñente estacional estimada s·j:
    • Se o modelo é aditivo: s·j = x·j - E·j
    • Se o modelo é multiplicativo:

Exemplo: neste exemplo calcularase a compoñente estacional da serie de matrimonios mediante o método das medias móbiles.

Como p=12 é un número par, primeiro hai que calcular as medias móbiles de orden p-1=11 e p+1=13.

Medias móbiles de orden 11

2008 2009 2010 2011 2012 2013 2014 2015
Xaneiro - 827 763 713 715 720 669 702
Febreiro - 769 759 730 700 696 644 676
Marzo - 781 759 727 704 690 673 699
Abril - 817 799 760 769 729 723 753
Maio - 863 848 794 805 747 753 792
Xuño 943 863 849 797 812 735 754 790
Xullo 957 870 859 807 835 747 767 805
Agosto 951 861 858 801 833 744 759 -
Setembro 935 846 843 788 814 738 752 -
Outubro 921 836 830 783 804 732 744 -
Novembro 852 783 785 757 771 698 709 -
Decembro 856 784 766 747 738 685 711 -

Medias móbiles de orden 13

2008 2009 2010 2011 2012 2013 2014 2015
Xaneiro - 904 861 840 816 787 738 777
Febreiro - 919 868 827 803 802 771 804
Marzo - 877 854 824 810 791 757 784
Abril - 838 824 775 770 729 716 755
Maio - 797 779 732 748 696 697 733
Xuño - 790 774 733 755 691 702 736
Xullo 852 777 769 723 746 675 693 -
Agosto 859 779 773 724 752 682 696 -
Setembro 868 787 783 740 763 689 696 -
Outubro 871 797 791 750 759 691 702 -
Novembro 914 835 811 769 780 721 739 -
Decembro 892 825 801 796 794 728 752 -

Medias móbiles de orden 12

2008 2009 2010 2011 2012 2013 2014 2015
Xaneiro - 865 812 776 766 753 703 740
Febreiro - 844 813 778 751 749 708 740
Marzo - 829 806 776 757 740 715 741
Abril - 827 811 767 770 729 720 754
Maio - 830 813 763 777 721 725 763
Xuño - 827 812 765 783 713 728 763
Xullo 905 824 814 765 790 711 730 -
Agosto 905 820 815 762 792 713 727 -
Setembro 902 817 813 764 788 714 724 -
Outubro 896 816 811 766 781 712 713 -
Novembro 883 809 798 763 776 710 724 -
Decembro 874 804 784 772 766 707 731 -

Unha vez calculadas as medias móbiles de orden p=12 e supoñendo que o modelo é aditivo, calcúlanse a estimación da compoñente estacional como: s·j = x·j - E·j

Por exemplo, para o mes de xaneiro x·1 = 1/8(261 + 283 + 254 + 286 + 235 + 277 + 284 + 284) = 271 e E·1 = 1/7(865 + 812 + 776 + 766 + 753 + 703 + 740) = 774, polo que s·1 = 271 - 774 = -503

Media mensual
x·j
E·j s·j
Xaneiro 271 774 -503
Febreiro 328 769 -441
Marzo 453 766 -314
Abril 540 768 -228
Maio 986 770 215
Xuño 1.039 770 269
Xullo 1.301 791 510
Agosto 1.499 791 708
Setembro 1.341 789 552
Outubro 827 786 41
Novembro 412 780 -368
Decembro 415 777 -362