Spektrální analýza časových řad

Autor: JAKUB

Časová řada je série dat měřených v pravidelných intervalech času. Spektrální analýza převádí tuto časovou řadu (signál) z časové domény do frekvenční domény. Jinými slovy, rozloží signál na různé frekvence (tóny) a ukáže, jak silně se každá frekvence vyskytuje. K tomuto účelu se často používá matematická metoda zvaná Fourierova transformace. Tato metoda rozloží složitý vlnový tvar na jednodušší vlny (sinusové a kosinusové vlny) různých frekvencí. Výstupem spektrální analýzy je spektrum, což je graf, který ukazuje, jak silně se každá frekvence vyskytuje v původním signálu.

Představme si, že máme signál skládající se ze dvou sinusových vln o frekvencích 5 a 20 Hz. Vykreslíme jej a pak provedeme analýzu spektra. 

Nahoře tedy vidíme signál, který má jistý průběh. Na spodním obrázku je spektrum. Zatím si jednoduše povězme, že jsme ve spektru identifikovali dvě složky. 0,1 tady představuje 100 Hz. My máme složky 5 a 20 Hz. Amplitudu zatím nechme tak, tím se budeme zabývat později, takže skutečnost, že první složka je ve spodním grafu vyšší než druhá necháme zatím stranou.

Na obrázku výše máme již diskrétní časovou řadu. Takže jsme měřili nějakou veličinu v izolovaných bodech. Asi jste si všimli, že se tam pořád opakuje jeden vzor, a v grafu je devětkrát. Ten vzor je pořád stejný, naprosto. Pod časovou řadou je spektrum. Všimněte si, že to spektrum je již tvořeno 4 složkami (máme tam čtyři hroty). Ale všechny jsou stejné, stejně vysoké.

V reálu ovšem, když něco měříme, třeba úrodu pšenice, hodnoty nejsou každou sezónu naprosto stejné, to je jasné. Takže z reálně naměřených dat nedostaneme vždycky přesně periodická data. Takže se koukněme na obrázky níže.

Všimněme si, že tentokrát již není vlnka naprosto přesná. Je tam celá spousta bodů, které jsou naměřeny mimo ni. Ale opticky vidíme, že tam ten tvar vlnky nějak je, přibližně. Koukněte na spektrum. Tam je pouze jedna složka obrovská. Ano, protože nám data připomínají základní sinusoidu, která je tvořena jednou frekvenční složkou. V prvním příkladu byly ve spektru dvě frekvenční složky, taky už byl ale tvar časové řady / signálu složitější. Ale pozor, tím, že ta naše poslední časová řada není úplně přesně vlnka, není v ní pouze jedna složka, ale nepatrně se tam objevují i jiné. Koukněte na obrázek spektra pořádně, klidně si jej můžete zvětšit. Mimo náš hroz nejsou všechny hodnoty nulové. Po celé ose se objevuje spousta nepatrných odchylek od nuly.

Nyní se podíváme na ještě více reálná data. To, co jsme "naměřili" nyní, není ještě úplně reálná situace, i když v některých technologických případech by to mohla být reálná data. 

Zde vidíme, že data jsou už více rozházená. Už nám nepřipomínají sinusoidu. Ale to ještě neznamená, že tam žádná není. Právě z tohoto důvodu spektrální analýza existuje. Koukněme na graf spektra. Jsou tam dvě výrazné frekvenční složky a pak spousta nějakých mini kopečků po celé ose. Zde narážíme konečně na to, že některé složky jsou výraznější než jiné. První (zleva) je skutečně výrazná, druhá trochu menší. A to je vlastně takový "výkon" či "síla" té složky. Jinými slovy, jak významnou roli v našich datech tato složka hraje. Asi teď někteří ještě nevíte, co to melu, ale postupně se to dozvíte. Lepší je ale jeden obrázek než tisíc slov. Níže uvádím naprosto stejná data, akorát Vám ukážu tu periodicitu. 

Tady konečně vidíme, o čem jsem celou dobu mluvil. Naše data jsou při troše přimhouření oka pediodická, a to přesně podle naší zakroužkované složky. Ta způsobuje tuto periodičnost. Takže nyní asi už víme, k čemu to celé je. Ale asi něteří ještě netuší, proč vůbec chceme nějakou periodu nacházet. K tomu se taky dostaneme:).

Všimněme si, že nyní máme v časové řadě zobrazeny dvě periody. Poznáte, které je která? A proč jsou tam vlastně dvě? Tak červená je 0,05, ta je nejvýznamnější. Zelená má větší periodu, tedy menší frekvenci, takže nutně to musí být složka, která je ve spektru více vlevo, takže zleva první vysoký kopeček. Dala by se brát v potaz jako důležitá i další, která je mezi 0,15 a 0,20. Takže těch period máme v datech více. Teď ale které jsou významné, jak to vlastně poznat?

Není to úplně triviální úkol. Nemůžeme si to určovat, jak se nám zlíbí. Existuje na tuto problematiku spousta nástrojů. Ukážeme si některé z nich.