「計量時系列分析」読解メモ④(Ch_2 ARMA過程③)|時系列分析の基礎を学ぶ #6

f:id:lib-arts:20190710004835p:plain

連載経緯は#1に記しました。

#1では時系列データとはどのようなデータであるかやモデリングにおいて重要になる定常過程について、#2ではモデリングにおいてよく用いられるAR、MA、ARMAについてご紹介しました。

#3以降では時系列分析の入門本として評判の良い、「経済・ファイナンスデータの計量時系列分析」について取り扱っています。

朝倉書店|経済・ファイナンスデータの 計量時系列分析

#3では1章の時系列分析の基礎概念について、#4では2.1のARMA過程の性質まで、#5では2.3のARMAモデルの推定までを取り扱いました。

#6では2.4のARMAモデルの選択について取り扱います。
以下目次になります。

1. ARMAモデルの選択(2.4)
1-1. モデル候補の選択(2.4.1)
1-2. 情報量基準(2.4.2)
1-3. モデルの診断(2.4.3)
2. まとめ


1. ARMAモデルの選択(2.4)
2.4では真のモデルが定常かつ反転可能なARMA(p,q)過程であるとして、与えられたデータに対して最適なARMAモデルを決定する方法を議論する。ARMA過程の選択の問題は、Box and Jenkins(1976)が原型を作り、ここでもその考え方を基礎とする。また、近年(執筆当時の2010年頃)では、最終的なモデル選択は情報量基準で行うのが一般的であるので、情報量基準についても述べる。

 

1-1. モデル候補の選択(2.4.1の簡単な要約)
ARMAモデルの選択は、標本自己相関や以下で述べる標本偏自己相関を用いてモデルの候補を選択することから始めることが多い。最終的には情報量基準を用いてモデル選択を行うのであるが、ARMAモデルの場合は、選択する字数が二つあるため、最初に考えられるモデルを絞る方が効率良い。
モデル候補の選択の際に重要となるツールとなるのが標本自己相関関数と偏自己相関(partial autocorrelation)である。

・標本自己相関関数
標本自己相関関数は本の(1.10)に記載されているので、(1.10)を以下に示す。
\hat{\rho}_{k}=\frac{\hat{\gamma}_{k}}{\hat{\gamma}_{0}}
上記が標本自己相関である。またこの際に\hat{\gamma}_{k}は下記のように定義されていることに注意が必要である。
\hat{\gamma}_{k}=\frac{1}{T}\sum_{t=k+1}^T(y_{t}-\bar{y})(y_{t-k}-\bar{y})
またこのとき、\bar{y}=\frac{1}{T}\sum_{t=1}^Ty_{t}である。
ここでモデルの特性について考えた際に、AR過程とARMA過程については自己相関関数の絶対値が指数的に減衰していったのに対し、MA(q)家庭の自己相関はq+1次以降0になるという性質があったことについて考えると、標本の自己相関がq+1次で切断されそれ以降0に近い値を取っている場合はMA(q)過程の可能性が高いと考えることができる。
したがって、標本自己相関関数を考慮することで、MA過程を用いるかどうかについて判断することができる。一方で、標本自己相関だけではAR過程とARMA過程の区別が難しい。その区別に役立つのが以下でまとめる偏自己相関である。

・偏自己相関(partial autocorrelation)
k次偏自己相関はy_{t}y_{t-k}からy_{t-1},...,y_{t-k+1}までの影響を取り除いたものの間の相関を考えたものである。すなわち、y_{t}y_{t-k}y_{t-1}y_{t-2}を通じて相関している可能性があるので、間にあるデータの影響を取り除いた上でy_{t}y_{t-k}の相関を評価したものがk次偏自己相関である。
AR(p)モデルの場合p+1次以降の偏自己相関は0になるのに対して、MA過程はAR(∞)過程で書き直すことができ、無限の偏自己相関を持つ。またその絶対値は指数的に減衰していく。同様にARMA過程の偏自己相関も指数的に減衰していく。

f:id:lib-arts:20190713170931p:plain
ここまでの話は上記のようにまとめることができる。

 

1-2. 情報量基準(2.4.2の簡単な要約)
情報量基準(information criterion)は最尤法の推定結果を基に最適なモデルを選択する客観的な基準であり、一般的に
IC = -2L(\hat{\theta})+p(T)k
で定義される。このときL(\hat{\theta})は対数尤度を最尤推定値で評価した最大対数尤度、Tはモデルの推定に用いた標本数、p(T)はTの何らかの関数、kは推定したパラメータの数である。
一般的に情報量基準は2つの部分からなり、第1項はモデルのあてはまりを表し、第2項はモデルが複雑になることに対するペナルティを表すとみなすことができる。パラメータを追加することに対して、第1項と第2項との間でトレードオフが生じるので、モデルが複雑になることを防ぐことができる。
情報量基準は客観的な基準であるが、ペナルティ関数の選択には主観的な部分もあり、このペナルティ関数の違いによって複数の情報量基準が存在する。以下、最もよく用いる2つの情報量基準を紹介する。

赤池情報量基準(AIC; Akaike Information Criterion)
AIC = -2L(\hat{\theta})+2k
AICは上記のように定義できる。ICの数式において、p(T)=2としたものと考えることができる。

・Schwarz情報量基準(SIC)/ベイズ情報量基準(BIC)
SIC=-2L(\hat{\theta})+log(T)k
SIC(BIC)は上記のように定義される。つまりSICはICの数式において、p(T)=log(T)としたものであると考えられる。


AICやSICはARMAモデルではなく、後の章で議論するより複雑なモデルに関しても適用が可能である。しかしながら、そのような複雑なモデルに関して、AICやSICを用いた時にどのような性質があるのかは一般的にわかっておらず、慣例として用いられていることが多いのが現状である。


1-3. モデルの診断(2.4.3の簡単な要約)
概要を掴むにあたって一旦省略します。


2. まとめ
#6では2.4のモデルの選択について取り扱いました。標本自己相関、偏自己相関などに着目して情報量基準をベースに最適なモデルを選択すると一旦抑えておくと良さそうです。
#7からは3章の予測に入っていきます。