「計量時系列分析」読解メモ①（Ch_1 時系列分析の基礎概念）｜時系列分析の基礎を学ぶ #3

f:id:lib-arts:20190710004835p:plain

強化学習などについて取り扱っていくにあたり、通常の時系列データについての取り扱いも一度まとめておく方が良さそうなので時系列分析の基本についてまとめていきます。
#1では時系列データとはどのようなデータであるかやモデリングにおいて重要になる定常過程について、#2ではモデリングにおいてよく用いられるAR、MA、ARMAについてご紹介しました。

#3以降では時系列分析の入門本として評判の良い、「経済・ファイナンスデータの計量時系列分析」について取り扱います。

朝倉書店｜経済・ファイナンスデータの計量時系列分析

#3では1章の時系列分析の基礎概念について取り扱います。
以下目次になります。（一旦概要を掴むにあたり、1.4は飛ばしました）

1. 時系列分析の基礎概念（Ch_1）
1-1. 時系列分析の基礎（1.1）
1-2. 定常性（1.2）
1-3. ホワイトノイズ（1.3）
2. まとめ

1. 時系列分析の基礎概念（Ch_1）
本の1章では時系列分析の考え方と基礎的な概念について紹介されています。特に定常性と自己相関に関して、時系列分析の中心的な役割を果たす概念とされています。
したがって下記の読解メモも定常性と自己相関の概要の把握についてを優先度高めでまとめていけたらと思います。

1-1. 時系列分析の基礎（1.1の簡単な要約）
・時系列分析の目的
時系列データ(time series data)は時間の推移とともに観測されるデータのことで、観測される順序に意味があることが大きな特徴である。順序が意味を持つというのがここで重要であり、ある一時点において複数の変数が観測されるクロスセクションデータ(cross section data)とは対照的である。
時点1からTまでのデータが観測されたとすると時系列データは $\bigl\{ y_{t}\bigr\}_{t=1}^T$ のように表記される。
時系列分析の目的は、時系列データが持っている多様な特徴を記述できるモデルを構築することであり、そしてそれらのモデルを基に目的に目的に応じた分析を行う。具体的な目的については下記のように挙げられる。

1) 時系列データに関して何らかの予測を行うこと
2) 変数間の動学的関係を明らかにすること
3) 経済理論やファイナンス理論を検証すること

・時系列データの種類
時系列データそのものは原系列と呼ばれることが多い。時系列分析の目的は、ほとんどの場合この原系列の性質を明らかにすることであるが、実際の解析は原系列に何らかの変換を施した系列に対して行われることも少なくはない。以下そのようなの変換を施した系列に関して整理しておく。

1) 対数系列（系列データに対数変換を施したもの $log y_{t}$ ）
2) 差分系列（1時点離れたデータとの差を求めたもの、階差系列とも呼ばれる。 $\Delta y_{t}$ ）
3) 対数差分系列（ $\Delta log y_{t}$ ）
4) 季節調整済み系列（seasonally adjusted series; 原系列から季節変動を除いたもの）

・基本統計量と時系列モデル
期待値(expectation)、平均(mean)、分散(variance)、標準偏差(standard deviation)などが基本統計量にあるが、基本的に一般的な意味と同じである。ファイナンスの分野では、標準偏差のことをボラタリティ(volatality)と呼ぶことが多く、リスクを計測する重要な指標として用いられる。
以下時系列モデルに特有の統計量である、自己共分散(autocovariance)、自己相関係数(autocorrelation coefficient)と自己相関係数をグラフに描いたコレログラム(correlogram)についてまとめる。
まず、自己共分散だが、同一の時系列データにおける異時点間の共分散である。具体的にはk次の自己共分散は下記のように定義される。
$\gamma_{k,t}=Cov(y_{t},y_{t-k})=E[(y_{t}-\mu_{t})(y_{t-k}-\mu_{t-k})$ ]
この自己共分散を解釈するにあたって、値が単位に依存してしまうので、変数間の関係の強弱を測るにあたっては、自己共分散を基準化した自己相関係数を用いる。k次の自己相関係数は下記のように定義できる。
$\rho=Corr(y_{t},y_{t-k})=\frac{Cov(y_{t},y_{t-k})}{\sqrt{Var(y_{t})Var(y_{t-k})}}=\frac{\rho_{k,t}}{\sqrt{\rho_{0,t}\rho_{0,t-k}}}$
この自己相関係数をラグであるkに着目して、可視化を行なったのがコレログラムである。

f:id:lib-arts:20190710013714p:plain

Correlogram - Wikipedia

上記がコレログラムの例である。横軸はラグを表すkが用いられている。

1-2. 定常性（1.2の簡単な要約）
様々な時系列モデルを紹介するにあたって、その根幹にあるのが定常性(stationarity)という概念である。定常的な仮定の下で基礎的な時系列モデルが構築され、それに基づいて非定常ばモデルが構築される。
定常性は、同時分布や基本統計量の時間不変性に関するものであり、何を不変とするかによって、弱定常性(weak stationarity)と強定常性(strict stationarity)の二つに分類される。以下に弱定常性と強定常性の定義をまとめる。

・弱定常性の定義
任意のtとkに関して、
$E(y_{t})=\mu$
$Cov(y_{t},y_{t-k})=E\bigl[(y_{t}-\mu)(y_{t-k}-\mu)\bigr]=\gamma_{k}$
が成立する場合、過程は弱定常(weak stationary)といわれる。

上記のように、弱定常性においては、自己共分散が時間差kにのみ依存する。これを共分散定常性(covariance stationarity)と呼ぶこともある。

・強定常性の定義
任意のtとkに対して、 $\mathbf{y}'=(y_{t},y_{t+1},...,y_{t+k})'$ の同時分布が同一となる場合、過程は強定常(strict stationary)といわれる。ここで $\mathbf{y}'$ はベクトル $\mathbf{y}$ の転置を表す。

このように定義される強定常性は弱定常性に比べ非常に強い仮定であるため、経済・ファイナンスの時系列分析では定常性に言及する際は暗に弱定常性を仮定することが多い。

1-3. ホワイトノイズ（1.3の簡単な要約）
最も基礎的な強定常過程としては、iid系列がある。iidとはindependently and identically distributedの略である。これは各時点のデータが互いに独立で、かつ同一の分布に従うことを意味している。
$\bigl\{y_{t}\bigr\}$ が期待値 $\mu$ 、分散 $\sigma^2$ のiid系列であることを以下 $y_{t}〜iid(\mu,\sigma^2)$ で表記していくとする。iid系列自体が経済・ファイナンスデータの時系列モデルとして用いられることは少ないが、期待値0のiid系列は時系列モデルの撹乱項(innovation, disturbance term)、すなわち時系列モデルにおいて確率的変動を表現する部分として用いることができる。
しかしながら、独立性や同一分布性は非常に強い仮定であり、必ずしも分析に必要となるものではない。したがってもう少し弱い仮定しか必要とせず、モデルの撹乱項として用いることができるものがあれば便利である。これがホワイトノイズである。以下ホワイトノイズの定義を記述する。

・ホワイトノイズの定義
全ての時点tにおいて、
$E(\epsilon_{t})=0$
$\gamma_{k}=E(\epsilon_{t},\epsilon_{t-k})=\sigma^2(k=0)｜0(k \neq 0)$
が成立するとき、 $\epsilon_{t}$ はホワイトノイズ(white noise)と呼ばれる。