寫給你的(de)金融時(shí)間序列分(fēn)析:基礎篇

發布時(shí)間:2017-05-17  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:本文爲系列第一篇:介紹金融時(shí)間序列的(de)特性和(hé)進行時(shí)間序列分(fēn)析的(de)目的(de);解釋時(shí)間序列分(fēn)析中的(de)核心概念:自相關性。


1 引言


時(shí)間序列分(fēn)析(time series analysis)是量化(huà)投資中的(de)一門基本技術。時(shí)間序列是指在一定時(shí)間内按時(shí)間順序測量的(de)某個(gè)變量的(de)取值序列。比如變量是股票(piào)價格,那麽它随時(shí)間的(de)變化(huà)就是一個(gè)時(shí)間序列;同樣的(de),如果變量是股票(piào)的(de)收益率,則它随時(shí)間的(de)變化(huà)也(yě)是一個(gè)時(shí)間序列。時(shí)間序列分(fēn)析就是使用(yòng)統計的(de)手段對(duì)這(zhè)個(gè)序列的(de)過去進行分(fēn)析,以此對(duì)該變量的(de)變化(huà)特性建模、并對(duì)未來(lái)進行預測。


時(shí)間序列分(fēn)析試圖通(tōng)過研究過去來(lái)預測未來(lái)。


時(shí)間序列分(fēn)析在工程學、經濟學、氣象學、金融學等衆多(duō)領域有著(zhe)廣泛的(de)應用(yòng)。在金融學領域,介紹時(shí)間序列分(fēn)析的(de)優秀書(shū)籍層出不窮。其中最家喻戶曉之一的(de)要數美(měi)國芝加哥(gē)大(dà)學商學院 Ruey S. Tsay 教授撰寫的(de)金融時(shí)間序列分(fēn)析——Analysis of Financial Time Series(下(xià)圖,該書(shū)也(yě)同時(shí)有中文版)。


f1.png


金融時(shí)間序列分(fēn)析要求使用(yòng)者具備一定的(de)高(gāo)等數學知識。特别是其中一些高(gāo)級的(de)模型,如分(fēn)析波動率的(de) ARCH/GARCH 模型、極值理(lǐ)論、連續随機過程、狀态空間模型等都對(duì)使用(yòng)者的(de)數學水(shuǐ)平有著(zhe)極高(gāo)的(de)要求。因此,在很多(duō)人(rén)眼中,金融時(shí)間序列分(fēn)析無疑帶著(zhe)厚厚的(de)面紗,令人(rén)望而卻步。然而,如果學習(xí)的(de)目的(de)是爲了(le)解金融時(shí)間序列的(de)特點、熟悉金融時(shí)間序列分(fēn)析的(de)目的(de)、并使用(yòng)線性但非常實用(yòng)的(de)模型(比如 ARMA 模型)對(duì)金融時(shí)間序列進行預測并以此制定量化(huà)策略,那麽隻要具備簡單的(de)統計學基礎,就完全能夠實現這(zhè)些目标。


出于這(zhè)個(gè)目的(de),從本周開始,量化(huà)核武研究這(zhè)個(gè)專題下(xià)将推出四篇文章(zhāng),深入淺出的(de)介紹金融時(shí)間序列分(fēn)析的(de)相關知識。該系列不會涉及上面提到的(de)那些高(gāo)級模型;相反的(de),本系列以對(duì)股票(piào)收益率建模并構建投資策略爲目标,按部就班的(de)把實現這(zhè)個(gè)目标所需要的(de)每一塊“積木(mù)”清晰地呈獻給讀者。這(zhè)四篇文章(zhāng)的(de)結構爲:


基礎篇(本文):介紹金融時(shí)間序列的(de)特性和(hé)進行金融時(shí)間序列分(fēn)析的(de)目的(de);解釋時(shí)間序列分(fēn)析中的(de)核心概念:序列相關性(又稱自相關性)。

 

初級篇說明(míng)時(shí)間序列建模的(de)過程;介紹時(shí)間序列分(fēn)析中的(de)最基本模型:白噪聲和(hé)随機遊走。


進階篇介紹時(shí)間序列分(fēn)析中常用(yòng)的(de)線性模型:AR、MA、ARMA 等。


應用(yòng)篇利用(yòng) ARMA 對(duì)上證指數收益率序列建模,并以此産生交易信号、構建投資策略,以此展示時(shí)間序列分(fēn)析在量化(huà)投資領域的(de)應用(yòng)。


本系列文章(zhāng)會避免過多(duō)羅列晦澀難懂(dǒng)的(de)大(dà)數學(但會涉及必要的(de)數學知識),希望帶你走入金融時(shí)間序列分(fēn)析的(de)大(dà)門,爲你今後學習(xí)更高(gāo)級的(de)模型奠定一些基礎。這(zhè)是寫給你的(de)金融時(shí)間序列分(fēn)析。


2 金融時(shí)間序列分(fēn)析


爲了(le)避免下(xià)文中涉及的(de)概念過于抽象,我們假設本文討(tǎo)論的(de)金融時(shí)間序列爲投資品的(de)收益率序列


金融時(shí)間序列分(fēn)析考慮的(de)是金融變量(比如投資品收益率)随時(shí)間演變的(de)理(lǐ)論和(hé)實踐。任何金融時(shí)間序列都包含不确定因素,因此統計學的(de)理(lǐ)論和(hé)方法在金融時(shí)間序列分(fēn)析中至關重要。金融資産的(de)時(shí)間序列常被看作是未知随機變量序列随時(shí)間變化(huà)的(de)一個(gè)實現。通(tōng)常假設該随機變量序列僅在時(shí)間軸上的(de)離散點有定義,則該随機變量序列就是一個(gè)離散随機過程。比如股票(piào)的(de)日收益率就是離散的(de)時(shí)間序列。在量化(huà)投資領域,我們的(de)目标是通(tōng)過統計手段對(duì)投資品的(de)收益率這(zhè)個(gè)時(shí)間序列建模,以此推斷序列中不同交易日的(de)收益率之間有無任何特征,以此來(lái)預測未來(lái)的(de)收益率并産生交易信号。


一個(gè)時(shí)間序列可(kě)能存在的(de)特征包括以下(xià)幾種:


趨勢:趨勢是時(shí)間序列在某一方向上持續運動(比如牛市時(shí)股市每天都在上漲,股票(piào)收益率持續爲正;熊市時(shí)股市每天都在下(xià)跌,股票(piào)收益率持續爲負)。趨勢經常出現在金融時(shí)間序列中,特别是大(dà)宗商品價格;許多(duō)商品交易顧問(CTA)基金在他(tā)們的(de)交易算(suàn)法中都使用(yòng)了(le)複雜(zá)的(de)趨勢識别模型。


季節變化(huà):許多(duō)時(shí)間序列中包含季節變化(huà)。在金融領域,我們經常看到商品價格的(de)季節性變化(huà),特别是那些與生長(cháng)季節或溫度變化(huà)有關的(de)商品,比如天然氣。


序列相關性:金融時(shí)間序列的(de)一個(gè)最重要特征是序列相關性(serial correlation),又稱爲自相關性(autocorrelation)。以投資品的(de)收益率序列爲例,我們會經常觀察到一段時(shí)間内的(de)收益率之間存在正相關或者負相關。此外,波動聚類(volatility clustering)也(yě)是一種序列相關性,它意味著(zhe)高(gāo)波動的(de)階段往往伴随著(zhe)高(gāo)波動的(de)階段出現、低波動的(de)階段往往伴随著(zhe)低波動的(de)階段出現,這(zhè)在量化(huà)投資中尤爲重要。比如下(xià)圖爲 2001 年到 2017 年上證指數日收益率的(de)标準差,從中可(kě)以清晰的(de)看到波動聚類。


f2.png


随機噪聲:它是時(shí)間序列中除去趨勢、季節變化(huà)和(hé)自相關性之後的(de)剩餘随機擾動。由于時(shí)間序列存在不确定性,随機噪聲總是夾雜(zá)在時(shí)間序列中,緻使時(shí)間序列表現出某種震蕩式的(de)無規律運動。


量化(huà)投資的(de)交易者的(de)目标是利用(yòng)統計建模來(lái)識别金融時(shí)間序列中潛在的(de)趨勢、季節變化(huà)和(hé)序列相關性。利用(yòng)一個(gè)好的(de)模型,金融時(shí)間序列分(fēn)析的(de)主要應用(yòng)包括:


預測未來(lái):爲了(le)成功交易,我們需要在統計上“準确”預測未來(lái)的(de)投資品價格或者收益率。

 

序列模拟:一旦發現了(le)金融時(shí)間序列的(de)統計特征,我們可(kě)以使用(yòng)它們來(lái)模拟時(shí)間序列并進行場(chǎng)景分(fēn)析。這(zhè)對(duì)于估計交易次數、期望交易成本、期望收益率至關重要,從而最終定量的(de)計算(suàn)一個(gè)策略或者投資組合的(de)風險分(fēn)布和(hé)盈利水(shuǐ)平。


上文說到,金融時(shí)間序列的(de)關系中,最重要的(de)當屬自相關性。這(zhè)是因爲我們很容易從一個(gè)時(shí)間序列中識别出趨勢以及季節變換。當除去這(zhè)些關系後,剩下(xià)的(de)時(shí)間序列往往看來(lái)十分(fēn)随機。然而對(duì)于金融時(shí)間序列,比如投資品的(de)收益率,看似随機的(de)時(shí)間序列中往往存在著(zhe)驚人(rén)的(de)自相關。對(duì)自相關建模并加以利用(yòng)能夠大(dà)幅提高(gāo)交易信号的(de)準确性。配對(duì)交易的(de)均值回複策略就是這(zhè)麽一個(gè)例子。均值回複策略利用(yòng)一對(duì)投資品價差序列的(de)負相關性進行投資,産生做(zuò)多(duō)或者做(zuò)空的(de)交易信号,實現盈利。


金融時(shí)間序列分(fēn)析的(de)核心就是挖掘該時(shí)間序列中的(de)自相關性。


本文的(de)下(xià)面幾節就來(lái)介紹如何計算(suàn)時(shí)間序列的(de)自相關性。爲此,首先來(lái)看兩個(gè)基礎概念:協方差和(hé)相關系數。之後會談及時(shí)間序列的(de)平穩性,它是時(shí)間序列分(fēn)析的(de)一個(gè)必要前提。最後介紹時(shí)間序列的(de)自相關性。


3 協方差和(hé)相關系數


本節介紹概率論中的(de)基礎概念:協方差和(hé)相關系數。熟悉它們的(de)讀者可(kě)跳過。假設兩個(gè)随機變量 X 和(hé) Y 滿足未知的(de)概率分(fēn)布(可(kě)以是同分(fēn)布也(yě)可(kě)以是不同的(de)分(fēn)布)。E[] 爲求解數學期望的(de)運算(suàn)符。X 和(hé) Y 的(de)總體協方差(population covariance)爲:


f3.png


其中,μ_X 和(hé) μ_Y 分(fēn)别爲 X 和(hé) Y 的(de)總體均值(population mean)


協方差告訴我們兩個(gè)随機變量是如何一起移動的(de)。


在實際中,由于總體的(de)概率分(fēn)布未知,我們隻能通(tōng)過 X 和(hé) Y 的(de)觀測值來(lái)計算(suàn)樣本均值(sample mean)。假設我們各有 X 和(hé) Y 的(de)觀測值 n 個(gè),則它們的(de)樣本協方差(sample covariance)爲:


f4.png


其中,\bar X 和(hé) \bar Y 爲 X 和(hé) Y 的(de)樣本均值。上面公式中右側之所以除以 n - 1 而非 n 的(de)原因是,這(zhè)麽做(zuò)可(kě)以保證樣本協方差是(未知)總體協方差的(de)一個(gè)無偏估計(unbiased estimator)假設我們随機生成兩個(gè)随機變量 X 和(hé) Y 的(de)序列,它們的(de)散點圖如下(xià)。


f5.png


按照(zhào)上面的(de)公式,X 和(hé) Y 的(de)樣本協方差爲 893.215203。它有什(shén)麽意義呢(ne)?在回答(dá)這(zhè)個(gè)問題之前,讓我們再來(lái)看另外兩個(gè)變量,我們稱之爲 X100 和(hé) Y100。它們分(fēn)别定義爲 X100 = 100 * X 和(hé) Y100 = 100 * Y。可(kě)見,它們僅僅是 X 和(hé) Y 各乘以 100 得(de)到的(de)。X100 和(hé) Y100 的(de)樣本協方差爲 8932152.03,這(zhè)是 X 和(hé) Y 的(de)協方差的(de) 10000 倍。然而,如果僅僅因此就得(de)出 X100 和(hé) Y100 的(de)相關性高(gāo)于 X 和(hé) Y 的(de)相關性就大(dà)錯特錯了(le)。事實上,由于 X100 和(hé) Y100 是由 X 和(hé) Y 分(fēn)别乘以 100 得(de)到的(de),因此它們之間的(de)相關性顯然和(hé) X 與 Y 的(de)相關性相同。


上面這(zhè)個(gè)例子說明(míng)使用(yòng)協方差衡量變量相關性的(de)緻命缺點:協方差是有量綱的(de),因此它的(de)大(dà)小受随機變量本身波動範圍的(de)影(yǐng)響。在上個(gè)例子中,當兩個(gè)随機變量的(de)波動範圍擴大(dà) 100 倍後,它們的(de)協方差擴大(dà)了(le) 10000 倍。因此,人(rén)們希望使用(yòng)某個(gè)和(hé)協方差有關,但是又是無量綱的(de)測量來(lái)描述兩個(gè)随機變量的(de)相關性。最簡單的(de)做(zuò)法就是用(yòng)變量自身的(de)波動對(duì)協方差進行标準化(huà)。相關系數(correlation 或者 correlation coefficient)便由此得(de)來(lái)。


令 ρ 表示 X 和(hé) Y 的(de)總體相關系數(population correlation),它的(de)定義爲:


f6.png


其中 σ_X 和(hé) σ_Y 分(fēn)别爲 X 和(hé) Y 的(de)總體标準差(population standard deviation)。通(tōng)過使用(yòng) X 和(hé) Y 的(de)标準差對(duì)它們的(de)協方差歸一化(huà),ρ 的(de)取值範圍在 -1 到 +1 之間,即 [-1, +1]:


ρ(X, Y) = 1 表示 X 和(hé) Y 之間存在确切的(de)線性正相關;


ρ(X, Y) = 0 表示 X 和(hé) Y 之間不存在任何線性相關性;


ρ(X, Y) = -1 表示 X 和(hé) Y 之間存在确切的(de)線性負相關。


值得(de)一提的(de)是,相關系數僅僅刻畫(huà) X 和(hé) Y 之間的(de)線性相關性;它不描述它們之間的(de)(任何)非線性關系。在實際中,由于總體的(de)概率分(fēn)布未知,我們隻能通(tōng)過 X 和(hé) Y 的(de)觀測值來(lái)計算(suàn) X 和(hé) Y 的(de)樣本相關系數(sample correlation)


f7.png


其中,sd(X) 和(hé) sd(Y) 分(fēn)别爲 X 和(hé) Y 的(de)樣本标準差(sample standard deviation)。在上面的(de)例子中,無論考慮 X 和(hé) Y 還(hái)是 X100 和(hé) Y100(即無論如何縮放 X 和(hé) Y),它們的(de)相關系數都是 0.894655,這(zhè)和(hé)我們的(de)預期相符。由于這(zhè)個(gè)數值非常接近 1,它意味著(zhe) X 和(hé) Y 之間存在很強的(de)線性正相關。


4 平穩性


平穩性(stationarity)是時(shí)間序列分(fēn)析的(de)基礎。


爲了(le)通(tōng)俗的(de)理(lǐ)解平穩性,來(lái)看下(xià)面這(zhè)個(gè)類比(這(zhè)是我能想到的(de)最好的(de)例子)。假如某股票(piào)的(de)日收益率由轉輪盤賭決定:轉到不同數字就對(duì)應不同的(de)收益率。在每個(gè)時(shí)刻 t,我們都轉同一個(gè)輪盤賭并确定收益率 r_t。隻要這(zhè)個(gè)輪盤不變,那麽對(duì)于所有的(de) t,r_t 的(de)概率分(fēn)布都是一樣的(de)、不随時(shí)間變化(huà)。這(zhè)樣的(de)時(shí)間序列 {r_t} 就是(嚴格)平穩的(de)。如果從某個(gè)時(shí)刻 t’ 開始,輪盤發生了(le)變化(huà)(比如輪盤上面的(de)數字變多(duō)了(le)),那麽顯然從 t ≥ t’ 開始,r_t 的(de)分(fēn)布就便随之發生變化(huà),因此時(shí)間序列 {r_t} 就不是平穩的(de)。


在數學上,時(shí)間序列的(de)嚴平穩(strictly stationary)有著(zhe)更精确的(de)定義:它要求時(shí)間序列中任意給定長(cháng)度的(de)兩段子序列都滿足相同的(de)聯合分(fēn)布。這(zhè)是一個(gè)很強的(de)條件,在實際中幾乎不可(kě)能被滿足。因此我們還(hái)有弱平穩(weakly stationary)的(de)定義,它要求時(shí)間序列滿足均值平穩性(stationary in mean)和(hé)二階平穩性(secondary order stationary)


如果一個(gè)時(shí)間序列 {r_t} 滿足以下(xià)兩個(gè)條件,則它是弱平穩的(de):


1. 對(duì)于所有的(de)時(shí)刻 t,有 E[r_t] = μ,其中 μ 是一個(gè)常數。


2. 對(duì)于所有的(de)時(shí)刻 t 和(hé)任意的(de)間隔 k,r_t 和(hé) r_(t-k) 的(de)協方差 σ(r_t, r_(t-k)) = γ_k,其中 γ_k 與時(shí)間 t 無關,它僅僅依賴于間隔 k。特别的(de),當 k = 0 時(shí),這(zhè)個(gè)特性意味著(zhe) σ(r_t, r_t) —— r_t 的(de)方差——不随時(shí)間變化(huà),等于一個(gè)與時(shí)間 t 無關的(de)常數 γ_0,這(zhè)稱爲方差平穩性(stationary in variance)


弱平穩假設對(duì)于分(fēn)析投資品收益率至關重要。


爲了(le)解釋這(zhè)一點,來(lái)看一個(gè)例子。假設我們想知道 2017 年 5 月(yuè) 16 日這(zhè)天上證指數收益率的(de)均值是多(duō)少,而我們的(de)猜想是它來(lái)自一個(gè)未知的(de)分(fēn)布。也(yě)許你會馬上說“查一下(xià) Wind 不就知道了(le)?上證指數那天的(de)收益率是 0.74%”。注意,0.74% 這(zhè)個(gè)數值僅僅是那天上證指數未知收益率分(fēn)布的(de)一個(gè)實現(realization)!它不是均值,因此從時(shí)間序列分(fēn)析的(de)角度來(lái)說僅僅知道 0.74% 遠(yuǎn)遠(yuǎn)不夠。


對(duì)于一般的(de)未知概率分(fēn)布,隻要通(tōng)過進行大(dà)量重複性實驗,就可(kě)以有足夠多(duō)的(de)獨立觀測點來(lái)進行統計推斷(計算(suàn)均值和(hé)方差這(zhè)些統計量)。按照(zhào)這(zhè)個(gè)思路,我們必須把 2017 年 5 月(yuè) 16 日這(zhè)一天經曆許多(duō)遍,得(de)到許多(duō)個(gè)那天的(de)收益率觀測值,然後用(yòng)這(zhè)些觀測值計算(suàn)出收益率的(de)均值。不幸的(de)是,曆史隻發生一次,時(shí)間也(yě)一去不複返,我們隻能實實在在的(de)經曆一遍 2017 年 5 月(yuè) 16 日,隻能得(de)到一個(gè)收益率的(de)觀測點,即 0.74%。因此這(zhè)個(gè)方法對(duì)于金融數據是行不通(tōng)的(de)。


然而,如果我們假設上證指數的(de)收益率序列滿足弱平穩,就柳暗花明(míng)了(le)。根據弱平穩假設,上證指數的(de)日收益率序列 {r_t} 的(de)均值是一個(gè)與時(shí)間無關的(de)常數,即 E[r_t] = μ。這(zhè)樣便可(kě)以利用(yòng)一段時(shí)間的(de)曆史數據來(lái)計算(suàn)出日收益率的(de)均值。比如我們可(kě)以對(duì)上證指數在 2017 年交易日的(de)日收益率序列取平均,把它作爲對(duì)總體均值 μ 的(de)一個(gè)估計。根據弱平穩性,該平均值也(yě)正是 2017 年 5 月(yuè) 16 日的(de)收益率均值。


同樣的(de)道理(lǐ),在弱平穩的(de)假設下(xià),可(kě)以根據曆史數據方便的(de)對(duì)時(shí)間序列的(de)諸多(duō)統計量進行推斷。在金融文獻中,也(yě)通(tōng)常假定投資品收益率序列是弱平穩的(de)。隻要有足夠多(duō)的(de)曆史數據,這(zhè)個(gè)假定可(kě)以用(yòng)實證方法驗證。比如,我們可(kě)以把數據分(fēn)成若幹個(gè)子集,并分(fēn)别計算(suàn)每個(gè)子集的(de)統計量,然後通(tōng)過統計的(de)手段檢驗這(zhè)些來(lái)自不同子集的(de)統計量的(de)一緻性。


需要說明(míng)的(de)是,即便是弱平穩性,有時(shí)金融數據也(yě)無法滿足。回想第二節中那個(gè)上證指數日收益率标準差的(de)圖,它清晰的(de)說明(míng),在 2001 到 2017 年之間,标準差是随時(shí)間變化(huà)的(de)。這(zhè)意味著(zhe)在這(zhè)段時(shí)間内,收益率序列不滿足二階平穩性。對(duì)于此,我們可(kě)以通(tōng)過更複雜(zá)的(de)非線性模型對(duì)波動率建模(比如 GARCH),又或者可(kě)以把時(shí)間段細分(fēn)爲更短的(de)區(qū)間,使得(de)在每個(gè)小區(qū)間内的(de)收益率序列盡量滿足弱平穩性。


有了(le)上一節和(hé)本節的(de)内容做(zuò)鋪墊,下(xià)面我們就可(kě)以聊聊時(shí)間序列的(de)自相關性了(le)。


5 自相關性和(hé)自相關函數


假設我們有弱平穩的(de)投資品收益率序列 {r_t}。自相關性考察的(de)是 t 時(shí)刻的(de)收益率 r_t 和(hé)距當前任意間隔 k 時(shí)刻的(de)收益率 r_(t-k) 之間的(de)線性相依關系(k 的(de)取值是所有 ≥ 0 的(de)整數)。由于 r_t 和(hé) r_(t-k) 來(lái)自同一個(gè)時(shí)間序列,因此我們将第三節中的(de)相關系數的(de)概念應用(yòng)到 r_t 和(hé) r_(t-k) 上,便推廣出自相關系數(autocorrelation)。


定義:r_t 和(hé) r_(t-k) 的(de)相關系數稱爲 r_t 的(de)間隔爲 k 的(de)自相關系數


在弱平穩假設下(xià),這(zhè)個(gè)間隔爲 k 的(de)自相關系數與時(shí)間 t 無關,而僅僅與間隔 k 有關,由 ρ_k 表示。由第三節中介紹的(de)相關系數的(de)定義可(kě)知:


f8.png

上面的(de)推導中用(yòng)到了(le)弱平穩的(de)性質,即協方差和(hé)方差平穩性(換句話(huà)說,二階平穩性)。從這(zhè)個(gè)定義不難看出,當 k = 0 時(shí)有:


f9.png


這(zhè)表示 r_t 的(de)間隔爲 0 的(de)自相關系數恒定爲 1。此外,ρ_k 還(hái)有如下(xià)的(de)性質:


f10.png


和(hé)第三節一樣,上面定義的(de) ρ_k 是總體的(de)統計特性。實際中,我們仍然隻能通(tōng)過有限的(de)樣本數據來(lái)計算(suàn)樣本的(de)統計特性。令 ζ_k 爲與 ρ_k 對(duì)應的(de)樣本統計量,則有:


f11.png


上式中,c_k 是 r_t 的(de)間隔爲 k 的(de)樣本自協方差(sample autocovariance of lag k);ζ_k 爲 r_t 的(de)間隔爲 k 的(de)樣本自相關系數(sample autocorrelation of lag k)。如果把 ζ_k 看作是 k 的(de)方程,則它通(tōng)常被稱爲樣本自相關方程(sample autocorrelation function;同樣的(de),ρ_k 爲總體自相關方程),它刻畫(huà)了(le)時(shí)間序列的(de)重要特性。利用(yòng)相關圖(correlogram)可(kě)以清晰地看到 ζ_k 是如何随間隔 k 變化(huà)的(de)。下(xià)圖爲兩個(gè)假想時(shí)間序列的(de)相關圖。它們呈現出完全不同結構的(de)自相關性。事實上,第一個(gè)相關圖的(de)時(shí)間序列存在明(míng)顯的(de)趨勢;而第二個(gè)相關圖的(de)時(shí)間序列存在明(míng)顯的(de)周期性。這(zhè)兩個(gè)例子說明(míng)相關圖可(kě)以告訴我們很多(duō)時(shí)間序列的(de)内在特性。


f12.png


金融時(shí)間序列的(de)相關圖雖然遠(yuǎn)沒有這(zhè)兩個(gè)假象序列的(de)相關圖這(zhè)麽有結構,但相關圖在我們對(duì)時(shí)間序列建模時(shí)至關重要。之前已經說過,金融時(shí)間序列,特别是收益率序列,最重要的(de)特性是一些不容易被發現的(de)自相關性。(通(tōng)常股票(piào)的(de)收益率序列沒有季節性或者明(míng)顯的(de)趨勢性;即便是弱趨勢也(yě)可(kě)以由自相關性反應。)因此,拿來(lái)一個(gè)收益率序列,隻要畫(huà)出相關圖,就可(kě)以檢測該序列在任何間隔 k 有無統計上顯著的(de)自相關性。


對(duì)金融時(shí)間序列建模,最重要的(de)就是挖掘出該序列中的(de)不同間隔 k 的(de)自相關性。相關圖可(kě)以幫助我們判斷模型是否合适。這(zhè)是因爲金融時(shí)間序列的(de)特征中往往包括相關性和(hé)随機噪聲。如果模型很好的(de)捕捉了(le)自相關性,那麽原始時(shí)間序列與模型拟合的(de)時(shí)間序列之間的(de)殘差應該近似的(de)等于随機噪聲。殘差序列自然也(yě)是一個(gè)時(shí)間序列,因此可(kě)以對(duì)它畫(huà)出相關圖。一個(gè)标準随機噪聲的(de)自相關滿足 ρ_0 = 1 以及 ρ_k = 0, k = 1, 2, 3, …,即對(duì)于任意不爲 0 的(de)間隔,随機噪聲的(de)自相關均爲 0。下(xià)圖爲一個(gè)随機噪聲的(de)相關圖(我們是用(yòng)标準正态分(fēn)布構造了(le)有 500 個(gè)點的(de)随機噪聲序列):


f13.png


關于這(zhè)個(gè)圖:


1. 顯然,間隔爲 0 的(de)自相關系數爲 1;


2. 對(duì)于任意的(de) k ≥ 1,藍色的(de)陰影(yǐng)區(qū)域爲 95% 的(de)置信區(qū)間。因此,自相關系數隻要沒有超過藍色陰影(yǐng)區(qū)域,我們就無法在 5% 的(de)顯著性水(shuǐ)平下(xià)拒絕原假設(原假設爲間隔爲 k 的(de)自相關系數爲 0)。上圖的(de)結果說明(míng)當 k 不爲 0 時(shí),随機噪聲的(de)自相關系數爲 0。


因此,在評價對(duì)金融時(shí)間序列的(de)建模是否合适時(shí),我們首先找到原始時(shí)間序列和(hé)它的(de)拟合序列之間的(de)殘差序列;然後隻要畫(huà)出這(zhè)個(gè)殘差序列的(de)相關圖就可(kě)以看到它是否含有任何模型未考慮的(de)額外自相關性:


如果殘差的(de)相關圖和(hé)上面這(zhè)個(gè)圖相似,則可(kě)以認爲殘差是一個(gè)随機噪聲,而模型已經很好的(de)捕捉了(le)原始時(shí)間序列中的(de)自相關性;


如果殘差的(de)相關圖體現了(le)額外的(de)自相關性,它們将爲我們改進已有的(de)模型提供依據,因爲這(zhè)些額外的(de)自相關說明(míng)已有模型沒有考慮原始時(shí)間序列在某些特定間隔上的(de)自相關。


6 下(xià)文預告


作爲金融時(shí)間序列分(fēn)析系列的(de)開篇,本文介紹金融時(shí)間序列的(de)特性和(hé)進行金融時(shí)間序列分(fēn)析的(de)目的(de);并解釋時(shí)間序列分(fēn)析中的(de)核心概念:自相關性。對(duì)金融時(shí)間序列建模的(de)核心就是捕捉該序列中不同間隔上的(de)自相關性。相關圖可(kě)以清晰地刻畫(huà)任何一個(gè)時(shí)間序列在不同間隔的(de)自相關性。


在下(xià)一篇中,我們将會從最簡單的(de)白噪聲和(hé)随機遊走出發,說明(míng)它們無法有效刻畫(huà)投資品收益率序列中體現出來(lái)的(de)自相關性。這(zhè)會促使我們提出更高(gāo)級的(de)模型,包括 AR,MA,以及 ARMA。這(zhè)些模型背後的(de)理(lǐ)論是什(shén)麽?如何正确的(de)挑選模型的(de)參數以構建最适當的(de)模型?這(zhè)些将會在本系列後面幾篇文章(zhāng)中探討(tǎo)。



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。