收益率到底能不能預測(實證篇)?

發布時(shí)間:2018-03-26  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:收益率的(de)時(shí)間序列并不具備很好的(de)可(kě)預測性。在一個(gè)很強的(de)非零漂移率項面前,殘差中的(de)非随機性作用(yòng)很小。


1 引言


我們都習(xí)慣了(le)早上 8 點半準時(shí)等候在站台的(de)列車;習(xí)慣了(le)中午食堂的(de)師傅給我們預留一份當日的(de)工作套餐;習(xí)慣了(le)每周的(de) happy hour 裏公司供應的(de)咖啡的(de)味道 —— 半勺糖、不加奶……這(zhè)些一成不變的(de)體驗讓我們感到非常舒服,因爲所有的(de)這(zhè)些結果都是符合預期的(de)、是可(kě)預測的(de)


人(rén)們都喜歡可(kě)預測性,在生活中如此,在市場(chǎng)中更是如此。這(zhè)也(yě)就是爲什(shén)麽學術界和(hé)業界都在研究資産的(de)收益率是否有預測性。本系列的(de)前篇(《模型篇》)從描述資産對(duì)數價格的(de)随機遊走出發,介紹了(le)兩種檢驗對(duì)數價格(對(duì)數收益率)的(de)随機性的(de)模型:“順序/反轉檢驗”和(hé)“遊程檢驗”。


作爲系列的(de)後篇也(yě)是實證篇,我們就來(lái)用(yòng)這(zhè)兩個(gè)檢驗測試對(duì) A 股做(zuò)一些實證。我絕不否認市場(chǎng)中存在很多(duō)個(gè)股層面的(de)錯誤定價,這(zhè)些錯誤定價是由于價格偏離價值造成的(de)。它們使得(de)個(gè)股層面的(de)收益率存在一定的(de)預測性。但這(zhè)些可(kě)預測性不是我們的(de)關注點。我們的(de)目标是考察時(shí)間序列層面的(de)可(kě)預測性,進而回答(dá)諸如“複雜(zá)的(de)機器學習(xí)或者時(shí)間序列分(fēn)析這(zhè)些手段在量化(huà)投資中到底有沒有用(yòng)”這(zhè)樣的(de)問題。此外,錯誤定價造成的(de)收益率可(kě)預測性一般都是在一個(gè)長(cháng)時(shí)間的(de)尺度上來(lái)看的(de),而我們更關心的(de)是短期收益率是否能預測 —— 比如收益率序列中是否有足夠的(de)非随機性讓我們能大(dà)概率的(de)猜出下(xià)一個(gè)交易日或者下(xià)一周的(de)漲跌。


基于這(zhè)些考慮,本文的(de)實證考察市場(chǎng)收益率是否具有可(kě)預測性,因此我們選擇 A 股上的(de)代表指數 —— 滬深 300 指數 —— 作爲研究對(duì)象(鑒于 A 股幾大(dà)指數的(de)時(shí)序相關性非常高(gāo),因此本文的(de)結果也(yě)可(kě)以擴展到其他(tā)幾大(dà)股指),檢驗它的(de)收益率是否有預測性。


2 日頻(pín)檢驗


一般來(lái)說,計算(suàn)收益率的(de)頻(pín)率越高(gāo),它的(de)噪聲越高(gāo)、确定性越低。我們正好用(yòng)滬深 300 指數的(de)收益率來(lái)驗證一下(xià)。爲此,首先以日頻(pín)對(duì)數收益率爲研究對(duì)象,用(yòng)“順序/反轉檢驗”和(hé)“遊程檢驗”檢驗其随機性。


假設回測期是 2011 年 1 月(yuè) 5 日到 2018 年 2 月(yuè) 7 日。如果讓我們判斷指數日頻(pín)對(duì)數收益率在整個(gè)時(shí)間區(qū)間内的(de)随機性,那即便不計算(suàn)也(yě)會猜它是随機的(de)。不出意外,檢驗的(de)結果證實了(le)這(zhè)個(gè)猜想:


順序和(hé)反轉檢驗:CJ 統計量 = 1.022,p-value = 0.646,結論爲對(duì)數收益率在整個(gè)區(qū)間滿足随機性。


遊程檢驗:Z 統計量 = -0.406,p-value = 0.684,結論同樣爲對(duì)數收益率在整個(gè)區(qū)間滿足随機性。


接下(xià)來(lái)使用(yòng)滾動時(shí)間窗(chuāng)口看看在股市發展的(de)不同時(shí)期,滬深 300 指數的(de)局部是否表現出非随機性。選擇滾動時(shí)間窗(chuāng)口爲 26 周(即半年),在每個(gè)交易日滾動計算(suàn)過去半年内的(de)日頻(pín)對(duì)數收益率是否具有非随機性。


下(xià)圖爲“順序/反轉檢驗”的(de)結果,其中綠色曲線爲滬深 300 指數,藍色曲線爲檢驗的(de) p-value(紅色水(shuǐ)平線爲 5% 顯著性阈值,當藍線在紅色以下(xià)就說明(míng)在 5% 的(de)顯著性水(shuǐ)平下(xià)顯著)。特别需要強調的(de)是,滾動檢驗非随機性時(shí),結果都是滞後的(de)(就像計算(suàn)移動平均一樣,因爲隻有發生了(le)之後才能計算(suàn));但是爲了(le)更好使用(yòng)檢驗結果表明(míng)同期滬深 300 指數的(de)非随機性,我們把藍線整體向前平移了(le) 26 周 —— 即滾動時(shí)間窗(chuāng)口的(de)長(cháng)度;這(zhè)在視覺呈現上更容易說明(míng)問題,即圖中藍線低的(de)部分(fēn)就說明(míng)同期滬深 300 指數具有非随機性。隻不過不要忘記在現實中,該指标的(de)計算(suàn)有滞後性。


f1.png


從上面的(de)結果可(kě)以觀察到,日頻(pín)對(duì)數收益率在回測期内的(de)絕大(dà)多(duō)數時(shí)間沒有統計意義上的(de)顯著非随機性(表現爲藍線在 5% 顯著性水(shuǐ)平這(zhè)根紅色阈值之上)。一些例外是,在 2013 年的(de)上半年,以及在 2015 年大(dà)牛市和(hé)大(dà)熊市的(de)部分(fēn)階段,日頻(pín)收益率顯示出了(le)一定的(de)非随機性。


最有意思的(de)是股災 3.0 之後(2016 年 3 月(yuè)開始),以滬深 300 指數爲代表的(de)藍籌股開始了(le)一段爲期兩年的(de)大(dà)漲。但從日頻(pín)收益率上來(lái)看卻幾乎看不出非随機性。這(zhè)樣的(de)特征和(hé)美(měi)股的(de)大(dà)指數(比如 SP 500)十分(fēn)接近,說明(míng)市場(chǎng)的(de)收益率在長(cháng)期來(lái)看由一個(gè)正的(de)漂移率項主宰,抛開了(le)這(zhè)個(gè)之後的(de)殘差部分(fēn)幾乎沒有可(kě)預測性、就是個(gè)波動不小的(de)随機運動,賺錢效應則是真正獎勵給那些從基本面出發堅定買入并持有的(de)人(rén),而任何主動的(de)擇時(shí)都會由于這(zhè)種擾動帶來(lái)的(de)負 Vega(即策略淨值對(duì)标的(de)波動率的(de)偏導數)而造成虧損。使用(yòng)“遊程檢驗”也(yě)會得(de)到類似的(de)結果(下(xià)圖),這(zhè)裏不再贅述。


f2.png


事實上,如果比較這(zhè)兩個(gè)檢驗的(de) p-value,會發現它們非常接近(下(xià)圖)。從兩個(gè)檢驗的(de)定義來(lái)看(見《模型篇》)二者也(yě)十分(fēn)類似,在實際使用(yòng)中選擇哪個(gè)都可(kě)以(我個(gè)人(rén)在實證中見到使用(yòng)“遊程檢驗”更多(duō)一些)。


f3.png


3 周頻(pín)檢驗


接下(xià)來(lái),讓我們把目光(guāng)轉向周頻(pín)。同樣的(de),首先考察在整段回測期内周頻(pín)對(duì)數收益率的(de)非随機性:


順序和(hé)反轉檢驗:CJ 統計量 = 1.105,p-value = 0.358,結論爲對(duì)數收益率在整個(gè)區(qū)間滿足随機性。


遊程檢驗:Z 統計量 = -0.760,p-value = 0.447,結論同樣爲對(duì)數收益率在整個(gè)區(qū)間滿足随機性。


周頻(pín)對(duì)數收益率在整段回測期内來(lái)看仍滿足随機性;其比日頻(pín)更低的(de) p-value 值似乎說明(míng)周頻(pín)上的(de)非随機性更高(gāo)一些(盡管在統計意義上仍不顯著)。下(xià)面使用(yòng) 26 周的(de)滾動窗(chuāng)口考察局部非随機性。下(xià)圖爲“順序/反轉檢驗”的(de)結果。與日頻(pín)收益率的(de)結果相比,它顯示在 2011 年的(de)下(xià)半年周頻(pín)收益率有一段明(míng)顯的(de)非随機過程;以及在 2016 年底、2017 年初周頻(pín)上也(yě)存在一定的(de)非随機性。此外,在 2015 年的(de)牛、熊周期中,周頻(pín)表現出了(le)比日頻(pín)更顯著的(de)非随機性,這(zhè)個(gè)結果并不令人(rén)意外。


f4.png


對(duì)周頻(pín)對(duì)數收益率使用(yòng)“遊程檢驗”,也(yě)會得(de)到類似的(de)結果(下(xià)圖)。


f5.png


比較本節和(hé)上一節的(de)結果,我們可(kě)以觀察到如下(xià)結論:


1. 無論是在日頻(pín)還(hái)是周頻(pín),在排除了(le)低頻(pín)漂移率後,對(duì)數收益率在市場(chǎng)處于震蕩時(shí)均沒有顯著的(de)随機性。


2. 在大(dà)牛市和(hé)大(dà)熊市,排除低頻(pín)漂移率之後,對(duì)數收益率仍然能夠表現出一定的(de)随機性。但不要忘了(le),上面所有這(zhè)些圖中,表示随機性強弱的(de) p-value 都被向前平移了(le),這(zhè)意味著(zhe)在現實中我們觀測到這(zhè)些非随機性都會有一定的(de)滞後。


下(xià)面就來(lái)看看收益率上的(de)局部非随機性對(duì)于構建策略到底有沒有幫助。


4 簡單均值 vs 複雜(zá)模型


我們在之前的(de)專題中介紹過時(shí)間序列分(fēn)析、Hurst 指數和(hé)分(fēn)數布朗運動、以及一些常見的(de)機器學習(xí)算(suàn)法。相比于技術分(fēn)析中最常見的(de)均線(移動平均),這(zhè)些無疑都是更高(gāo)階的(de)算(suàn)法。但是它們和(hé)均線又有本質的(de)不同。均線就是爲了(le)計算(suàn)收益率的(de)低頻(pín)分(fēn)量 —— 漂移率項;而這(zhè)些複雜(zá)的(de)算(suàn)法則是爲了(le)分(fēn)析收益率的(de)殘差項(即排除了(le)收益率中的(de)漂移率、周期性等之後所剩餘的(de)部分(fēn))是否存在預測性。如果殘差滿足非随機性,這(zhè)些複雜(zá)算(suàn)法則有用(yòng)武之地。


前面的(de)實證分(fēn)析結果顯示,當市場(chǎng)處于大(dà)牛、大(dà)熊市的(de)時(shí)候,收益率确實存在統計意義上顯著的(de)非随機性。但不要忘了(le),在些時(shí)期,收益率的(de)漂移率項也(yě)顯著的(de)不爲零。在一個(gè)很強的(de)非零漂移率項面前,殘差中的(de)非随機性是“錦上添花”還(hái)是“畫(huà)蛇添足”?這(zhè)是在建模篇的(de)最後抛出的(de)問題。


爲了(le)回答(dá)這(zhè)個(gè)問題,我們對(duì)滬深 300 指數采用(yòng)簡單移動平均和(hé)時(shí)間序列的(de) ARMA 模型構建兩個(gè)簡單的(de)基于日頻(pín)收益率預測的(de)擇時(shí)策略。策略的(de)大(dà)緻思路是預測每個(gè)交易日的(de)收益率,如果大(dà)于零則持倉、否則空倉。具體的(de),這(zhè)兩個(gè)策略分(fēn)别爲:


移動平均模型策略:

對(duì)于每一個(gè)交易日,計算(suàn)過去 40 個(gè)曆史交易日收益率的(de)均值,如果均值大(dà)于零則在該交易日持有滬深 300;反之空倉。不考慮交易成本。


ARMA 模型策略:

對(duì)于每一個(gè)交易日,使用(yòng)之前的(de) 40 個(gè)曆史交易日收益率構建帶常數項的(de) ARMA 模型,對(duì)該日的(de)收益率預測。模型參數方面,ARMA 的(de)階數 p 和(hé) q 的(de)取值範圍均爲 1 到 4,并根據 AIC 準則确定最優參數。如果收益率預測爲正則持倉;反之空倉。不考慮交易成本。


由于在 ARMA 模型中考慮了(le)常數項(即低頻(pín)漂移率項),因此它實際上是在簡單移動均線的(de)基礎上額外考慮了(le)殘差中可(kě)能存在的(de)非随機性。這(zhè)兩個(gè)策略和(hé)滬深 300 指數本身的(de)淨值如下(xià)圖所示。其中綠線爲簡單均值模型、藍色爲 ARMA 模型。


f6.png


令人(rén)失望的(de)是,更複雜(zá)的(de) ARMA 模型不但大(dà)幅跑輸簡單均線模型,它就連指數本身都沒有超過。頗具諷刺意味的(de)是,這(zhè)兩個(gè)策略的(de)淨值的(de)差距主要在三波牛、熊市中被拉開,而牛、熊市恰恰是殘差中的(de)非随機性最強的(de)階段。這(zhè)意味著(zhe)哪怕是當市場(chǎng)表現出了(le)非随機性的(de)時(shí)候,這(zhè)種可(kě)預測性和(hé)低頻(pín)分(fēn)量相比也(yě)十分(fēn)微弱。在預測收益率時(shí),殘差的(de)非随機性對(duì)于低頻(pín)漂移率來(lái)說仍然是“噪聲”。


5 對(duì)構建策略的(de)啓發


不要把時(shí)間序列中的(de)長(cháng)期漂移率項當成可(kě)預測性。


上面這(zhè)句話(huà)是這(zhè)個(gè)系列兩篇文章(zhāng)的(de)主題。實證結果說明(míng),在構建策略時(shí),真正有用(yòng)的(de)不是收益率中那一抹若有若無的(de)自相關性,而是收益率的(de)低頻(pín)漂移率分(fēn)量。當這(zhè)個(gè)分(fēn)量爲正我們就應該堅定地持有;而當這(zhè)個(gè)分(fēn)量爲負就應該堅決的(de)離場(chǎng)。


然而,低頻(pín)漂移率項的(de)改變是很難預測的(de)。市場(chǎng)狀态的(de)變化(huà)(market regime change)—— 比如牛、熊市的(de)轉換;或者是影(yǐng)響重大(dà)的(de)全球性事件(比如美(měi)國加息、特朗普簽署針對(duì)中美(měi)貿易議(yì)題的(de)總統備忘錄等),這(zhè)些是能夠改變市場(chǎng)收益率低頻(pín)分(fēn)量的(de)。對(duì)于這(zhè)些事件何時(shí)發生、以及發生了(le)又會在多(duō)大(dà)程度上影(yǐng)響市場(chǎng),這(zhè)類判斷是非常困難的(de)。很多(duō)時(shí)候,即便發生了(le)能夠改變市場(chǎng)低頻(pín)分(fēn)量的(de)事件,但由于信息在投資者中傳播的(de)速度不同,以及不同人(rén)的(de)該事件的(de)反應也(yě)不同,它最終能被價格充分(fēn)反映到位也(yě)是需要時(shí)間的(de)由于這(zhè)些因素,提前對(duì)市場(chǎng)的(de)動向做(zuò)出正确的(de)判斷(即做(zuò)一名左側交易者)是非常困難的(de)。人(rén)們都喜歡事情按自己期望的(de)發展:買入了(le)希望價格接著(zhe)漲、賣出了(le)希望價格繼續跌。一旦發展不符合預期就會恐慌。這(zhè)并非市場(chǎng)的(de)錯誤,而是預期的(de)錯誤。


A 股代表性指數的(de)走勢和(hé)上面這(zhè)個(gè)簡單均線擇時(shí)策略的(de)結果告訴我們:


1. 市場(chǎng)的(de)低頻(pín)分(fēn)量是會發生變化(huà)的(de),但是何時(shí)發生、幅度如何,非常難預測。


2. 做(zuò)一名右側交易者挺好的(de),即根據市場(chǎng)已經出現的(de)變化(huà)做(zuò)出正确的(de)應對(duì),比如市場(chǎng)漲了(le)跟著(zhe)買入;市場(chǎng)扭頭了(le)果斷賣出。


任何時(shí)候,正确的(de)應對(duì)都是最爲關鍵的(de)。市場(chǎng)的(de)走勢撲朔迷離,沒有什(shén)麽固定的(de)模式,也(yě)總會出乎人(rén)們的(de)預料;但是在交易中,我們總能根據合理(lǐ)的(de)假設做(zuò)出一緻性的(de)應對(duì)。比如在上面的(de)例子中,我們假設每當市場(chǎng)收益率的(de)低頻(pín)分(fēn)量改變後,它會持續一段時(shí)間,因此當低頻(pín)分(fēn)量爲正時(shí),進入市場(chǎng)、當低頻(pín)分(fēn)量爲負時(shí),離開市場(chǎng)。這(zhè)種一緻性的(de)應對(duì)是任何一個(gè)成功策略的(de)必要條件。


在 2018 年 2 月(yuè)份發生“黑(hēi)色一星期”的(de)時(shí)候,有朋友問我怎麽看。我說既然已經跌下(xià)來(lái)了(le),與其瞎猜會不會再暴力反彈,不如老老實實的(de)按策略減倉(正确的(de)應對(duì))。我也(yě)比較認可(kě)“基本面選股、技術面擇時(shí)”這(zhè)個(gè)思路。任何策略都是針對(duì)市場(chǎng)的(de)某部分(fēn)特征、賺它該賺的(de)錢;任何策略也(yě)都有它無能爲力的(de)地方。既然市場(chǎng)是難以預測的(de),就把策略表現的(de)不确定性交給市場(chǎng)、努力排除一切人(rén)爲幹預帶來(lái)的(de)額外擾動。持之以恒地執行這(zhè)樣一個(gè)量化(huà)策略,得(de)到一緻性的(de)交易結果;隻要這(zhè)個(gè)策略的(de)期望收益是正的(de),時(shí)間最終會變成我們的(de)朋友。



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。