False In-Sample Predictability ?

發布時(shí)間:2021-06-22  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:Martin and Nagel (2019) 指出投資者 high-dimensional learning 有可(kě)能造成樣本内虛假的(de)可(kě)預測性。


1


讓我們從兩組實證結果說起。下(xià)圖是 Fama and French (2015) 五因子(除了(le) SMB)和(hé) Carhart (1997) 動量因子在 1963 到 2008 年之間的(de)表現,無一例外的(de),它們都獲得(de)了(le)顯著的(de)超額收益。由于時(shí)間跨度和(hé)相關論文所涉及的(de)實證區(qū)間接近,我們可(kě)以把它們視作樣本内的(de)表現。



再來(lái)看看樣本外……



怎麽說呢(ne)?“此時(shí)無聲勝有聲”。看完了(le)美(měi)股,再來(lái)看看 A 股上中國版四因子的(de)表現。下(xià)圖統計了(le)市場(chǎng)、SMB、VMG(基于 Earnings-to-Price ratio 構造的(de)價值因子)以及 PMO 四因子在樣本内、外以及全樣本的(de)表現(樣本的(de)劃分(fēn)是根據該模型的(de)論文)。


f3.png


Again,“此時(shí)無聲勝有聲”。此處無意進一步探討(tǎo)因子的(de)表現,隻是想通(tōng)過這(zhè)兩個(gè)例子引出本文要探討(tǎo)的(de)内容。在過去的(de) 30 年,學術界提出了(le)大(dà)量樣本内顯著的(de)因子和(hé)異象(zoo of factors),然而絕大(dà)多(duō)數在樣本外都無法持續。至于這(zhè)背後的(de)原因,目前有兩種主流看法。一種是由于多(duō)重假設檢驗,大(dà)多(duō)數因子都是 p-hacking 的(de)結果(Harvey, Liu, and Zhu (2016));另一種則是因子在樣本外之所以變差是因爲套利者把它們交易了(le)(McLean and Pontiff (2016))。


而今天要解讀的(de) Martin and Nagel (2019) 則給出了(le)第三種可(kě)能。該文題目是 Market Efficiency in the Age of Big Data,作者是 Ian Martin 和(hé) Stefan Nagel。看過上期推文的(de)小夥伴會知道這(zhè)就是我說的(de) Stefan Nagel 的(de)背靠背的(de)第二篇。針對(duì)大(dà)量樣本内顯著樣本外消失的(de)可(kě)預測性,該文提出了(le)一個(gè)新穎的(de)視角 —— high-dimensional investor learning正如下(xià)圖所描繪的(de),在大(dà)數據時(shí)代,人(rén)們面對(duì)著(zhe)指數級增長(cháng)的(de)數據量,而能夠影(yǐng)響公司未來(lái)基本面的(de)變量也(yě)在無限擴張(例如會計報表數據,公司财報中的(de)措辭,分(fēn)析師一緻預期,量價數據,公司所處行業的(de)景氣度,以及各種宏觀經濟變量和(hé)其他(tā)另類數據)。在這(zhè)個(gè)背景下(xià),傳統的(de)實證資産定價檢驗受到了(le)巨大(dà)的(de)挑戰。



傳統實證資産定價假設理(lǐ)性預期(rational expectation),即假設投資者知道哪些變量影(yǐng)響公司基本面以及它們和(hé)基本面的(de)關系,即 基本面 = f(預測變量) 對(duì)投資者是已知的(de),并在這(zhè)個(gè)前提下(xià)通(tōng)過曆史數據(在樣本内)檢驗市場(chǎng)有效性。一旦原假設被拒絕便認爲變量獲得(de)的(de)超額收益代表著(zhe)風險補償或定價錯誤。然而,Martin and Nagel (2019) 指出,在大(dà)數據時(shí)代,投資者根本無法知道到底哪些變量能夠影(yǐng)響公司基本面,以及變量和(hé)基本面之間的(de)關系  到底是什(shén)麽樣。取而代之的(de)是在高(gāo)維參數空間的(de)學習(xí)問題,即估計  到底長(cháng)什(shén)麽樣、參數是多(duō)少。在理(lǐ)性預期範式下(xià),不存在投資者對(duì)  的(de)學習(xí)問題,因此樣本内檢驗發現的(de)可(kě)預測性可(kě)以直接推廣到樣本外。然而,一旦投資者需要估計  且估計存在誤差時(shí),通(tōng)過樣本内檢驗發現的(de)可(kě)預測性則無法再保證樣本外的(de)可(kě)預測性。


從直觀上來(lái)理(lǐ)解,這(zhè)是因爲投資者高(gāo)維學習(xí)問題會導緻均衡狀态下(xià)資産的(de)價格和(hé)理(lǐ)性預期情況下(xià)相比出現偏差;該偏差的(de)存在将造成事後(ex post)從計量經濟學家的(de)視角來(lái)看,已實現收益率不再随機,而是包含了(le)一部分(fēn)可(kě)預測的(de)成分(fēn);因此當人(rén)們事後用(yòng)統計檢驗分(fēn)析變量和(hé)收益率的(de)關系時(shí),會誤以爲某些變量對(duì)收益率有預測性(且在高(gāo)維問題下(xià),即變量越來(lái)越多(duō)時(shí),這(zhè)個(gè)偏差造成的(de)影(yǐng)響愈加明(míng)顯)。


但實際的(de)情況是,對(duì)投資者來(lái)說,這(zhè)種可(kě)預測性在事前(ex ante)是感知不到的(de);對(duì)進行事後檢驗的(de)計量經濟學家來(lái)說,樣本内的(de)可(kě)預測性僅僅是源自由投資者學習(xí)  而導緻的(de)資産定價的(de)偏差,因而是虛假的(de),這(zhè)些變量在樣本外并不能預測收益率。因此,該文主張 high-dimensional investor learning 是諸多(duō)樣本内 false discoveries 的(de)另一個(gè)潛在原因,而唯有樣本外的(de)可(kě)預測性才真正代表風險補償或錯誤定價。下(xià)圖高(gāo)度總結了(le)該文。



下(xià)面就來(lái)深度解讀這(zhè)篇文章(zhāng)。


2 Model


本節介紹 Martin and Nagel (2019) 使用(yòng)的(de)模型。  代表資産數,  代表投資者用(yòng)來(lái)預測資産未來(lái)現金流的(de)變量(firm characteristics)的(de)個(gè)數,令  (  階矩陣)表示  個(gè)公司的(de)  個(gè)變量。不失一般性且爲了(le)簡化(huà)推導,假設  。進一步假設  代表資産的(de)分(fēn)紅,而分(fēn)紅高(gāo)低是投資者對(duì)資産估值的(de)依據。模型假設 dividend growth 和(hé)  滿足如下(xià)線性模型:



由上式可(kě)知,模型中假設  不随時(shí)間變化(huà)。在現實世界中,firm characteristics 當然會随時(shí)間發生變化(huà),且 dividend growth 也(yě)完全有可(kě)能是  的(de)非線性函數,但是允許  時(shí)變或考慮非線性将會使得(de)研究 learning 問題的(de)難度陡然增加(就現在這(zhè)個(gè)簡單的(de)設定而言,問題本身已經十分(fēn)複雜(zá))。由于 Martin and Nagel (2019) 是第一篇通(tōng)過建模研究 investor learning 對(duì) asset pricing 和(hé) return predictability 影(yǐng)響的(de)文章(zhāng),因此他(tā)們決定盡量簡化(huà)模型[1]。在模型中,參數向量  決定了(le)變量如何影(yǐng)響資産未來(lái) dividend growth 的(de)變化(huà),而它也(yě)正是投資者在高(gāo)維變量空間中需要估計的(de)(learning)。模型假設  滿足多(duō)元正态分(fēn)布:



其中  是一個(gè)常數,  是  階單位矩陣。這(zhè)個(gè)假設的(de)核心是  的(de)方差和(hé)  (變量的(de)個(gè)數)成反比。它對(duì)模型盡可(kě)能貼合現實世界至關重要。這(zhè)是因爲上述假設保證了(le)無論  怎麽變,模型中的(de)信噪比都是不變的(de)。如果沒有這(zhè)個(gè)約束,則随著(zhe)使用(yòng)的(de)變量越來(lái)越多(duō),  中可(kě)解釋的(de)部分(fēn)将會越來(lái)越大(dà),遠(yuǎn)超過噪音(yīn)  ,這(zhè)顯然是不切實際的(de)。以上就是關于資産基本面的(de)建模。


接下(xià)來(lái)是關于投資者的(de)設定。該文假設投資者是風險中性(risk-neutral)以及同質的(de)(homogeneous)。此外,他(tā)們還(hái)假設無風險收益率爲 0。在風險中性 + 無風險收益率爲 0 下(xià),資産的(de) risk premium 爲零,因此稍後對(duì)模型求解時(shí)發現的(de)任何 in-sample return predictability 都不應歸結爲 risk premium(因爲 risk premium 已經在模型中被排除了(le))。同質性則意味著(zhe)所有投資者對(duì)于  的(de)估計是一樣的(de),不會因人(rén)而異,且投資者之間不會相互學習(xí)。


有了(le)資産和(hé)投資者,接下(xià)來(lái)就要開始研究投資者如何對(duì)資産估值、确定其均衡狀态下(xià)的(de)價格,以及在這(zhè)個(gè)過程中造成的(de)資産收益率的(de)可(kě)預測性。爲了(le)簡化(huà),Martin and Nagel (2019) 使用(yòng)了(le)單期估值模型。由于投資者是風險中性且利率爲零,因此  期資産的(de)價格等于  期分(fēn)紅在  時(shí)刻的(de)期望:



由上式可(kě)知,均衡狀态下(xià)資産的(de)價格
  取決于投資者如何形成  的(de)預期,即由投資者如何形成關于  的(de)預期決定。而由于  ,因此  最終和(hé)投資者如何在高(gāo)維變量空間估計  密切相關。從計量經濟學家事後檢驗的(de)角度出發,投資者在高(gāo)維空間下(xià)對(duì)  的(de)(不準确)估計如何影(yǐng)響資産的(de)價格,以及這(zhè)種影(yǐng)響是否能夠造成任何樣本内(虛假的(de))可(kě)預測性呢(ne)?這(zhè)就是 Martin and Nagel (2019) 想要回答(dá)的(de)問題。


3 Rational Expectation


在探討(tǎo) investor learning 之前,我們先來(lái)看基準,即理(lǐ)性預期的(de)情況。理(lǐ)性預期下(xià)假設投資者知道真實的(de)  (即無需估計),因此有  ,以及  。利用(yòng)下(xià)期  和(hé)理(lǐ)性預期下(xià)的(de)資産價格  ,就可(kě)以計算(suàn)出 realized price change,即收益率(Martin and Nagel (2019) 将 realized price change 稱作“收益率”,本文遵循這(zhè)一術語使用(yòng)):



在理(lǐ)性預期下(xià),由于投資者無需估計
  ,因而有  。這(zhè)意味著(zhe)哪怕是事後檢驗來(lái)看,樣本内也(yě)沒有任何可(kě)預測性。爲說明(míng)這(zhè)一點,假設事後使用(yòng)  對(duì)  進行截面回歸,得(de)到回歸系數向量:



由于
  ,将其代入有:



從實證資産定價檢驗的(de)角度來(lái)說,我們關注的(de)是事後聯合檢驗  是否顯著偏離零 —— 顯著偏離零意味著(zhe)有(樣本内)的(de)可(kě)預測性。利用(yòng)統計檢驗,  滿足  分(fēn)布,因此隻要利用(yòng)實際的(de)樣本數據就可(kě)以對(duì)其檢驗。由  的(de)定義可(kě)知,在理(lǐ)性預期下(xià),任何偏離零都是由于噪音(yīn)  造成的(de)。
除了(le)直接聯合檢驗  ,我們也(yě)可(kě)以從另一個(gè)角度理(lǐ)解。令  ,并考慮以  爲權重構造的(de)投資組合(這(zhè)對(duì)應了(le)常用(yòng)的(de)樣本内構造投資組合并檢驗其收益率)。該投資組合的(de)收益率爲:



  滿足  分(fēn)布可(kě)知,該投資組合的(de)預期收益爲:



在沒有任何可(kě)預測性的(de)原假設下(xià),該投資組合在樣本内的(de)預期收益爲  ,它之所以大(dà)于零僅是因爲對(duì)樣本内噪音(yīn)的(de)過拟合。在事後檢驗中,常規操作就是考察該投資組合的(de)收益率是否顯著的(de)偏離  。如果發現顯著的(de)偏離,人(rén)們會認爲  可(kě)以預測 ,并把可(kě)預測性歸結于風險補償或投資者的(de)系統性偏誤。然而,若投資者不知道真實的(de)  ,而是需要對(duì)它估計(learning)時(shí)又會怎樣呢(ne)?估計的(de)不準确是否會造成上述原假設被錯誤地拒絕呢(ne)(即樣本内虛假的(de)可(kě)預測性)?


4 OLS Learning


首先來(lái)看最簡單(但稍微不太滿足實際)的(de)情況 —— 投資者直接使用(yòng) OLS 來(lái)估計  ,即 OLS learning。至于爲什(shén)麽說它稍微不滿足現實,我們放到第 5 節介紹 Bayesian Learning 時(shí)討(tǎo)論。爲估計  ,假設投資者首先計算(suàn)全部  期 dividend growths 的(de)均值:



然後用(yòng)  對(duì)  回歸有:



和(hé)理(lǐ)性預期(上一節)不同,由于投資者不知道真實的(de)
  ,而是通(tōng)過 OLS 估計,因此這(zhè)将影(yǐng)響他(tā)們對(duì)資産未來(lái) dividend growth 的(de)估計  。在這(zhè)個(gè)情況下(xià),均衡狀态下(xià)資産的(de)價格爲:


而 realized return 爲:


站在投資者在  時(shí)刻的(de)視角,他(tā)們是無法察覺對(duì)  的(de)估計有偏誤的(de),因此對(duì)于投資者來(lái)說,  依然是不可(kě)預測的(de),正如理(lǐ)性預期一樣。然而,對(duì)于事後進行統計檢驗來(lái)說,上述通(tōng)過 OLS 估計的(de)    是否影(yǐng)響檢驗結果呢(ne)?
定義  ,因而有  。将該式代入  的(de)表達式并進行簡單代數運算(suàn)有:



将其代入  的(de)表達式可(kě)得(de):


怎麽樣,在 OLS learning 下(xià),  看著(zhe)和(hé)理(lǐ)性預期下(xià)不一樣了(le)。下(xià)表對(duì)它們進行了(le)對(duì)比。


f6.png


和(hé)理(lǐ)性預期相比,投資者對(duì)  的(de) OLS 估計造成 realized return 中多(duō)出了(le)一項,即  。因此,當我們如常進行事後統計檢驗時(shí),收益率對(duì)  的(de)回歸系數  就變成了(le):


與理(lǐ)性預期相比,OLS learning 造成事後檢驗的(de)回歸系數  中也(yě)多(duō)了(le)一項(上式中第一項)。觀察該項,從直覺上可(kě)知,如果  中的(de)某些 firm characteristics 和(hé)誤差  正相關或者負相關時(shí),就很有可(kě)能造成  聯合起來(lái)顯著偏離零且原假設被(錯誤地)拒絕。
如果我們仍然從投資組合收益率的(de)視角來(lái)解讀,那麽在 OLS learning 下(xià),可(kě)以推導出該投資組合的(de)預期收益中同樣包含兩項,較理(lǐ)性預期的(de)情況下(xià)多(duō)了(le)一項:


沒有可(kě)預測性的(de)原假設下(xià),  的(de)預期是  (理(lǐ)性預期的(de)情況)。然而,由于 OLS learning 造成了(le)額外的(de)一項  。當  很小,或者  (用(yòng)來(lái)預測 dividend growth 的(de)變量的(de)個(gè)數)非常大(dà)的(de)時(shí)候(即 high-dimensional learning 問題),  這(zhè)一項将會造成  相對(duì)  的(de)顯著偏離,使得(de)事後統計檢驗拒絕原假設,認爲  中有某些變量能夠預測  [2]。


讓我們串一下(xià)上面“可(kě)預測性”産生的(de)邏輯。該邏輯是因爲投資者不知道  ,而是通(tōng)過 OLS 來(lái)估計  ,并根據  對(duì)資産估值,産生均衡狀态下(xià)資産的(de)價格。它進而造成了(le)和(hé)理(lǐ)性預期相比,已實現收益率中出現額外一項,而這(zhè)個(gè)額外項繼而造成了(le)回歸系數  顯著地聯合偏離零或投資組合預期收益顯著的(de)偏離  ,讓人(rén)們(錯誤地)拒絕原假設。由于在模型中已經排除了(le) risk premium,因此該樣本内的(de)可(kě)預測性僅僅是 investor learning 造成的(de)。


5 Bayesian Learning


通(tōng)過上一節的(de)介紹,希望各位小夥伴搞清楚 Martin and Nagel (2019) 想要幹什(shén)麽了(le)。但是我負責的(de)說,OLS learning 因爲有些問題,并不是他(tā)們關注的(de)重點。下(xià)面就來(lái)上點“硬貨”—— Bayesian learning。好消息是,有了(le) OLS learning 做(zuò)鋪墊,本節的(de)内容會容易理(lǐ)解地多(duō)(我寫起來(lái)也(yě)容易的(de)多(duō))。


爲了(le)簡化(huà)模型,Martin and Nagel (2019) 假設投資者的(de)先驗是  的(de)真實分(fēn)布,即  。經過推導,可(kě)以得(de)到投資者對(duì)  的(de)後驗估計:


和(hé) OLS learning 相比,Bayesian learning 下(xià)的(de)  是先驗和(hé) OLS 估計之間的(de)貝葉斯收縮。爲了(le)更直觀的(de)理(lǐ)解往先驗的(de)收縮,上述  又可(kě)以寫作:


其中  是收縮系數,而往先驗收縮的(de)程度滿足如下(xià)性質(都非常複合直覺):


1.   越小,越往先驗收縮(樣本點的(de)時(shí)間跨度越短,誤差越大(dà));

2.   越小,越往先驗收縮(  決定了(le)先驗中  相對(duì)零的(de)偏離程度);

3.   越大(dà),越往先驗收縮(變量個(gè)數越多(duō),越有可(kě)能對(duì)著(zhe)樣本内過拟合,因此更需要收縮)。


比較 Bayesian learning 和(hé) OLS learning 可(kě)知二者的(de)差異就體現在  上。數學運算(suàn)可(kě)知,當先驗是擴散的(de)時(shí)候(  ),  收斂到單位矩陣。因此,OLS learning 是 Bayesian learning 的(de)一個(gè)特例。現在我們就可(kě)以回答(dá)前面遺留的(de)問題:爲什(shén)麽 OLS learning 不太合理(lǐ)。由  的(de)定義可(kě)知,變量偏離零的(de)程度由  确定。如果  非常大(dà),則意味著(zhe) dividend growth 的(de)信噪比非常高(gāo)(有很大(dà)一部分(fēn)可(kě)以通(tōng)過  來(lái)預測),這(zhè)顯然與真實世界不符。由于在真實世界中投資者通(tōng)常不會認爲 dividend growth 中有很大(dà)一部分(fēn)能夠被預測,因此 Bayesian learning 比 OLS learning 更符合實際。


在 Bayesian learning 下(xià),投資者通(tōng)過  來(lái)判斷 dividend growth 并對(duì)資産估值。在均衡狀态下(xià),收益率滿足:


毫無疑問,和(hé)理(lǐ)性預期以及 OLS learning 相比,這(zhè)個(gè)  看著(zhe)更複雜(zá)了(le)。不用(yòng)慌,我們再放在一起對(duì)比一下(xià)。


f7.png


上表中,我特地使用(yòng)了(le)相同的(de)顔色圈出了(le)相似的(de)項。和(hé) OLS learning 相比,Bayesian learning 中又多(duō)了(le)額外的(de)一項(第一項),而它的(de)第二項則對(duì)應 OLS learning 的(de)第一項,其中的(de)差異是,Bayesian Learning 的(de)第二項中多(duō)了(le)收縮系數  。Bayesian learning 下(xià)  中的(de)三項可(kě)以解讀爲:


1. 第一項是因爲往先驗收縮,因此投資者對(duì)基本面信息  的(de)“反應不足”(如果不收縮,即  ,這(zhè)一項就會消失)。

2. 第二項和(hé) OLS learning 類似,是噪聲對(duì)投資者估計的(de)影(yǐng)響。不過  的(de)存在意味著(zhe)先驗使得(de)投資者對(duì)噪音(yīn)的(de)反應沒那麽強烈,因此從一定程度上降低了(le)這(zhè)部分(fēn)對(duì)估計的(de)影(yǐng)響;在 Bayesian learning 下(xià),  在前兩項誤差之間實現了(le)最優的(de)權衡。

3. 最後一項和(hé)理(lǐ)性預期一樣,爲  。


接下(xià)來(lái)如法炮制,利用(yòng)上述  來(lái)估計并檢驗  ,以及檢驗利用(yòng)它構造的(de)投資組合的(de)預期收益。和(hé)  一樣,由于 Bayesian learning,  也(yě)有三項,分(fēn)别對(duì)應  的(de)三項(不再贅述)。而該投資組合的(de)預期收益爲:


  時(shí),上式收斂到 OLS learning 的(de)情況,即  。下(xià)圖給出了(le) OLS learning 和(hé) Bayesian learning(informative prior)兩種情況下(xià),該投資組合預期收益如何随  的(de)增加而變化(huà)。當沒有先驗時(shí),OLS learning 更容易過拟合,因此其預期收益随  升高(gāo)的(de)更快(kuài)。使用(yòng)貝葉斯收縮之後,會從一定程度上減弱這(zhè)個(gè)情況,但卻無法從根本上消除樣本内的(de)可(kě)預測性。



最後,我們再來(lái)回顧下(xià)“可(kě)預測性”産生的(de)原因。投資者通(tōng)過 Bayesian learning 估計  并根據  對(duì)資産估值,産生均衡狀态下(xià)資産的(de)價格。這(zhè)造成了(le)和(hé)理(lǐ)性預期相比,已實現收益率中的(de)額外的(de)兩項,而這(zhè)兩項進而造成利用(yòng)  構造的(de)投資組合的(de)預期收益顯著的(de)偏離  ,讓人(rén)們(錯誤地)拒絕原假設。因此,該樣本内的(de)可(kě)預測性僅僅是 investor learning 造成的(de)。哪怕是采用(yòng)了(le)更加接近現實的(de) Bayesian learning,投資者的(de) high-dimensional learning 依然會産生樣本内虛假的(de)可(kě)預測性。


6 Out-of-Sample


以上就是關于投資者的(de) high-dimensional learning 如何影(yǐng)響事後樣本内統計檢驗的(de)研究。在該文的(de)後半部分(fēn),Martin and Nagel (2019) 也(yě)詳細討(tǎo)論了(le)樣本外的(de)可(kě)預測性。結論就是,investor learning 不會産生樣本外的(de)可(kě)預測性,這(zhè)顯然非常符合邏輯。按照(zhào)投資組合的(de)視角,它可(kě)以表述爲:


假設有兩個(gè)互不重疊的(de)時(shí)間窗(chuāng)口。如果我們使用(yòng)窗(chuāng)口 1 來(lái)檢驗  并發現了(le)一些虛假的(de)可(kě)預測性,則使用(yòng)它們作爲系數的(de)投資組合在窗(chuāng)口 2 内的(de)預期收益爲零;唯有當窗(chuāng)口 1 内發現的(de)可(kě)預測性是真實的(de)(即不是由 investor learning 造成的(de)虛假的(de)可(kě)預測性),通(tōng)過它們才能在窗(chuāng)口 2 内(樣本外)獲得(de)顯著大(dà)于零的(de)超額收益。


就我個(gè)人(rén)的(de)看法,Martin and Nagel (2019) 的(de)發現對(duì)學術界的(de)意義重大(dà)。在實證資産定價研究中,學術界通(tōng)常假設理(lǐ)性預期(即投資者不存在學習(xí)問題),因而無一例外都是事後通(tōng)過樣本内的(de)數據來(lái)檢驗某個(gè)異象或者因子的(de)超額收益是否顯著大(dà)于零。這(zhè)一慣例在過去 30 年内産生了(le)大(dà)量樣本内顯著的(de)異象,但是其中的(de)絕大(dà)多(duō)數在樣本外壓根不好使或者無法被複現(Hou, Xue, and Zhang (2020))。而究其原因,除了(le) p-hacking 以及被套利走之外,Martin and Nagel (2019) 給出了(le)另一個(gè)解釋。


在大(dà)數據時(shí)代,我們有了(le)過去無可(kě)比拟的(de)數據量。然而,投資者面臨更加複雜(zá)的(de)高(gāo)維預測和(hé)估計問題。大(dà)數據如何影(yǐng)響投資者的(de)估計,如何影(yǐng)響均衡狀态下(xià)資産的(de)價格,如何影(yǐng)響市場(chǎng)的(de)有效性?這(zhè)些都是等待回答(dá)的(de)問題。毫無疑問,Martin and Nagel (2019) 是一個(gè)有益和(hé)大(dà)膽的(de)嘗試,而它提出的(de) investor learning 問題也(yě)足以引起人(rén)們的(de)重視。


所有曆史數據都是樣本内[3]。



備注:

[1] 但這(zhè)絲毫不影(yǐng)響這(zhè)是一個(gè)很好的(de)開端,我們也(yě)有理(lǐ)由期待今後拓展的(de)模型會有更深入的(de)發現。

[2] 如果  很小,則  即使造成了(le)偏離也(yě)并不大(dà),因此這(zhè)一項在 high-dimensional learning 中才格外重要。

[3] 見《所有曆史數據都是樣本内》



參考文獻

Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model.Journal of Financial Economics 116(1), 1 – 22.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.

Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies. Review of Financial Studies 33(5), 2019 – 2133.

McLean, R. D. and J. Pontiff (2016). Does academic research destroy stock return predictability? Journal of Finance 71(1), 5 – 32.

Martin, I. and S. Nagel (2019). Market efficiency in the age of big data. Working paper, available at: https://ssrn.com/abstract=3511296.



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。