另類數據與分(fēn)析師盈利預測

發布時(shí)間:2023-04-11  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:另類數據的(de)廣泛使用(yòng)提高(gāo)了(le)分(fēn)析師短期盈利預測的(de)準确性。然而分(fēn)析師的(de)精力是有限的(de),因此另類數據的(de)使用(yòng)也(yě)并非不是沒有代價。一進一出,分(fēn)析師盈利預測準确性的(de)期限結構也(yě)悄然發生變化(huà)。


特别緻謝:本文中針對(duì) A 股的(de)精彩實證得(de)益于朝陽永續在數據和(hé)研究方面的(de)大(dà)力支持,特此說明(míng)并感謝。如果沒有針對(duì) A 股的(de)實證,本文将會遜色不少。


1


另類數據是近年來(lái)金融領域研究和(hé)實踐的(de)重點。然而,另類數據的(de)豐富是否提高(gāo)了(le)金融預測的(de)質量呢(ne)?如果從發表在頂刊上的(de)關于股票(piào)預期收益率的(de)實證文章(zhāng)來(lái)看,這(zhè)個(gè)問題的(de)答(dá)案似乎是肯定的(de)。但是如果我們希望從另外一個(gè)視角來(lái)審視,即另類數據的(de)使用(yòng)如何影(yǐng)響賣方分(fēn)析師關于上市公司盈利預測的(de)準确度,那麽這(zhè)個(gè)問題的(de)答(dá)案又是什(shén)麽呢(ne)?


這(zhè)便是 Dessaint, Foucault, and Fresard (2022) 的(de)内容。這(zhè)篇文章(zhāng)理(lǐ)論簡明(míng)、實證清晰,然而卻研究了(le)一個(gè)之前很少有人(rén)考慮的(de)角度,讓人(rén)看完眼前一亮。該文的(de)出發點是系統審視另類數據在金融預測方面的(de)應用(yòng)。通(tōng)過梳理(lǐ) 26 篇相關學術論文(使用(yòng)的(de)另類數據包括社交媒體、衛星數據、搜索引擎數據等),該文發現這(zhè)些另類數據的(de)預測時(shí)間尺度均不超過 1 年。換句話(huà)說,這(zhè)些另類數據是 short-term oriented data,隻能對(duì)短期的(de)預測提供信息增量。


在這(zhè)個(gè)前提下(xià),一系列問題自然而然地浮出水(shuǐ)面:估值模型中同時(shí)需要短期和(hé)長(cháng)期的(de)盈利預測作爲 input,那麽大(dà)量具備短期預測信息的(de)另類數據的(de)湧現對(duì)于分(fēn)析師不同時(shí)間尺度(短期 vs 長(cháng)期)的(de)盈利預測結果會有怎樣的(de)影(yǐng)響?不同尺度上的(de)綜合影(yǐng)響又是否能夠提高(gāo)整體的(de)預測質量呢(ne)?在另類數據愈加普及的(de)今天,回答(dá)這(zhè)些問題對(duì)于使用(yòng)分(fēn)析師盈利預測信息至關重要。


就上述問題,Dessaint, Foucault, and Fresard (2022) 通(tōng)過理(lǐ)論和(hé)實證給出了(le)精彩的(de)論述。在理(lǐ)論模型(of course 有 math!隻不過我們還(hái)是通(tōng)過文字描述一下(xià)吧)方面,該文假設分(fēn)析師在進行盈利預測時(shí),需要最優地分(fēn)配其投入到不同時(shí)間尺度預測的(de)精力,從而最小化(huà)預測誤差以及獲取不同時(shí)間尺度預測信息的(de)成本這(zhè)二者之和(hé)。另類數據的(de)出現降低了(le)獲取短期預測數據的(de)成本,并同時(shí)提高(gāo)了(le)短期預測數據的(de)準确度。因此,它促使分(fēn)析師将更多(duō)的(de)精力投入到獲取和(hé)分(fēn)析短期預測信息上,以此來(lái)提高(gāo)短期預測的(de)準确度。然而顧此失彼,由于分(fēn)析師的(de)精力是有限的(de),這(zhè)造成的(de)後果是降低了(le)他(tā)們長(cháng)期預測的(de)準确度。


f1.png


在實證方面,該文使用(yòng)美(měi)股分(fēn)析師的(de)盈利預測數據對(duì)上述理(lǐ)論模型進行了(le)檢驗。而該文最重要的(de)一張圖就是該文的(de) Figure III:分(fēn)析師盈利預測準确度的(de)期限結構(term structure)。我們先來(lái)說其中的(de) Panel A。


f2.png


圖中曲線之所以被稱爲 term structure 是因爲圖中橫坐(zuò)标是預測的(de)時(shí)間尺度(horizon,即分(fēn)析師發布盈利預測到公司财報正式披露之間的(de)時(shí)間之差,也(yě)即預測的(de)時(shí)間尺度),而圖中的(de)縱坐(zuò)标是分(fēn)析師平均預測準确度。預測準确度的(de)計算(suàn)方法如下(xià)。對(duì)于給定的(de)日期  、分(fēn)析師  以及時(shí)間尺度  ,獲取該分(fēn)析師所做(zuò)的(de)全部盈利預測(假設一共有  個(gè)),對(duì)應找到事後實際的(de)财報中的(de)盈利,然後在截面上将經總資産标準化(huà)後的(de)實際盈利對(duì)同樣标準化(huà)後的(de)盈利預測回歸:


  


最終,以上述截面回歸的(de) R-squared 作爲日期  、分(fēn)析師  、時(shí)間尺度  下(xià)的(de)預測準确度;然後,對(duì)于給定的(de)時(shí)間尺度,在時(shí)間以及分(fēn)析師兩個(gè)維度同時(shí)聚合,獲得(de)該  下(xià)全部 R-squared 均值,以此表示時(shí)間尺度  下(xià)的(de)分(fēn)析師預測準确度水(shuǐ)平。而上圖所繪的(de)正是 R-squared 均值如何随  變化(huà)。圖中曲線清晰的(de)表明(míng),分(fēn)析師盈利預測準确度随預測時(shí)間尺度遞減(圖中灰色區(qū)域爲置信區(qū)間)。這(zhè)似乎是在意料之中,而且也(yě)和(hé)另類數據關系不大(dà)。但之所以鋪墊它,是爲了(le)更好的(de)解讀 Panel B,它诠釋了(le)該文的(de)核心。


f3.png


圖中的(de)藍色曲線是使用(yòng) 1983 到 1999 年之間的(de)數據構造的(de) term structure;紅色曲線是使用(yòng) 2000 到 2017 年之間的(de)數據構造的(de) term structure。兩條曲線傳遞出的(de)信息是:紅色曲線的(de)斜率比藍色曲線斜率更加陡峭,說明(míng)進入 2000 年之後(即另類數據逐漸開始在美(měi)股上嶄露頭角之後)短時(shí)間尺度上預測準确度增加,而其代價是長(cháng)時(shí)間尺度上預測準确度下(xià)降。


爲了(le)更好的(de)說明(míng)這(zhè)一點,下(xià)圖分(fēn)别逐年繪制了(le)短期預測(小于一年)的(de)平均準确度以及長(cháng)期預測(超過兩年)的(de)平均準确度。圖中清晰的(de)展示出,短期預測的(de)平均準确度呈上行趨勢,而長(cháng)期預測的(de)平均準确度則呈下(xià)行趨勢。


f4.png


需要說明(míng)的(de)是,雖然預測準确性的(de) term structure 随著(zhe)另類數據的(de)普及變得(de)更加陡峭(短期預測準确性上升、長(cháng)期預測準确性降低),但是該結果并不能直接證實二者的(de)聯系。爲此,Dessaint, Foucault, and Fresard (2022) 考察了(le)不同行業 term structure 随時(shí)間的(de)變化(huà)趨勢與另類數據的(de)使用(yòng)關系。回歸結果顯示,另類數據使用(yòng)越多(duō)的(de)行業,term structure 變得(de)更加陡峭,從而說明(míng)了(le)另類數據的(de)使用(yòng)以及長(cháng)短期預測準确度變化(huà)差異二者之間的(de)聯系。以上簡要介紹了(le) Dessaint, Foucault, and Fresard (2022) 的(de)核心結果。下(xià)面馬上來(lái)看看 A 股的(de)分(fēn)析師盈利預測又如何。


2


使用(yòng)朝陽永續的(de)分(fēn)析師預測數據(時(shí)間跨度爲 2012 到 2023,共 4208520 個(gè)樣本),我們(基本)複現了(le) Dessaint, Foucault, and Fresard (2022) 的(de) term structure(及其變化(huà))。由于沒有 A 股分(fēn)析師使用(yòng)另類數據的(de)具體情況,我們的(de)實證主要聚焦于 term structure 部分(fēn)及其随時(shí)間的(de)變化(huà)。另外,實證部分(fēn)針對(duì) A 股的(de)實際情況也(yě)做(zuò)了(le)相應的(de)調整。


首先,Dessaint, Foucault, and Fresard (2022) 在每個(gè)日期  、分(fēn)析師  以及時(shí)間尺度  的(de)組合下(xià)進行截面回歸,然後再從時(shí)間和(hé)分(fēn)析師兩個(gè)維度聚合到時(shí)間尺度  下(xià),計算(suàn)平均 R-squared。在 A 股中,在如此粒度的(de)切割下(xià),對(duì)于給定的(de)  、  以及  組合,無法産生足夠的(de)樣本進行截面回歸。因此我們先在分(fēn)析師層面進行一次聚合,然後将給定  和(hé)  組合下(xià)的(de)全部樣本進行截面回歸,得(de)到 R-squared 之後再聚合時(shí)間維度,最終得(de)到給定  下(xià)的(de)平均信息準确度。此外,不難發現,  取值的(de)粒度也(yě)将決定每次截面回歸時(shí)樣本數的(de)多(duō)寡。本文彙報的(de)結果中,其取值粒度爲月(yuè)份,即将盈利預測發布時(shí)間和(hé)實際财報發布時(shí)間之間的(de)差距映射到月(yuè)。例如,  表示盈利預測和(hé)财報發布之間的(de)時(shí)間區(qū)間在 0 到 1 個(gè)月(yuè)之間。


下(xià)表展示了(le)  、  時(shí)的(de)分(fēn)析師預測樣本。


f5.png


另外一個(gè)差異是  的(de)取值範圍。從原文可(kě)知,美(měi)股中  的(de)跨度到 60 個(gè)月(yuè)。而 A 股實證中這(zhè)個(gè)跨度是 1 到 36 個(gè)月(yuè)。由于超過 36 個(gè)月(yuè)的(de)樣本個(gè)數太少,因此我們将其排除在考慮範圍之内。下(xià)面就來(lái)看實證結果。首先是整個(gè)實證區(qū)間内的(de) term structure(對(duì)應原文 Figure III,Panel A)。和(hé)美(měi)股上的(de)結果一緻,A 股分(fēn)析師盈利預測的(de)準确性也(yě)随著(zhe)預測時(shí)間尺度而遞減。不過有意思的(de)是,當預測時(shí)間尺度很短(即  取值很小)時(shí),A 股分(fēn)析師的(de)預測準确性要高(gāo)于美(měi)股分(fēn)析師。例如,當  時(shí),A 股分(fēn)析師預測準确度超過 90%,而美(měi)股分(fēn)析師的(de)預測準确度則不到 90%。(稍後會簡要討(tǎo)論這(zhè)個(gè)問題。)


f6.png


接下(xià)來(lái),我們看看能否複現原文的(de) Figure III, Panel B。爲此,以 2016 年爲分(fēn)界将分(fēn)析師盈利預測樣本分(fēn)成前後兩個(gè)區(qū)間,然後分(fēn)别計算(suàn)并繪制這(zhè)兩個(gè)區(qū)間内分(fēn)析師盈利預測準确度的(de) term structure,結果如下(xià)。從圖中可(kě)知,後一個(gè)區(qū)間内的(de)短期預測準确度确有提升(和(hé)美(měi)股一緻),另外有意思的(de)現象是在跨度爲 1 - 2 年(12 到 24 個(gè)月(yuè))的(de)預測尺度上,第二個(gè)區(qū)間内的(de)準确度較第一個(gè)區(qū)間顯著降低。不過和(hé)美(měi)股不同的(de)是,在大(dà)于 2 年的(de)預測尺度上,兩個(gè)區(qū)間内的(de)結果并無顯著差異。


f7.png


在進一步討(tǎo)論結論之前,我們再嘗試複現原文 Figure IV,即逐年計算(suàn)短期預測(以  個(gè)月(yuè)的(de)全部預測爲代表)和(hé)長(cháng)期預測(以  個(gè)月(yuè)的(de)全部預測爲代表)下(xià) R-squared 的(de)均值。下(xià)表彙報了(le)每年的(de) R-squared 樣本數。


f8.png


接下(xià)來(lái),分(fēn)别用(yòng)每年 R-squared 均值對(duì)時(shí)間回歸,得(de)到  和(hé)  兩個(gè)情境下(xià)各自的(de)回歸斜率。之後,統計檢驗這(zhè)兩個(gè)斜率是否相等。下(xià)表展示了(le)檢驗結果,其中同時(shí)考慮了(le) OLS 和(hé) robust regression 的(de)情況(後者中使用(yòng) Huber function 及默認參數作爲 obj function)。在 OLS 下(xià),檢驗的(de) p-value 小于 5%;但當換成 robust regression 時(shí),p-value 卻高(gāo)于 10%,表明(míng)兩個(gè)回歸系數的(de)差異并不顯著。


f9.png


下(xià)圖繪制了(le)逐年 R-squared 均值的(de)散點圖以及相應的(de)回歸結果。通(tōng)過回歸結果可(kě)知,短期預測準确性的(de)斜率爲正(說明(míng)随時(shí)間呈上升趨勢);長(cháng)期預測準确性的(de)斜率爲負(說明(míng)随時(shí)間呈下(xià)降趨勢)。然而,由于 A 股分(fēn)析師盈利預測的(de)時(shí)間跨度遠(yuǎn)不如美(měi)股(且也(yě)有理(lǐ)由合理(lǐ)地懷疑應用(yòng)另類數據的(de)程度也(yě)不及美(měi)股),因此上述結果是否穩健有待時(shí)間的(de)檢驗(比如,當使用(yòng) robust regression 時(shí),兩個(gè)回歸系數的(de)差異在統計上并不顯著)。


f10.png


最後,在結束本文實證之前,再來(lái)看看前面遺留的(de)問題:爲什(shén)麽 A 股中短期預測的(de)準确性比美(měi)股更高(gāo)。我們對(duì)此的(de)猜想是分(fēn)析師在上市公司披露了(le)業績預告或者業績快(kuài)報(根據監管要求,前者是有條件強制披露,後者是鼓勵披露)之後做(zuò)出的(de)預測提升了(le)短期準确性。爲此,我們挑出在每個(gè)财報期發布業績預告(業績快(kuài)報)的(de)上市公司,然後将相應的(de)分(fēn)析師盈利預測樣本劃分(fēn)爲早于和(hé)晚于業績預告(業績快(kuài)報)兩組,并檢驗這(zhè)兩組在短時(shí)間尺度上預測準确性(即 R-squared)是否在統計上顯著不同。下(xià)表給出了(le)  分(fēn)别取 1,2 以及 3 時(shí)的(de)檢驗結果。


f11.png


由結果可(kě)知,無論是業績預告還(hái)是快(kuài)報,在其發布後的(de)分(fēn)析師盈利預測準确性均顯著提升。這(zhè)一結果符合預期,同時(shí)也(yě)暗示了(le)業績預告和(hé)快(kuài)報對(duì)資産定價的(de)重要性。以上就是針對(duì) A 股的(de)實證結果,希望它們能給你帶來(lái)些許不一樣的(de)啓發。再次感謝朝陽永續對(duì)實證的(de)全方位支持。


3


如果你不希望單純地将另類數據和(hé)市場(chǎng)異象研究畫(huà)等号,那麽 Dessaint, Foucault, and Fresard (2022) 應該會讓你眼前一亮。因爲前者,僅僅是另類數據在資産定價研究中的(de)很小一部分(fēn)而已。


如何通(tōng)過另類數據的(de)角度去理(lǐ)解哪些系統性風險驅動資産收益率在時(shí)序和(hé)截面上的(de)變化(huà)?另類數據如何影(yǐng)響各類金融參與者的(de)行爲?數據豐富性和(hé)資産價格中信息含量之間的(de)動态關系又如何随時(shí)間變化(huà)?另類數據如何影(yǐng)響投資者學習(xí)以及它們是否會進一步導緻事後虛假可(kě)預測性?……這(zhè)些問題也(yě)許遠(yuǎn)比挖個(gè) anomaly 重要。


根據作者官網的(de)介紹,Dessaint, Foucault, and Fresard (2022) 是 JF forthcoming,盼它早日見刊。



參考文獻

Dessaint, O., T. Foucault, and L. Fresard (2022). Does alternative data improve financial forecasting? The horizon effect. Working paper.



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。