解釋股票(piào)截面預期收益差異的(de)獨立因子
發布時(shí)間:2018-12-12 | 來(lái)源: 川總寫量化(huà)
作者:石川
摘要:Green, Hand and Zhang (2017) 通(tōng)過 Fama-MacBeth 回歸同時(shí)檢驗了(le) 94 個(gè)因子,發現其中 12 個(gè)是顯著的(de)。
1 引言
在發表偏差(publication bias)的(de)驅使下(xià),多(duō)重檢驗(multiple testing)已經成爲學術界在進行 asset pricing 時(shí)的(de)普遍做(zuò)法。然而,很多(duō)發表于頂級期刊的(de)所謂能夠解釋股票(piào)截面預期收益差異的(de)因子都是虛假發現(見《出色不如走運(II)?》)。針對(duì)這(zhè)個(gè)問題,2011 年,前美(měi)國金融協會主席 John Cochrane 教授在主席演講中向學術界提出挑戰 —— 到底哪些因子能獨立解釋股票(piào)預期收益截面差異?
2017 年,一篇發表于頂刊 Review of Financial Studies 上的(de)文章(zhāng)通(tōng)過使用(yòng) Fama-MacBeth Regression (Fama and MacBeth 1973)同時(shí)檢驗 94 個(gè)學術界發表的(de)異象回答(dá)了(le)這(zhè)個(gè)問題(Green, Hand and Zhang 2017,下(xià)文記爲 GHZ)。
事實上,這(zhè)并不是學術界就此問題的(de)唯一嘗試。比如,Harvey and Liu (2018) 提出了(le)一個(gè)基于回歸的(de)框架來(lái)排除運氣的(de)成分(fēn)以便檢驗真正有效的(de)因子。不過 Harvey and Liu (2018) 這(zhè)篇文章(zhāng)的(de)核心内容是介紹他(tā)們提出的(de)方法而非實證結果。而 GHZ 的(de)研究指出了(le)美(měi)股上真正有效的(de)因子,具有更高(gāo)的(de)實證價值。無論是這(zhè)些因子還(hái)是 GHZ 使用(yòng)的(de)方法對(duì) A 股都有不小的(de)借鑒意義。本文就來(lái)介紹 GHZ 這(zhè)篇論文。
2 數據和(hé)因子
在研究中,GHZ 利用(yòng)了(le) CRSP,Compustat 以及 I/B/E/S 數據庫的(de)數據首先挑選出了(le) 102 個(gè)因子,回測時(shí)間是 1980 年 1 月(yuè)到 2014 年 12 月(yuè),頻(pín)率爲月(yuè)頻(pín)。回測期之所以從 1980 年開始是由上市公司基本面數據的(de)可(kě)得(de)性決定的(de);同時(shí)包含 NYSE、AMEX 以及 NASDAQ 的(de)上市公司。除此之外,GHZ 的(de)特别之處是考慮了(le)微小市值公司對(duì)評價因子有效性時(shí)的(de)影(yǐng)響。爲此,他(tā)們将所有股票(piào)根據市值分(fēn)成三擋:
1. 市值超過中位數的(de)股票(piào)爲大(dà)市值組;
2. 市值在中位數和(hé) 20% 分(fēn)位數之間的(de)爲小市值組;
3. 市值在 20% 分(fēn)位數之下(xià)的(de)爲微小市值(microcap)組。
微小市值的(de)這(zhè)些股票(piào)的(de)市值之和(hé)僅占所有股票(piào)總市值的(de) 3%。爲了(le)避免回歸分(fēn)析時(shí)對(duì)它們過度加權,GHZ 采取了(le)兩種回歸方法:
1. 對(duì)所有股票(piào)采用(yòng)市值加權最小二乘法(VWLS);
2. 對(duì)前兩組的(de)股票(piào)(即所有股票(piào)中排除微小市值組)采取普通(tōng)最小二乘法(OLS)。
作者認爲上述兩種方法能夠更合理(lǐ)的(de)找到有效因子,并通(tōng)過合并這(zhè)兩種回歸的(de)結果确定最終的(de)顯著因子。作爲比較 —— 同時(shí)也(yě)是爲了(le)說明(míng)過度加權微小市值股票(piào)的(de)危害 —— GHZ 也(yě)同樣對(duì)所有的(de)股票(piào)進行了(le) OLS 回歸。不出意外,由于微小市值股票(piào)存在造成的(de)偏誤,這(zhè)種方法能夠發現更多(duō)的(de)“有效”因子,但很多(duō)因子在非微小市值股票(piào)上并不顯著。
在進行多(duō)因子同時(shí)回歸時(shí),因子間的(de)共線性是必須考慮的(de)問題。共線性會造成因子收益率标準誤(standard error)的(de)巨大(dà)誤差,從而無法有效的(de)評價因子是否顯著(見《爲什(shén)麽要進行因子正交化(huà)處理(lǐ)?》)。GHZ 使用(yòng) variance inflation factors(VIF)對(duì)因子進行了(le)初步篩選,并剔除了(le) 8 個(gè) VIF 高(gāo)于 7 的(de)因子(下(xià)圖),最終從 102 個(gè)因子中選出了(le) 94 個(gè)待評價的(de)因子。這(zhè) 94 個(gè)因子的(de)平均相關系數爲 0.07。
同時(shí)檢驗 94 個(gè)因子屬于 multiple testing 的(de)問題。爲避免過拟合,GHZ 對(duì)回歸分(fēn)析得(de)到的(de)單個(gè)因子 p-value 進行了(le)以控制 false discovery rate爲目标的(de)調整,具體使用(yòng)的(de)方法爲 BHY 修正(Benjamini and Yekutieli 2001,見《出色不如走運(II)?》)。GHZ 以調整後的(de) p-value 小于 0.05 作爲因子顯著的(de)準則。
除了(le)調整後的(de) p-value 之外,GHZ 也(yě)同時(shí)計算(suàn)了(le)每個(gè)因子的(de) t-statistic。Harvey et al. (2016) 指出由于 multiple testing 的(de)問題,單個(gè)因子的(de) t-statistic(的(de)絕對(duì)值)至少要大(dà)于 3 才可(kě)能顯著。GHZ 也(yě)以此爲顯著性準則彙報了(le)顯著性因子的(de)個(gè)數。該準則比調整後 p-value 小于 0.05 要弱一些,因此找到了(le)更多(duō)的(de)因子。
下(xià)面就來(lái)看看實證結果。
3 單個(gè)因子檢驗
在同時(shí)對(duì) 94 個(gè)因子進行檢驗之前,GHZ 首先對(duì)每個(gè)因子進行了(le)單獨檢驗。作者這(zhè)麽做(zuò)的(de)目的(de)是希望通(tōng)過單獨檢驗和(hé)共同檢驗分(fēn)别找出顯著性的(de)因子,以此比較這(zhè)兩種方法找到的(de)因子是否一緻,這(zhè)可(kě)能會對(duì)未來(lái)的(de) asset pricing 研究帶來(lái)一些啓發和(hé)靈感。在單個(gè)因子檢驗中,截面回歸方程的(de)左側是個(gè)股的(de)收益率,右側是目标因子和(hé)其他(tā)控制變量。根據有無控制變量,單個(gè)因子的(de)檢驗一共有以下(xià)四個(gè)版本:
1. 僅有單個(gè)目标因子,無其他(tā)控制變量;
2. 除了(le)單個(gè)目标因子外,還(hái)包括四因子模型(Fama and French 1993 的(de)三因子 + Carhart 1997 的(de)動量因子);
3. 除了(le)單個(gè)目标因子外,還(hái)包括 Fama-French 五因子模型(Fama and French 2015);
4. 除了(le)單個(gè)目标因子外,還(hái)包括 Hou et al. (2015) 的(de)因子模型。
對(duì)每一個(gè)版本,通(tōng)過在每期用(yòng)因子暴露和(hé)下(xià)一期的(de)個(gè)股收益率截面回歸得(de)到因子收益率,然後使用(yòng)因子收益率的(de)時(shí)序對(duì)因子顯著性進行分(fēn)析,計算(suàn)得(de)到調整後的(de) p-value 以及 t-statistic,使用(yòng) p-value 是否小于 0.05 或 t-statistic 絕對(duì)值是否大(dà)于 3.0 爲基準決定真正顯著的(de)獨立因子。在回歸時(shí),考慮了(le)本文前一節提到的(de)三種方法 —— 對(duì)所有股票(piào)進行 VWLS,對(duì)非微小市值股票(piào)進行 OLS,以及(作爲“反面教材”的(de))對(duì)所有股票(piào)進行 OLS。爲了(le)方便在下(xià)文中介紹結果,将前兩種回歸稱爲 GHZ 回歸。
單個(gè)因子檢驗的(de)結果如下(xià)(由于 94 個(gè)因子太多(duō),故節選部分(fēn)):
上圖中最重要的(de)部分(fēn)是紅色标記的(de)地方 —— 即使用(yòng)調整後 p-value 小于 0.05 爲基準确定的(de)顯著因子個(gè)數。在沒有控制變量的(de)模型中(column A),GHZ 回歸一共找到了(le) 12 個(gè)顯著因子;作爲對(duì)比,由于微小市值股票(piào)的(de)影(yǐng)響,對(duì)所有股票(piào)的(de) OLS 回歸發現了(le) 30 個(gè)顯著因子。這(zhè)說明(míng) 18 個(gè)因子在非微小市值股票(piào)上是無效的(de)。其他(tā)帶控制變量的(de)回歸(columns B to D)也(yě)有類似的(de)結果。
在沒有控制變量的(de)模型中,通(tōng)過單個(gè)因子回歸分(fēn)析發現的(de)顯著因子包括:
1. 總資産增長(cháng)率(asset growth);
2. 經行業調整的(de)銷售收入增長(cháng)率(growth in industry-adjusted sales);
3. 流通(tōng)股本變動百分(fēn)比(growth in shares outstanding);
4. 存貨變動(growth in inventory);
5. 盈餘公告宣告收益(earnings announcement return);
6. 賬面價值增長(cháng)率(growth in book value of equity);
7. 資本支出增長(cháng)率(growth in CAPEX);
8. 長(cháng)期淨營運資産增長(cháng)率(growth in long-term net operating assets);
9. 機器設備廠房(fáng)存貨增長(cháng)率(growth in PP&E plus inventory);
10. 盈利同比增長(cháng)的(de)季度數(number of consecutive quarters with earnings higher than the same quarter a year ago);
11. 銷售收入與存貨差的(de)增長(cháng)率(growth in sales less growth in inventory);
12. 标準化(huà)的(de)未預期盈餘(standardized unexpected quarterly earnings)。
以上通(tōng)過單個(gè)檢驗從 94 個(gè)發表于學術期刊的(de)顯著因子中選出了(le) 12 個(gè),這(zhè)些因子是經過 multiple testing 調整後仍然有效的(de)。下(xià)面就來(lái)看看對(duì)這(zhè) 94 個(gè)因子同時(shí)回歸會得(de)到怎樣的(de)結果。
4 多(duō)個(gè)因子共同檢驗
在共同檢驗時(shí),GHZ 将所有 94 個(gè)因子同時(shí)放入回歸方程的(de)右側,進行 Fama-MacBeth regression。和(hé)上一節一樣,仍然使用(yòng)三種回歸方法。結果(節選)如下(xià):
根據 p-value 基準,在對(duì)所有股票(piào)進行 VWLS 時(shí),一共發現了(le) 6 個(gè)顯著因子;在對(duì)非微小市值股票(piào)進行 OLS 回歸時(shí),一共發現了(le) 9 個(gè)顯著因子。将這(zhè)兩個(gè)回歸的(de)結果合并一共得(de)到 12 個(gè)顯著因子。與之相對(duì)應的(de)是,在對(duì)所有股票(piào)進行 OLS 回歸時(shí),由于微小市值的(de)影(yǐng)響,一共發現了(le) 23 個(gè)顯著因子。把 94 個(gè)因子共同檢驗也(yě)發現了(le) 12 個(gè)顯著因子,它們是:
1. 賬面市值比(book-to-market);
2. 現金(cash);
3. 分(fēn)析師數量的(de)變化(huà)(change in the number of analysts);
4. 盈餘公告宣告收益(earnings announcement return);
5. 一個(gè)月(yuè)的(de)動量(1-month momentum);
6. 六個(gè)月(yuè)動量的(de)變化(huà)(change in 6-month momentum);
7. 盈利同比增長(cháng)的(de)季度數量(number of consecutive quarters with earnings higher than the same quarter in a year ago);
8. 年度研發支出占市值的(de)比重(annual R&D to market cap);
9. 收益波動性(return volatility);
10. 股票(piào)換手率(share turnover);
11. 股票(piào)換手率的(de)波動性(volatility of share turnover);
12. 零交易的(de)天數(zero trading days)。
雖然上一節的(de)單一因子檢驗和(hé)本節的(de)共同檢驗碰巧都發現了(le) 12 個(gè)因子,但是仔細比較不難看出兩種方法找到的(de)顯著因子中大(dà)部分(fēn)并不相同。根據 McLean and Pontiff (2016) 對(duì)因子分(fēn)類的(de)定義,在單一因子檢驗中,10 個(gè)顯著的(de)因子都是基本面因子;而在共同檢驗時(shí),僅有盈利同比增長(cháng)的(de)季度數量屬于基本面因子,剩餘更多(duō)的(de)是交易行爲因子。
上述兩種檢驗結果爲今後的(de) asset pricing 傳遞出兩個(gè)重要信息:
1. 在排除了(le)微小市值對(duì)回歸造成的(de)偏誤以及修正了(le)多(duō)重檢驗的(de)數據挖掘之後,真正顯著的(de)因子個(gè)數很少;
2. 在 asset pricing 的(de)研究中,在分(fēn)析一個(gè)潛在異象時(shí),應該選擇共同檢驗發現的(de)這(zhè)些顯著因子作爲控制變量來(lái)進行研究。
5 樣本外投資組合收益率分(fēn)析
在前兩節的(de)研究中,這(zhè)些顯著的(de)因子是在整個(gè)回測期(1980 到 2014)期間發現的(de)。它們也(yě)許對(duì) asset pricing 有幫助,但是上述結果無法說明(míng)它們在實戰中是否有交易的(de)價值 —— 我們不能回到過去交易這(zhè)些在事後被證明(míng)有效的(de)因子。
爲了(le)研究它們在交易中是否能夠帶來(lái)超額收益,GHZ 采用(yòng)了(le)滾動窗(chuāng)口使用(yòng)因子選股并在樣本外構建投資組合的(de)方法。樣本外滾動測試使用(yòng)過去 10 年(120 個(gè)月(yuè))的(de)數據來(lái)回歸,因此從 1990 年開始。在選股時(shí),由于同時(shí)考慮了(le)多(duō)個(gè)因子,因此使用(yòng)因子收益率來(lái)預測個(gè)股在下(xià)一期的(de)收益率,并使用(yòng)預期收益率的(de)高(gāo)低構建多(duō)空對(duì)沖的(de)投資組合(做(zuò)多(duō)預期收益率最高(gāo)的(de) 10%、做(zuò)空預期收益率最低的(de) 10%)。實證中一共考察了(le)三種不同的(de)投資組合(三個(gè)組合的(de)區(qū)别是對(duì)小市值股票(piào)的(de)權重依次提升)。當使用(yòng)全部 94 個(gè)因子進行滾動回歸時(shí),不同投資組合的(de)收益率如下(xià)圖所示。随著(zhe)小市值比重的(de)增加,投資組合的(de)收益率逐漸增大(dà)。
如果不使用(yòng)全部 94 個(gè)因子,而僅僅使用(yòng) GHZ 通(tōng)過共同檢驗找出的(de) 12 個(gè)獨立因子會怎樣呢(ne)?下(xià)圖給出了(le)答(dá)案。
可(kě)以很明(míng)顯的(de)看到,僅僅使用(yòng) 12 個(gè)獨立因子顯著降低了(le)投資組合的(de)收益率。這(zhè)意味著(zhe)我們好不容易辛辛苦苦找出了(le) 12 個(gè)對(duì)解釋 asset pricing 有效的(de)獨立因子,但是從實戰選股的(de)角度來(lái)說,這(zhè)卻不如使用(yòng)全部 94 個(gè)因子 —— 不管它們是不是過拟合。如何解釋這(zhè)種現象呢(ne)?GHZ 這(zhè)篇文章(zhāng)并沒有對(duì)此進行過多(duō)的(de)討(tǎo)論。就我的(de)理(lǐ)解,上述結果說明(míng)了(le)兩點:
1. 這(zhè) 12 個(gè)因子在整個(gè)回測期内顯著;當使用(yòng)滾動窗(chuāng)口時(shí),不同的(de)因子可(kě)能在不同曆史時(shí)期顯著,因此使用(yòng) 94 個(gè)因子能夠更好的(de)捕捉因子風格的(de)輪動。
2. 實盤交易的(de)目标是爲了(le)獲得(de)超額收益,而不是理(lǐ)解 asset pricing 的(de)機制。對(duì)于選股模型來(lái)說,最核心的(de)是對(duì)未來(lái)收益率的(de)預測是否準确,而非因子的(de)收益率估計是否無偏。上面的(de)結果說明(míng)使用(yòng)更多(duō)的(de)因子提高(gāo)了(le)樣本外收益率預測的(de)準确性。
有必要指出的(de)是,上面的(de)實證結果并沒有考慮實際交易中的(de)手續費等問題,且同時(shí)使用(yòng) 94 個(gè)因子一定存在過拟合的(de)問題。因此,雖然數據顯示 94 個(gè)因子比 12 個(gè)因子的(de)效果更好,這(zhè)也(yě)不意味著(zhe)我們在實際交易中一定能取得(de)顯著的(de)優勢。
6 2003 前後的(de)差異
GHZ 這(zhè)篇文章(zhāng)研究的(de)最後一個(gè)部分(fēn)發現因子在 2003 年前後截然不同的(de)表現 —— 因子對(duì)截面收益率差異的(de)解釋力度驟然下(xià)降。上一節提到的(de)三個(gè)樣本外投資組合的(de)收益率在 2003 年前後的(de)表現如下(xià)圖所示,前後出現了(le)明(míng)顯的(de)差異。這(zhè)些投資組合的(de)淨值曲線在 2003 年之後變得(de)更加平坦。
在 2003 年之後,僅僅有 2 個(gè)因子仍然顯著,它們分(fēn)别爲盈利同比增長(cháng)的(de)季度數量以及經行業調整後的(de)員(yuán)工數。究其原因,GHZ 認爲在 2003 年之後,美(měi)股上的(de)套利成本大(dà)幅降低造成了(le)這(zhè)種現象。2002 年 7 月(yuè),美(měi)國股市通(tōng)過了(le) Sarbanes-Oxley 法案;同年 10 月(yuè),SEC 加速了(le)對(duì)上市公司披露 10-Q 和(hé) 10-K 文件的(de)要求。與此同時(shí),在 2003 年初(1 月(yuè)到 5 月(yuè)),紐交所引入自動報價系統,減少了(le)交易的(de)摩擦成本。這(zhè)一系列變化(huà)極大(dà)降低了(le)交易股票(piào)市場(chǎng)異象的(de)量化(huà)對(duì)沖策略的(de)成本和(hé)技術難度。無疑,2003 年前後的(de)差異對(duì)于今後研究提出了(le)挑戰。GHZ 也(yě)呼籲今後 asset pricing 的(de)研究應該給予 2003 年之後的(de)數據更多(duō)的(de)權重。
7 結語
研究因子時(shí)最艱難的(de)部分(fēn)往往是數據的(de)準備。一旦有了(le)高(gāo)質量的(de)數據,各種用(yòng)于檢驗的(de)回歸及其他(tā)統計手段是非常豐富的(de)。作爲一篇同時(shí)研究 94 個(gè)因子的(de)文章(zhāng),GHZ 的(de)一個(gè)巨大(dà)貢獻在于因子數據的(de)計算(suàn),以及爲了(le)計算(suàn)因子而對(duì)公司基本面和(hé)交易數據的(de)收集、整理(lǐ)。此外,GHZ 在截面回歸中用(yòng)個(gè)股的(de)收益率和(hé)這(zhè) 94 個(gè)因子進行回歸,可(kě)以想見計算(suàn)量之巨大(dà)。這(zhè)和(hé) Harvey and Liu (2018) 中給出的(de)簡單例子完全不同。簡單總結一下(xià)這(zhè)篇文章(zhāng)給多(duō)因子投資實務的(de)啓發:
1. 分(fēn)析時(shí)應排除過度加權微小市值股票(piào)造成的(de)偏差;
2. 真正顯著的(de)因子很少,絕大(dà)部分(fēn)其他(tā)因子都是數據挖掘的(de)産物(wù)、或者能夠被這(zhè)一小部分(fēn)獨立因子解釋;
3. 共同檢驗和(hé)單一檢驗發現的(de)顯著因子往往不同,前者的(de)發現更有效;
4. 因子投資和(hé)資産定價的(de)目标不同;前者是爲了(le)提高(gāo)樣本外預測的(de)準确性,後者是爲了(le)确保因子收益率的(de)無偏估計;在投資實務中,更應該注重前者,但也(yě)要考慮實際的(de)交易限制和(hé)成本。
GHZ 通(tōng)過同時(shí)回歸找到的(de) 12 個(gè)因子雖然是針對(duì)美(měi)股,但很多(duō)在 A 股上也(yě)是有效的(de)。此外,GHZ 使用(yòng)多(duō)個(gè)因子同時(shí)進行 Fama-MacBeth regression 的(de)做(zuò)法和(hé) Barra 如出一轍。今後的(de)研究會使用(yòng) Barra 中國股票(piào)模型中的(de)風格因子進行類似的(de)實證,檢驗不同因子在 A 股上的(de)顯著性,希望以此更好的(de)指導我們在 A 股上實踐因子投資。
參考文獻
Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. Annals of Statistics 29, 1165 – 1188.
Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.
Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607 – 636.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.
Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.
Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies 30(12), 4389 – 4436.
McLean, R.D., J. Pontiff. (2016). Does academic research destroy stock return predictability? Journal of Finance 71(1), 5–32.
免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。