PCA 的(de)源起、中興和(hé)未來(lái)

發布時(shí)間:2024-01-12  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:PCA 及其各種變化(huà)已成爲估計隐性因子模型的(de)利器。本文帶你了(le)解實證資産定價領域中 PCA 的(de)源起,中興和(hé)未來(lái)。


1 源起


APT (Ross 1976) 指出資産收益率和(hé)因子之間的(de)線性結構。根據定義,我們可(kě)以把資産協方差矩陣用(yòng)因子暴露和(hé)因子溢價的(de)協方差矩陣表示,即:


  


其中  、  以及  分(fēn)别爲資産協方差矩陣、因子協方差矩陣和(hé)随機擾動的(de)協方差矩陣;  是因子暴露。Ross (1976) 假設不同資産的(de)随機擾動不相關,因此  爲對(duì)角陣。滿足該條件的(de)因子模型被稱爲嚴格的(de)因子模型(exact factor model)。


上式意味著(zhe)因子的(de)協方差應能解釋資産協方差的(de)一大(dà)部分(fēn)。因此,我們也(yě)可(kě)以從資産的(de)協方差矩陣出發來(lái)估計隐性(latent)因子和(hé)相應的(de)因子暴露。談到分(fēn)析協方差矩陣,最直接的(de)是因子分(fēn)析(factor analysis)。Roll and Ross (1980) 通(tōng)過這(zhè)種方法分(fēn)析了(le)早年的(de)美(měi)股收益率數據并發現了(le)三到四個(gè)因子,它們在一定程度上成功的(de)解釋了(le)資産的(de)預期收益率。


之後,Chamberlain and Rothschild (1983) 放松了(le) Ross 關于  的(de)假設,允許随機擾動之間弱相關,并由此得(de)到了(le)近似的(de)因子模型(approximate factor model)。對(duì)于該模型,他(tā)們指出用(yòng) PCA 代替因子分(fēn)析可(kě)以得(de)到同樣的(de)結果。另外,Connor and Korajczyk (1986,1988) 提出了(le)當截面(cross-section)上資産個(gè)數增大(dà)時(shí)的(de)漸近主成分(fēn)分(fēn)析(asymptotic principal components)。這(zhè)些研究一舉奠定用(yòng) PCA 研究隐性因子或統計因子(statistical factor)的(de)基礎。


然而在實證方面,應用(yòng) PCA 卻并沒有那麽順利。Connor and Korajczyk (1988) 最早使用(yòng)大(dà)約 1500 支股票(piào)研究了(le)隐性因子模型的(de)表現。結果顯示,盡管基于 PCA 的(de)因子模型比起 CAPM 模型更能解釋樣本中的(de)風險和(hé)收益率,但定價誤差依然非常顯著。這(zhè)是因爲基于 PCA 估計的(de)時(shí)無條件(或靜态)因子模型(即 beta 不随時(shí)間變化(huà)),而這(zhè)類模型很難描述個(gè)股級别的(de)數據。從那之後,PCA 便淡出了(le)人(rén)們的(de)視線。


2 中興


近年來(lái),随著(zhe)機器學習(xí)在實證資産定價中的(de)廣泛應用(yòng),PCA 再次回到了(le)人(rén)們的(de)視線。這(zhè)一現象在一定程度上得(de)益于三方面的(de)原因。


首先最重要的(de)原因是,盡管基于個(gè)股協方差矩陣的(de) PCA 所構造的(de)隐性因子模型在描述個(gè)股面闆數據時(shí)效果不理(lǐ)想,但如果把 assets 換成基于公司特征構造的(de)投資組合,然後使用(yòng)投資組合的(de)協方差矩陣作爲 PCA 的(de)輸入,則得(de)到的(de)隐性多(duō)因子模型能夠很好的(de)爲這(zhè)些資産定價。這(zhè)方面的(de)代表包括 Kozak, Nagel and Santosh (2018, 2020)


第二個(gè)原因是從無條件(靜态)因子模型向條件(動态)因子模型的(de)轉變,這(zhè)背後的(de)代表是 Kelly et al. (2019) 的(de)工具變量 PCA(IPCA)模型。該模型和(hé)前述研究最大(dà)的(de)區(qū)别是将因子暴露 beta 視爲公司特征的(de)函數,從而對(duì) beta 直接建模。由于公司特征是随時(shí)間變化(huà)的(de),因此 beta 也(yě)自然就是時(shí)變的(de)。以此得(de)到的(de)隐性因子模型能夠更好的(de)捕捉資産收益率在時(shí)序的(de)變化(huà)以及在截面上的(de)差異。後續一些比較基于不同機器學習(xí)方法所構造的(de)因子模型的(de)實證研究發現,IPCA 方法不輸于(甚至是優于)一些更複雜(zá)的(de)非線性模型(例如深度神經網絡)。


第三個(gè)原因是從經濟學角度對(duì)傳統 PCA 目标函數的(de)擴展,使通(tōng)過它得(de)到的(de)隐性模型有更好的(de)定價能力。關于這(zhè)點,我們可(kě)以通(tōng)過 Lettau and Pelger (2020a, b) 提出的(de) Risk-Premium PCA(PR-PCA)爲例來(lái)理(lǐ)解。令  表示資産的(de)超額收益率矩陣、  表示資産超額收益率時(shí)序均值向量。則傳統 PCA 是對(duì)資産的(de)(樣本)協方差矩陣,即:


  


來(lái)進行。不難看出,傳統 PCA 方法隻考慮了(le)收益率的(de)二階矩信息,而忽視了(le)和(hé)定價可(kě)能更爲相關的(de)一階矩信息。基于這(zhè)個(gè)動機,Lettau and Pelger (2020a, b) 對(duì)協方差矩陣進行了(le)變形,加入了(le)一階矩信息:


  


并通(tōng)過參數  控制一階矩信息的(de)強弱(當  時(shí),上述表達式退化(huà)爲樣本協方差矩陣)。以該目标得(de)到的(de)隐性因子模型被證明(míng)在樣本外有更好的(de)定價能力以及更高(gāo)的(de)夏普比率。


3 未來(lái)


Lettau and Pelger (2020a, b) 的(de)研究事實上爲進一步發揮 PCA 在實證資産定價中的(de)作用(yòng)提供了(le)一個(gè)可(kě)行的(de)思路,即人(rén)們能否通(tōng)過經濟學指引對(duì)樣本協方差矩陣進行其他(tā)變形,從而更好的(de)估計隐性因子模型。Bryzgalova et al. (2023) 一文從時(shí)序和(hé)截面角度精彩地回答(dá)了(le)這(zhè)個(gè)問題。(BTW,去年我沒在知乎上回答(dá) 202X 年優秀的(de)金融學論文這(zhè)個(gè)問題。如果要我來(lái)回答(dá),那麽它就是 Bryzgalova et al. 2023)。


這(zhè)篇文章(zhāng)最大(dà)的(de)價值,是提出了(le)如何在樣本協方差矩陣中納入截面或時(shí)序或 both 信息的(de)一個(gè)框架。在數學上,它們均可(kě)以被表達爲在樣本協方差矩陣中加入相關信息的(de)形式,并通(tōng)過罰參數來(lái)控制信息的(de)強弱。以截面信息爲例,我們可(kě)以對(duì)如下(xià)矩陣進行 PCA:


  


其中  表示含有截面信息的(de)截面投影(yǐng)矩陣,  可(kě)以理(lǐ)解爲截面信息的(de)維數。那麽,從經濟學先驗出發,可(kě)以考慮哪些截面和(hé)時(shí)序信息呢(ne)?


先來(lái)說截面方面。大(dà)量實證結果表明(míng)通(tōng)過公司特征進行組合排序而構造的(de)分(fēn)位數投資組合的(de)收益率往往十分(fēn)單調。因此我們自然希望這(zhè)些投資組合對(duì)于 PCA 得(de)到的(de)隐性因子的(de)暴露也(yě)是單調的(de)。我們可(kě)以以此爲目标對(duì)樣本協方差矩陣進行相應的(de)變形。再說時(shí)序方面。上一節介紹的(de) PR-PCA 已經是這(zhè)方面的(de)一個(gè)特例,即它在樣本協方差矩陣的(de)基礎上加入了(le)不同資産收益率時(shí)序均值的(de)信息  。除此之外,我們還(hái)可(kě)以考慮其他(tā)的(de)時(shí)序信息,比如資産相對(duì)給定定價模型(例如 FF5)的(de)定價誤差 alpha。這(zhè)背後的(de)動機是,我們希望隐性因子模型所估計出的(de)因子,能夠有效地對(duì)該定價模型無法解釋的(de)收益率部分(fēn)定價。


從 Bryzgalova et al. (2023) 的(de)實證結果來(lái)看,加入截面或者時(shí)序信息的(de) PCA 在樣本内、外均能獲得(de)更好的(de)結果,體現爲更小的(de)定價誤差以及更高(gāo)的(de)夏普比率。那麽,爲什(shén)麽加入這(zhè)些信息有助于估計出更好的(de)因子呢(ne)?對(duì)于估計隐性因子而言,能否發現一個(gè)因子的(de)關鍵因素在于因子的(de)強度,即它能解釋資産收益率共同運動的(de)比例。這(zhè)一點從 PCA 的(de)結果不難理(lǐ)解:找到的(de)因子對(duì)應著(zhe)特征值最大(dà)的(de)特征向量。然而,如果一個(gè)因子僅能解釋很少的(de)波動,它就是一個(gè)弱因子(week factor),哪怕它帶有關于截面預期收益率差異的(de)重要信息,也(yě)無法被 PCA 發現。在樣本協方差矩陣中加入截面和(hé)/或時(shí)序信息的(de)作用(yòng)就是爲了(le)提高(gāo)弱因子的(de)強度。因此,盡管一個(gè)因子就解釋資産波動而言可(kě)能很弱,但是它在新加入的(de)信息方面可(kě)能很強。通(tōng)過對(duì)協方差矩陣的(de)變形能夠提升這(zhè)些因子的(de)強度,從而讓它們可(kě)以被發現和(hé)估計。


對(duì)于不同類型的(de)因子,加入新信息都是有益的(de)。那些原本無法僅通(tōng)過協方差矩陣檢測到的(de)弱因子,現在可(kě)以被估計出來(lái)。那些強度一般的(de)因子(semi-weak factors),能夠以更高(gāo)的(de)收斂率被估計出來(lái)。而對(duì)于本來(lái)就能夠解釋大(dà)部分(fēn)波動的(de)強因子而言,加入上述信息也(yě)能提升它們的(de)估計效率。這(zhè)是因爲加入的(de)截面和(hé)時(shí)序信息包含了(le)收益率的(de)一階矩信息,而如此得(de)到的(de) PCA 可(kě)以被視爲一個(gè)矩估計量,其中通(tōng)過優化(huà)罰參數來(lái)權衡不同的(de)矩信息。


Bryzgalova et al. (2023) 所提出的(de)框架的(de)意義在于,它能夠讓人(rén)們根據自己的(de)目标,通(tōng)過适當的(de)經濟學依據來(lái)引入關于隐性因子的(de)先驗信息,并得(de)到更好的(de)隐性因子模型。它代表了(le) PCA 的(de)未來(lái)。最後,讓我以 Bryzgalova et al. (2023) 自己的(de)話(huà)總結并結束本文:


Our framework can be used to study a broad class of various asset-pricing restrictions related to different spanning properties of the risk factors as well as shape restrictions on their loadings. Importantly, we do not aim to provide a single most efficient way to recover the underlying SDF by choosing “optimal” priors. Instead, we allow the researcher to specify different types of restrictions consistent with both structural and reduced-form insights about the cross-section of asset returns and risk factors that drive it.



參考文獻

Bryzgalova, S., V. DeMiguel, S. Li, and M. Pelger (2023). Asset-pricing factors with economic targets. Working paper.

Chamberlain, G. and M. Rothschild (1983). Arbitrage, factor structure, and mean-variance analysis on large asset markets. Econometrica 51(5), 1281–1304.

Connor, G. and R. A. Korajczyk (1986). Performance measurement with the arbitrage pricing theory. Journal of Financial Economics 15(3), 373–394.

Connor, G. and R. A. Korajczyk (1988). Risk and return in an equilibrium APT application of a new test methodology. Journal of Financial Economics 21(2), 255–289.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501–524.

Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73(3), 1183–1223.

Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271–292.

Lettau, M. and M. Pelger (2020a). Estimating latent asset-pricing factors. Journal of Econometrics 218, 1–31.

Lettau, M. and M. Pelger (2020b). Factors that fit the time series and cross-section of stock returns. Review of Financial Studies 33(5), 2274–2325.

Roll, R. and S. A. Ross (1980). An empirical investigation of the arbitrage pricing theory. Journal of Finance 35(5), 1073–1103.

Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341–360.



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。