Risk-Return Tradeoffs (II)
發布時(shí)間:2023-12-21 | 來(lái)源: 川總寫量化(huà)
作者:石川
摘要:隐性多(duō)因子模型如何成爲研究資産定價的(de)重要範式?且聽(tīng) Kelly and Xiu (2023) 娓娓道來(lái)。
本文繼續翻譯 Bryan Kelly 和(hé)修大(dà)成兩位教授的(de) Financial Machine Learning (Kelly and Xiu 2023) 第四章(zhāng)(Risk-Return Tradeoffs)的(de)剩餘部分(fēn),即 4.4 到 4.6 節。(第一部分(fēn)請見此處。)
再次感謝王熙和(hé)劉洋溢對(duì)内容的(de)反饋。本翻譯僅供學習(xí)交流使用(yòng),禁止一切商業行爲,未經授權,禁止轉載。
以下(xià)是正文部分(fēn)。
4.4 複雜(zá)因子模型
許多(duō)論文拓展了(le)隐性條件因子模型 (4.8) 中關于 beta 的(de)設定。IPCA 可(kě)以被視爲使用(yòng)可(kě)觀察特征數據的(de)線性變化(huà)來(lái)近似風險暴露。盡管許多(duō)資産定價模型預測預期收益率和(hé)狀态變量之間存在非線性關系,但在篩選條件變量和(hé)挑選函數形式方面,理(lǐ)論文獻能夠提供的(de)指引十分(fēn)有限。機器學習(xí)的(de)出現使人(rén)們能夠用(yòng)一系列的(de)非線性方法來(lái)應對(duì)函數形式的(de)模糊性。
在早期的(de)研究中,Connor et al. (2012) 和(hé) Fan et al. (2016b) 通(tōng)過将 beta 視爲條件特征的(de)非參數函數,從而實現 beta 的(de)非線性設定(但與 IPCA 不同,爲了(le)可(kě)解釋性,這(zhè)些特征在時(shí)間維度上是固定的(de))。利用(yòng)這(zhè)一框架,Kim et al. (forthcoming) 研究了(le)能夠對(duì)沖掉因子風險的(de)“套利”組合的(de)行爲。
Gu et al. (2021) 利用(yòng)神經網絡将 beta 表述爲特征的(de)非線性函數,從而擴展了(le) IPCA 模型。圖 4.3 展示了(le)他(tā)們的(de)“條件自編碼器”(CA)模型。圖 4.3 揭示了(le)其基本結構,該結構與 (4.8) 的(de)不同之處在于,它通(tōng)過非線性激活函數傳遞輸入數據(工具變量
Gu et al. (2021) 是一個(gè)高(gāo)度複雜(zá)的(de)模型。其出色的(de)實證表現暗示著(zhe),對(duì)于因子模型而言,複雜(zá)性提升帶來(lái)的(de)好處可(kě)能與 Kelly et al. (2022a) 在市場(chǎng)擇時(shí)研究中所發現的(de)效果類似(譯者注:即複雜(zá)度可(kě)以提升樣本外表現。)。Didisheim et al. (2023) 正式提出了(le)上述觀點并證明(míng)了(le)因子定價模型中複雜(zá)性的(de)優越性。他(tā)們的(de)分(fēn)析是基于條件随機貼現因子(SDF)視角展開。一般而言,SDF 可(kě)以被表述爲一組風險資産的(de)投資組合:
其中,
其中
其中每個(gè)“因子”
4.5 高(gāo)頻(pín)模型
随著(zhe)可(kě)交易資産越來(lái)越多(duō)的(de)以及它們的(de)高(gāo)頻(pín)交易數據越來(lái)越多(duō),數據可(kě)得(de)性的(de)提升爲估計單個(gè)資産的(de)風險及其相互依賴性提供了(le)獨特的(de)機會。通(tōng)過簡單的(de)非參數化(huà)波動率和(hé)協方差,Andersen and Bollerslev (1998)、Andersen et al. (2001) 以及 Barndorff-Nielsen and Shephard (2002) 展示了(le)如何利用(yòng)豐富且及時(shí)的(de)日内價格數據更好地了(le)解資産市場(chǎng)的(de)波動。使用(yòng)高(gāo)頻(pín)指标有助于解決研究低頻(pín)時(shí)間序列時(shí)面對(duì)的(de)若幹挑戰。例如,它幫助研究者在無需依賴太多(duō)假設的(de)前提下(xià),來(lái)處理(lǐ)結構性變化(huà)和(hé)時(shí)變的(de)參數。此外,對(duì)于日内數據建模而言,經典時(shí)間序列分(fēn)析中關于線性、平穩性、依賴性和(hé)異方差性的(de)許多(duō)标準假設往往是不必要的(de)。
在最新的(de)文獻中,我們發現存在兩大(dà)流派,它們均采用(yòng)機器學習(xí)技術來(lái)估計高(gāo)維協方差矩陣,并利用(yòng)高(gāo)頻(pín)數據提高(gāo)波動率預測的(de)準确性。
對(duì)于成功構建投資組合而言,準确的(de)協方差估計至關重要。但是,由于維數災難問題,估計高(gāo)維協方差矩陣是一個(gè)極具挑戰性的(de)統計問題。許多(duō)方法依賴于各種形式的(de)收縮以改進估計(Bickel and Levina 2008a; Bickel and Levina 2008b; Cai and Liu 2011; Ledoit and Wolf 2012; Ledoit and Wolf 2004)。受 APT 啓發,Fan et al. (2008) 考察了(le)包含可(kě)觀測因子的(de)嚴格因子模型,并提出了(le)基于因子模型的(de)協方差矩陣估計量,而 Fan et al. (2013) 則轉而研究了(le)包含隐性因子的(de)近似因子模型,并提出了(le)相應的(de)估計量。
當面闆數據的(de)(橫截面)維度接近樣本大(dà)小時(shí),在高(gāo)頻(pín)數據中使用(yòng)因子結構式必要的(de)。然而,低頻(pín)和(hé)高(gāo)頻(pín)數據中的(de)計量經濟學方法在本質上存在差異。後者通(tōng)常基于一個(gè)通(tōng)用(yòng)的(de)連續時(shí)間半鞅模型,允許收益率的(de)變化(huà)中出現随機變化(huà)和(hé)跳躍。針對(duì)日内數據,Ait-Sahalia and Xiu (2019) 提出了(le)非參數 PCA 的(de)漸近理(lǐ)論,爲在連續時(shí)間中應用(yòng)因子模型鋪平了(le)道路。此外,基于連續時(shí)間因子模型,Fan et al. (2016a) 和(hé) Ait-Sahalia and Xiu (2017) 使用(yòng)高(gāo)頻(pín)數據提出了(le)個(gè)股高(gāo)維協方差矩陣的(de)估計量。
一個(gè)充滿前景的(de)研究方向是将關于高(gāo)頻(pín)風險度量的(de)文獻與關于預期收益率橫截面的(de)文獻相結合,從而利用(yòng)更豐富的(de)風險信息來(lái)獲得(de)有關風險-收益權衡的(de)深入見解。在這(zhè)個(gè)方向上的(de)一些相關研究包括 Bollerslev et al. (2016)。他(tā)們在連續時(shí)間框架下(xià)計算(suàn)了(le)個(gè)股對(duì)單一市場(chǎng)因子運動中連續和(hé)跳躍兩部分(fēn)各自的(de) beta 值,然後在離散時(shí)間框架中将研究了(le)上述 beta 估計值和(hé)股票(piào)預期收益率的(de)截面關系。Ait-Sahalia et al. (2021) 在統一的(de)連續時(shí)間框架下(xià)爲風險溢價提供了(le)統計推斷。他(tā)們在第一步考慮多(duō)個(gè)因子和(hé)随機 beta 值,并将通(tōng)過第一步估計得(de)到的(de) beta 應用(yòng)于第二步中,進而擴展了(le) Shanken (1992a) 的(de)經典推斷方法。在實證方面,他(tā)們使用(yòng) Ait-Sahalia et al. (2020) 使用(yòng) 15 分(fēn)鐘(zhōng)收益率構造的(de) Fama-French 和(hé)動量因子,檢驗了(le)日内收益率的(de)因子模型。
利用(yòng)高(gāo)頻(pín)數據測量波動率的(de)想法也(yě)使得(de)有關波動率預測的(de)研究充滿前景。Corsi (2009) 提出的(de)測量曆史已實現波動率的(de)異質自回歸(HAR)模型已是當前學術研究和(hé)業界實踐中領先的(de)波動率預測模型。最近,有許多(duō)論文研究如何通(tōng)過機器學習(xí)進行波動率預測,包括 Li and Tang (2022) 以及 Bollerslev et al. (2022)。但與收益率預測時(shí)機器學習(xí)預測的(de)有效性體現爲更高(gāo)的(de)夏普比率不同,對(duì)于波動率預測而言,人(rén)們尚不清楚機器學習(xí)模型能否以及在多(duō)大(dà)的(de)經濟學意義上超越了(le)已有的(de) HAR 模型。這(zhè)是研究中一個(gè)有趣的(de)開放性問題。
4.6 Alphas
本節討(tǎo)論關于 alpha 檢驗和(hé)機器學習(xí)的(de)相關文獻。Alpha 是預期收益率中未被因子暴露所解釋的(de)部分(fēn),因此它是一個(gè)依賴模型(以及測試資産)的(de)對(duì)象。由于經濟理(lǐ)論通(tōng)常過于簡化(huà)、不能指明(míng)所有的(de)因子,且數據量也(yě)不足以讓人(rén)們通(tōng)過數據驅動的(de)方式推斷出所有真正的(de)因子,模型設定偏誤的(de)存在使得(de)區(qū)分(fēn) alpha 和(hé)因子暴露的(de)“公平”補償充滿挑戰。例如,alpha 可(kě)能是因子 beta 偏弱的(de)表現,這(zhè)讓人(rén)想起回歸中的(de)遺漏變量問題。換句話(huà)說,一個(gè)模型的(de) alpha 可(kě)能是另一個(gè)模型的(de) beta。在一個(gè)隐性因子模型中,alpha 和(hé) beta 最終是由一個(gè)區(qū)分(fēn)因子與特質性噪聲的(de)因子強度阈值來(lái)區(qū)分(fēn)的(de)。
我們主要從非條件隐性因子模型的(de)角度分(fēn)析 alpha。之所以強調非條件而不是條件 alpha 是因爲前者是學術研究的(de)重點。此外,我們關注隐性因子模型是因爲對(duì)隐形因子模型來(lái)說,模型設定偏誤問題沒那麽嚴重。
4.6.1 Alpha 檢驗和(hé)經濟重要性
長(cháng)久以來(lái),實證資産定價的(de)焦點是原假設,即所有的(de) alpha 都等于零
衆所周知的(de) GRS 檢驗(Gibbons et al. 1989)是針對(duì)
他(tā)們還(hái)推導了(le) alpha 的(de)必要漸近展開,爲在隐性因子模型中檢驗 alpha 鋪平了(le)道路。
GRS 檢驗統計量基于
APT 假設套利者知道收益率生成過程的(de)真實參數。隻要樣本量足夠大(dà),該這(zhè)假設可(kě)能是成立的(de)。因爲在這(zhè)種情況下(xià),參數能夠被(漸近地)準确估計出來(lái),且套利者的(de)行爲(近似地)表現得(de)好像他(tā)們确切地知道了(le)這(zhè)些真實參數。但問題是,在 APT 的(de)設置中,套利者必須知道越來(lái)越多(duō)的(de) alpha,因此,橫截面維度相對(duì)于典型的(de)樣本大(dà)小來(lái)說是太大(dà)。因此,即使是在
Da et al. (2022) 重新審視了(le) APT,并放寬了(le)參數已知的(de)假設。在他(tā)們的(de)設定中,套利者必須使用(yòng)一個(gè)基于樣本大(dà)小爲
其中
其中當
很顯然,
這(zhè)個(gè)結果表明(míng),alpha 的(de)後驗估計決定了(le)可(kě)行的(de)最優夏普比率以及統計套利利潤的(de)上限。任何機器學習(xí)策略,無論簡單還(hái)是複雜(zá),都需要遵循這(zhè)個(gè)可(kě)行的(de)夏普比率上限。
一般來(lái)說,
可(kě)行和(hé)不可(kě)行策略之間的(de)“夏普比率差距”刻畫(huà)了(le)統計學習(xí)的(de)難度。學習(xí)難度越高(gāo),則差距就越大(dà)。圖 4.4 考慮了(le)假想的(de)收益率生成過程并報告了(le)這(zhè)兩個(gè)夏普比率之比,其中
Da et al. (2022) 展示了(le)如何定量刻畫(huà)可(kě)行和(hé)不可(kě)行夏普比率之間的(de)差距。他(tā)們基于一個(gè)包含 27 個(gè)因子的(de)模型來(lái)評估 APT,其中 16 個(gè)公司特征和(hé) 11 個(gè) GICS 行業啞變量被用(yòng)作可(kě)觀測的(de) beta。使用(yòng) 1975 年 1 月(yuè)到 2020 年 12 月(yuè)的(de)數據,不可(kě)行夏普比率的(de)估計值超過 2.5,是機器學習(xí)算(suàn)法獲得(de)的(de)可(kě)行夏普比率估計值 0.5 的(de)四倍有餘。可(kě)行夏普比率(在考慮交易成本之前)低于 0.5 恰恰表明(míng) APT 在實證上十分(fēn)有效。從理(lǐ)論上講,如果套利者面臨更多(duō)的(de)統計困難,如模型設定偏誤、非稀疏的(de)殘差協方差矩陣等,可(kě)行和(hé)不可(kě)行夏普比率之間的(de)差距會進一步擴大(dà)。
4.6.2 多(duō)重假設檢驗
自從 CAPM 以來(lái),金融經濟學界便開始共同尋找異象;即能獲得(de) CAPM 無法解釋的(de) alpha 的(de)投資組合。其中的(de)一些,如規模、價值和(hé)少數其他(tā)因子已被納入基準定價模型中(Fama and French 1993;Fama and French 2015)。之後,一旦研究者發現這(zhè)些基準模型無法解釋的(de) alpha 時(shí),就宣布找到了(le)新的(de)異象。Harvey et al. (2016) 對(duì)此進行了(le)綜述并整理(lǐ)了(le)一個(gè)超過三百個(gè)異象的(de)清單。他(tā)們提出了(le)一個(gè)重要的(de)批判觀點,即在檢驗新異象的(de)顯著性時(shí)未能正确考慮多(duō)重假設檢驗的(de)影(yǐng)響。
在這(zhè)個(gè)背景下(xià)的(de)多(duō)重假設檢驗是指同時(shí)檢驗一組原假設:
設
對(duì)于任何預先選定的(de)水(shuǐ)平
雖然資産定價文獻中早就談到了(le)一般的(de)數據窺探問題(Lo and MacKinlay 1990; Sullivan et al. 1999),但早期的(de)建議(yì)是另選單一的(de)原假設,例如
歸根結底,多(duō)重假設檢驗在本質上是一個(gè)統計問題。前述統計方法通(tōng)常滿足一個(gè)好的(de)統計檢驗所需具備的(de)标準,例如控制第一類錯誤或僞發現率等。然而,比起統計标準,經濟效益才是經濟主體最關心的(de)。但是,這(zhè)兩個(gè)目标通(tōng)常是相互沖突的(de)。Jensen et al. (2023) 和(hé) Da et al. (2022) 指出,盡管傳統多(duō)重假設檢驗方法能有效防範 FDR,但以此選擇 alpha 會導緻極其保守的(de)交易策略。Jensen et al. (2023) 證明(míng),相比于使用(yòng)傳統方法控制 FDR 的(de)投資者,使用(yòng)貝葉斯分(fēn)層多(duō)重假設檢驗方法作爲評判因子标準的(de)投資者将能夠獲得(de)更大(dà)的(de)經濟效益。
參考文獻
Ait-Sahalia, Y., J. Jacod, and D. Xiu (2021). Continuous-time Fama-MacBeth regressions. Tech. rep. Princeton University and the University of Chicago.
Ait-Sahalia, Y., I. Kalnina, and D. Xiu (2020). High frequency factor models and regressions. Journal of Econometrics 216(1), 86-105.
Ait-Sahalia, Y. and D. Xiu (2017). Using principal component analysis to estimate a high dimensional factor model with high-frequency data. Journal of Econometrics 201(2), 384-399.
Ait-Sahalia, Y. and D. Xiu (2019). Principal component analysis of high frequency data. Journal of the American Statistical Association 114(525), 287-303.
Andersen, T. G. and T. Bollerslev (1998). Answering the skeptics: Yes, standard volatility models do provide accurate forecasts. International Economic Review 39(4), 885-905.
Andersen, T. G., T. Bollerslev, F. X. Diebold, and P. Labys (2001). The distribution of exchange rate realized volatility. Journal of the American Statistical Association 96(453), 42-55.
Bajgrowicz, P. and O. Scaillet (2012). Technical trading revisited: False discoveries, persistence tests, and transaction costs. Journal of Financial Economics 106(3), 473-491.
Barndorff-Nielsen, O. E. and N. Shephard (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models. Journal of the Royal Statistical Society Series B (Statistical Methodology) 64(2), 253-280.
Barras, L., O. Scaillet, and R. Wermers (2010). False discoveries in mutual fund performance: Measuring luck in estimated alphas. Journal of Finance 65(1), 179-216.
Benjamini, Y. and Y. Hochberg (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological) 57(1), 289-300.
Bickel, P. J. and E. Levina (2008a). Covariance regularization by thresholding. Annals of Statistics 36(6), 2577-2604.
Bickel, P. J. and E. Levina (2008b). Regularized estimation of large covariance matrices. Annals of Statistics 36(1), 199-227.
Bollerslev, T., S. Z. Li, and V. Todorov (2016). Roughing up beta: Continuous versus discontinuous betas and the cross section of expected stock returns. Journal of Financial Economics 120(3), 464-490.
Bollerslev, T., M. C. Medeiros, A. Patton, and R. Quaedvlieg (2022). From zero to hero: Realized partial (co)variances. Journal of Econometrics 231(2), 348-360.
Cai, T. and W. Liu (2011). Adaptive thresholding for sparse covariance matrix estimation. Journal of the American Statistical Association 106(494), 672-684.
Connor, G., M. Hagmann, and O. Linton (2012). Efficient semiparametric estimation of the Fama–French model and extensions. Econometrica 80(2), 713-754.
Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics 7(2), 174-196.
Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Tech. rep. Chicago Booth.
Didisheim, A., S. Ke, B. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Tech. rep. Yale University.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3-56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1-22.
Fama, E. F. and K. R. French (2010). Luck versus skill in the cross-section of mutual fund returns. Journal of Finance 65(5), 1915-1947.
Fan, J., Y. Fan, and J. Lv (2008). High dimensional covariance matrix estimation using a factor model. Journal of Econometrics 147(1), 186-197.
Fan, J., A. Furger, and D. Xiu (2016a). Incorporating global industrial classification standard into portfolio allocation: A simple factor-based large covariance matrix estimator with high frequency data. Journal of Business and Economic Statistics 34(4), 489-503.
Fan, J., Y. Liao, and M. Mincheva (2013). Large covariance estimation by thresholding principal orthogonal complements. Journal of the Royal Statistical Society Series B (Statistical Methodology) 75(4), 603-680.
Fan, J., Y. Liao, and J. Yao (2015). Power enhancement in high-dimensional cross-sectional tests. Econometrica 83(4), 1497-1541.
Fan, J., Y. Liao, and W. Wang (2016b). Projected principal component analysis in factor models. Annals of Statistics 44(1), 219-254.
Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121-1152.
Giglio, S., Y. Liao, and D. Xiu (2021a). Thousands of alpha tests. Review of Financial Studies 34(7), 3456-3496.
Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429-450.
Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503-2553.
Harvey, C. R., Y. Liu, and H. Zhu (2016). ... and the cross-section of expected returns. Review of Financial Studies 29(1), 5-68.
Jensen, T. I., B. Kelly, and L. H. Pedersen (2023). Is there a replication crisis in finance? Journal of Finance 78(5), 2465-2518.
Kelly, B. T., S. Malamud, and K. Zhou (2022a). Virtue of complexity in return prediction. Tech. rep. Yale University.
Kim, S., R. Korajczyk, and A. Neuhierl (forthcoming). Arbitrage Portfolios. Review of Financial Studies.
Kosowski, R., A. Timmermann, R. Wermers, and H. White (2006). Can mutual fund “stars” really pick stocks? New evidence from a bootstrap analysis. Journal of Finance 61(6), 2551-2595.
Ledoit, O. and M. Wolf (2004). Honey, I shrunk the sample covariance matrix. Journal of Portfolio Management 30(4), 110-119.
Ledoit, O. and M. Wolf. (2012). Nonlinear shrinkage estimation of large-dimensional covariance matrices. Annals of Statistics 40(2), 1024-1060.
Li, S. Z. and Y. Tang (2022). Automated risk forecasting. Tech. rep. Rutgers, The State University of New Jersey.
Lo, A. W. and A. C. MacKinlay. (1990). Data-snooping biases in tests of financial asset pricing models. Review of Financial Studies 3(3), 431-467.
Pesaran, H. and T. Yamagata (2017). Testing for alpha in linear factor pricing models with a large number of securities. Tech. rep.
Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341-360.
Shanken, J. (1992a). On the estimation of beta pricing models. Review of Financial Studies 5(1), 1-33.
Sullivan, R., A. Timmermann, and H. White (1999). Data-snooping, technical trading rule performance, and the bootstrap. Journal of Finance 54(5), 1647-1691.
White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097-1126.
免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。