Risk-Return Tradeoffs (II)

發布時(shí)間:2023-12-21  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:隐性多(duō)因子模型如何成爲研究資産定價的(de)重要範式?且聽(tīng) Kelly and Xiu (2023) 娓娓道來(lái)。


本文繼續翻譯 Bryan Kelly 和(hé)修大(dà)成兩位教授的(de) Financial Machine Learning (Kelly and Xiu 2023) 第四章(zhāng)(Risk-Return Tradeoffs)的(de)剩餘部分(fēn),即 4.4 到 4.6 節。(第一部分(fēn)請見此處。)


再次感謝王熙和(hé)劉洋溢對(duì)内容的(de)反饋。本翻譯僅供學習(xí)交流使用(yòng),禁止一切商業行爲,未經授權,禁止轉載。


以下(xià)是正文部分(fēn)。


4.4 複雜(zá)因子模型


許多(duō)論文拓展了(le)隐性條件因子模型 (4.8) 中關于 beta 的(de)設定。IPCA 可(kě)以被視爲使用(yòng)可(kě)觀察特征數據的(de)線性變化(huà)來(lái)近似風險暴露。盡管許多(duō)資産定價模型預測預期收益率和(hé)狀态變量之間存在非線性關系,但在篩選條件變量和(hé)挑選函數形式方面,理(lǐ)論文獻能夠提供的(de)指引十分(fēn)有限。機器學習(xí)的(de)出現使人(rén)們能夠用(yòng)一系列的(de)非線性方法來(lái)應對(duì)函數形式的(de)模糊性。


在早期的(de)研究中,Connor et al. (2012) 和(hé) Fan et al. (2016b) 通(tōng)過将 beta 視爲條件特征的(de)非參數函數,從而實現 beta 的(de)非線性設定(但與 IPCA 不同,爲了(le)可(kě)解釋性,這(zhè)些特征在時(shí)間維度上是固定的(de))。利用(yòng)這(zhè)一框架,Kim et al. (forthcoming) 研究了(le)能夠對(duì)沖掉因子風險的(de)“套利”組合的(de)行爲。


Gu et al. (2021) 利用(yòng)神經網絡将 beta 表述爲特征的(de)非線性函數,從而擴展了(le) IPCA 模型。圖 4.3 展示了(le)他(tā)們的(de)“條件自編碼器”(CA)模型。圖 4.3 揭示了(le)其基本結構,該結構與 (4.8) 的(de)不同之處在于,它通(tōng)過非線性激活函數傳遞輸入數據(工具變量  )。CA 是首個(gè)明(míng)确同時(shí)考慮風險和(hé)收益的(de)股票(piào)收益率深度學習(xí)模型。其結果表明(míng),盡管就總體  而言 CA 和(hé) IPCA 表現相當,但在預測性  方面,它大(dà)大(dà)超過了(le) IPCA。換句話(huà)說,CA 能夠更準确地計算(suàn)資産因暴露于因子風險而獲得(de)的(de)條件補償。(譯者注:如果使用(yòng)線性激活函數,則 CA 基本上和(hé) IPCA 等價;但由于使用(yòng)了(le)非線性激活函數,從而使 CA 能夠描述協變量和(hé)收益率之間潛在的(de)非線性關系。不過從他(tā)人(rén)後來(lái)複現的(de)實證結果來(lái)看,雖然 CA 因能捕捉非線性而更具潛力,但是 IPCA 在樣本外的(de)表現似乎始終優于 CA。)


f1.png


Gu et al. (2021) 是一個(gè)高(gāo)度複雜(zá)的(de)模型。其出色的(de)實證表現暗示著(zhe),對(duì)于因子模型而言,複雜(zá)性提升帶來(lái)的(de)好處可(kě)能與 Kelly et al. (2022a) 在市場(chǎng)擇時(shí)研究中所發現的(de)效果類似(譯者注:即複雜(zá)度可(kě)以提升樣本外表現。)。Didisheim et al. (2023) 正式提出了(le)上述觀點并證明(míng)了(le)因子定價模型中複雜(zá)性的(de)優越性。他(tā)們的(de)分(fēn)析是基于條件随機貼現因子(SDF)視角展開。一般而言,SDF 可(kě)以被表述爲一組風險資産的(de)投資組合:


  


其中,  是  個(gè)資産的(de)超額收益率向量。  維向量  包含 SDF 的(de)條件權重,  代表  期信息集的(de)條件變量。由于不知道  的(de)函數形式,我們用(yòng)機器學習(xí)模型來(lái)近似它:


  


其中  是  的(de)某個(gè)非線性函數,且在上述近似中的(de)  相應的(de)參數數量  很大(dà)。該關于 SDF 的(de)機器學習(xí)模型可(kě)以解釋爲具有  個(gè)因子的(de)因子定價模型:


  


其中每個(gè)“因子”  是使用(yòng)非線性資産“特征”   爲權重的(de)風險資産的(de)投資組合(managed portfolio)。Didisheim et al. (2023) 的(de)主要理(lǐ)論結果顯示,在資産定價模型中因子越多(duō)越好。在該設定下(xià),增加因子個(gè)數意味著(zhe)更充分(fēn)利用(yòng)  所包含的(de)信息,從而可(kě)以使用(yòng)相應的(de)方法更好地近似真正的(de) SDF。對(duì)于 SDF 的(de)更優近似将勝過了(le)需要估計更多(duō)參數所帶來(lái)的(de)統計成本。因此,随著(zhe)因子數量的(de)增加,樣本外的(de)預期定價誤差将減小。這(zhè)種關于模型複雜(zá)度的(de)解釋對(duì)傳統的(de) APT 構成了(le)挑戰,後者主張隻需少量的(de)風險因子便能夠爲任何可(kě)交易資産提供有關風險-收益率權衡的(de)完整描述(譯者注:APT 沒有這(zhè)個(gè)要求。)。這(zhè)意味著(zhe),即使在套利不存在且 SDF 存在的(de)前提下(xià),由于我們必須估計 SDF,因此很有可(kě)能(實際上是可(kě)以預見的(de))将持續不斷地找到不能被已有因子定價的(de)新的(de)實證“風險”因子,而将它們加入定價模型将不斷地提高(gāo)其樣本外的(de)表現。


4.5 高(gāo)頻(pín)模型


随著(zhe)可(kě)交易資産越來(lái)越多(duō)的(de)以及它們的(de)高(gāo)頻(pín)交易數據越來(lái)越多(duō),數據可(kě)得(de)性的(de)提升爲估計單個(gè)資産的(de)風險及其相互依賴性提供了(le)獨特的(de)機會。通(tōng)過簡單的(de)非參數化(huà)波動率和(hé)協方差,Andersen and Bollerslev (1998)、Andersen et al. (2001) 以及 Barndorff-Nielsen and Shephard (2002) 展示了(le)如何利用(yòng)豐富且及時(shí)的(de)日内價格數據更好地了(le)解資産市場(chǎng)的(de)波動。使用(yòng)高(gāo)頻(pín)指标有助于解決研究低頻(pín)時(shí)間序列時(shí)面對(duì)的(de)若幹挑戰。例如,它幫助研究者在無需依賴太多(duō)假設的(de)前提下(xià),來(lái)處理(lǐ)結構性變化(huà)和(hé)時(shí)變的(de)參數。此外,對(duì)于日内數據建模而言,經典時(shí)間序列分(fēn)析中關于線性、平穩性、依賴性和(hé)異方差性的(de)許多(duō)标準假設往往是不必要的(de)。


在最新的(de)文獻中,我們發現存在兩大(dà)流派,它們均采用(yòng)機器學習(xí)技術來(lái)估計高(gāo)維協方差矩陣,并利用(yòng)高(gāo)頻(pín)數據提高(gāo)波動率預測的(de)準确性。


對(duì)于成功構建投資組合而言,準确的(de)協方差估計至關重要。但是,由于維數災難問題,估計高(gāo)維協方差矩陣是一個(gè)極具挑戰性的(de)統計問題。許多(duō)方法依賴于各種形式的(de)收縮以改進估計(Bickel and Levina 2008a; Bickel and Levina 2008b; Cai and Liu 2011; Ledoit and Wolf 2012; Ledoit and Wolf 2004)。受 APT 啓發,Fan et al. (2008) 考察了(le)包含可(kě)觀測因子的(de)嚴格因子模型,并提出了(le)基于因子模型的(de)協方差矩陣估計量,而 Fan et al. (2013) 則轉而研究了(le)包含隐性因子的(de)近似因子模型,并提出了(le)相應的(de)估計量。


當面闆數據的(de)(橫截面)維度接近樣本大(dà)小時(shí),在高(gāo)頻(pín)數據中使用(yòng)因子結構式必要的(de)。然而,低頻(pín)和(hé)高(gāo)頻(pín)數據中的(de)計量經濟學方法在本質上存在差異。後者通(tōng)常基于一個(gè)通(tōng)用(yòng)的(de)連續時(shí)間半鞅模型,允許收益率的(de)變化(huà)中出現随機變化(huà)和(hé)跳躍。針對(duì)日内數據,Ait-Sahalia and Xiu (2019) 提出了(le)非參數 PCA 的(de)漸近理(lǐ)論,爲在連續時(shí)間中應用(yòng)因子模型鋪平了(le)道路。此外,基于連續時(shí)間因子模型,Fan et al. (2016a) 和(hé) Ait-Sahalia and Xiu (2017) 使用(yòng)高(gāo)頻(pín)數據提出了(le)個(gè)股高(gāo)維協方差矩陣的(de)估計量。


一個(gè)充滿前景的(de)研究方向是将關于高(gāo)頻(pín)風險度量的(de)文獻與關于預期收益率橫截面的(de)文獻相結合,從而利用(yòng)更豐富的(de)風險信息來(lái)獲得(de)有關風險-收益權衡的(de)深入見解。在這(zhè)個(gè)方向上的(de)一些相關研究包括 Bollerslev et al. (2016)。他(tā)們在連續時(shí)間框架下(xià)計算(suàn)了(le)個(gè)股對(duì)單一市場(chǎng)因子運動中連續和(hé)跳躍兩部分(fēn)各自的(de) beta 值,然後在離散時(shí)間框架中将研究了(le)上述 beta 估計值和(hé)股票(piào)預期收益率的(de)截面關系。Ait-Sahalia et al. (2021) 在統一的(de)連續時(shí)間框架下(xià)爲風險溢價提供了(le)統計推斷。他(tā)們在第一步考慮多(duō)個(gè)因子和(hé)随機 beta 值,并将通(tōng)過第一步估計得(de)到的(de) beta 應用(yòng)于第二步中,進而擴展了(le) Shanken (1992a) 的(de)經典推斷方法。在實證方面,他(tā)們使用(yòng) Ait-Sahalia et al. (2020) 使用(yòng) 15 分(fēn)鐘(zhōng)收益率構造的(de) Fama-French 和(hé)動量因子,檢驗了(le)日内收益率的(de)因子模型。


利用(yòng)高(gāo)頻(pín)數據測量波動率的(de)想法也(yě)使得(de)有關波動率預測的(de)研究充滿前景。Corsi (2009) 提出的(de)測量曆史已實現波動率的(de)異質自回歸(HAR)模型已是當前學術研究和(hé)業界實踐中領先的(de)波動率預測模型。最近,有許多(duō)論文研究如何通(tōng)過機器學習(xí)進行波動率預測,包括 Li and Tang (2022) 以及 Bollerslev et al. (2022)。但與收益率預測時(shí)機器學習(xí)預測的(de)有效性體現爲更高(gāo)的(de)夏普比率不同,對(duì)于波動率預測而言,人(rén)們尚不清楚機器學習(xí)模型能否以及在多(duō)大(dà)的(de)經濟學意義上超越了(le)已有的(de) HAR 模型。這(zhè)是研究中一個(gè)有趣的(de)開放性問題。


4.6 Alphas


本節討(tǎo)論關于 alpha 檢驗和(hé)機器學習(xí)的(de)相關文獻。Alpha 是預期收益率中未被因子暴露所解釋的(de)部分(fēn),因此它是一個(gè)依賴模型(以及測試資産)的(de)對(duì)象。由于經濟理(lǐ)論通(tōng)常過于簡化(huà)、不能指明(míng)所有的(de)因子,且數據量也(yě)不足以讓人(rén)們通(tōng)過數據驅動的(de)方式推斷出所有真正的(de)因子,模型設定偏誤的(de)存在使得(de)區(qū)分(fēn) alpha 和(hé)因子暴露的(de)“公平”補償充滿挑戰。例如,alpha 可(kě)能是因子 beta 偏弱的(de)表現,這(zhè)讓人(rén)想起回歸中的(de)遺漏變量問題。換句話(huà)說,一個(gè)模型的(de) alpha 可(kě)能是另一個(gè)模型的(de) beta。在一個(gè)隐性因子模型中,alpha 和(hé) beta 最終是由一個(gè)區(qū)分(fēn)因子與特質性噪聲的(de)因子強度阈值來(lái)區(qū)分(fēn)的(de)。


我們主要從非條件隐性因子模型的(de)角度分(fēn)析 alpha。之所以強調非條件而不是條件 alpha 是因爲前者是學術研究的(de)重點。此外,我們關注隐性因子模型是因爲對(duì)隐形因子模型來(lái)說,模型設定偏誤問題沒那麽嚴重。


4.6.1 Alpha 檢驗和(hé)經濟重要性


長(cháng)久以來(lái),實證資産定價的(de)焦點是原假設,即所有的(de) alpha 都等于零  ,是否成立。這(zhè)是一個(gè)單一假設,有别于我們稍後将討(tǎo)論的(de)多(duō)重假設 alpha 檢驗問題。一旦  被拒絕,它往往被解釋爲資産定價模型存在偏誤或者測試資産存在錯誤定價(有時(shí)它也(yě)會被錯誤地視爲違背了(le) Ross (1976) 提出的(de) APT)。(譯者注:即我們可(kě)以說拒絕了(le)一個(gè)實證模型,但是不能說拒絕了(le) APT。APT 是一個(gè)定價框架但并未給出什(shén)麽才是合适的(de)定價因子。)


衆所周知的(de) GRS 檢驗(Gibbons et al. 1989)是針對(duì)  的(de)卡方檢驗,專爲含有可(kě)觀測因子的(de)低維因子模型設計。Fan et al. (2015) 和(hé) Pesaran and Yamagata (2017) 設計了(le)在高(gāo)維環境中檢驗  的(de)方法。由于它消除了(le)原始 GRS 檢驗中要求  的(de)約束并當  較大(dà)時(shí)提高(gāo)了(le)檢驗的(de)功效,因此在方法上是一個(gè)重要的(de)進步。盡管這(zhè)些方法最初是爲包含可(kě)觀測因子的(de)因子模型提出的(de),但可(kě)以将它們擴展到隐性因子模型中。事實上,Giglio et al. (2021a) 利用(yòng)公式 (4.4) 和(hé) (4.6) 給出的(de)因子暴露以及風險溢價估計,構建了(le)一個(gè)關于 alpha 的(de)估計量:


  


他(tā)們還(hái)推導了(le) alpha 的(de)必要漸近展開,爲在隐性因子模型中檢驗 alpha 鋪平了(le)道路。


GRS 檢驗統計量基于  ,它可(kě)以理(lǐ)解爲對(duì)于一個(gè)因子暴露爲零的(de)投資組合能夠獲得(de)的(de)最高(gāo)夏普比率平方。然而,估計這(zhè)個(gè)夏普比率是一回事,而通(tōng)過一個(gè)交易策略來(lái)實現它則是另一回事。也(yě)就是說,在 GRS 這(zhè)類檢驗中拒絕零 alpha 假設并不一定意味著(zhe)它能夠在經濟意義上産生多(duō)麽重要的(de)結果(譯者注:即很難在實際中在考慮了(le)所有交易成本以及市場(chǎng)摩擦之後,投過某個(gè)可(kě)實施的(de)投資策略來(lái)獲得(de)這(zhè)種夏普率。)。隻有在考慮了(le)潛在套利者交易策略的(de)可(kě)行性之後,定量討(tǎo)論 alpha 的(de)經濟重要性才是有意義的(de)。隻有從經濟角度評估統計上的(de)拒絕才對(duì)資産定價研究更有價值,也(yě)對(duì)從業者而言更加重要。


APT 假設套利者知道收益率生成過程的(de)真實參數。隻要樣本量足夠大(dà),該這(zhè)假設可(kě)能是成立的(de)。因爲在這(zhè)種情況下(xià),參數能夠被(漸近地)準确估計出來(lái),且套利者的(de)行爲(近似地)表現得(de)好像他(tā)們确切地知道了(le)這(zhè)些真實參數。但問題是,在 APT 的(de)設置中,套利者必須知道越來(lái)越多(duō)的(de) alpha,因此,橫截面維度相對(duì)于典型的(de)樣本大(dà)小來(lái)說是太大(dà)。因此,即使是在  很大(dà)的(de)極限情況假設套利者了(le)解所有 alpha 也(yě)是不合理(lǐ)的(de)。


Da et al. (2022) 重新審視了(le) APT,并放寬了(le)參數已知的(de)假設。在他(tā)們的(de)設定中,套利者必須使用(yòng)一個(gè)基于樣本大(dà)小爲  的(de)曆史數據而構造的(de)可(kě)交易策略。對(duì)于  期的(de)任何可(kě)行策略  (譯者注:策略由投資組合的(de)權重  表示。),他(tā)們定義了(le)該策略下(xià)一期的(de)條件夏普比率:


  


其中  是  期的(de)信息集。他(tā)們指出  滿足:


  


其中當  趨向于無窮時(shí)   是因子的(de)協方差矩陣,而  是由  生成的(de)信息集。


很顯然,  是最優因子組合的(de)夏普比率平方。因此,對(duì)于任何因子中性策略  ,即  ,


  


這(zhè)個(gè)結果表明(míng),alpha 的(de)後驗估計決定了(le)可(kě)行的(de)最優夏普比率以及統計套利利潤的(de)上限。任何機器學習(xí)策略,無論簡單還(hái)是複雜(zá),都需要遵循這(zhè)個(gè)可(kě)行的(de)夏普比率上限。


一般來(lái)說,  ,僅隻有當  幾乎必然時(shí)等号才成立。這(zhè)裏,  來(lái)自可(kě)行的(de)交易策略,而  則代表了(le)不可(kě)行的(de)最優夏普比率。


可(kě)行和(hé)不可(kě)行策略之間的(de)“夏普比率差距”刻畫(huà)了(le)統計學習(xí)的(de)難度。學習(xí)難度越高(gāo),則差距就越大(dà)。圖 4.4 考慮了(le)假想的(de)收益率生成過程并報告了(le)這(zhè)兩個(gè)夏普比率之比,其中  的(de)概率爲  ,  或  的(de)概率各爲  。殘差的(de)協方差矩陣  是一個(gè)以  爲方差的(de)對(duì)角陣。在這(zhè)類 DGP 中,  表征了(le) alpha 相對(duì)于噪聲的(de)強度,而  刻畫(huà)了(le)其稀有性。通(tōng)過改變  以及  的(de)取值,我們可(kě)以理(lǐ)解數據生成過程如何影(yǐng)響套利者的(de)表現,如圖 4.4 所示。随著(zhe)  的(de)增加,alpha 足夠大(dà)且學習(xí)難度不高(gāo),夏普比率差距就會更小。盡管更普遍的(de) alpha 也(yě)會降低夏普比率差距的(de)縮小,但其稀有性的(de)作用(yòng)并不突出。


f2.png


Da et al. (2022) 展示了(le)如何定量刻畫(huà)可(kě)行和(hé)不可(kě)行夏普比率之間的(de)差距。他(tā)們基于一個(gè)包含 27 個(gè)因子的(de)模型來(lái)評估 APT,其中 16 個(gè)公司特征和(hé) 11 個(gè) GICS 行業啞變量被用(yòng)作可(kě)觀測的(de) beta。使用(yòng) 1975 年 1 月(yuè)到 2020 年 12 月(yuè)的(de)數據,不可(kě)行夏普比率的(de)估計值超過 2.5,是機器學習(xí)算(suàn)法獲得(de)的(de)可(kě)行夏普比率估計值 0.5 的(de)四倍有餘。可(kě)行夏普比率(在考慮交易成本之前)低于 0.5 恰恰表明(míng) APT 在實證上十分(fēn)有效。從理(lǐ)論上講,如果套利者面臨更多(duō)的(de)統計困難,如模型設定偏誤、非稀疏的(de)殘差協方差矩陣等,可(kě)行和(hé)不可(kě)行夏普比率之間的(de)差距會進一步擴大(dà)。


4.6.2 多(duō)重假設檢驗


自從 CAPM 以來(lái),金融經濟學界便開始共同尋找異象;即能獲得(de) CAPM 無法解釋的(de) alpha 的(de)投資組合。其中的(de)一些,如規模、價值和(hé)少數其他(tā)因子已被納入基準定價模型中(Fama and French 1993;Fama and French 2015)。之後,一旦研究者發現這(zhè)些基準模型無法解釋的(de) alpha 時(shí),就宣布找到了(le)新的(de)異象。Harvey et al. (2016) 對(duì)此進行了(le)綜述并整理(lǐ)了(le)一個(gè)超過三百個(gè)異象的(de)清單。他(tā)們提出了(le)一個(gè)重要的(de)批判觀點,即在檢驗新異象的(de)顯著性時(shí)未能正确考慮多(duō)重假設檢驗的(de)影(yǐng)響。


在這(zhè)個(gè)背景下(xià)的(de)多(duō)重假設檢驗是指同時(shí)檢驗一組原假設:  。這(zhè)個(gè)問題與早先討(tǎo)論的(de)檢驗單一原假設  有本質區(qū)别。由于僅靠運氣就會使單個(gè) alpha 檢驗中出現一部分(fēn)顯著結果從而使它們的(de)原假設被錯誤地拒絕,因此多(duō)重假設建議(yì)容易造成僞發現問題。


設  是原假設  的(de)檢驗統計量。如果  (  是個(gè)預先指定的(de)阈值),那麽  就會被拒絕。令  代表原假設爲真的(de)假設的(de)編号集合。另外,令  表示樣本中所有被拒絕假設的(de)數量,令  表示該樣本中錯誤拒絕的(de)數量:


  


  


  和(hé)  都是随機變量,但  是可(kě)觀測的(de)而  卻不是。


對(duì)于任何預先選定的(de)水(shuǐ)平  ,比如  ,單個(gè)檢驗确保每個(gè)檢驗的(de)錯誤率的(de)上界由  确定:  。換句話(huà)說,預期的(de)錯誤拒絕個(gè)數可(kě)以多(duō)達  。爲了(le)減少僞發現的(de)數量,另一個(gè)方法是選擇一個(gè)更大(dà)的(de)阈值來(lái)控制族錯誤率(FWER):  。不幸的(de)是,這(zhè)個(gè)方法在實踐中過于保守。第三個(gè)方法則可(kě)追溯到 Benjamini and Hochberg (1995),即直接控制僞發現率 (FDR):  ,其中僞發現比例(FDP)及其期望 FDR 分(fēn)别定義爲  。


雖然資産定價文獻中早就談到了(le)一般的(de)數據窺探問題(Lo and MacKinlay 1990; Sullivan et al. 1999),但早期的(de)建議(yì)是另選單一的(de)原假設,例如  或  (例如 White 2000; Kosowski et al. 2006; Fama and French 2010)。Barras et al. (2010),Bajgrowicz and Scaillet (2012) 以及 Harvey et al. (2016) 則是最早在資産定價中采用(yòng) FDR 或 FWER 控制方法來(lái)遏制多(duō)重假設檢驗問題。Harvey and Liu (2020) 提出了(le)一個(gè)雙層自助法方法來(lái)控制 FDR,同時(shí)也(yě)考慮了(le)假陰性率和(hé)幾率比。Giglio et al. (2021a) 則提出了(le)一種嚴格的(de)推斷方法,用(yòng)于控制隐性因子模型中 alpha 的(de) FDR,同時(shí)解決了(le)遺漏的(de)變量問題、數據缺失問題以及測試資産維度過大(dà)的(de)問題。Jensen et al. (2023) 則通(tōng)過一個(gè)貝葉斯分(fēn)層模型來(lái)實現對(duì)多(duō)重假設檢驗的(de)修正。該模型使用(yòng)了(le)零 alpha 先驗并利用(yòng)因子的(de)聯合表現,允許利用(yòng)因子之間的(de)信息将 alpha 的(de)估計值向先驗收縮。


歸根結底,多(duō)重假設檢驗在本質上是一個(gè)統計問題。前述統計方法通(tōng)常滿足一個(gè)好的(de)統計檢驗所需具備的(de)标準,例如控制第一類錯誤或僞發現率等。然而,比起統計标準,經濟效益才是經濟主體最關心的(de)。但是,這(zhè)兩個(gè)目标通(tōng)常是相互沖突的(de)。Jensen et al. (2023) 和(hé) Da et al. (2022) 指出,盡管傳統多(duō)重假設檢驗方法能有效防範 FDR,但以此選擇 alpha 會導緻極其保守的(de)交易策略。Jensen et al. (2023) 證明(míng),相比于使用(yòng)傳統方法控制 FDR 的(de)投資者,使用(yòng)貝葉斯分(fēn)層多(duō)重假設檢驗方法作爲評判因子标準的(de)投資者将能夠獲得(de)更大(dà)的(de)經濟效益。



參考文獻

Ait-Sahalia, Y., J. Jacod, and D. Xiu (2021). Continuous-time Fama-MacBeth regressions. Tech. rep. Princeton University and the University of Chicago.

Ait-Sahalia, Y., I. Kalnina, and D. Xiu (2020). High frequency factor models and regressions. Journal of Econometrics 216(1), 86-105.

Ait-Sahalia, Y. and D. Xiu (2017). Using principal component analysis to estimate a high dimensional factor model with high-frequency data. Journal of Econometrics 201(2), 384-399.

Ait-Sahalia, Y. and D. Xiu (2019). Principal component analysis of high frequency data. Journal of the American Statistical Association 114(525), 287-303.

Andersen, T. G. and T. Bollerslev (1998). Answering the skeptics: Yes, standard volatility models do provide accurate forecasts. International Economic Review 39(4), 885-905.

Andersen, T. G., T. Bollerslev, F. X. Diebold, and P. Labys (2001). The distribution of exchange rate realized volatility. Journal of the American Statistical Association 96(453), 42-55.

Bajgrowicz, P. and O. Scaillet (2012). Technical trading revisited: False discoveries, persistence tests, and transaction costs. Journal of Financial Economics 106(3), 473-491.

Barndorff-Nielsen, O. E. and N. Shephard (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models. Journal of the Royal Statistical Society Series B (Statistical Methodology) 64(2), 253-280.

Barras, L., O. Scaillet, and R. Wermers (2010). False discoveries in mutual fund performance: Measuring luck in estimated alphas. Journal of Finance 65(1), 179-216.

Benjamini, Y. and Y. Hochberg (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological) 57(1), 289-300.

Bickel, P. J. and E. Levina (2008a). Covariance regularization by thresholding. Annals of Statistics 36(6), 2577-2604.

Bickel, P. J. and E. Levina (2008b). Regularized estimation of large covariance matrices. Annals of Statistics 36(1), 199-227.

Bollerslev, T., S. Z. Li, and V. Todorov (2016). Roughing up beta: Continuous versus discontinuous betas and the cross section of expected stock returns. Journal of Financial Economics 120(3), 464-490.

Bollerslev, T., M. C. Medeiros, A. Patton, and R. Quaedvlieg (2022). From zero to hero: Realized partial (co)variances. Journal of Econometrics 231(2), 348-360.

Cai, T. and W. Liu (2011). Adaptive thresholding for sparse covariance matrix estimation. Journal of the American Statistical Association 106(494), 672-684.

Connor, G., M. Hagmann, and O. Linton (2012). Efficient semiparametric estimation of the Fama–French model and extensions. Econometrica 80(2), 713-754.

Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics 7(2), 174-196.

Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Tech. rep. Chicago Booth.

Didisheim, A., S. Ke, B. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Tech. rep. Yale University.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3-56.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1-22.

Fama, E. F. and K. R. French (2010). Luck versus skill in the cross-section of mutual fund returns. Journal of Finance 65(5), 1915-1947.

Fan, J., Y. Fan, and J. Lv (2008). High dimensional covariance matrix estimation using a factor model. Journal of Econometrics 147(1), 186-197.

Fan, J., A. Furger, and D. Xiu (2016a). Incorporating global industrial classification standard into portfolio allocation: A simple factor-based large covariance matrix estimator with high frequency data. Journal of Business and Economic Statistics 34(4), 489-503.

Fan, J., Y. Liao, and M. Mincheva (2013). Large covariance estimation by thresholding principal orthogonal complements. Journal of the Royal Statistical Society Series B (Statistical Methodology) 75(4), 603-680.

Fan, J., Y. Liao, and J. Yao (2015). Power enhancement in high-dimensional cross-sectional tests. Econometrica 83(4), 1497-1541.

Fan, J., Y. Liao, and W. Wang (2016b). Projected principal component analysis in factor models. Annals of Statistics 44(1), 219-254.

Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121-1152.

Giglio, S., Y. Liao, and D. Xiu (2021a). Thousands of alpha tests. Review of Financial Studies 34(7), 3456-3496.

Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429-450.

Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503-2553.

Harvey, C. R., Y. Liu, and H. Zhu (2016). ... and the cross-section of expected returns. Review of Financial Studies 29(1), 5-68.

Jensen, T. I., B. Kelly, and L. H. Pedersen (2023). Is there a replication crisis in finance? Journal of Finance 78(5), 2465-2518.

Kelly, B. T., S. Malamud, and K. Zhou (2022a). Virtue of complexity in return prediction. Tech. rep. Yale University.

Kim, S., R. Korajczyk, and A. Neuhierl (forthcoming). Arbitrage Portfolios. Review of Financial Studies.

Kosowski, R., A. Timmermann, R. Wermers, and H. White (2006). Can mutual fund “stars” really pick stocks? New evidence from a bootstrap analysis. Journal of Finance 61(6), 2551-2595.

Ledoit, O. and M. Wolf (2004). Honey, I shrunk the sample covariance matrix. Journal of Portfolio Management 30(4), 110-119.

Ledoit, O. and M. Wolf. (2012). Nonlinear shrinkage estimation of large-dimensional covariance matrices. Annals of Statistics 40(2), 1024-1060.

Li, S. Z. and Y. Tang (2022). Automated risk forecasting. Tech. rep. Rutgers, The State University of New Jersey.

Lo, A. W. and A. C. MacKinlay. (1990). Data-snooping biases in tests of financial asset pricing models. Review of Financial Studies 3(3), 431-467.

Pesaran, H. and T. Yamagata (2017). Testing for alpha in linear factor pricing models with a large number of securities. Tech. rep.

Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341-360.

Shanken, J. (1992a). On the estimation of beta pricing models. Review of Financial Studies 5(1), 1-33.

Sullivan, R., A. Timmermann, and H. White (1999). Data-snooping, technical trading rule performance, and the bootstrap. Journal of Finance 54(5), 1647-1691.

White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097-1126.



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。