[置頂] 機器學習(xí)與資産定價

發布時(shí)間:2023-03-20  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:一本大(dà)數據時(shí)代的(de)實證資産定價方法前沿,請查收。



大(dà)數據時(shí)代,與資産預期收益率相關的(de)協變量數量與日俱增。資産定價已然步入了(le)協變量的(de)高(gāo)維數時(shí)代。在這(zhè)個(gè)背景下(xià),傳統計量經濟學方法在利用(yòng)諸多(duō)協變量以及它們的(de)非線性變換來(lái)預測預期收益率方面稍顯遜色,而擅長(cháng)處理(lǐ)這(zhè)類問題的(de)機器學習(xí)算(suàn)法已悄然走進了(le)實證研究和(hé)量化(huà)投資實踐之中。


然而,面對(duì)收益率數據低信噪比、不滿足平穩性等問題,在其他(tā)領域大(dà)放異彩的(de)機器學習(xí)算(suàn)法在資産定價中并非即插即用(yòng)。大(dà)到算(suàn)法選擇,中到超參數調優,小到變量預處理(lǐ),每一個(gè)決策都會影(yǐng)響機器學習(xí)算(suàn)法在資産定價應用(yòng)中的(de)效果。爲了(le)獲得(de)樣本外更好的(de)結果,人(rén)們又應該依據什(shén)麽來(lái)做(zuò)出上述決策呢(ne)?


爲了(le)回答(dá)這(zhè)些問題,讓我們從理(lǐ)論和(hé)實證資産定價的(de)發展說起。




資産定價研究的(de)核心目标之一是解釋不同資産預期收益率在截面上的(de)差異。自 20 世紀 50 年代以來(lái),學術界就該問題在理(lǐ)論和(hé)實證兩方面取得(de)了(le)大(dà)量的(de)成果。在理(lǐ)論方面,研究表明(míng)了(le)随機貼現因子、均值—方差有效投資組合以及多(duō)因子模型之間的(de)等價性;而在實證方面,以資本資産定價模型和(hé) Fama-French 三因子模型爲代表的(de)因子模型更是引領了(le)數十年的(de)研究。


學術界在理(lǐ)論和(hé)實證方面的(de)雙管齊下(xià)也(yě)爲業界的(de)投資實務建立了(le)必要的(de)秩序,使之從最初充斥著(zhe)華爾街(jiē)逸聞趣事或者“某某一夜暴富”的(de)頭條故事的(de)雜(zá)亂無章(zhāng),演化(huà)至當前在金融經濟學框架内,使用(yòng)嚴謹的(de)數據分(fēn)析和(hé)統計檢驗已經成爲業界的(de)研究範式。從多(duō)因子模型衍生出來(lái)的(de)因子投資在投資實務中已經占據了(le)舉足輕重的(de)地位,而利用(yòng)諸如價值、規模、盈利、動量等因子區(qū)分(fēn)不同資産預期收益率的(de)差異、獲得(de)更高(gāo)的(de)風險調整後收益這(zhè)樣的(de)認知更是深入人(rén)心。資産定價已然成爲金融領域内一個(gè)理(lǐ)論和(hé)實踐緊密聯系、相互交融的(de)典型代表。


然而,在這(zhè)片有序之下(xià)也(yě)并非沒有“暗流湧動”。首先,在實證方面,在過去的(de) 10~20 年中,在發表偏差所導緻的(de) p-hacking 問題驅使下(xià),學術界制造了(le)大(dà)量所謂的(de)“市場(chǎng)異象”,它們中的(de)每一個(gè)都在特定的(de)實證設定下(xià)獲得(de)了(le)超額收益。仿佛就在一夜之間,成百上千個(gè)能爲解釋資産預期收益率截面差異提供增量貢獻的(de)協變量便如雨(yǔ)後春筍一般湧現出來(lái)。但這(zhè)諸多(duō)變量到底代表了(le)何種系統性風險?它們之間的(de)相關性和(hé)帶有的(de)預測信息的(de)冗餘度幾何?哪些能夠作爲真正的(de)定價因子?因子的(de)風險價格又究竟是多(duō)少?與衆多(duō)協變量形成鮮明(míng)對(duì)比的(de)是,人(rén)們對(duì)上述問題的(de)理(lǐ)解卻十分(fēn)貧瘠,這(zhè)無疑令人(rén)尴尬。


數據量的(de)激增進一步加劇了(le)上述實證挑戰。如今,被用(yòng)來(lái)預測收益率的(de)潛在協變量的(de)數量與日俱增。傳統的(de)包括曆史量價數據、财務報表數據、分(fēn)析師一緻預期數據,以及另類的(de)包括新聞輿情數據、文本分(fēn)析數據、衛星圖像數據等均能夠被拿來(lái)加工成各式各樣的(de)預測變量。毫不誇張地說,就資産定價的(de)研究而言,我們已經步入了(le)預測變量的(de)高(gāo)維數時(shí)代。而這(zhè)樣一個(gè)大(dà)數據時(shí)代對(duì)傳統的(de)計量經濟學方法提出了(le)巨大(dà)的(de)挑戰——試想一下(xià)當協變量個(gè)數超過觀測樣本個(gè)數時(shí),OLS 的(de)無能爲力。爲了(le)通(tōng)過計量經濟學方法得(de)出可(kě)靠的(de)結果,人(rén)們隻能退而求其次在實證分(fēn)析中施加人(rén)爲的(de)稀疏性假設,這(zhè)意味著(zhe)在多(duō)因子模型中僅考慮有限個(gè)因子,或在研究收益率截面預測問題中隻同時(shí)考慮很少的(de)變量。


類似的(de)挑戰也(yě)存在于資産定價的(de)理(lǐ)論方面。已有的(de)、被學界和(hé)業界廣泛認可(kě)的(de)統計檢驗方法和(hé)統計推斷結果均是建立在理(lǐ)性預期假設(即投資者已知現金流生成模型以及模型的(de)參數)之上的(de)。這(zhè)意味著(zhe)事後樣本内檢驗發現的(de)收益率可(kě)預測性可(kě)以被安全地歸因爲系統性風險補償或由投資者行爲偏差而導緻的(de)錯誤定價。可(kě)是,如果理(lǐ)性預期假設不滿足又會如何呢(ne)?在如今的(de)大(dà)數據時(shí)代,既然對(duì)市場(chǎng)數據進行事後分(fēn)析的(de)統計者們面臨著(zhe)高(gāo)維預測變量問題,那麽我們有同樣的(de)理(lǐ)由相信在金融市場(chǎng)中實際交易的(de)投資者(他(tā)們的(de)交易行爲産生了(le)實實在在的(de)價格數據)也(yě)一定面臨類似的(de)高(gāo)維預測問題。而已有的(de)資産定價理(lǐ)論模型并未将投資者置于如此複雜(zá)的(de)環境之中,因爲在該環境中理(lǐ)性預期假設不再成立。面對(duì)這(zhè)種進退兩難的(de)情形,我們是否真的(de)無能爲力?一旦在模型中放棄理(lǐ)性預期假設,對(duì)事後樣本内統計推斷又會有什(shén)麽影(yǐng)響呢(ne)?除了(le)風險補償和(hé)錯誤定價,事後檢驗中存在的(de)收益率可(kě)預測性背後的(de)原因是否還(hái)有第三種可(kě)能?


面對(duì)實證和(hé)理(lǐ)論兩方面的(de)困境,好不容易建立起秩序的(de)資産定價再一次陷入了(le)無序之中。人(rén)們又回到了(le)需要重新建立新秩序的(de)起點。而無論是實證檢驗還(hái)是理(lǐ)論建模,爲了(le)應對(duì)協變量的(de)高(gāo)維數問題,擅于處理(lǐ)高(gāo)維問題和(hé)非線性關系的(de)機器學習(xí)方法自然而然地成爲彌補傳統計量經濟學方法不足的(de)不二之選。各種機器學習(xí)方法已經在資産定價之外的(de)其他(tā)領域(如圖像識别)取得(de)了(le)巨大(dà)的(de)成功,讓人(rén)們對(duì)它們在資産定價方面的(de)表現充滿期待。不幸的(de)是,機器學習(xí)算(suàn)法并非“即插即用(yòng)”。大(dà)量實證結果表明(míng),将現成的(de)機器學習(xí)算(suàn)法簡單粗暴地應用(yòng)于資産定價領域的(de)數據并不能在樣本外取得(de)優秀的(de)表現。這(zhè)是否意味著(zhe)人(rén)們的(de)希望破滅了(le)呢(ne)?幸運的(de)是,答(dá)案亦是否定的(de)。


資産定價領域的(de)數據,諸如資産收益率,較機器學習(xí)擅長(cháng)發揮作用(yòng)的(de)其他(tā)領域的(de)數據具有一些與生俱來(lái)不同的(de)屬性,例如信噪比極低、難以滿足平穩性及預測誤差直接影(yǐng)響投資組合的(de)風險收益特征等。這(zhè)些特殊屬性的(de)存在阻礙著(zhe)現成機器學習(xí)算(suàn)法發揮其威力。然而,一旦知道了(le)問題所在,我們便能夠有的(de)放矢,針對(duì)資産定價數據的(de)屬性選擇和(hé)調整機器學習(xí)算(suàn)法及其參數,使它們充分(fēn)發揮所長(cháng)。


雖然目标明(míng)确,但這(zhè)條利用(yòng)機器學習(xí)拓展資産定價研究的(de)道路仍然十分(fēn)曲折。好消息是,在這(zhè)條道路上,已經有人(rén)爲我們勾勒出了(le)系統性的(de)、可(kě)操作的(de)藍圖。這(zhè)張藍圖就是由身爲芝加哥(gē)大(dà)學金融學教授、金融領域頂級期刊 Journal of Finance 執行主編的(de) Stefan Nagel 教授所撰寫的(de) Machine Learning in Asset Pricing。該書(shū)高(gāo)屋建瓴,邏輯缜密,推理(lǐ)嚴謹,得(de)到了(le) John Campbell、Bryan Kelly、Allan Timmermann 和(hé)範劍青四位大(dà)咖的(de)聯袂推薦。


f1.png


微信圖片_20220708172759.png


作爲資産定價領域的(de)領軍學者之一,Stefan Nagel 教授以預測股票(piào)截面收益率中所遇到的(de)各種問題爲例,在書(shū)中體系化(huà)地討(tǎo)論了(le)如何将機器學習(xí)方法成功地引入實證和(hé)理(lǐ)論資産定價研究之中,從而有效解決前文提到的(de)挑戰。比如,該書(shū)通(tōng)過理(lǐ)論推導和(hé)實證分(fēn)析表明(míng)分(fēn)别以  和(hé)投資組合表現爲準則進行機器學習(xí)超參數優化(huà)時(shí),會得(de)到截然不同的(de)結論及其背後的(de)原因;又如它通(tōng)過将專業投資者建模爲使用(yòng)機器學習(xí)工具的(de)經濟主體,指出投資者對(duì)現金流内在生成過程的(de)學習(xí)問題會導緻樣本内虛假的(de)可(kě)預測性,這(zhè)爲近年來(lái)日益擴充的(de)“因子動物(wù)園”提供了(le)另一種令人(rén)信服的(de)解釋。


資産定價應用(yòng)中數據的(de)低信噪比意味著(zhe)人(rén)們不應指望在靈活的(de)框架下(xià),僅依靠“數據自己發聲”便能取得(de)良好的(de)結果。因此,爲了(le)實現在實證和(hé)理(lǐ)論方面的(de)突破,需要對(duì)機器學習(xí)算(suàn)法的(de)選擇以及參數的(de)設定施加必要的(de)結構性約束。爲此,将資産定價數據屬性背後的(de)内在經濟學原理(lǐ)注入機器學習(xí)的(de)應用(yòng)就變得(de)尤爲重要。在這(zhè)方面,貝葉斯統計提供了(le)一個(gè)天然的(de)框架。通(tōng)過指定關于風險和(hé)收益機會的(de)先驗分(fēn)布,該研究框架允許人(rén)們在收益率預測問題中加入具有經濟學動機的(de)約束條件,它們對(duì)機器學習(xí)的(de)成功應用(yòng)至關重要。通(tōng)過貝葉斯框架使得(de)機器學習(xí)在資産定價中發揮更大(dà)的(de)作用(yòng)正是 Machine Learning in Asset Pricing 的(de)一大(dà)特色。該書(shū)的(de)另一個(gè)特色是強調開放性問題而非提供明(míng)确的(de)答(dá)案。通(tōng)過指出尚待解決的(de)重要問題,Stefan Nagel 教授展望了(le)資産定價研究的(de)未來(lái)。


對(duì)業界投資實務來(lái)說,該書(shū)描繪的(de)理(lǐ)論前沿進展極具價值。當下(xià),人(rén)們似乎站在這(zhè)樣一個(gè)十字路口之中,即傳統的(de)基于人(rén)爲稀疏性假設的(de)多(duō)因子模型越來(lái)越難以獲得(de)可(kě)觀的(de)風險調整後收益。這(zhè)背後的(de)原因是,傳統實證資産定價研究和(hé)業界的(de)投資實務的(de)目标之間存在錯配。前者的(de)目标是提出簡約的(de)靜态模型并爲模型中的(de)因子提供合理(lǐ)的(de)依據,而後者的(de)目标則是最大(dà)化(huà)樣本外投資組合的(de)條件風險收益特征。在這(zhè)種錯配下(xià),投資實務亟需來(lái)自學術研究的(de)全新方法的(de)指引,而注入經濟學推理(lǐ)的(de)機器學習(xí)方法就是最好的(de)答(dá)案。該書(shū)介紹的(de)理(lǐ)論方法以及相應的(de)實證結果很好地擴展了(le)因子投資的(de)前沿。


毫不誇張地說,Machine Learning in Asset Pricing 是一本資産定價領域劃時(shí)代的(de)引領之作,同時(shí)也(yě)我最近兩年的(de)最愛(ài)。書(shū)中所展示的(de)機器學習(xí)在資産定價中的(de)應用(yòng)前景也(yě)極大(dà)地開闊了(le)我的(de)研究眼界和(hé)思路;而将書(shū)中闡述的(de)前沿觀點和(hé)實證結果介紹給公衆号的(de)小夥伴也(yě)成爲我今年最大(dà)的(de)心願。今天,這(zhè)個(gè)願望終于實現:我和(hé)北(běi)大(dà)經院的(de)王熙老師合作,翻譯出版了(le)該書(shū)的(de)中文版:《機器學習(xí)與資産定價》


f2.png


toc1.png


toc2.png


作爲譯者,特别感謝 Stefan Nagel 教授以及普林(lín)斯頓大(dà)學出版社的(de)同意和(hé)信任,讓我們有機會将其引入國内。能有機會參與本書(shū)的(de)翻譯,我們深感榮幸,同時(shí)也(yě)明(míng)白身上擔負的(de)使命和(hé)責任。在翻譯過程中,我們反複討(tǎo)論和(hé)修訂,力争做(zuò)到在文字意義忠于原著的(de)前提下(xià),行文更加符合中文的(de)表述習(xí)慣。此外,我們還(hái)在中文版中加入了(le)大(dà)量的(de)譯者注,希望以此起到兩個(gè)作用(yòng):(1)給原著提供必要的(de)背景知識,幫助讀者掌握上下(xià)文的(de)行文邏輯;(2)原著中的(de)第 3 至 5 章(zhāng)均涉及大(dà)量公式,我們爲其中絕大(dà)多(duō)數公式提供了(le)推導過程,幫助讀者加深對(duì)貝葉斯統計框架的(de)理(lǐ)解。爲了(le)區(qū)分(fēn)譯者注和(hé)原著自帶的(de)腳注,譯者注采用(yòng)了(le)獨立的(de)編号且使用(yòng)了(le)楷體。希望這(zhè)些努力能夠使中文版讀者更好地體會到原著的(de)魅力。


在翻譯過程中,我們有幸得(de)到了(le)學界和(hé)業界很多(duō)專家的(de)熱(rè)情幫助,感謝芝加哥(gē)大(dà)學布斯商學院修大(dà)成教授以及嘉實基金首席科學家張自力博士爲中譯版撰寫精彩的(de)序言。此外,本書(shū)的(de)出版也(yě)離不開電子工業出版社的(de)全力支持,在此向各位編輯老師表示感謝。


在各位讀者開始這(zhè)段令人(rén)興奮的(de)機器學習(xí)與資産定價之旅之前,我們還(hái)想給出一些小小的(de)忠告。雖然原著旨在介紹機器學習(xí)在資産定價中的(de)應用(yòng),但它并不涵蓋機器學習(xí)方法的(de)最新進展,也(yě)并沒有在計算(suàn)問題方面花費太多(duō)篇幅。另外,原著也(yě)并沒有緻力于提供關于哪個(gè)機器學習(xí)方法更好的(de)“神秘配方”或“靈丹妙藥”。機器學習(xí)不是純粹的(de)調包,不是幻想能毫無阻礙地揭示數據中的(de)規律。毫無章(zhāng)法的(de)使用(yòng)機器學習(xí)會帶來(lái)如辛普森悖論一樣的(de)悖論。唯有基于已有資産定價理(lǐ)論,将機器學習(xí)方法有機的(de)融合理(lǐ)論視角,才能使得(de)我們在驗證既有理(lǐ)論時(shí)有更強大(dà)的(de)方法,并且使用(yòng)理(lǐ)論框架約束機器學習(xí)的(de)過拟合過程。


但是,如何有機的(de)将機器學習(xí)融合進資産定價,人(rén)們并沒有一個(gè)“萬能公式”,而是需要根據所研究問題的(de)特性,創造性的(de)使用(yòng)機器學習(xí)及其思想。原著在如何将機器學習(xí)運用(yòng)至數個(gè)經典的(de)資産定價問題上,給研究者們提供了(le)一系列精美(měi)絕倫的(de)設計,很好地回答(dá)了(le)“機器學習(xí)方法是否适用(yòng)于資産定價”以及“如何基于經濟學推理(lǐ)更合理(lǐ)地應用(yòng)機器學習(xí)方法”這(zhè)些本質的(de)問題。希望通(tōng)過該書(shū)中文版的(de)出版,能夠幫助資産定價的(de)研究者和(hé)量化(huà)投資的(de)實踐者們在未來(lái)見微知著,突破傳統框架約束,爲自己所感興趣的(de)研究問題設計出有針對(duì)性的(de)機器學習(xí)解決方案。




以下(xià)是一組中文版實物(wù)的(de)精美(měi)圖片。本書(shū)爲精裝書(shū),紙張選用(yòng) 80g 純質紙,實物(wù)拿到手裏的(de)質感非常好,希望内容和(hé)制作能給各位帶來(lái)雙重享受。


微信圖片_20220707170404.jpg


微信圖片_20220707170344.jpg


微信圖片_20220707170348.jpg


回顧過去半個(gè)世紀的(de)資産定價研究,不禁讓人(rén)感慨萬千。學術研究也(yě)許就是這(zhè)樣,在無序中建立秩序,秩序又被新的(de)問題打破并重新被建立,周而複始。在大(dà)數據時(shí)代研究資産定價,我們不僅要擁抱機器學習(xí),而且要正确、科學、有效地擁抱機器學習(xí)。Stefan Nagel 教授的(de) Machine Learning in Asset Pricing 使我們朝著(zhe)這(zhè)個(gè)目标邁出堅實的(de)一步。該書(shū)不僅是對(duì)最新前沿成果的(de)精彩梳理(lǐ),更是一種面對(duì)未來(lái)的(de)整裝待發。相信每個(gè)關注資産定價的(de)人(rén)都會因此而深受啓發。



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。