随筆

發布時(shí)間:2024-07-06  |   來(lái)源: 川總寫量化(huà)

作者:石川

摘要:我們每個(gè)人(rén)的(de)能力都有限,也(yě)終究會停下(xià)腳步。但是如果我們把路鋪好,就能夠讓别人(rén)走得(de)更遠(yuǎn)。


最近看到了(le)北(běi)大(dà)王熙老師說的(de)一段話(huà):


知識的(de)傳授不是爲了(le)炫技

而是梳理(lǐ)清楚學科裏面重要的(de)問題

問題和(hé)問題之間的(de)聯系

前人(rén)是怎麽回答(dá)的(de)

我們怎麽樣更好地回答(dá)這(zhè)些問題

并最終學會問更好的(de)問題


看完後感觸頗深。這(zhè)和(hé)我一直寫公衆号的(de)初衷契合,也(yě)和(hé)我自己涉獵一個(gè)領域時(shí)的(de) approach 一緻。例如,我的(de)博士論文的(de)文獻綜述裏,最早的(de)參考文獻是上世紀 50 年代的(de)。後來(lái)有個(gè)老教授看了(le)之後,不無感慨的(de)說“現在很少有人(rén)讀 old papers 了(le)”。


對(duì)于任何一個(gè) topic,我們都需要搞清楚其發展的(de)來(lái)龍去脈并清晰的(de)展現出來(lái)。更重要的(de)是,這(zhè)種展現不應是文獻按照(zhào)不同 categories 的(de)羅列(盡管很多(duō) review paper 都是這(zhè)麽寫的(de)),而是通(tōng)過主線厘清問題以及解決方法的(de)演進和(hé)叠代、不同方法之間的(de)關聯。


就以基于多(duō)因子模型的(de)實證資産定價爲例。如今最新的(de)文章(zhāng)大(dà)部分(fēn)是在這(zhè)個(gè)框架下(xià)通(tōng)過機器學習(xí)算(suàn)法把大(dà)量的(de) firm characteristics 映射到 factor exposure 之中。然而,當我們試圖去理(lǐ)解這(zhè)種做(zuò)法的(de)時(shí)候,先決條件就是首先明(míng)白人(rén)們是如何走到這(zhè)一步的(de)。


這(zhè)就意味著(zhe),我們需要從資産定價理(lǐ)論,例如 SDF、APT/ICAPM 說起:APT/ICAPM 提出了(le)使用(yòng)多(duō)因子模型作爲實證研究的(de)框架。然而,無論 APT 還(hái)是 ICAPM 都沒有告訴人(rén)們應該用(yòng)哪些因子。所以,從這(zhè)裏開始,相關的(de)研究就又劃分(fēn)到兩個(gè)分(fēn)支。


其一是通(tōng)過經濟學或者金融學理(lǐ)論來(lái)提出因子,例如 Fama-French 和(hé) q-factor model 等(它們确實叱咤學術界二十載),而另一個(gè)分(fēn)支則是繼承 APT 的(de)思想,以解構 covariance matrix 的(de) structure 爲目标,通(tōng)過 PCA 來(lái)構造 latent factor。而這(zhè)方面,随著(zhe)機器學習(xí)的(de)發展又換發了(le)青春。比如,傳統的(de) PCA 隻關心 central 二階矩,而不關心一階矩(average return),所以學界在 PCA 的(de)基礎上提出了(le) RP-PCA;又比如上述方法都僅僅是通(tōng)過 return 數據來(lái)構造因子,而忽視了(le)其他(tā)信息,因此在這(zhè)個(gè)動機的(de)趨勢下(xià),Instrumented PCA 被提出,它在 return 基礎上納入了(le) firm characteristics 的(de)信息,且因爲後者是随時(shí)間變化(huà)的(de),因此還(hái)把多(duō)因子模型從靜态轉向了(le)動态。


再比如,随著(zhe)近年來(lái)對(duì)模型複雜(zá)度和(hé)樣本外表現關系的(de)重新認知,學界又提出應該盡可(kě)能用(yòng)更豐富的(de)高(gāo)維信息以及信息和(hé)收益率之間的(de)非線性關系(盡管尚有争議(yì))。在這(zhè)個(gè) trend 之下(xià),人(rén)們又從 linear mapping 轉向了(le) nonlinear mapping(例如 Conditional Autoencoder 模型)等等。


你看,這(zhè)就解釋了(le)我們是怎麽從 FF3 慢(màn)慢(màn)的(de)走到今天的(de)。而當這(zhè)條主線清晰的(de)被展現在人(rén)們面前的(de)時(shí)候,我們就能更好的(de)理(lǐ)解新模型被提出的(de)動機,以及每個(gè)新模型解決了(le)哪些前人(rén)遺留的(de)問題。


說到這(zhè),我索性歪個(gè)樓,簡單介紹一篇我個(gè)人(rén)很欣賞的(de)文章(zhāng) Kozak (2019)。這(zhè)篇文章(zhāng)将 kernel trick 巧妙的(de)用(yòng)在了(le) PCA 當中,在不增加計算(suàn)量的(de)同時(shí)實現了(le) managed portfolio 的(de)維數激增,從而提升了(le) latent factor model 的(de)樣本外表現。


簡單來(lái)說,我們考慮  個(gè) managed portfolios:


 


并以這(zhè)些 managed portfolios 爲 assets、通(tōng)過 PCA 來(lái)構造 latent factors。把  轉置再縱向堆疊起來(lái),得(de)到  維矩陣  :


  


爲了(le)簡單起見,假設  的(de)每一列(即每個(gè) managed portfolio)已經時(shí)序上 demean 了(le),因此它們的(de) variance-covariance matrix 可(kě)以寫成:


  


上面就是一般的(de) PCA,隻不過把個(gè)股的(de)超額收益率換成了(le) managed portfolios 的(de)超額收益率。下(xià)面是第一個(gè)精妙之處:對(duì)于 PCA 而言,對(duì)  進行特征分(fēn)解和(hé)對(duì)  進行特征分(fēn)解是等價的(de)(因爲都是基于原始數據  的(de) SVD 分(fēn)解,所以二者之間可(kě)以相互轉換)。所以,可(kě)以把原始問題轉化(huà)爲對(duì)  維的(de)矩陣  來(lái)進行PCA:


  


其中


  


式中每個(gè)  都是一個(gè)  維矩陣,其中第  個(gè)元素代表  期股票(piào)  和(hé)  期股票(piào)  所有特征取值的(de)內積。可(kě)見,在  中,  包含了(le)所使用(yòng)的(de)協變量的(de)全部信息。更重要的(de)是,無論 managed portfolios 的(de)維數  多(duō)大(dà),其中每個(gè)  都是  維。


Ok,下(xià)面就是第二個(gè)精妙之處(kernel trick)。我們可(kě)以把  換成原始協變量的(de)非線性函數,即  ,但這(zhè)可(kě)能是非常高(gāo)維的(de),從而大(dà)大(dà)增加計算(suàn)量。然而,利用(yòng) kernel trick,  的(de)計算(suàn)可(kě)以通(tōng)過 kernel 函數來(lái)完成,即  。而  變爲


  


這(zhè)樣,就可(kě)以在不增加計算(suàn)量的(de)前提下(xià),把原始協變量增加到更高(gāo)的(de)維數和(hé)更複雜(zá)的(de)非線性關系。實證結果顯示,以此爲前提構造的(de) latent factors 能夠 span 出樣本外更好的(de) SDF。


Beautiful.


老實說,我個(gè)人(rén)非常喜歡這(zhè)種 style 的(de)論文,就是它有足夠的(de)經濟學動機,且 technique 用(yòng)的(de)恰到好處(而不是無腦(nǎo)模型的(de)堆砌;我不是很理(lǐ)解連漸近性質都沒搞清楚的(de)時(shí)候非要使用(yòng)複雜(zá)神經網絡的(de)做(zuò)法)。


不過有意思的(de)是,這(zhè)篇文章(zhāng)到今天還(hái)是個(gè) working paper。也(yě)許 Kozak(或者學術界?)認爲它的(de) contribution 有限?另外,我自己試過這(zhè)個(gè)方法,但是它的(de)實施上确實還(hái)有一些坑。感興趣的(de)小夥伴請仔細閱讀原文。


Sorry! 我 detour 的(de)有點遠(yuǎn)。讓我在回到本文的(de)主題:聽(tīng)王老師的(de)話(huà)有感。我希望公衆号能一直不忘初心,腳踏實地。畢竟,我們每個(gè)人(rén)的(de)能力都有限,也(yě)終究會停下(xià)腳步。但是如果我們把路鋪好,就能夠讓别人(rén)走得(de)更遠(yuǎn)。



參考文獻

Kozak, S. (2019). Kernel trick for the cross-section. Working paper.



免責聲明(míng):入市有風險,投資需謹慎。在任何情況下(xià),本文的(de)内容、信息及數據或所表述的(de)意見并不構成對(duì)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文作者及所屬機構不對(duì)任何人(rén)因使用(yòng)本文的(de)任何内容所引緻的(de)任何損失負任何責任。除特别說明(míng)外,文中圖表均直接或間接來(lái)自于相應論文,僅爲介紹之用(yòng),版權歸原作者和(hé)期刊所有。