Financial Machine Learning

發(fā)布時(shí)間：2023-07-20 | 來(lái)源: 川總寫(xiě)量化

作者：石川

摘要：跟著兩位大佬一起洞悉金融機(jī)器學(xué)習(xí)的最新學(xué)術(shù)前沿。

近日，Bryan Kelly 和修大成兩位教授的最新力作?Financial Machine Learning?上線 SSRN。

作為機(jī)器學(xué)習(xí)和實(shí)證資產(chǎn)定價(jià)交叉領(lǐng)域中你不可能忽視的兩個(gè)名字，他們二位對(duì)金融市場(chǎng)中最新的機(jī)器學(xué)習(xí)文獻(xiàn)進(jìn)行了梳理并提供了該領(lǐng)域研究中的經(jīng)典范例。該文近 150 頁(yè)，旨在幫助對(duì)機(jī)器學(xué)習(xí)工具感興趣的金融經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家以及投資從業(yè)者了解最新的研究成果，其目錄如下（光看目錄就足夠讓人躍躍欲試）。

這篇文章也讓我想起了之前和王熙老師翻譯的 Nagel 的?Machine Learning in Asset Pricing。毫無(wú)疑問(wèn)，這兩篇力作的風(fēng)格（專(zhuān)業(yè)性、嚴(yán)謹(jǐn)性、時(shí)效性）都是我非常推崇的，也均是這個(gè)交叉領(lǐng)域非常重要的學(xué)習(xí)資料。為此，今天就來(lái)全文翻譯?Financial Machine Learning?的第一章。感興趣的小伙伴請(qǐng)自行下載和閱讀原著的其他章節(jié)。特別感謝劉洋溢和王熙兩位老師提出的寶貴修改建議。

最后，本翻譯僅供學(xué)習(xí)交流使用，禁止一切商業(yè)行為，未經(jīng)授權(quán)，禁止轉(zhuǎn)載。

1.1?價(jià)格即預(yù)測(cè)

現(xiàn)代金融市場(chǎng)分析聚焦于如式 (1.1) 所示的關(guān)于價(jià)格的定義，它源自投資者的一般（跨期）優(yōu)化條件：

? $P_{i,t}=\mathbb{E}[M_{t+1}X_{i,t+1}|\mathcal{I}_t]. ~~~~ (1.1)$ ?

該公式的含義是，資產(chǎn)價(jià)格? $P_{i,t}$ ?反映了投資者對(duì)其未來(lái)償付? $X_{i,t+1}$ ?的估值。而投資者對(duì)于時(shí)間和風(fēng)險(xiǎn)等方面的偏好和經(jīng)濟(jì)狀況會(huì)決定這一償付如何被折現(xiàn)，在上式中則體現(xiàn)為對(duì)? $M_{t+1}$ ?的刻畫(huà)。因此，價(jià)格由投資者對(duì)于前述對(duì)象乘積的條件期望決定，而期望又是基于投資者自身所掌握的信息? $\mathcal{I}_t$ ?之上。換句話說(shuō)，價(jià)格即預(yù)測(cè) —— 它們反映了投資者關(guān)于任意資產(chǎn)經(jīng)折現(xiàn)后的未來(lái)償付的最優(yōu)猜測(cè)。

在實(shí)際中，通過(guò)預(yù)期收益率或者“折現(xiàn)率”來(lái)分析價(jià)格十分常見(jiàn)。利用它們和價(jià)格的等價(jià)關(guān)系，我們可以通過(guò)? $t$ ?時(shí)刻的價(jià)格將式 (1.1) 標(biāo)準(zhǔn)化，從而得到：

? $\mathbb{E}[R_{i,t+1}|\mathcal{I}_t]=\beta_{i,t}\lambda_t,~~~~(1.2)$ ?

其中? $R_{i,t+1}=X_{i,t+1}/P_{i,t}-R_{f,t}$ ?表示資產(chǎn)的超額收益率，? $R_{f,t}=\mathbb{E}[M_{t+1}|\mathcal{I}_t]^{-1}$ ?表示單期無(wú)風(fēng)險(xiǎn)收益率，? $\beta_{i,t}=\frac{\mbox{Cov}(M_{t+1},R_{i,t+1}|\mathcal{I}_t)}{\mbox{Var}[M_{t+1}|\mathcal{I}_t]}$ ?為資產(chǎn)和? $M_{t+1}$ ?的協(xié)方差（譯者注：這里實(shí)際就是? $\beta$ ?（風(fēng)險(xiǎn)暴露）的定義；不過(guò)原著中用的是 covariance），而? $\lambda_t=-\frac{\mbox{Var}[M_{t+1}|\mathcal{I}_t]}{\mathbb{E}[M_{t+1}|\mathcal{I}_t]}$ ?則表示風(fēng)險(xiǎn)價(jià)格。我們既可以通過(guò)價(jià)格也可以通過(guò)收益率來(lái)回答所關(guān)心的經(jīng)濟(jì)學(xué)問(wèn)題。然而出于以下原因，使用收益率在學(xué)術(shù)文獻(xiàn)中更為常見(jiàn)。首先，價(jià)格通常不滿足平穩(wěn)性，而收益率則不然。因此，當(dāng)估計(jì)量的統(tǒng)計(jì)屬性依賴(lài)于平穩(wěn)性假設(shè)時(shí)，收益率就是更好的選擇。第二，資產(chǎn)償付上的數(shù)量級(jí)差異會(huì)導(dǎo)致資產(chǎn)價(jià)格上的數(shù)量級(jí)差異，然而這樣的差異對(duì)于分析而言并無(wú)實(shí)質(zhì)性影響（譯者注：但是研究人員必須意識(shí)到并處理這種差異。收益率是可以跨資產(chǎn)進(jìn)行對(duì)比的，而價(jià)格則不然）。而收益率則不受償付數(shù)量級(jí)差異的影響，因此研究者也就無(wú)需額外處理它。

更一般地說(shuō)，通過(guò)對(duì)數(shù)據(jù)同質(zhì)化處理（譯者注：使其具有相同或相似性質(zhì)）可使數(shù)據(jù)具有易于處理的變化規(guī)律和縮放屬性，因此通過(guò)收益率來(lái)研究市場(chǎng)現(xiàn)象有助于降低研究人員的建模難度。此外，收益率本身也是預(yù)測(cè)，且關(guān)于它們的解釋十分清晰且具有很強(qiáng)的實(shí)用性。? $\mathbb{E}[R_{i,t+1}|\mathcal{I}_t]$ ?描繪了投資者對(duì)下一期資產(chǎn)價(jià)值增長(zhǎng)的預(yù)期。正因如此，預(yù)期收益率是資產(chǎn)配置決策中的重要輸入元素。如果我們能設(shè)法找到一個(gè)能夠很好地描述實(shí)際數(shù)據(jù)的實(shí)證模型，那么就能更好地了解市場(chǎng)功能，并同時(shí)得到一個(gè)改進(jìn)未來(lái)資源配置的工具。這個(gè)例子很好地闡釋了應(yīng)用社會(huì)科學(xué)研究的雙重性：一個(gè)好的模型既增進(jìn)了科學(xué)理解，又改善了現(xiàn)實(shí)世界的決策。

1.2?龐大的信息集

金融研究中的兩個(gè)特性使它自然而然成為了應(yīng)用機(jī)器學(xué)習(xí)方法的沃土：（1）龐大的條件信息集和（2）模糊的函數(shù)關(guān)系（譯者注：這里指的是信息和預(yù)期收益率之間的潛在關(guān)系是未知且復(fù)雜的）。由式 (1.1) 可知，資產(chǎn)價(jià)格的研究與信息密切相關(guān)。金融經(jīng)濟(jì)學(xué)研究的核心問(wèn)題包括“市場(chǎng)參與者擁有什么信息以及他們?nèi)绾问褂盟俊眱r(jià)格中所反映出的預(yù)測(cè)由和未來(lái)資產(chǎn)償付（? $X_{i,t+1}$ ?）有關(guān)的可用信息以及投資者對(duì)這些償付的偏好（? $M_{t+1}$ ?）決定。如果價(jià)格在所有狀態(tài)下的運(yùn)動(dòng)規(guī)律都相同，即償付和偏好近似滿足 I.I.D，那么我們可以從式 (1.1) 中拿掉條件信息集? $\mathcal{I}_{t}$ ?。然而，哪怕是毫無(wú)經(jīng)驗(yàn)的投資者，當(dāng)他們?cè)谄湓诰€交易賬戶中瀏覽或者閱讀最新的華爾街日?qǐng)?bào)時(shí)，也注定能夠迅速意識(shí)到隱藏在市場(chǎng)價(jià)格背后的龐大信息。此外，現(xiàn)代資產(chǎn)管理行業(yè)的行為范式表明海量信息會(huì)影響資產(chǎn)價(jià)格的形成：專(zhuān)業(yè)管理人（以手動(dòng)和自動(dòng)方式）定期研究大量的新聞內(nèi)容、發(fā)布數(shù)據(jù)和專(zhuān)家預(yù)測(cè)，以便為他們的投資決策提供信息。

金融市場(chǎng)數(shù)據(jù)的面板屬性使得和價(jià)格有關(guān)的信息范疇變得更加龐大。對(duì)于給定資產(chǎn)來(lái)說(shuō)，其價(jià)格在時(shí)序上的變化極具研究?jī)r(jià)值，這對(duì)應(yīng)著面板數(shù)據(jù)的時(shí)序維度。另一方面，在任何一個(gè)時(shí)點(diǎn)，資產(chǎn)的價(jià)格在截面上的差異同樣不容忽視，這對(duì)應(yīng)著面板數(shù)據(jù)的截面維度。市場(chǎng)環(huán)境隨時(shí)間的變化將會(huì)以相互關(guān)聯(lián)的方式影響諸多資產(chǎn)。例如，大多數(shù)資產(chǎn)在高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)，或者不同的政策環(huán)境下的表現(xiàn)均會(huì)出現(xiàn)差異。隨著宏觀經(jīng)濟(jì)條件的變化，資產(chǎn)價(jià)格由這些共同影響驅(qū)動(dòng)而發(fā)生同步調(diào)整。另一方面，不同的資產(chǎn)或者不同組的資產(chǎn)會(huì)在截面上出現(xiàn)不同的行為。因此，條件信息不僅僅具有時(shí)序性質(zhì)，而且還具備資產(chǎn)層面的屬性。一個(gè)好的資產(chǎn)定價(jià)模型應(yīng)能夠同時(shí)刻畫(huà)導(dǎo)致資產(chǎn)價(jià)格共同變化的共性因素以及驅(qū)動(dòng)資產(chǎn)價(jià)格截面差異的資產(chǎn)自身因素（其本身可能是靜態(tài)或動(dòng)態(tài)的）。對(duì)此，Gu, Kelly and Xiu (2020) 指出：

金融行業(yè)已經(jīng)積累出了一份令人震驚的預(yù)測(cè)指標(biāo)列表，其中的每個(gè)指標(biāo)都被學(xué)者們證明能夠預(yù)測(cè)收益率。文獻(xiàn)中報(bào)告的資產(chǎn)層面的預(yù)測(cè)特征有數(shù)百個(gè)之多，而預(yù)測(cè)市場(chǎng)整體的宏觀經(jīng)濟(jì)指標(biāo)也有數(shù)十個(gè)之多。

此外，考慮到每項(xiàng)金融經(jīng)濟(jì)學(xué)研究往往只研究一個(gè)或少數(shù)幾個(gè)變量，因此我們可以猜想還有廣泛的領(lǐng)域未被觸及。例如，直到最近，新聞文本的信息內(nèi)容才被用來(lái)作為經(jīng)驗(yàn)?zāi)Ｐ?(1.1) 的輸入，因此可以預(yù)期該領(lǐng)域以及其他前沿領(lǐng)域還有很大的擴(kuò)展空間。

1.3?模糊的函數(shù)關(guān)系

如果資產(chǎn)價(jià)格反映對(duì)未來(lái)償付的預(yù)期，那么預(yù)測(cè)模型就是研究?jī)r(jià)格的統(tǒng)計(jì)工具。金融市場(chǎng)研究中的傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法（例如 Hansen and Singleton 1982）首先根據(jù)理論經(jīng)濟(jì)模型為收益率預(yù)測(cè)模型設(shè)定了一個(gè)函數(shù)形式，然后再估計(jì)其參數(shù)，以理解在所選擇的模型約束內(nèi)，潛在信息源與所觀察到的市場(chǎng)價(jià)格之間的關(guān)聯(lián)。然而，我們應(yīng)該以文獻(xiàn)中提出的哪個(gè)經(jīng)濟(jì)模型為出發(fā)點(diǎn)呢？

式 (1.1) 中的一階條件或“歐拉方程”的表述足夠?qū)挿?，使之能夠包含各種結(jié)構(gòu)性經(jīng)濟(jì)假設(shè)。這種通用性是有理由的，因?yàn)槿藗兩形淳湍姆N具體的結(jié)構(gòu)化公式更好達(dá)成共識(shí)。早期的基于消費(fèi)的定價(jià)模型（譯者注：宏觀金融模型）在大多數(shù)評(píng)價(jià)標(biāo)準(zhǔn)下均無(wú)法匹配市場(chǎng)價(jià)格數(shù)據(jù)（例如 Mehra and Prescott 1985）。如果將衡量成功的標(biāo)準(zhǔn)降的足夠低，那么現(xiàn)代結(jié)構(gòu)模型在匹配價(jià)格數(shù)據(jù)方面則表現(xiàn)的要稍好一些（例如 Chen, Dou and Kogan forthcoming），不過(guò)這些模型描述的現(xiàn)象通常僅限于少數(shù)資產(chǎn)，且評(píng)估的結(jié)果僅僅是基于樣本內(nèi)數(shù)據(jù)。

鑒于結(jié)構(gòu)模型難以貼合實(shí)證數(shù)據(jù)，過(guò)去二十年的大多數(shù)實(shí)證研究已選擇摒棄結(jié)構(gòu)化假設(shè)，轉(zhuǎn)而轉(zhuǎn)向更為靈活的“簡(jiǎn)化形式”（reduced-form model）或“無(wú)套利”框架（譯者注：在經(jīng)濟(jì)學(xué)中，reduced-form model 是指模型的輸出只是輸入變量的函數(shù)，而不直接假設(shè)底層經(jīng)濟(jì)行為邏輯。換句話說(shuō)，reduced-form model 尋找輸入變量和輸出變量之間的統(tǒng)計(jì)關(guān)系。這與結(jié)構(gòu)模型相反，結(jié)構(gòu)模型試圖詳細(xì)地建立和估計(jì)底層的經(jīng)濟(jì)行為和機(jī)制，甚至結(jié)構(gòu)模型能夠?qū)崿F(xiàn)諸如反事實(shí)分析一類(lèi)的高階因果推斷分析）。雖然關(guān)于市場(chǎng)的實(shí)證研究通常避免強(qiáng)加具體的經(jīng)濟(jì)結(jié)構(gòu)，但它們通常會(huì)施加統(tǒng)計(jì)結(jié)構(gòu)（例如，以低維多因子模型或其他參數(shù)化假設(shè)的形式）。然而，即便在簡(jiǎn)化形式的模型中也有很多統(tǒng)計(jì)結(jié)構(gòu)可供選擇，因而探索靈活模型是值得的，因?yàn)楹笳呖梢匀菁{許多不同的函數(shù)形式，并且可以應(yīng)對(duì)不同程度的非線性關(guān)系以及變量之間的交互作用。

這就是諸如核方法、懲罰似然估計(jì)量、決策樹(shù)和神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)工具的應(yīng)用場(chǎng)景。由多種非參數(shù)估計(jì)量和大型參數(shù)模型組成，機(jī)器學(xué)習(xí)方法正是為了逼近未知的數(shù)據(jù)生成函數(shù)而生。此外，機(jī)器學(xué)習(xí)可以將許多數(shù)據(jù)源整合到一個(gè)模型中。由 1.2 節(jié)的討論可知，為了更好地對(duì)價(jià)格或者預(yù)期收益率建模，我們需要豐富的條件信息集? $\mathcal{I}_t$ ?。對(duì)于這一點(diǎn)，Cochrane (2005)?指出“我們顯然無(wú)法觀測(cè)到經(jīng)濟(jì)主體使用的所有信息，我們甚至很難在模型中包含所觀測(cè)到的哪怕一小部分信息。”Hansen and Richard (1987)（以及最新的?Martin and Nagel 2022）強(qiáng)調(diào)了經(jīng)濟(jì)學(xué)模型中的投資者可接觸到的信息量與模型外部的計(jì)量經(jīng)濟(jì)學(xué)家可獲得的信息量之間的差距。機(jī)器學(xué)習(xí)提供了讓研究者能夠處理更大信息集的方法，從而幫助縮小研究者和市場(chǎng)參與者所使用的信息集大小的差距。

我們使用的條件信息集越豐富，模型就會(huì)越貼近現(xiàn)實(shí)。同樣的邏輯適用于函數(shù)形式問(wèn)題。市場(chǎng)參與者不僅將豐富的信息納入預(yù)測(cè)，而且他們利用推理和直覺(jué)，使用非常復(fù)雜的方式來(lái)進(jìn)行預(yù)測(cè)。我們必須認(rèn)識(shí)到，作為研究者，我們無(wú)從知道投資者使用信息的具體方式，因此也就無(wú)法在參數(shù)統(tǒng)計(jì)模型中詳盡地（當(dāng)然更不可能簡(jiǎn)潔地）指定該方式。正如 Cochrane (2005) 提醒我們?cè)诳紤]條件信息時(shí)要謹(jǐn)慎一樣，我們?cè)诳紤]函數(shù)形式時(shí)也必須同樣謹(jǐn)慎。

1.4?機(jī)器學(xué)習(xí) vs 計(jì)量經(jīng)濟(jì)學(xué)

到底什么是機(jī)器學(xué)習(xí)，它與傳統(tǒng)的計(jì)量經(jīng)濟(jì)學(xué)有何不同？Gu, Kelly and Xiu (2020) 強(qiáng)調(diào)，機(jī)器學(xué)習(xí)的精確定義尚無(wú)定論，且其定義有時(shí)會(huì)因使用者的市場(chǎng)營(yíng)銷(xiāo)目的而扭曲。我們遵循 Gu, Kelly and Xiu (2020) 的定義，將機(jī)器學(xué)習(xí)描述為以下三方面的總和：（i）用于統(tǒng)計(jì)預(yù)測(cè)的多樣化高維模型的集合，（ii）用于模型選擇和降低過(guò)擬合的“正則化”方法，以及（iii）用于搜索大量潛在模型設(shè)定的高效算法。

根據(jù)這個(gè)定義，金融機(jī)器學(xué)習(xí)可被理解為一套用于估計(jì)統(tǒng)計(jì)模型并使用該模型進(jìn)行決策的程序。因此，從本質(zhì)上講，我們無(wú)需將機(jī)器學(xué)習(xí)與計(jì)量經(jīng)濟(jì)學(xué)或統(tǒng)計(jì)學(xué)區(qū)分開(kāi)來(lái)。機(jī)器學(xué)習(xí)背后的很多理念在過(guò)去幾十年里已經(jīng)在統(tǒng)計(jì)學(xué)的大旗下生根發(fā)芽（Israel, Kelly and Moskowitz 2020）。

為了通過(guò)數(shù)據(jù)來(lái)學(xué)習(xí)，機(jī)器需要一個(gè)關(guān)于其學(xué)習(xí)任務(wù)的函數(shù)化表達(dá)。研究者必須對(duì)此做出選擇 —— 這將決定我們將會(huì)從數(shù)據(jù)中得到怎樣的發(fā)現(xiàn)。前述關(guān)于機(jī)器學(xué)習(xí)定義的第（i）部分指出，機(jī)器學(xué)習(xí)對(duì)函數(shù)化表示幾乎沒(méi)有約束，它可以是高度參數(shù)化且通常是非線性的。另一方面，小模型往往不夠靈活且過(guò)于簡(jiǎn)化，但其簡(jiǎn)潔性有利于精確的參數(shù)估計(jì)并很容易解釋。大型和復(fù)雜的模型則要靈活得多，但也可能對(duì)樣本內(nèi)的噪聲更加敏感，并因?yàn)閷?duì)噪聲的過(guò)擬合而削弱其在樣本外的表現(xiàn)。當(dāng)研究者認(rèn)為更準(zhǔn)確地描述現(xiàn)實(shí)世界的復(fù)雜現(xiàn)象所帶來(lái)的好處超過(guò)過(guò)擬合的成本時(shí)，他們便會(huì)轉(zhuǎn)而使用大模型。從直觀上講，當(dāng)分析師不確定其統(tǒng)計(jì)模型應(yīng)采取哪種具體結(jié)構(gòu)化假設(shè)時(shí)，機(jī)器學(xué)習(xí)便提供了進(jìn)行統(tǒng)計(jì)分析的另一種途徑。從這個(gè)意義上講，大部分的機(jī)器學(xué)習(xí)可以被視為非參數(shù)（或半?yún)?shù)）化建模。其運(yùn)行范式考慮了各種可能的模型設(shè)定，并通過(guò)數(shù)據(jù)的指引來(lái)確定哪個(gè)模型對(duì)于手頭待處理的問(wèn)題最為有效。有人可能會(huì)問(wèn)：分析師何時(shí)知道什么結(jié)構(gòu)化假設(shè)適合他們的統(tǒng)計(jì)分析？答案當(dāng)然是“永遠(yuǎn)不會(huì)”，而這就是為什么機(jī)器學(xué)習(xí)在金融研究中大有可為。正如 Breiman (2001) 所強(qiáng)調(diào)的，機(jī)器學(xué)習(xí)與傳統(tǒng)統(tǒng)計(jì)學(xué)研究目標(biāo)的最根本差異在于，前者在未知數(shù)據(jù)模型的前提下最大化預(yù)測(cè)準(zhǔn)確性，而后者則在假設(shè)數(shù)據(jù)模型已知的前提下估計(jì)模型參數(shù)并進(jìn)行統(tǒng)計(jì)檢驗(yàn)。

定義的第（ii）部分強(qiáng)調(diào)，機(jī)器學(xué)習(xí)從“多樣化的候選模型集合”中選擇一個(gè)最佳模型（或模型組合）。同樣的想法以模型選擇（或與之相關(guān)的模型平均）的概念早已存在于計(jì)量經(jīng)濟(jì)學(xué)方法中。二者的不同之處在于，機(jī)器學(xué)習(xí)將模型選擇置于實(shí)證設(shè)計(jì)的核心。尋找具有最優(yōu)樣本外預(yù)測(cè)性能模型的過(guò)程（通常被稱(chēng)為模型“調(diào)優(yōu)”）是機(jī)器學(xué)習(xí)方法的重要特征。當(dāng)然，從諸多模型中機(jī)械地選擇會(huì)發(fā)生樣本內(nèi)過(guò)擬合，從而削弱樣本外的表現(xiàn)。因此，機(jī)器學(xué)習(xí)的研究過(guò)程往往伴隨著“正則化”，它是一個(gè)用于約束模型大小以確保樣本外性能穩(wěn)定性的通用術(shù)語(yǔ)。正如 Gu, Kelly and Xiu (2020) 所說(shuō)，“最優(yōu)模型是一個(gè)‘恰到好處的’模型。一方面，它足夠大因而能夠可靠地識(shí)別出數(shù)據(jù)中可能存在的復(fù)雜預(yù)測(cè)關(guān)系，而另一方面它又不至于過(guò)于靈活以至于由過(guò)擬合主導(dǎo)，從而影響樣本外的表現(xiàn)。”正則化方法傾向于產(chǎn)生較小的模型；只有當(dāng)更豐富的模型能夠真正提升樣本外預(yù)測(cè)準(zhǔn)確性時(shí)，它們才能夠脫穎而出。

機(jī)器學(xué)習(xí)定義中的第（iii）個(gè)組成部分也許是它與傳統(tǒng)統(tǒng)計(jì)學(xué)最明顯的不同之處，但也可能是經(jīng)濟(jì)學(xué)直覺(jué)最為最欠缺的部分。當(dāng)數(shù)據(jù)集很大且/或模型參數(shù)太多時(shí)，計(jì)算量有可能成為瓶頸。機(jī)器學(xué)習(xí)已經(jīng)發(fā)展出各種近似優(yōu)化方法來(lái)減少計(jì)算負(fù)載。例如，傳統(tǒng)的計(jì)量經(jīng)濟(jì)學(xué)估計(jì)量通常在迭代優(yōu)化過(guò)程的每一步中使用所有數(shù)據(jù)點(diǎn)，并且只有在結(jié)果收斂時(shí)才停止參數(shù)搜索。而諸如使用數(shù)據(jù)子集以及在收斂前停止搜索等捷徑通常能夠以很小的準(zhǔn)確性損失為代價(jià)而大大減少計(jì)算量（例如，隨機(jī)梯度下降和早停法是訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)的兩個(gè)基本要素）。

1.5?金融學(xué)中應(yīng)用機(jī)器學(xué)習(xí)的挑戰(zhàn)（及施加經(jīng)濟(jì)學(xué)約束的好處）

盡管金融研究在許多方面都非常適合機(jī)器學(xué)習(xí)方法，但金融領(lǐng)域的某些方面也對(duì)機(jī)器學(xué)習(xí)提出了挑戰(zhàn)。理解這些障礙對(duì)于形成關(guān)于金融機(jī)器學(xué)習(xí)益處的正確預(yù)期至關(guān)重要。

首先，雖然機(jī)器學(xué)習(xí)通常被視為一個(gè)“大數(shù)據(jù)”工具，但許多金融學(xué)領(lǐng)域的基礎(chǔ)問(wèn)題都飽受經(jīng)濟(jì)時(shí)間序列中有限數(shù)據(jù)量的困擾。例如，在宏觀金融中，標(biāo)準(zhǔn)數(shù)據(jù)集僅包含幾百個(gè)月度觀測(cè)值。如此程度的數(shù)據(jù)稀缺現(xiàn)實(shí)在其他機(jī)器學(xué)習(xí)領(lǐng)域是十分罕見(jiàn)的；在其他領(lǐng)域中研究者通常具有（出于各種意圖和目的）無(wú)限的數(shù)據(jù)（或具備在需要時(shí)生成新數(shù)據(jù)的能力）。而在關(guān)于時(shí)間序列的研究中，新數(shù)據(jù)只有隨著時(shí)間的推移而累積。

其次，金融研究經(jīng)常面臨低信噪比問(wèn)題。這一點(diǎn)在收益率預(yù)測(cè)中最為明顯，這是因?yàn)槭袌?chǎng)有效性的力量（利潤(rùn)最大化和競(jìng)爭(zhēng)）始終在努力地消除價(jià)格走勢(shì)中的任何可預(yù)測(cè)性（Samuelson 1965;?Fama?1970）。因此，可以預(yù)見(jiàn)價(jià)格變化的主要來(lái)源是意料之外的新息（對(duì)于模型而言，這是無(wú)法預(yù)測(cè)的噪聲）。市場(chǎng)也可能表現(xiàn)出無(wú)效性，投資者偏好也可能產(chǎn)生隨時(shí)間變化的風(fēng)險(xiǎn)溢價(jià)，從而導(dǎo)致一定的收益率可預(yù)測(cè)性。盡管如此，我們?nèi)詰?yīng)預(yù)期收益率的可預(yù)測(cè)性很低、但關(guān)于可預(yù)測(cè)性的競(jìng)爭(zhēng)卻非常激烈。

第三，市場(chǎng)會(huì)隨時(shí)間不斷演變而身處其中的投資者也會(huì)持續(xù)學(xué)習(xí)。因此機(jī)器學(xué)習(xí)預(yù)測(cè)模型的目標(biāo)并非一成不變。先前得到的可靠的預(yù)測(cè)模式可能會(huì)因套利而被消除。監(jiān)管和技術(shù)變化也可能會(huì)使經(jīng)濟(jì)結(jié)構(gòu)發(fā)生變化。結(jié)構(gòu)不滿足平穩(wěn)性使金融學(xué)對(duì)于機(jī)器學(xué)習(xí)而言成為一個(gè)特別復(fù)雜的領(lǐng)域，且不滿足平穩(wěn)性進(jìn)一步加劇了有限數(shù)據(jù)量以及低信噪比帶來(lái)的挑戰(zhàn)。

這些挑戰(zhàn)也提供了一個(gè)機(jī)會(huì)，讓人們可以從經(jīng)濟(jì)理論知識(shí)中獲益。如 Israel, Kelly and Moskowitz (2020) 指出：

統(tǒng)計(jì)分析的一個(gè)基本原則是，理論和模型參數(shù)可以相互替代。你在模型中施加的結(jié)構(gòu)越多，你需要估計(jì)的參數(shù)就越少，且模型能夠更有效地使用可用的數(shù)據(jù)來(lái)減少噪聲。也就是說(shuō)，由于能夠過(guò)濾掉噪聲，因此模型是有用的。但是，過(guò)于簡(jiǎn)化的模型也可能過(guò)濾掉一些信號(hào)，所以在數(shù)據(jù)充盈且信噪比高的環(huán)境中，人們往往不希望使用一個(gè)不必要的小模型。通過(guò)引入經(jīng)濟(jì)學(xué)理論來(lái)描述數(shù)據(jù)的某些屬性，并配合機(jī)器學(xué)習(xí)算法來(lái)捕獲理論無(wú)法描述的數(shù)據(jù)的另外一些屬性，人們便可以開(kāi)始解決數(shù)據(jù)量有限和信噪比很低這兩個(gè)問(wèn)題。

1.6?經(jīng)濟(jì)學(xué)內(nèi)容（金融經(jīng)濟(jì)學(xué)的兩種文化）

我們回顧一下 Breiman (2001) 關(guān)于統(tǒng)計(jì)學(xué)中 “兩種文化”的論述，經(jīng)過(guò)適當(dāng)修改，它在金融經(jīng)濟(jì)學(xué)中也有一個(gè)類(lèi)比。第一種是“結(jié)構(gòu)模型/假設(shè)檢驗(yàn)”文化，它傾向于施加完全或部分指定的結(jié)構(gòu)化假設(shè)，并通過(guò)假設(shè)檢驗(yàn)來(lái)研究經(jīng)濟(jì)機(jī)制。在簡(jiǎn)化形式的多因子模型和機(jī)器學(xué)習(xí)預(yù)測(cè)模型出現(xiàn)之前，傳統(tǒng)的實(shí)證資產(chǎn)定價(jià)分析范式通過(guò)嚴(yán)格約束的預(yù)測(cè)模型來(lái)研究?jī)r(jià)格。其中約束形式包括（i）特定的函數(shù)形式以及擾動(dòng)項(xiàng)分布，和（ii）被允許納入到條件信息集的變量十分有限。這些模型的泛化能力很差，表現(xiàn)在它們無(wú)法解釋超出模型假定的狹窄范圍或超出訓(xùn)練數(shù)據(jù)集之外的資產(chǎn)價(jià)格行為。由于這一看法早已深入人心，人們幾乎從不考慮這類(lèi)完全指定的結(jié)構(gòu)資產(chǎn)定價(jià)模型在樣本外的表現(xiàn)。

另一種是“預(yù)測(cè)模型”文化，它最看重統(tǒng)計(jì)方面的解釋力，且其發(fā)展主要得益于早先建立的結(jié)構(gòu)模型無(wú)法有效解釋實(shí)證數(shù)據(jù)。一旦能夠產(chǎn)生更加有意義且穩(wěn)健的數(shù)據(jù)擬合結(jié)果，哪怕模型設(shè)定和經(jīng)濟(jì)學(xué)理論之間缺乏明確的關(guān)聯(lián)，這類(lèi)模型也能夠被預(yù)測(cè)模型文化所接納。除了自 1990 年代以來(lái)主導(dǎo)實(shí)證金融研究的簡(jiǎn)化形式模型外，迄今為止的金融機(jī)器學(xué)習(xí)研究也完全符合這種文化。

在經(jīng)濟(jì)研討會(huì)上，聽(tīng)眾、討論者和審稿人不時(shí)對(duì)統(tǒng)計(jì)預(yù)測(cè)研究拋出“欠缺經(jīng)濟(jì)學(xué)”的指責(zé)。這種批評(píng)常常是錯(cuò)誤的，而我們應(yīng)當(dāng)防止它過(guò)度貶低金融機(jī)器學(xué)習(xí)的發(fā)展。我們不應(yīng)忽視即使是最純粹的統(tǒng)計(jì)建模應(yīng)用在金融學(xué)中也扮演著重要的經(jīng)濟(jì)角色。和傳統(tǒng)的進(jìn)行結(jié)構(gòu)假設(shè)檢驗(yàn)的計(jì)量經(jīng)濟(jì)學(xué)相比，相對(duì)無(wú)結(jié)構(gòu)的預(yù)測(cè)模型的經(jīng)濟(jì)重要性相當(dāng)，這兩者只是扮演了不同的科學(xué)角色。假設(shè)檢驗(yàn)通過(guò)探究特定的機(jī)制來(lái)學(xué)習(xí)經(jīng)濟(jì)學(xué)。然而，檢驗(yàn)理論機(jī)制并非經(jīng)濟(jì)學(xué)的全部。無(wú)理論的（我們想不到更好的術(shù)語(yǔ)）預(yù)測(cè)模型所觸及的實(shí)證領(lǐng)域更加廣泛，且能夠描繪出全新的實(shí)證事實(shí)；基于這些事實(shí)，人們能夠提出新理論并且通過(guò)假設(shè)檢驗(yàn)來(lái)研究其背后的機(jī)制。這兩種形式的實(shí)證研究 —— 精確的檢驗(yàn)和粗略的探索 —— 在科學(xué)進(jìn)步的庫(kù)恩過(guò)程中發(fā)揮著互補(bǔ)的作用。

再回到資產(chǎn)定價(jià)研究的核心問(wèn)題：資產(chǎn)的風(fēng)險(xiǎn)溢價(jià)到底由什么決定？即使能準(zhǔn)確地觀測(cè)到預(yù)期收益率，我們?nèi)匀恍枰碚搧?lái)解釋它們的行為，以及需要通過(guò)實(shí)證研究來(lái)檢驗(yàn)這些理論。然而，我們并不能觀測(cè)到風(fēng)險(xiǎn)溢價(jià)，此外準(zhǔn)確地估計(jì)它們也難如登天。機(jī)器學(xué)習(xí)在衡量風(fēng)險(xiǎn)溢價(jià)方面取得了一定的進(jìn)展，有助于人們提出更好的理論來(lái)解釋決定收益率行為的經(jīng)濟(jì)機(jī)制。

拓展已有實(shí)證研究疆域的一個(gè)重要好處是，哪怕人們尚不能參透隱藏在新實(shí)證發(fā)現(xiàn)背后的經(jīng)濟(jì)機(jī)制，經(jīng)濟(jì)參與者 —— 尤其是金融市場(chǎng)參與者 —— 也總能從更多的實(shí)證發(fā)現(xiàn)中受益。一直以來(lái)，預(yù)測(cè)模型文化的傳統(tǒng)是以幫助投資者、消費(fèi)者以及政策制定者做出更好決策為目的而展開(kāi)研究。改進(jìn)的預(yù)測(cè)能夠?yàn)榻?jīng)紀(jì)參與者提供關(guān)于狀態(tài)依賴(lài)分布的更準(zhǔn)確描述。

總的來(lái)說(shuō)，經(jīng)濟(jì)學(xué)是一個(gè)應(yīng)用領(lǐng)域。而預(yù)測(cè)模型文化的經(jīng)濟(jì)學(xué)恰恰體現(xiàn)在其能夠提高預(yù)測(cè)能力。一旦具備更好的預(yù)測(cè) —— 即對(duì)經(jīng)濟(jì)機(jī)會(huì)集的更準(zhǔn)確的評(píng)估 —— 經(jīng)濟(jì)主體便能夠在分配稀缺資源時(shí)更好地權(quán)衡成本和收益。這提高了社會(huì)的福利水平。在投資組合優(yōu)化問(wèn)題中，這一點(diǎn)顯得尤為突出。我們也許不能總是理解模型通過(guò)什么經(jīng)濟(jì)機(jī)制提供了更好的收益率或風(fēng)險(xiǎn)預(yù)測(cè)；但如果它做到了，它就會(huì)提高投資者的效用，因此它在經(jīng)濟(jì)上是重要的。

Breiman 對(duì)結(jié)構(gòu)假設(shè)檢驗(yàn)文化的主要批評(píng)是：

當(dāng)通過(guò)數(shù)據(jù)擬合來(lái)確定模型、并通過(guò)模型做出定量結(jié)論時(shí)：這些結(jié)論是關(guān)于模型的機(jī)制，而不是關(guān)于真實(shí)世界的機(jī)制。一旦模型不能很好地反映真實(shí)世界，那么通過(guò)模型得出的結(jié)論便可能是錯(cuò)誤的。

我們并不將上述觀點(diǎn)視為對(duì)結(jié)構(gòu)建模的批判 —— 畢竟結(jié)構(gòu)建模仍然是實(shí)證金融研究的基礎(chǔ) —— 而是將它視為對(duì)使用預(yù)測(cè)模型的辯護(hù)。當(dāng)然，將兩種文化完全對(duì)立開(kāi)來(lái)同樣是不可理喻的。學(xué)術(shù)研究往往二者兼顧且需要利用諸多工具，研究者們也并非被劃分到不同的意識(shí)形態(tài)陣營(yíng)（每個(gè)陣營(yíng)是同質(zhì)的）。兩種文化在經(jīng)濟(jì)上都很重要。Breiman 鼓勵(lì)人們考慮靈活的乃至是非參數(shù)化模型，以更好的了解經(jīng)濟(jì)機(jī)制：

模型的目的是獲取關(guān)于因變量和自變量之間關(guān)系的有用信息?？山忉屝允谦@取信息的一種方式。但是，并非只有簡(jiǎn)單的模型才能提供關(guān)于二者之間關(guān)系的準(zhǔn)確信息；同樣也并非只有（結(jié)構(gòu)）數(shù)據(jù)模型才能實(shí)現(xiàn)上述目標(biāo)。

預(yù)測(cè)模型是理解機(jī)制的第一步。此外，結(jié)構(gòu)建模也可以直接從機(jī)器學(xué)習(xí)中受益，而這種受益并不以犧牲有針對(duì)性的假設(shè)檢驗(yàn)或其特定的經(jīng)濟(jì)機(jī)制為前提。到目前為止，機(jī)器學(xué)習(xí)更多地出現(xiàn)在金融經(jīng)濟(jì)學(xué)的預(yù)測(cè)模型文化中。然而很重要的一點(diǎn)是要認(rèn)識(shí)到，對(duì)于結(jié)構(gòu)假設(shè)檢驗(yàn)文化而言，它同樣是一個(gè)強(qiáng)大的工具（這是未來(lái)金融機(jī)器學(xué)習(xí)研究的一個(gè)重要方向）。當(dāng)然，對(duì)于一個(gè)僅僅建立于“無(wú)理論測(cè)量”（Koopmans 1947）之上的研究方式來(lái)說(shuō)，如果我們同時(shí)通過(guò)經(jīng)濟(jì)學(xué)理論以及深入理解 Lucas (1976) 批判來(lái)思考數(shù)據(jù)，將會(huì)使它發(fā)揮更大的作用。同樣，一個(gè)僅通過(guò)現(xiàn)有經(jīng)濟(jì)模型解釋數(shù)據(jù)的研究方式也很可能會(huì)忽視掉意想不到、但經(jīng)濟(jì)上非常重要的統(tǒng)計(jì)模式。

Hayek (1945) 研究了分散化信息對(duì)資源配置的經(jīng)濟(jì)影響。關(guān)于如何實(shí)現(xiàn)有效的經(jīng)濟(jì)秩序的核心問(wèn)題，他指出：

如果我們掌握了所有相關(guān)信息，如果我們可以從給定的偏好系統(tǒng)出發(fā)，如果我們掌握了可用手段的完整知識(shí)，那么剩下的問(wèn)題就純粹是邏輯問(wèn)題……然而，這顯然不是社會(huì)面臨的經(jīng)濟(jì)問(wèn)題。人們提出的經(jīng)濟(jì)計(jì)算雖然是解決社會(huì)經(jīng)濟(jì)問(wèn)題的重要步驟，但尚未就該問(wèn)題給出答案。這其中的原因是，經(jīng)濟(jì)計(jì)算的起始數(shù)據(jù)是從整個(gè)社會(huì)收集的所有相關(guān)數(shù)據(jù)，沒(méi)有哪個(gè)人或者單個(gè)機(jī)構(gòu)能完全獲得并理解所有的數(shù)據(jù)以及數(shù)據(jù)變化所帶來(lái)的經(jīng)濟(jì)影響（譯者注：在經(jīng)濟(jì)領(lǐng)域，這個(gè)觀點(diǎn)被廣泛接受。這也是為什么我們需要使用統(tǒng)計(jì)模型，以便從大量多樣的數(shù)據(jù)中抽取有用的信息，并嘗試預(yù)測(cè)和理解經(jīng)濟(jì)現(xiàn)象）。

雖然 Hayek 主要關(guān)注的是分散式計(jì)劃的優(yōu)點(diǎn)，但他的陳述也適用于一般的信息技術(shù)，特別是預(yù)測(cè)技術(shù)。讓我們大膽地從統(tǒng)計(jì)學(xué)問(wèn)題視角重新解讀 Hayek 的觀點(diǎn)：經(jīng)濟(jì)主體在數(shù)據(jù)生成過(guò)程（DGP）已知時(shí)所能夠?qū)崿F(xiàn)的配置效率，與其在必須估計(jì) DGP 時(shí)所能夠?qū)崿F(xiàn)的配置效率二者之間存在差距。其中的第一個(gè)原因是模型設(shè)定偏誤問(wèn)題，即我們不能指望經(jīng)濟(jì)主體正確地設(shè)定統(tǒng)計(jì)模型。他們只能使用某種帶設(shè)定偏誤的參數(shù)模型或非參數(shù)近似模型。在任何一種情況下，模型設(shè)定偏誤都會(huì)導(dǎo)致已知 DGP 時(shí)的最優(yōu)配置（稱(chēng)之為“第一最優(yōu)解”）與由該模型得到的最優(yōu)配置（稱(chēng)之為“第二最優(yōu)解”）之間存在差距。然而，由于我們必須通過(guò)有限的數(shù)據(jù)來(lái)估計(jì)模型，因此即便是第二最優(yōu)解也只是水中望月。這就引發(fā)了由采樣波動(dòng)導(dǎo)致的另一個(gè)差距。即使我們知道 DGP 的函數(shù)形式，我們?nèi)匀恍枰烙?jì)它，而估計(jì)中的噪聲會(huì)導(dǎo)致最終偏離第一最優(yōu)解。再疊加模型設(shè)定偏誤問(wèn)題，我們實(shí)際上只能獲得“第三最優(yōu)解”的配置，即來(lái)自一個(gè)誤設(shè)模型的噪聲估計(jì)所產(chǎn)生的解。

如果我們能夠通過(guò)使用善于處理大量信息和數(shù)據(jù)集的方法而獲得改進(jìn)的預(yù)測(cè)，便可使縮小前文中提到的差距（即 Hayek 提到的第一最優(yōu)資源配置這一純粹的“邏輯問(wèn)題”和經(jīng)濟(jì)主體能夠?qū)崿F(xiàn)的第三最優(yōu)現(xiàn)實(shí)配置這二者的差距）成為可能。由于可學(xué)習(xí)性的統(tǒng)計(jì)限制（Da, Nagel and Xiu 2022；Didisheim, et al. 2023），我們永遠(yuǎn)無(wú)法完全消除上述差距。但是，強(qiáng)大的近似模型和巧妙的正則化方法意味著機(jī)器學(xué)習(xí)在經(jīng)濟(jì)上是重要的，而其重要性恰恰源自它能夠產(chǎn)生更好的決策。投資組合選擇問(wèn)題能夠很好地說(shuō)明這一點(diǎn)。如果一個(gè)遵循現(xiàn)代投資組合理論的投資者知道真實(shí)的預(yù)期收益率和協(xié)方差矩陣，那么他只需將它們套入到?Markowitz?理論的“邏輯”之中便能夠得到第一最優(yōu)解。然而，與 Hayek 的問(wèn)題類(lèi)似，這并非現(xiàn)實(shí)世界中的投資者所要處理的問(wèn)題。相反，他們的問(wèn)題主要是一個(gè)估計(jì)問(wèn)題（一類(lèi)預(yù)測(cè)問(wèn)題）。投資者的目標(biāo)是獲得關(guān)于預(yù)期收益率和協(xié)方差矩陣的合理估計(jì)，以便當(dāng)他們采用 Markowitz 理論時(shí)，能夠獲得穩(wěn)健的樣本外表現(xiàn)。一旦這個(gè)前提不成立，即缺少高質(zhì)量的估計(jì)值，Markowitz 的最優(yōu)解將會(huì)導(dǎo)致災(zāi)難性的配置后果。這一點(diǎn)已在很多研究中得到證實(shí)。

參考文獻(xiàn)

Breiman, L. (2001). Random forests.?Machine Learning 45(1), 5 – 32.

Chen, H., W. W. Dou, and L. Kogan (forthcoming). Measuring “Dark Matter” in Asset Pricing Models.?Journal of Finance.

Cochrane, J. H. (2005).?Asset Pricing: Revised Edition. Princeton University Press.

Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Working paper.

Didisheim, A., S. Ke, B. T. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Working paper.

Fama, E. F. (1970). Efficient capital markets: A review of theory and empirical work.?Journal of Finance 25(2), 383 – 417.

Gu, S., B. T. Kelly, and D. Xiu (2020). Empirical asset pricing via machine learning.?Review of Financial Studies 33(5), 2223 – 2273.

Hansen, L. P. and S. F. Richard (1987). The role of conditioning information in deducing testable restrictions implied by dynamic asset pricing models.?Econometrica 55(3), 587 – 613.

Hansen, L. P. and K. J. Singleton (1982). Generalized instrumental variables estimation of nonlinear rational expectations models.?Econometrica 50(5), 1269 – 1286.

Hayek, F. A. (1945). The use of knowledge in society.?American Economic Review 35(4), 519 – 530.

Israel, R., B. Kelly, and T. J. Moskowitz (2020). Can Machines “Learn” Finance??Journal of Investment Management 18(2), 23 – 36.

Koopmans, T. C. (1947). Measurement without theory.?Review of Economics and Statistics 29(3), 161 – 172.

Lucas Jr, R. E. (1976). Econometric policy evaluation: A critique. In: Carnegie-Rochester Conference Series on Public Policy. Vol. 1. North-Holland. 19 – 46.

Martin, I. W. and S. Nagel (2022). Market efficiency in the age of big data.?Journal of Financial Economics 145(1), 154 – 177.

Mehra, R. and E. C. Prescott (1985). The equity premium: A puzzle.?Journal of Monetary Economics 15(2), 145 – 161.

Samuelson, P. A. (1965). Rational theory of warrant pricing.?Industrial Management Review 6(2), 13 – 39.

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見(jiàn)并不構(gòu)成對(duì)任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說(shuō)明外，文中圖表均直接或間接來(lái)自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

在线看片免费人成视久网,无码日本被黑人强伦姧视频 ,中日产幕无线码一区,无码精品av久久久免费

合格投資者聲明

Financial Machine Learning