出色不如走運(yùn) (IV)?
發(fā)布時(shí)間:2020-04-27 | 來源: 川總寫量化
作者:石川
摘要:繼 Harvey, Liu, and Zhu (2016) 把因子顯著性 t-statistic 閾值提升到 3.0 之后,如今它又被提升到 3.4 以上?
00?引言
上周,Review of Financial Studies 發(fā)布了最新的一刊(2020 年五月刊)。令人頗為驚喜的是,它是一個(gè)關(guān)于股票截面收益率研究新方法的特刊(Special Issue: New methods in the cross-section)。下圖是這期的封面,羅列它所包含的文章。除了第一篇是來自編輯的介紹軟文外,從第二篇 Eugene Fama 和老搭檔 Ken French 的文章開始就是被收錄的論文。大咖云集、眾星閃耀。
關(guān)于這 9 篇論文,本公眾號(hào)和 [因子動(dòng)物園] 之前零星介紹過一些(因?yàn)橛行┠軌蛟?SSRN 上拿到早期的研究手稿),例如 Fama and French (2020),Daniel et al. (2020) 以及 Gu, Kelly, and Xiu (2020) 等;另外相信各位小伙伴對(duì)于 Hou, Xue, and Zhang (2020) 的 Replicating Anomalies 也一定不陌生(這篇文章終于見刊了?。?/span>
本文的目的并非逐一介紹這個(gè)特刊收錄每篇論文,而是重點(diǎn)關(guān)注其中的一篇。也許各位已經(jīng)從本文的題目猜到了,它是《出色不如走運(yùn)》系列的最新一篇,而這一系列所闡述的都是到底如何排除運(yùn)氣的成分、找到真正顯著的異象。因此,本文的主要內(nèi)容就是介紹 Chordia, Goyal, and Saretto (2020) 這篇題為 Anomalies and false rejections 的論文。
當(dāng)然,由于特刊過于精彩,它精彩的勾勒出關(guān)于截面預(yù)期收益率研究的三個(gè)趨勢。因此本文也會(huì)對(duì)其進(jìn)行簡要介紹。下文的第一節(jié)將會(huì)深入淺出的解讀 Chordia, Goyal, and Saretto (2020);第二節(jié)會(huì)介紹特刊中的三大趨勢;第三節(jié)總結(jié)。
需要背景知識(shí)的小伙伴,請(qǐng)參考本系列的前幾篇文章《出色不如走運(yùn)?》、《出色不如走運(yùn)(II)?》以及《出色不如走運(yùn)(III)?》。
01?Chordia, Goyal, and Saretto (2020)
本節(jié)簡要介紹 Chordia, Goyal, and Saretto (2020) 一文的核心思想和結(jié)論。行文會(huì)盡可能采用直白的方式,輔以少量的公式。對(duì)技術(shù)細(xì)節(jié)感興趣的小伙伴請(qǐng)直接閱讀論文原文。
近年來,學(xué)術(shù)界越來越重視多重假設(shè)檢驗(yàn)(multiple hypothesis testing,簡稱 MHT 問題)對(duì)異象顯著性的影響。所謂 MHT 問題,就是說當(dāng)很多學(xué)者對(duì)著同樣的數(shù)據(jù)(過去幾十年的美股數(shù)據(jù))挖異象的時(shí)候,僅靠運(yùn)氣就能發(fā)現(xiàn)很多顯著的異象。舉個(gè)具象一些的例子,比如同時(shí)測了 100 個(gè)異象,其中最高的那個(gè)的 t-statistic 就會(huì)很高 —— 哪怕從金融學(xué)角度來說它可能和股票收益率根本沒什么關(guān)聯(lián)。MHT 問題的存在使得單一檢驗(yàn)的 t-statistic 被高估了,即里面有運(yùn)氣的成分。當(dāng)排除了運(yùn)氣成分后,該異象很可不再顯著。如果仍然按照傳統(tǒng)意義上的 2.0 作為 t-statistic 閾值來評(píng)價(jià)異象是否顯著,一定會(huì)有很多 false rejections。MHT 問題的核心就是控制 false rejections 發(fā)生的概率。這意味著,單一異象的 t-statistic 只有比傳統(tǒng)意義上的 2.0 要高的多,那么這個(gè)異象才在控制了 false rejections 概率之后仍然有可能是真實(shí)的。
因此,問題的核心就是:t-statistic 的閾值應(yīng)該是多少?關(guān)于這個(gè)問題,統(tǒng)計(jì)學(xué)和醫(yī)學(xué)界做過大量的研究。而金融領(lǐng)域開始(格外)重視它大概是在近 5 年。其中的代表是 Harvey, Liu, and Zhu (2016) 這篇同樣發(fā)表在 Review of Financial Studies 上的論文,它把 t-statistic 從 2.0 提升至 3.0。而今天的這篇 Chordia, Goyal, and Saretto (2020) 從某種程度上正是對(duì)標(biāo)了 Harvey, Liu, and Zhu (2016)。為了回答 t-statistic 閾值是多少,需要有兩個(gè)問題需要解決。先來看第一個(gè),即使用何種算法來控制 false rejections 的概率。就這個(gè)問題,學(xué)術(shù)界提出了很多不同的方法,下面借助下表來解釋它們。
假設(shè)一共研究了 S 個(gè)異象,其中 S_0 個(gè)在原假設(shè)下為真(即不能預(yù)測收益率),S_1 個(gè)在原假設(shè)下為假(即能夠預(yù)測收益率)。接下來,按 5% 的顯著性水平對(duì)每個(gè) hypothesis 進(jìn)行檢驗(yàn),并一共拒絕了 R 個(gè)假設(shè),其中 F_1 個(gè) false rejections(因?yàn)樗鼈兊脑僭O(shè)為真)。使用 F_1 和 R 可以定義一些不同的統(tǒng)計(jì)量,而不同的 MHT 算法是以控制不同的統(tǒng)計(jì)量為目標(biāo)。這些統(tǒng)計(jì)量包括三大類:FWER、FDR 和 FDP。
FWER 是 familywise error rate,控制它相當(dāng)于:
其中 α 為顯著性水平。由定義可知,F(xiàn)WER 是控制出現(xiàn) 1 個(gè) false rejection 的概率。常見的算法包括 Bonferroni 和 Holm 方法(見《出色不如走運(yùn)(II)?》),以及 White (2000) 的 bootstrap reality check 算法和 Romano and Wolf (2005) 的 StepM 算法等。毫無疑問,這個(gè)控制太過嚴(yán)苛,不適用于分析異象。
FDR 是 false discover rate,它是 F_1/R 的期望。因此控制它相當(dāng)于:
從定義可知,F(xiàn)DR 比 FWER 要溫和得多,它允許 F_1 著 R 的增大而成比例上升。常見的算法為 BHY 方法(見《出色不如走運(yùn)(II)?》)。
FDP 是 false discovery proportion,它和 FDR 類似,控制它相當(dāng)于:
它的含義是控制偽發(fā)現(xiàn)比例(F_1/R)超過 γ 的概率低于顯著性水平 α。這其中著名的算法包括 Romano and Wolf (2007) 以及 Romano, Shaikh, and Wolf (2008)。
Chordia, Goyal, and Saretto (2020) 選擇的控制 false rejections 的對(duì)象是控制 FDP(他們并非“憑空想象”而是給出了理由)。該文采用了 Romano and Wolf (2007) 以及 Romano, Shaikh, and Wolf (2008) 的算法,并結(jié)合 bootstrap 方法以保留異象之間的相關(guān)性。具體方法本文暫且不表,感興趣的朋友請(qǐng)參考論文原文,因?yàn)檫x擇哪種控制算法并不是 Chordia, Goyal, and Saretto (2020) 一文的核心貢獻(xiàn)。
前文說過,要找到正確的閾值,需要解決兩個(gè)問題。第一個(gè)問題是選擇如何控制 false rejections。但是,這并不是問題的關(guān)鍵。計(jì)算 t-statistic 閾值的關(guān)鍵是下面馬上要介紹的第二個(gè)問題 —— 學(xué)術(shù)界到底挖了多少個(gè)異象?為什么說這個(gè)問題重要?因?yàn)檫@個(gè)基數(shù)決定了運(yùn)氣的多寡。這就好比,檢驗(yàn) 100 個(gè)和 10000 個(gè)異象相比,萬里挑一的肯定要比百里挑一的更顯著。所以,只有知道學(xué)術(shù)界到底挖了多少異象,才有可能正確給出 t-statistic 的閾值,而這個(gè)問題比如何控制 false rejections 重要的多。
有的小伙伴可能會(huì)說 —— 不就那 300 來個(gè)嗎,就是 Harvey, Liu, and Zhu (2016) 考慮的那些;或者 450 個(gè)左右,就是 Hou, Xue, and Zhang (2020) 復(fù)現(xiàn)的那些。答案并沒有這么簡單。其原因是,一個(gè)異象之所以被發(fā)表,顯然因?yàn)樗旧磉_(dá)到了傳統(tǒng)意義上的顯著性水平(如 2.0)。如果一個(gè)學(xué)者研究出來的異象不顯著,那么他也不會(huì)針對(duì)它寫篇論文,或者即便寫了也不會(huì)被發(fā)表。令 P 代表被發(fā)表的異象的集合,R 代表被挖出來的異象的集合,由上述的論述可知 P 是 R 的一個(gè)子集。且我們可以合理的假設(shè)它們大約滿足如下的關(guān)系:
由于 P 僅僅是 R 的子集(“下界”),使用 P 來進(jìn)行 false rejections 控制只能低估了運(yùn)氣的成分,因此 Harvey, Liu, and Zhu (2016) 找到的 3.0 閾值只可能是真實(shí) t-statistic 閾值的下限。有了 R 的“下界”,再來看看“上界”。Chordia, Goyal, and Saretto (2020) 使用財(cái)務(wù)三大表中的指標(biāo),經(jīng)過“無腦”加減乘除運(yùn)算,構(gòu)建了 2,393,641 個(gè)異象。令集合 E 代表這些異象,它就是 R 的上界。兩百多萬個(gè)異象,哇咔咔,但需要說明的是,這些只是通過“無腦”加減乘除得到的,這可以理解成從 econometrician(計(jì)量經(jīng)濟(jì)學(xué)家)的角度找到的異象個(gè)數(shù)。
那么,能不能用 E 當(dāng)作異象集來控制 false rejections 呢?答案也是否定的。Chordia, Goyal, and Saretto (2020) 指出,和 econometrician 們不同,金融學(xué)教授那都是有 domain knowledge 的,顯然不會(huì)胡亂找一個(gè)看著就不太可能預(yù)測收益率的變量構(gòu)建異象。因此,金融學(xué)者們研究的異象肯定(遠(yuǎn))小于 2,393,641 個(gè),所以 R 是 E 的子集。綜合上述討論得到:
繞了一大圈似乎啥也沒解決,還是不知道 R 有多大。別著急,確定 R 的統(tǒng)計(jì)特征、從而依據(jù)其特征控制 false rejections 計(jì)算 t-statistic 閾值就是 Chordia, Goyal, and Saretto (2020) 一文最大的亮點(diǎn)。而他們采用的方法則是 simulation。Simulation 的好處是 data generating process 是已知的,因此能夠知道哪些 H_0 為真、哪些 H_0 為假,從而計(jì)算出正確的 t-statistic 閾值。
為了進(jìn)行 simulation,就要有模型。該文假設(shè)股票收益率在時(shí)序上滿足如下多因子模型:
其中 α_i 是模型無法解釋的超額收益。此外,在所有能夠構(gòu)建異象的變量中,模型假設(shè)顯著變量的概率為 π。對(duì)于該變量,simulation 中假設(shè)其在 t 期的取值滿足以下模型:
式中 η 滿足正態(tài)分布 N(0, σ^2),是隨機(jī)擾動(dòng)。如果變量是真的異象(發(fā)生概率 π),則它對(duì)于股票 i 在 t 期的取值為 α_i + η_{it}。值得說明的是,simulation 中當(dāng)然無從知道異象變量到底應(yīng)該怎么取值,但既然真正的異象能夠獲得超額收益,那么異象變量的取值一定和個(gè)股的 α_i 相關(guān)(否則按 portfolio sort 排序就沒法獲得超額收益了),因此令 s_{it} = α_i + η_{it} 是合理的。如果變量是假的異象(發(fā)生概率 1 - π),則 s_{it} = η_{it} 是隨機(jī)噪聲。
除了關(guān)于收益率的模型和異象變量的模型外,simulation 中還有一個(gè)至關(guān)重要的參數(shù) —— Ω。它代表了金融學(xué)者們挖出真正異象的能力。怎么理解呢?前面已經(jīng)說了 π 是異象的概率,但這只不過是隨機(jī)抽取的概率。對(duì)于金融學(xué)教授來說,因?yàn)橛邢闰?yàn)知識(shí),因此他們獲得異象的條件概率要高于非條件概率 π。這個(gè)參數(shù) Ω 就是衡量金融學(xué)教授挖出異象的概率,這個(gè)概率為 Ωπ,即二者的乘積。
OK!現(xiàn)在有了模型,只要知道參數(shù)取值就可以跑仿真了。參數(shù)如何取值呢?對(duì)于收益率模型中的因子收益率、因子暴露以及超額收益,Chordia, Goyal, and Saretto (2020) 采用了真實(shí)美股市場數(shù)據(jù)的分布進(jìn)行估計(jì),而對(duì)于異象變量模型的參數(shù) π、Ω 以及 σ,他們使用了校準(zhǔn)。既然要校準(zhǔn),就要給定 target quantities,用它們作為校準(zhǔn)參數(shù)來逼近的對(duì)象。為了解釋這些 target quantities,先介紹一個(gè)概念。如果某個(gè) H_0 在單一檢驗(yàn)下被拒絕了,但是在考慮了多重假設(shè)檢驗(yàn)后沒有被拒絕,則稱它為 single, but not multiple(SnM)rejection。
通過控制 FDP,Chordia, Goyal, and Saretto (2020) 發(fā)現(xiàn)不帶任何先驗(yàn)的計(jì)量經(jīng)濟(jì)學(xué)家集合 E 中,SnM 的比例為 97.9% —— 如此之高,說明不帶金融學(xué)先驗(yàn)去挖異象確實(shí)不靠譜?;氐?simulation,這個(gè) SnM 值顯然和無條件的異象概率 π 有關(guān),因此它就是對(duì) π 校準(zhǔn)的 target quantity。接下來如法炮制,對(duì)于發(fā)表的異象集合 P,它的 SnM 的比例為 27.0% —— 看來金融學(xué)教授們要靠譜得多。這個(gè)數(shù)值顯然和異象的條件概率 Ωπ 有關(guān)。但是注意這個(gè) SnM 是針對(duì)集合 P 的,它是被發(fā)表的異象,而 Ωπ 所代表的是學(xué)者們在研究中挖出顯著異象的概率。因此,使用 SnM = 27.0% 來校準(zhǔn) Ωπ 的思路是正確的,但是必須帶上 P 和 R 的關(guān)系,即 P = {s \in R, t ≥ 2.0}。最后是隨機(jī)擾動(dòng)的波動(dòng) σ。為了校準(zhǔn)它,Chordia, Goyal, and Saretto (2020) 選擇了兩個(gè) target quantities。為了便于理解,在此介紹其中一個(gè)。由于 σ 控制隨機(jī)擾動(dòng)的波動(dòng),因此它直接影響著信噪比。該文采用下式來衡量信噪比:
其中分子是顯著異象組合超額收益 α_s 絕對(duì)值的期望;分母是顯著股票超額收益 α_i 絕對(duì)值的期望。該比值來自真實(shí)美股數(shù)據(jù),大小為 0.12。
有了上述這些,Chordia, Goyal, and Saretto (2020) 通過全局優(yōu)化算法求解,并平均了 1000 次 simulation 結(jié)果確定了 π、Ω 以及 σ 的取值。再次強(qiáng)調(diào)的是,有了這些取值,就相當(dāng)于整個(gè)學(xué)者挖異象的 data generating process 是已知的了!利用這些參數(shù),和前述的股票收益率和異象變量模型,他們又進(jìn)行了 1000 次 simulation —— 這次是為了模擬 R 集合下(學(xué)者們挖掘異象的集合),當(dāng)控制了 FDP 之后 t-statistic 應(yīng)該是多少。最后,Chordia, Goyal, and Saretto (2020) 發(fā)現(xiàn),如果以 portfolio sort 的超額收益(時(shí)序回歸,用多因子模型作為解釋變量)為研究對(duì)象,其 t-statistic 閾值高達(dá) 3.8;如果以 Fama-MacBeth 回歸斜率(即在控制了其他變量后異象的收益率)為研究對(duì)象,其 t-statistic 閾值高達(dá) 3.4。一般來說,比起 portfolio sort,F(xiàn)ama-MacBeth 回歸更不容易受多重假設(shè)檢驗(yàn)影響,因此其 t-statistic 閾值略低。但無論如何,這兩個(gè)數(shù)值均高于 Harvey, Liu, and Zhu (2016) 提出的 3.0,符合預(yù)期。以上這兩個(gè)閾值就是 Chordia, Goyal, and Saretto (2020) 一文的核心結(jié)論。除此之外,該文還通過 simulation 計(jì)算了 false rejections 比例(即 F_1/R),高達(dá) 45.3%。
呼!我希望你沒有 get lost!
02?截面研究新趨勢
本節(jié)簡要介紹本期 RFS 特刊中關(guān)于截面收益率研究的三個(gè)趨勢(下圖)。
本期一共收錄 9 篇文章,每個(gè)趨勢下三篇。第一個(gè)趨勢是 extracting information from both the cross-section and time series。其實(shí),用白話說,它的意思就是 portfolio sort vs cross-sectional regression。
從 Fama-French 三因子模型開始,用 portfolio sort 構(gòu)建因子投資組合,計(jì)算其收益率作為因子便是多因子模型中采用的做法,無一例外。然而,越來越多的研究,包括 Fama 自己都發(fā)現(xiàn),截面回歸的純因子組合似乎更能解釋截面預(yù)期收益率的差異。因此,從這兩個(gè)角度去理解因子就是第一個(gè)趨勢。這個(gè)話題下的三篇文章是:
對(duì)于上面第一篇,《Which Beta (II)?》一文做過詳細(xì)解讀;而第二篇,[因子動(dòng)物園] 的《對(duì)沖:獲取更純粹的 CP》一文進(jìn)行了系統(tǒng)說明。第三篇嘛,還沒看……不過排上號(hào)了。
第二個(gè)趨勢是 replicating anomalies, multiple hypothesis testing, and transaction costs,包括如下三篇:
其中 Replicating anomalies 不用做太多介紹了,而本文重點(diǎn)梳理了其中第二篇。至于第三篇嘛,again,還沒看……不過也排上號(hào)了。
最后一個(gè)趨勢是 machine-learning tools,它關(guān)注如何將機(jī)器學(xué)習(xí)算法科學(xué)的應(yīng)用在古老的實(shí)質(zhì)資產(chǎn)定價(jià)之中。這個(gè)話題下包含的三篇文章為:
其中第一篇 Gu, Kelly, and Xiu (2020) 是最近一兩年非?;鸬囊黄撐?。[因子動(dòng)物園] 的《因子投資中的機(jī)器學(xué)習(xí)》一文對(duì)它進(jìn)行了梳理。第二篇提出了一個(gè) PCA estimator,在降維的同時(shí)保留主成分對(duì)截面收益率的預(yù)測能力。第三篇?jiǎng)t提出了一個(gè)非參數(shù)的方法,從 62 個(gè)常見的收益率預(yù)測變量中找到 13 個(gè)真正有效的。今后會(huì)找機(jī)會(huì)介紹這些新的方法。
03?結(jié)語
本期 RFS 特刊在描述三大趨勢的同時(shí)也給出了四個(gè)展望,不妨以它們作為本文的結(jié)尾:
1. 重視 multiple hypothesis testing 問題,形成科研中更好的研究流程,避免 publication bias,data snooping 以及 p-hacking。
2. 不同降維方法極大減少了因子的個(gè)數(shù)(通常不超過 10 個(gè))。不過有意思的是,不同方法得到的因子可能差異很大,在這方面學(xué)術(shù)界需要尋求 common ground across methods。
3. 根據(jù)資產(chǎn)定價(jià)理論,SDF(隨機(jī)折現(xiàn)因子)其實(shí)是 factors 的某種線性組合。因此只有 factors 有意義,SDF 才有意義。從這個(gè)意義上說,無論采用傳統(tǒng)方法還是新的機(jī)器學(xué)習(xí)算法,都要重視因子的經(jīng)濟(jì)學(xué)含義。
4. 將源于預(yù)測股票收益率的這些新方法應(yīng)用于金融學(xué)的其他領(lǐng)域,比如預(yù)測其他資產(chǎn),或者用于評(píng)價(jià)基金經(jīng)理以及公司決策等領(lǐng)域。
毫無疑問,這期 RFS 特刊十分過癮。而我們也有理由相信,未來關(guān)于實(shí)證資產(chǎn)定價(jià)和因子投資的研究會(huì)更加精彩。
感謝閱讀,預(yù)祝各位五一快樂。
參考文獻(xiàn)
Chordia, T., A. Goyal, and A. Saretto (2020). Anomalies and false rejections. Review of Financial Studies 33(5), 2134 – 2179.
Daniel, K., L. Mota, S. Rottke, and T. Santos (2020). The cross-section of risk and returns. Review of Financial Studies 33(5), 1927 – 1979.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891 – 1926.
Gu, S., B. Kelly, and D. Xiu (2020). Empirical asset pricing via machine learning. Review of Financial Studies 33(5), 2223 – 2273.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.
Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies. Review of Financial Studies 33(5), 2019 – 2133.
Romano, J. P., A. M. Shaikh, and M. Wolf (2008). Formalized data snooping based on generalized error rates. Econometric Theory 24(2), 404 – 447.
Romano, J. P. and M. Wolf (2005). Stepwise multiple testing as formalized data snooping. Econometrica 73(4), 1237 – 1282.
Romano, J. P. and M. Wolf (2007). Control of generalized error rates in multiple testing. The Annals of Statistics 35(4), 1378 – 1408.
White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097 – 1126.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。