在线看片免费人成视久网,无码日本被黑人强伦姧视频 ,中日产幕无线码一区,无码精品av久久久免费

Augmented Fama-MacBeth Regression

發(fā)布時間:2023-06-05  |   來源: 川總寫量化

作者:石川

摘要:增強(qiáng)版 Fama-MacBeth Regression 是研究 nontradable?factor 的利器。


1


因子有 tradable?factors 和 nontradable?factors 之分。對于前者而言,常見的做法是直接用公司特征構(gòu)造 managed portfolios;而對于后者,F(xiàn)ama-MacBeth two-pass regression 往往是首選,即在第一步中在時序上用資產(chǎn)(超額)收益率對因子取值回歸來估計??,第二步中每期在截面上用資產(chǎn)(超額)收益率對??回歸估計因子 risk premia 和資產(chǎn)的 pricing errors。令??表示??期資產(chǎn)??的因子暴露向量,??表示??期資產(chǎn)??的超額收益率,則上述第二步截面回歸模型可以表示為(為了簡化符號,假設(shè)不帶截距項):


??


式中??為??期因子收益率向量,殘差??則為資產(chǎn)??的 pricing error。按照傳統(tǒng)做法,只需在每期??進(jìn)行截面回歸,然后就可以對??和??進(jìn)行相應(yīng)的檢驗。故事到此似乎就結(jié)束了。不過,既然本文的題目帶個“augmented”,下面我們就來看看上述過程有什么痛點(diǎn)。


2


在上述過程中,如果 nontradable?factors 數(shù)量眾多(比如遠(yuǎn)遠(yuǎn)超過 ad-hoc 模型中通常使用的 3 – 5 個因子)且高度相關(guān),那么回歸估計就會有巨大的誤差。因此,一個自然的想法就是對因子進(jìn)行降維處理。這時,我們便可以請出這幾年非?;鸬?IPCA(工具變量 PCA)方法(Kelly, Pruitt, and Su 2019)。該方法將??視為原始(高維)協(xié)變量的線性組合,即:


??


其中??維向量??表示??期資產(chǎn)??在??個原始高維協(xié)變量(工具變量)的取值,??是??維矩陣,將原始工具變量通過??個線性組合降為到??個因子,得到資產(chǎn)??對??個因子的暴露向量??。加入 IPCA 之后,F(xiàn)ama-MacBeth 第二步的截面回歸變?yōu)?/span>


??


在實際應(yīng)用中,??已知。我們可以通過最小化所有資產(chǎn)的 pricing errors 來估計??。在上述目標(biāo)下,最優(yōu)化問題的目標(biāo)函數(shù)等價于


??


值得一提的是,雖然上述最優(yōu)化問題中的變量包括??和每期的??。但是,一旦給定??,??實際上就確定了,而一旦??確定了,使得 pricing errors 最小的因子收益率??自然而然就得到了。上述邏輯保證了??和??之間內(nèi)在的 economic connection。那么至此,我們是否 augmented 完了呢?(Hint:既然問了,當(dāng)然還沒有。)


3


在第二節(jié)中,我們將 IPCA 加入到 Fama-MacBeth 中,將原始??個工具變量通過??個線性組合轉(zhuǎn)化成??個因子,從而實現(xiàn)了降維。但是從數(shù)學(xué)表達(dá)式中不難看出,每個因子都是??個變量的某種組合。在現(xiàn)實中,??很可能是高維的(幾百甚至上千),而我們雖然指望數(shù)據(jù)發(fā)聲,但同時有先驗告訴我們??中的某些工具變量和??沒什么關(guān)系,因此在??中不應(yīng)該發(fā)揮作用(即對應(yīng)的列應(yīng)該都是元素零)。在這樣的背景下,我們希望在構(gòu)造??的時候,引入稀疏性(sparsity),得到 Sparse IPCA。


為此,在估計??(以及??)的時候加入罰項:


??


式中??表示??的第??列,且


??


目標(biāo)函數(shù)中第一個罰項(式中第二項)可理解為 column-wise group lasso。如果第??個工具變量對估計??沒有幫助,那么??中的第??列將會為零。目標(biāo)函數(shù)中的第二個罰項(式中第三項)是出于技術(shù)方面的考慮而加上的。注意,目標(biāo)函數(shù)中的第一項是 pricing errors,在縮放??時,我們總能通過擴(kuò)大??來保證第一項不變。因此,如果目標(biāo)函數(shù)中沒有第二個罰項,那么將會出現(xiàn)這樣的結(jié)果,即在不改變 pricing errors 的前提下??將會變得非常小從而使正則化失去本來的作用。目標(biāo)函數(shù)中置于??的罰項正是為了避免上述情況發(fā)生而出現(xiàn)。最后,由于加入了罰項,我們需要對超參數(shù)??調(diào)優(yōu)。對于每個給定的??,求解最優(yōu)化問題可得到對應(yīng)的??和??時序。由資產(chǎn)定價理論可知,因子構(gòu)造的 OOS 夏普比率平方應(yīng)該盡可能大,而夏普比率可以表示為:


??


其中??是因子預(yù)期收益率,??是因子協(xié)方差矩陣,它們均可通過因子收益率時序估計得到。因此可以以此為目標(biāo)確定最優(yōu)的??。


Okay!以上就完成了“augmented”部分的介紹。即我們從 Fama-MacBeth two-pass regression 出發(fā),首先加入了 IPCA 實現(xiàn)了降維,然后又在 IPCA 基礎(chǔ)上進(jìn)而使用 Sparse IPCA 從而確保聚焦于只和??有關(guān)的變量,最后通過經(jīng)濟(jì)學(xué)理論為依據(jù)進(jìn)行超參數(shù)調(diào)優(yōu)。


4


前面三節(jié)簡單說了方法論,本文最后一節(jié)來說說應(yīng)用以及本文的動機(jī)。我寫今天這篇文章時之所以沒有上來就介紹動機(jī),是因為我認(rèn)為這個 augmented Fama-MacBeth regression 的價值更大,而非下面要介紹的實證結(jié)果。這個方法出自 Bybee, Kelly, and Su (forthcoming) 這篇題為 Narrative Asset Pricing 的文章。介紹該文之前,先來簡單說一下 Bybee, et al. (forthcoming)。Bybee, et al. (forthcoming) 使用 LDA 將 1984 至 2017 年間華爾街日報的文章分析出了 180 個 topics,并且給每個 topic 計算了一個 attention 的時間序列。(例如,下圖展示了 Commodities, Mortgages 以及 Small caps 三個 topics 的 attention 的時間序列。)


f1.png


再來說 Bybee, Kelly, and Su (forthcoming)。這篇文章的動機(jī)是從 ICAPM 出發(fā),猜想財經(jīng)新聞揭示了投資者關(guān)于未來投資機(jī)會的信念,從而能夠影響資產(chǎn)的價格。為此,該文利用 Bybee, et al. (forthcoming) 構(gòu)造的 180 個 topics 構(gòu)造了基于新聞報道的多因子模型,這也是該文題為 Narrative Asset Pricing 的原因。


在實證細(xì)節(jié)方面,該文使用資產(chǎn)收益率和新聞 topics 時序??的協(xié)方差作為工具變量,即??。而至于為什么不在有了??之后直接使用 Fama-MacBeth,而是既要降維又要稀疏呢?該文給出的回答是:(1)很多 topics 所代表的 state variable 很可能是非常接近的,比如 Economic growth 和 Recession 這兩個 topics,所以降維是必要的;(2)很多 topics 可能和資產(chǎn)定價沒什么關(guān)系,比如 Gender issues,因此稀疏性也是必要的。基于此,該文最終提出了上文介紹的 Sparse IPCA augmented Fama-MacBeth 方法。具體的細(xì)節(jié),感興趣的小伙伴請閱讀 Bybee, Kelly, and Su (forthcoming) 原文(注意該文中的數(shù)學(xué) notation 和我本文中的不盡相同,例如本文中的??是 Bybee, Kelly, and Su (forthcoming) 中??的轉(zhuǎn)置)。


在實證結(jié)果方面,無論是對 test assets 的定價能力還是因子構(gòu)造的 OOS 最大夏普比率,該方法構(gòu)造的新聞因子在和傳統(tǒng)基于公司特征的 ad-hoc 多因子模型相比都是不落下風(fēng)的。以夏普比率而言,當(dāng)使用 6 個因子時,該模型 OOS 的夏普比率為 1.31,而 FF5 + Carhart 動量的 OOS 夏普比率只有 0.67。僅從實證結(jié)果來看,該新聞因子模型構(gòu)造的最大夏普比率確實不如近年來各種公司特征 + 機(jī)器學(xué)習(xí)所構(gòu)造的因子。但不要忘了,該模型中的因子僅僅來自資產(chǎn)收益率和新聞的協(xié)方差,而沒有使用任何公司特征。此外,Bybee, Kelly, and Su (forthcoming) 除了我詳細(xì)介紹的 return model 之外,還有 news model 的部分。通過它可以反推出 state variables,從而提供公司特征之外的 insights。


而對我而言,該文?Fama-MacBeth regression + IPCA + Sparsity + OOS SR based tuning 這個清晰的框架才是最大的收獲。它可以成為分析 nontradable?factors 的有力工具之一。


最后,我再忍不住“吐個槽”。Bybee, Kelly, and Su (forthcoming) 如今已經(jīng) RFS forthcoming。在 2022 年某個會議上 Kelly 作報告時,他在實證部分幾乎每頁 slide 都強(qiáng)調(diào)他們的結(jié)果是 OOS 的。但是,他們使用的 180 個 topics 可是用 1984 到 2017 全局的新聞數(shù)據(jù)構(gòu)造出來的(180 這個取值就是通過全局?jǐn)?shù)據(jù)最優(yōu)化選定的)。因此,這樣的 asset pricing 結(jié)果真的是 100% OOS 嗎?鑒于國內(nèi)頂刊無腦照搬海外頂刊不可阻擋的大趨勢,還想對國內(nèi)的某些(偽)一流學(xué)者說一句,如果這篇文章在你的 to replicate list 之上,那么請你在照搬之前至少先搞清楚 Bybee, Kelly, and Su (forthcoming) 最核心的內(nèi)容是什么。



參考文獻(xiàn)

Bybee, L., B. T. Kelly, A. Manela, and D. Xiu (forthcoming). Business news and business cycles.?Journal of Finance.

Bybee, L., B. T. Kelly, and Y. Su (forthcoming). Narrative asset pricing: Interpretable systematic risk factors from news text.?Review of Financial Studies.

Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances A unified model of risk and return.?Journal of Financial Economics 134(3), 501 – 524.



免責(zé)聲明:入市有風(fēng)險,投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。