量化選股 101
發(fā)布時(shí)間:2016-09-27 | 來源: 川總寫量化
作者:石川
摘要:本文介紹基礎(chǔ)量化選股模型。
1 Alpha 收益率
一般認(rèn)為股票的收益率分為?alpha?和?beta?兩個(gè)部分。每支股票的?beta?收益率來自市場,而?alpha?部分則是它的超額收益率。買股票就是買公司,每個(gè)基金經(jīng)理都在努力尋求有真正?alpha?收益率的優(yōu)秀股票。大型的公募基金和券商有足夠的人力和財(cái)力來組建自己的行業(yè)專家團(tuán)隊(duì),還有很多基金經(jīng)理絞盡腦汁成為上市公司董秘肚子里的蛔蟲,以希望能挖掘優(yōu)秀的個(gè)股。但小型的私募或者資管公司如果沒有能力來構(gòu)建團(tuán)隊(duì)呢,量化選股就成為一個(gè)低成本的必然選擇。本文介紹基本量化選股方法。
2 量化選股模型
量化選股的核心是找到能挖掘出股票超額收益率的選股因子(因此這種方法稱為多因子選股),這些因子可以是基本面的財(cái)務(wù)因子或者是技術(shù)面的因子;黑貓白貓,抓到耗子就是好貓。確定有效因子以后,用這些因子給每個(gè)股票打分,選出得分高的那些股票進(jìn)行投資。選股模型每隔一段時(shí)間就會重新運(yùn)行一次,以確定新的股票池子。這么做的原因主要有兩個(gè):
1. 不管是財(cái)務(wù)因子還是技術(shù)因子,任何一個(gè)因子都很難持續(xù)有效。因此必須定期對因子的選股小姑進(jìn)行評估,剔除逐漸失效的因子,選入新的有效的因子。
2. 股模型中用到了大量的財(cái)務(wù)因子,因此當(dāng)上市公司披露新的財(cái)報(bào)時(shí),需根據(jù)新的因子數(shù)據(jù)重新運(yùn)行。
基于上述原因,量化選股模型一般在公司披露財(cái)報(bào)的時(shí)點(diǎn)更新股票池子。量化選股模型的流程圖如下圖所示。下面一一簡要說明。
2.1 確定備選因子
從大類上說,因子主要包括基本面和技術(shù)面兩類。基本面因子是和上市公司財(cái)務(wù)相關(guān)的因子,又可以細(xì)分為盈利因子(如 ROE、ROA 等)、估值因子(如 PE、PB 等)、規(guī)模因子等;技術(shù)面因子主要是和股票量價(jià)相關(guān)的因子,可以分為波動類、動量類和反轉(zhuǎn)類。除了這兩類主要因子外,還可以考慮其他一些因子,包括券商評級、市場情緒等。
2.2 計(jì)算每個(gè)因子的選股能力
計(jì)算每個(gè)因子的選股能力是量化選股模型的核心。我們以 ROE 為例說明這個(gè)過程。
第一步,因子預(yù)處理:首先對 ROE 因子進(jìn)行預(yù)處理,這里可以去掉一些 ROE 取異常值(極大或極小值)的那些股票,它們可能對選股造成干擾;另外,可以對剩余股票的 ROE 進(jìn)行歸一化處理。
第二步,將股票排序:預(yù)處理之后,按照因子的業(yè)務(wù)邏輯給所有個(gè)股排序。由于 ROE 是盈利因子,因此其業(yè)務(wù)邏輯是 ROE 越大,上市公司的價(jià)值應(yīng)該越好,其股票的超額收益率就應(yīng)該越高。因此,按照 ROE 的大小給個(gè)股排序。
第三步,構(gòu)造投資組合:排序后,選出排名前 1/5 的股票做多,選出排名后 1/5 的股票做空(假設(shè)可以做空),這就是我們當(dāng)期的投資組合。注意,你當(dāng)然也可以選前后 1/10,而非 1/5。
第四步,計(jì)算投資組合收益率:計(jì)算回測區(qū)間內(nèi)內(nèi)該因子的選股效果。在實(shí)證中,隨著財(cái)報(bào)數(shù)據(jù)的逐步披露,我們會得到新的 ROE 數(shù)據(jù)。每次得到新的 ROE,重新對股票排序并構(gòu)建當(dāng)期的投資組合。這也被稱為投資組合再平衡。
第五步,檢驗(yàn)收益率:檢驗(yàn)收益率均值是否顯著大于零,以此作為評價(jià)因子的基準(zhǔn)。
2.3 選出最好的 n 個(gè)因子并賦權(quán)
由于備選的因子可以有上百個(gè),因此我們必須擇優(yōu)選出 n 個(gè)有效的因子。這里主要有兩個(gè)方法:
1. 設(shè)定因子選股能力閾值,如果一個(gè)因子的選股能力高于該閾值則選為有效因子,因子的個(gè)數(shù) n 不固定。
2. 設(shè)定固定的因子個(gè)數(shù) n(n 一般取 10 到 20 個(gè)之間)。將所有因子按其選股能力從高到低排序,選出前 n 個(gè)因子作為有效因子。
選出 n 個(gè)因子后,為這些因子賦權(quán),以便最后一步中給個(gè)股打分。在賦權(quán)之前,值得一提的是,選出的 n 個(gè)因子之間可能存在多重共線性。換句話說,有些因子之間可能存在很高的相關(guān)性,這對于選股是不利的,應(yīng)該給予考慮。(我們將在第 4 節(jié)說明多重共線性的缺點(diǎn)。)賦權(quán)有以下兩種常規(guī)方法:
1. 等權(quán),所有優(yōu)選出來的因子一視同仁;因此每個(gè)因子的權(quán)重是 1 或者 1/n。
2. 正比于每個(gè)因子的選股能力賦權(quán);因此每個(gè)因子的權(quán)重等于“該因子的選股能力”除以“所有因子中最大的選股能力”。
2.4 為股票打分
為股票打分分為兩步。第一步使用每個(gè)因子對每支個(gè)股獨(dú)立打分,即用選出的 n 個(gè)因子為個(gè)股打分。對于每一個(gè)因子,按其業(yè)務(wù)邏輯對個(gè)股排序,并打分如下:最好的 10% 的股票得 10 分,次好的 10% 的股票的 9 分,以此類推,最差的 10% 的股票得 1 分。第二步為計(jì)算每支股票的總分,即用每支股票在每個(gè)因子上的得分乘以該因子的權(quán)重就得到這支股票在該因子上的得分。將該股票在所有 n 個(gè)因子上的得分相加就得到該股票的總分。最終,按總分對所有股票排序,然后選擇排名最高的 m 支股票作為最終的量化選股結(jié)果。同樣,m 的確定可以有兩種方法:
1. 設(shè)定優(yōu)秀股票得分閾值,如果一個(gè)股票的總分高于該閾值則入選,因此 m 不固定。如果閾值選取的不好,那么可能出現(xiàn)選出來的股票個(gè)數(shù)過少甚至無法選出股票的情況。我們會在后面說明,這也不一定完全是缺點(diǎn)。
2. 設(shè)定固定的股票個(gè)數(shù) m(考慮到分散個(gè)股風(fēng)險(xiǎn),m 一般取 50 到 100 之間)。將所有股票按其總分從高到低排序,選出前 m 個(gè)股票。
因?yàn)樵诂F(xiàn)實(shí)中無法做空個(gè)股,因此在實(shí)際操作中,投資者可以買入選股模型優(yōu)選出的 m 支股票,并持有到下一次選股模型重新選擇。
3 問題和討論
上述量化選股模型存在以下幾個(gè)問題:
1. 僅僅使用了有限個(gè)選股因子:無論是固定因子個(gè)數(shù)或者使用因子選股能力閾值,最終使用的都是有限的 n 個(gè)因子,從 n+1 之后的因子就被舍棄了。因此,剩余因子的選股作用不作考慮,造成模型設(shè)定偏誤。
2. 假設(shè)因子間的作用是獨(dú)立的:模型在選擇因子時(shí),逐一獨(dú)立地考慮每個(gè)因子,完全忽視因子之間的非線性關(guān)系。這也是選股模型的局限性之一。
3. 因子可能存在多重共線性(即獨(dú)立性的假設(shè)不成立):如果兩個(gè)或多個(gè)優(yōu)選出來的因子有很高的線性相關(guān)性,則它們的效果相似。如果不作處理而把它們當(dāng)做獨(dú)立的因子,則會加強(qiáng)選股在這類因子上的偏重程度,造成偏差。因此必須要檢驗(yàn)并剔除多重共線性,確保最終選出的因子之間是相互獨(dú)立的。
4. 小市值高 beta 股傾向:眾所周知,由于高 beta 股承擔(dān)了更高的市場風(fēng)險(xiǎn),它們有著更高的收益。在量化選股模型中,股票按因子排名,而非按股票對 beta 修正后的收益率排名,然后按排名前后 1/5 股票的絕對收益率對因子效果評價(jià)。因此這會造對成市值類因子選股能力的高估,從而選出的股票大多也都是小市值股票。
5. 固定的選股個(gè)數(shù):無論市場行情如何,這個(gè)選股模型通常選擇前 50 到 100 相對優(yōu)秀的股票。但我們知道,當(dāng)市場很差的時(shí)候,即便得分最高的那些股票的分值可能也會很低、后市走勢也會隨大盤一樣下跌。在這種情況下,如果仍然偏執(zhí)的選出 50 到 100 支股票,效果可想而知。
針對這些問題,可以考慮以下幾方面:
1. 綜合考慮多個(gè)因子,而非獨(dú)立篩選單一因子,捕捉因子之間的相互作用。
2. 使用非線性的有監(jiān)督學(xué)習(xí)算法對股票進(jìn)行分類,捕捉高收益率股票的特征,進(jìn)而選股。
3. 用選股模型作為另類擇時(shí)工具。當(dāng)某期股票的打分都很低的時(shí)候,不一定要刻意的非要選出多少支股票。不妨認(rèn)為這恰恰說明了市場的弱勢,不應(yīng)持股。在這種情況下,選股模型便成為了一個(gè)擇時(shí)工具。
4. 提高選股模型的使用頻率:雖然財(cái)務(wù)因子在財(cái)報(bào)披露時(shí)才能更新,但技術(shù)類或者其他類因子迭代的更頻繁。因此可以考慮提高選股頻率。當(dāng)然,選股頻率提高并不意味著我們應(yīng)該提高股票池內(nèi)股票的輪動頻率,仍應(yīng)該保證每支選出的股票被持有一段時(shí)間,再被新的股票替代。因此可以考慮滾動輪動的方法,比如每一個(gè)月重新選股一次,然后每次從投資組合中替換最早進(jìn)入的 1/3 的股票,這樣可以保證每支股票至少在投資組合中持有 3 個(gè)月。
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。