量化選股 101

發(fā)布時(shí)間：2016-09-27 | 來源: 川總寫量化

作者：石川

摘要：本文介紹基礎(chǔ)量化選股模型。

1 Alpha 收益率

一般認(rèn)為股票的收益率分為?alpha?和?beta?兩個(gè)部分。每支股票的?beta?收益率來自市場，而?alpha?部分則是它的超額收益率。買股票就是買公司，每個(gè)基金經(jīng)理都在努力尋求有真正?alpha?收益率的優(yōu)秀股票。大型的公募基金和券商有足夠的人力和財(cái)力來組建自己的行業(yè)專家團(tuán)隊(duì)，還有很多基金經(jīng)理絞盡腦汁成為上市公司董秘肚子里的蛔蟲，以希望能挖掘優(yōu)秀的個(gè)股。但小型的私募或者資管公司如果沒有能力來構(gòu)建團(tuán)隊(duì)呢，量化選股就成為一個(gè)低成本的必然選擇。本文介紹基本量化選股方法。

2 量化選股模型

量化選股的核心是找到能挖掘出股票超額收益率的選股因子（因此這種方法稱為多因子選股），這些因子可以是基本面的財(cái)務(wù)因子或者是技術(shù)面的因子；黑貓白貓，抓到耗子就是好貓。確定有效因子以后，用這些因子給每個(gè)股票打分，選出得分高的那些股票進(jìn)行投資。選股模型每隔一段時(shí)間就會重新運(yùn)行一次，以確定新的股票池子。這么做的原因主要有兩個(gè)：

1. 不管是財(cái)務(wù)因子還是技術(shù)因子，任何一個(gè)因子都很難持續(xù)有效。因此必須定期對因子的選股小姑進(jìn)行評估，剔除逐漸失效的因子，選入新的有效的因子。

2. 股模型中用到了大量的財(cái)務(wù)因子，因此當(dāng)上市公司披露新的財(cái)報(bào)時(shí)，需根據(jù)新的因子數(shù)據(jù)重新運(yùn)行。

基于上述原因，量化選股模型一般在公司披露財(cái)報(bào)的時(shí)點(diǎn)更新股票池子。量化選股模型的流程圖如下圖所示。下面一一簡要說明。

2.1 確定備選因子

從大類上說，因子主要包括基本面和技術(shù)面兩類。基本面因子是和上市公司財(cái)務(wù)相關(guān)的因子，又可以細(xì)分為盈利因子（如 ROE、ROA 等）、估值因子（如 PE、PB 等）、規(guī)模因子等；技術(shù)面因子主要是和股票量價(jià)相關(guān)的因子，可以分為波動類、動量類和反轉(zhuǎn)類。除了這兩類主要因子外，還可以考慮其他一些因子，包括券商評級、市場情緒等。

2.2 計(jì)算每個(gè)因子的選股能力

計(jì)算每個(gè)因子的選股能力是量化選股模型的核心。我們以 ROE 為例說明這個(gè)過程。

第一步，因子預(yù)處理：首先對 ROE 因子進(jìn)行預(yù)處理，這里可以去掉一些 ROE 取異常值（極大或極小值）的那些股票，它們可能對選股造成干擾；另外，可以對剩余股票的 ROE 進(jìn)行歸一化處理。

第二步，將股票排序：預(yù)處理之后，按照因子的業(yè)務(wù)邏輯給所有個(gè)股排序。由于 ROE 是盈利因子，因此其業(yè)務(wù)邏輯是 ROE 越大，上市公司的價(jià)值應(yīng)該越好，其股票的超額收益率就應(yīng)該越高。因此，按照 ROE 的大小給個(gè)股排序。

第三步，構(gòu)造投資組合：排序后，選出排名前 1/5 的股票做多，選出排名后 1/5 的股票做空（假設(shè)可以做空），這就是我們當(dāng)期的投資組合。注意，你當(dāng)然也可以選前后 1/10，而非 1/5。

第四步，計(jì)算投資組合收益率：計(jì)算回測區(qū)間內(nèi)內(nèi)該因子的選股效果。在實(shí)證中，隨著財(cái)報(bào)數(shù)據(jù)的逐步披露，我們會得到新的 ROE 數(shù)據(jù)。每次得到新的 ROE，重新對股票排序并構(gòu)建當(dāng)期的投資組合。這也被稱為投資組合再平衡。

第五步，檢驗(yàn)收益率：檢驗(yàn)收益率均值是否顯著大于零，以此作為評價(jià)因子的基準(zhǔn)。

2.3 選出最好的 n 個(gè)因子并賦權(quán)

由于備選的因子可以有上百個(gè)，因此我們必須擇優(yōu)選出 n 個(gè)有效的因子。這里主要有兩個(gè)方法：

1. 設(shè)定因子選股能力閾值，如果一個(gè)因子的選股能力高于該閾值則選為有效因子，因子的個(gè)數(shù) n 不固定。

2. 設(shè)定固定的因子個(gè)數(shù) n（n 一般取 10 到 20 個(gè)之間）。將所有因子按其選股能力從高到低排序，選出前 n 個(gè)因子作為有效因子。

選出 n 個(gè)因子后，為這些因子賦權(quán)，以便最后一步中給個(gè)股打分。在賦權(quán)之前，值得一提的是，選出的 n 個(gè)因子之間可能存在多重共線性。換句話說，有些因子之間可能存在很高的相關(guān)性，這對于選股是不利的，應(yīng)該給予考慮。（我們將在第 4 節(jié)說明多重共線性的缺點(diǎn)。）賦權(quán)有以下兩種常規(guī)方法：

1. 等權(quán)，所有優(yōu)選出來的因子一視同仁；因此每個(gè)因子的權(quán)重是 1 或者 1/n。

2. 正比于每個(gè)因子的選股能力賦權(quán)；因此每個(gè)因子的權(quán)重等于“該因子的選股能力”除以“所有因子中最大的選股能力”。

2.4 為股票打分

為股票打分分為兩步。第一步使用每個(gè)因子對每支個(gè)股獨(dú)立打分，即用選出的 n 個(gè)因子為個(gè)股打分。對于每一個(gè)因子，按其業(yè)務(wù)邏輯對個(gè)股排序，并打分如下：最好的 10% 的股票得 10 分，次好的 10% 的股票的 9 分，以此類推，最差的 10% 的股票得 1 分。第二步為計(jì)算每支股票的總分，即用每支股票在每個(gè)因子上的得分乘以該因子的權(quán)重就得到這支股票在該因子上的得分。將該股票在所有 n 個(gè)因子上的得分相加就得到該股票的總分。最終，按總分對所有股票排序，然后選擇排名最高的 m 支股票作為最終的量化選股結(jié)果。同樣，m 的確定可以有兩種方法：

1. 設(shè)定優(yōu)秀股票得分閾值，如果一個(gè)股票的總分高于該閾值則入選，因此 m 不固定。如果閾值選取的不好，那么可能出現(xiàn)選出來的股票個(gè)數(shù)過少甚至無法選出股票的情況。我們會在后面說明，這也不一定完全是缺點(diǎn)。

2. 設(shè)定固定的股票個(gè)數(shù) m（考慮到分散個(gè)股風(fēng)險(xiǎn)，m 一般取 50 到 100 之間）。將所有股票按其總分從高到低排序，選出前 m 個(gè)股票。

因?yàn)樵诂F(xiàn)實(shí)中無法做空個(gè)股，因此在實(shí)際操作中，投資者可以買入選股模型優(yōu)選出的 m 支股票，并持有到下一次選股模型重新選擇。

3 問題和討論

上述量化選股模型存在以下幾個(gè)問題：

1. 僅僅使用了有限個(gè)選股因子：無論是固定因子個(gè)數(shù)或者使用因子選股能力閾值，最終使用的都是有限的 n 個(gè)因子，從 n+1 之后的因子就被舍棄了。因此，剩余因子的選股作用不作考慮，造成模型設(shè)定偏誤。

2. 假設(shè)因子間的作用是獨(dú)立的：模型在選擇因子時(shí)，逐一獨(dú)立地考慮每個(gè)因子，完全忽視因子之間的非線性關(guān)系。這也是選股模型的局限性之一。

3. 因子可能存在多重共線性（即獨(dú)立性的假設(shè)不成立）：如果兩個(gè)或多個(gè)優(yōu)選出來的因子有很高的線性相關(guān)性，則它們的效果相似。如果不作處理而把它們當(dāng)做獨(dú)立的因子，則會加強(qiáng)選股在這類因子上的偏重程度，造成偏差。因此必須要檢驗(yàn)并剔除多重共線性，確保最終選出的因子之間是相互獨(dú)立的。

4. 小市值高 beta 股傾向：眾所周知，由于高 beta 股承擔(dān)了更高的市場風(fēng)險(xiǎn)，它們有著更高的收益。在量化選股模型中，股票按因子排名，而非按股票對 beta 修正后的收益率排名，然后按排名前后 1/5 股票的絕對收益率對因子效果評價(jià)。因此這會造對成市值類因子選股能力的高估，從而選出的股票大多也都是小市值股票。

5. 固定的選股個(gè)數(shù)：無論市場行情如何，這個(gè)選股模型通常選擇前 50 到 100 相對優(yōu)秀的股票。但我們知道，當(dāng)市場很差的時(shí)候，即便得分最高的那些股票的分值可能也會很低、后市走勢也會隨大盤一樣下跌。在這種情況下，如果仍然偏執(zhí)的選出 50 到 100 支股票，效果可想而知。

針對這些問題，可以考慮以下幾方面：

1. 綜合考慮多個(gè)因子，而非獨(dú)立篩選單一因子，捕捉因子之間的相互作用。

2. 使用非線性的有監(jiān)督學(xué)習(xí)算法對股票進(jìn)行分類，捕捉高收益率股票的特征，進(jìn)而選股。

3. 用選股模型作為另類擇時(shí)工具。當(dāng)某期股票的打分都很低的時(shí)候，不一定要刻意的非要選出多少支股票。不妨認(rèn)為這恰恰說明了市場的弱勢，不應(yīng)持股。在這種情況下，選股模型便成為了一個(gè)擇時(shí)工具。

4. 提高選股模型的使用頻率：雖然財(cái)務(wù)因子在財(cái)報(bào)披露時(shí)才能更新，但技術(shù)類或者其他類因子迭代的更頻繁。因此可以考慮提高選股頻率。當(dāng)然，選股頻率提高并不意味著我們應(yīng)該提高股票池內(nèi)股票的輪動頻率，仍應(yīng)該保證每支選出的股票被持有一段時(shí)間，再被新的股票替代。因此可以考慮滾動輪動的方法，比如每一個(gè)月重新選股一次，然后每次從投資組合中替換最早進(jìn)入的 1/3 的股票，這樣可以保證每支股票至少在投資組合中持有 3 個(gè)月。

免責(zé)聲明：入市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。在任何情況下，本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下，本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外，文中圖表均直接或間接來自于相應(yīng)論文，僅為介紹之用，版權(quán)歸原作者和期刊所有。

在线看片免费人成视久网,无码日本被黑人强伦姧视频 ,中日产幕无线码一区,无码精品av久久久免费

合格投資者聲明

量化選股 101