股債量化基本面迭代更新--IM的增量信息擴充

2022-09-15 21:33:21 來源: 作者:王鍇

  在上一期關于股債CTA策略的報告中,我們以量化基本面為核心,結合持倉量模型,形成了多周期結構的策略。從截面維度考慮,相較于大宗商品,股債涉及的品種池偏少,因子在橫截面上排序多空信號所帶來的的對沖和套利機制不太穩定,風險分散能力有限。隨著今年7月中證1000指數期貨合約上市,其所代表的中小市值板塊與已有的IH、IF和IC合約在衍生品風險管理方面形成了有效的互補。對于以量化基本面為核心的CTA策略而言,由于中證1000指數中新能源、電力設備、TMT、醫藥生物等行業的新興成長性科技企業的占比更大,這些行業受中高頻經濟數據變化的影響相比其他指數具有一定差異,為截面多空套利帶來了更多可能性。

  在之前的報告中,我們分別使用中高頻的金融數據和低頻的宏觀月度數據對于股債輪動的相關因素進行分析,結合樣本外的持續跟蹤,我們發現基于市場預期的持倉量指標在更多時間上能反映出短期內風險偏好所帶來的蹺蹺板的現象,這一周度級別的現象在今年三季度以來資金面較為寬松的格局下尤為明顯。從更長的時間軸來看,長周期對于股債輪動的反應更具有領先意義,而在板塊風格輪動的問題上,短周期模型對于6月以來風格頻繁高低切換的狀況也有一定捕捉和反映,主要體現在短周期在周度行情內與持倉量模型形成的聯動與反轉關系。

  短周期模型聚焦于市場風格,外部因素,資金面三大高頻金融數據板塊。在原有的樣本外跟蹤過程中,我們發現IC在股指合約中收益表現一直較為穩定,尤其是在IC/IH風格切換中,預測勝率較高。加入IM合約后,同樣延續了短周期模型信號對于中小市值板塊的反應較為敏銳的特點。通過用中證1000指數代替歷史期貨數據的模型訓練,我們發現IM在樣本內與樣本外測試集中差異不大,區間內的平均收益率和回撤均優于除IC以外的其他合約。結合IC此前樣本外的表現,間接反映出目前采用的中高頻金融經濟數據庫對于成長風格的映射更為緊密,也為之后擴充預測變量提供了一定參考依據。

  在對于低頻單一類別因子的基本面回測中,我們發現不同類型因子不同時間段表現存在差異。如果采用單因子模型則難以提供穩定收益,這也符合指標在不同行情周期下局部有效的規律。我們更新了長周期模型的類型,經過樣本內的訓練和樣本外的比較,我們發現目前來看新模型僅對于IM合約較為有效,因此在其它合約上仍舊采用之前的Logistic模型進行預測。綜合訓練和測試集的表現,IM的平均收益率7.5%,略高于CTA策略在近1年的樣本外跟蹤年化,最大回撤在10.83%,高于綜合策略的回,但是在單品種中這一數值相對較小,對比Logistic模型也有一定優勢?紤]到訓練集中采用現貨指數代替因變量擬合的信息缺失,可以認為采用Lasso擬合IM合約長周期信號是值得跟蹤的方法之一。

  收縮算法的延伸與運用

  之前的長周期模型中,我們主要采用stepwise逐步遞回歸算法和BestSubset最優子集法來實現數據特征篩選,從樣本外的跟蹤測試來看基本沒有呈現出樣本內過大的差異性,但是考慮到最優子集法篩選出的靠前最有因子組合差異仍然偏大,有理由認為結構具有偶然性,并且通過逐步遞回歸方法得出的結果也可能存在先后順序跳空方面的問題。因此,這次我們采用收縮算法中的Lasso特征篩選方法來進行嘗試。

  Lasso模型是廣義線性模型,在經過特征值篩選、標簽設定、特征值預處理以及遍歷參數之后產生日頻信號。通過交叉檢驗的方式篩選最優參數。由于長周期宏觀數據的樣本較少,為避免模型過度擬合,保持樣本外的泛化能力,主要從線性模型入手分析,同時為了提高預測精度,以方向判斷來替代連續性數值的預測,即樣本內價格到達某一區間時,定義多空信號。根據結果統計,正則化模型在宏觀因子上對于模型的預測精度在測試集上表現欠佳,合約在測試集上出現回撤,因為模型訓練樣本容量小,以及樣本的特征已經證實其有效性,降低了正則化的效果,從而減少了模型的相對魯棒性,并在測試集上出現虧損,在信號分化較為明顯的IF合約上出現近48%的最大回撤。相對而言Logistic Lasso模型在IM以及TF合約的測試集表現相對良好。

  KNN算法的迭代更新

  隨著數據容量的增大,在日頻的宏觀數據上,使用無估計參數的KNN模型進行因子篩選,同時也可以規避數據量綱的影響。長周期模型關注市場預期,聚焦于宏觀經濟數據等低頻指標。主要邏輯是從高維數據中選出有效且相對獨立的因子,如果公布的實際金融數據與市場預期存在一定偏差,則部分投資者可能會根據自身投資風格在數據的公布的時間段內進行短期博弈。持倉量模型主要考慮機構多空單持倉量并進行合成,使用機構會員持倉可以為價格提供有效信息,這或是更專業的機構行為和資金推動的結果。在2016-2021期間,策略勝率為57%。

  從訓練集和測試集可以看出,KNN模型在股指期貨的方向預測上的勝率較高,除去TF合約的測試集表現一般,其余合約均正收益。從信號強度可以看出多空信號相對分布均勻,最大回撤一般出現在訓練集,而在測試集的擇時效果更優,表征模型具有較優秀的預測效果。在股指期貨IH上產生19%的年化收益,而新加入的IM股指期貨則產生21%的年化收益。同時我們注意到盡管中證1000指數作為IM合約的標的,價格關聯性很高,但是由于樣本內采用非合約標的替代的緣故,IM是期指中唯一在測試集中收益表現比訓練集差的合約。因此,未來隨著IM合約價格數據樣本的延伸,將有更多空間去解決模型在樣本內的潛在過擬合問題。

  樣本外跟蹤概況

  從今年的風格結構上來看, 1月到 4 月下旬的下跌趨勢中,美聯儲加息預期升溫,地緣政治因素疊加疫情影響經濟復蘇對成長股造成較大壓力,價值股占優,量化信號在這段時間的表現主要以持續做空IC為主,一直持續到4月初,期指長周期逐漸高于短周期,并且趨向接近期債,從磨底轉向修復的跡象初現。

  而 5 月來的反彈修復行情中,由于成長股前期估值受到明顯壓縮,再加上 5 月和 6 月社融放水,地產銷售還未改善,因此在后期的修復性行情中,成長股表現明顯優于價值股。在這段時間內,期指的長周期信號開始反超期債,開始出現間歇性的做多IC的信號。從最近1個多月的跟來看,自IM合約上市以來基本以做多信號為主,這也體現7月以來成長強于價值的風格情況,臨近8月底,大盤整固回調之后IH為代表的價值開始出現回歸,IM持倉量和短周期開始走低,以中性震蕩方向。隨著IM加入成長板塊標的的補充,使原來在IH/IC套利波動得到放大和增強。

  綜合來看,IM在加入策略品種池后,對于周期模型提供了歷史平均跟蹤表現以上的增益作用。短周期方面,周內的板塊風格間輪動加快,均值回歸與傾斜交替,以IM代替IC參與品種間的套利可以獲得相對更低的相關性和更完全的對沖作用。長周期方面,新品種上市后機構資金流入量較大,市場參與度快速提升,IM在測試區間內顯著體現出股債間的資金輪動和蹺蹺板效應。

  高級分析師 王鍇 期貨投資咨詢證號:Z0016943

關注同花順財經(ths518),獲取更多機會

0

+1

回復 0 條,有 0 人參與

禁止發表不文明、攻擊性、及法律禁止言語

請發表您的意見(游客無法發送評論,請 登錄 or 注冊 網站)

評 論

還可以輸入 140 個字符

熱門評論網友評論只代表同花順網友的個人觀點,不代表同花順金融服務網觀點。

最新評論

查看更多評論
  • 南天信息
  • 青島金王
  • 通程控股
  • 通達股份
  • 新華聯
  • 實益達
  • 恒寶股份
  • 中國軟件
  • 代碼|股票名稱 最新 漲跌幅