quantlab5.4代码发布:新增deap因子挖掘,lightgbm机器学习因子筛选及全量转债数据(附python代码)

avatar
作者
猴君
阅读量:0

原创文章第606篇,专注“AI量化投资、世界运行的规律、个人成长与财富自由"。
 

又到了一周一度更新quantlab代码的日子。

图片

1、Deap遗传算法多支股票(转债)因子挖掘。 

2、全量可转债历史数据,含对应的正股基本面指标。 

3、多个可转债的因子 

4、lightGBM的机器学习因子筛选

5、pandas_ta替换talib

本周主要更新如下:

1、Deap遗传算法多支股票(转债)因子挖掘。

图片

2、全量可转债历史数据,含对应的正股基本面指标。

图片

3、多个可转债的因子模型策略:

图片

4、lightGBM的机器学习因子筛选:

图片

5、pandas_ta替换talib

本周需要新安装如下4个包。

图片

有同学问,遗传算法因子挖掘,到底是Deap好,还是gplearn好?

这里说明一下,大家看研报或者网上有些课程,讲因子挖掘,都是围绕gplearn。

有一个原因,gplearn的api更接近sklearn,所以大家感觉很熟悉。

gplearn.fit(X,y)这样的形式。

但原生的gplearn其实直接是不可用的。

1、这里的X没法区分多个symbol(因为它没有维度信息),因此只能挖掘单支股票的时序因子。

2、gplearn的符号生成不支持常量,比如roc(close,20),这个20它必须hard code进去,不支持说,你从【1,2,5,10,20,40】里随机选择一下。

因此,如果需要用gplearn,接近于重写这个框架。——这些缺点,正是由于它为了兼容sklearn的api形式而引入的。因子挖掘的时候,并不需要传入X,y,我们只为生成符号,而不需要进行计算,计算是在fitness的时候进行,而fitness完成是我们自主定义,我就可以在这个环节对多个symbol进行计算。

但Deap不用,Deap原生就支持。

基于Deap遗传算法在全量可转债上做因子挖掘(附python代码及全量因子数据)

明天开始咱们正式进行股票市场——股票的多因子挖掘。

股票的数据量比较大,还有各种指标,基本面数据,我们会在服务器上构建。

有同学问数据api的事情,择机会向大家开放,敬请期待。

吾日三省吾身

人生三件事:健康、平安、财富。

前两件事对于随时普通人得来似乎很容易,以至于大家忘了感恩。

对于失去的人,那就是全部。

他们愿意用大多数的财富来换。

而普通人,更关心财富。

人生的悖论。

正确的态度,让自己和家人健康平安为前提。

良好的饮食、作息,情绪调节,习惯即可。

然后,不违背上述的前提下,全力以赴,十倍努力追求财富。

财富是创造性地解决一部分人的真实关切。

投资而言当然是可实盘的策略,分解下来核心是因子。

历史文章:

Alpla003经典的价量背离的因子在可转债列表里的因子分析(附python代码)

年化27.9%,最大回撤-13.6%的可转债因子策略,结合机器学习特征筛选(附python代码)

代码发布:quantlabv5.3,可转债所有数据及双低、动量因子策略,单因子分析框架

完全出乎你意料的动量因子roc_20的单因子分析与回测(附python代码)

AI量化实验室——2024量化投资的星辰大海

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!