量化小讲堂吧 关注:174贴子:520
  • 5回复贴,共1

最新研报解读 | 华泰证券-华泰人工智能系列之七

只看楼主收藏回复

人工智能选股之Python实战-20170919


1楼2017-10-11 22:34回复
    「最新研报解读」栏目,解读最新发布的券商金融工程研报,每天推送。帮助大家了解最新研究成果、提供策略灵感。


    2楼2017-10-11 22:35
    回复
      在工具的介绍中,研究员推荐了三个常用工具包:
      1. Numpy: 能够储存盒处理大型数组,具有强大的科学计算功能。
      2. Pandas:提供了DataFrame这一数据结构,极大简化了数据分析过程
      3. Scikit-Learn: Python机器学习中最广泛使用的工具,囊括了广义线性模型,支持向量机,朴素贝叶斯,现行和二次判别分析等算法。


      4楼2017-10-11 22:35
      回复
        有了工具基础,文章开始介绍利用Python进行机器学习。研究员认为多因子选股是最适合转换为机器学习,并且用计算机语言表达出来的框架。其原理类似线性回归,通过分析数据寻找因变量和多个自变量之间的关系。根据历史的自变量和因变量的关系,用机器学习的方法估计出自由参数量。再利用最新的自变量和自由参数量,预测未来的因变量。相比于线性回归,机器学习的优势在于可以发现非线性关系,还能够筛选出最有效的自变量。再者,参数优化的过程能够遴选出预测力强的模型。


        5楼2017-10-11 22:36
        回复
          在第三部分,研究员将机器学习选股代码拆分为十二个子模块,包括:模块导入,参数设置,数据读入,数据标记,数据预处理,模型设置,模型训练,模型预测,模型评价,策略构建,策略评价和结果保存。研究员选取2005年1月至2010年12为训练区间,2011年1月至2017年5月为预测区间。选取每个月超额收益排名前三十的股票为正例,排名后三十的股票为反例。围绕预测结果,研究员构建一个简单的策略:选取每个月最可能涨的100只股票,等权配置资产,然后计算该策略的收益和净值。测试的结果,年化超额收益28%,波动率23%, 信息比率(information ratio)为1.22。


          6楼2017-10-11 22:36
          回复
            本篇研报即提供了策略思路,也提供了使用Python机器学习选股的详细方法。是量化投资入门的好文。希望童鞋们喜欢~


            7楼2017-10-11 22:37
            回复