主要行业
- 金融服务 房地产 有色金属
- 医药生物 化工行业 机械设备
- 交通运输 农林牧渔 电子行业
- 新能源 建筑建材 信息服务
- 汽车行业 黑色金属 采掘行业
- 家用电器 餐饮旅游 公用事业
- 商业贸易 信息设备 食品饮料
- 轻工制造 纺织服装 新能源汽车
- 高端装备制造 其他行业
点击进入可选择细分行业
股票名称: | 股票代码: | 分享时间:2018-05-08 14:53:58 |
研报栏目: 期货研究 | 研报类型: ![]() | 研报作者: 陈维嘉 |
研报出处: 华泰期货 | 研报页数: 11 页 | 推荐评级: 无 |
研报大小: 1,098 KB | 分享者: son****man | 我要报错 |
训练样本时间窗口简介
常见的量化模型根据训练样本的结构大致可分成两类:一类是截面模型,这类模型的输入通常是同一个时间节点上因子;另一类是时间序列模型,这类模型的训练样本通常涉及一段连续的时间序列。http://www.hibor.com.cn【慧博投研资讯】在训练截面模型时,通常可以随机选取一大部分数据作训练集,一小部分数据作验证集和测试集进行交叉验证,训练样本在时间上的出现顺序没有太严格的要求。http://www.hibor.com.cn(慧博投研资讯)而时间序列模型训练样本中的训练集和验证集在时间上往往会有先后顺序,因此在时间序列模型的实际训练通常是使用一部分时间靠前的数据进行模型训练,再去预测时间上靠后的数据,这样就不得不面对一个训练样本的时间窗口长度选择问题。如果使用了太长的数据可能包含了过时的信息,但如果使用了太短的数据就无法对历史情况做出准确的刻画,因此如何选择样本的时间窗口是所有时间序列模型训练中必须面对的一个问题。
在本报告主要研究递归时间窗口和滚动时间窗口训练方法在时间序列模型中的应用。递归时间窗口即根随着时间的流逝,训练样本数量不断增加,而滚动时间窗口则是指随着时间的流逝不断增加新样本,剔除就样本但保持训练样本数量不变。有相关学者的研究指出,如果数据结构发生了较大改变,使用滚动时间窗口的方法会比递归时间窗口要好,但实际上很难准确判断数据结构有否发生改变以及何时发生了改变,所以在实际应用中可以把这两种方法结合从而提高模型的预测效果。本报告尝试把这种方法应用到19种商品期货的周度收益率预测上,对大部分商品而言能够改善预测效果。
不良信息举报电话:400-806-1866 举报邮箱:hbzixun@126.com