- 以2014年到2016年的肉鸡销售价格数据为训练数据,建立肉鸡销售价格预测模型;
- 基于你的模型,预测2017年1月到3月每一天每个地区的肉鸡销售价格;
- 根据你的模型和分析结果提出相应的决策建议。
- 首先明确这是一个回归问题,两个解决思路,
- 使用自回归模型,根据前面的数据得到数据趋势模式
- 提取特征得到回归模型
- 特征提取思路
- 对于第i个月第j天的特征,我们提取两个思路特征;
- 对应当天的前一年和两年的时间点提取的特征,我们以16年的数据中提取训练数据
- 当天的前k天的值对应的特征
- 选择时间区间
- k in [0,1,2,3,5,7,10,15]
- 提取预测当天前k天的值,以及对应的统计值[min,max,avg,skew,kurt,var,std],以及前后的差值
- 这里需要在线特征的提取,需要将预测的值进行一个特征的提取的基础
- k in [-7,-5,-3,-2,-1,0,1,2,3,5,7],-5代表后五天
- 提取对应天前一年和两年的对应k天的值,已经统计值和差值
- 缺失值处理
- 对于回归题目缺失值处理很重要
- 这里选择的以前一年对应月份的均值进行填充
- 选择模型
- line regerssion
- xgb 的线性模型
- 模型训练
- 将省份作为特征,整体训练
- 对不同的省份进行单独的训练和预测
- 比较两种模型,进行模型的平均
- 重新修改k的取值区间,继续重复前面的步骤。
- code.py 是测试代码,主要目的是简单实现模型代码正确性,包括自回归和基于特征的预测
- mycode_k.py 基于数字进行增加提取特征,比如说先选择前两年的特征,扩展到前k天,以及修改k值等不同操作,以此递增
37 / 245(508人)