JD 京东算法大赛项目代码
TencentAD 腾讯社交广告大赛项目代码
知道了怎么从历史信息中提取、组合、划分样本,用pandas库进行数据处理,以及如何使用xgboost训练、预测、保存数据;
了解一些相关领域的知识,利用pandas库进行特征提取,寻找特征,筛选特征;
- 简单的将几个模型结果加权平均;
- 利用stack进行模型融合;
- 将神经网络的中间层作为特征同原本特征一起加入到其他模型进行训练。
京东算法大赛一共四千多只队伍,最后获得60多名,腾讯社交广告算法大赛决赛一共两百只队伍,最后也获得60名,也不是特别好,但是学到了不少东西。
1.如何对实际历史数据进行样本提取,数据处理,比如数据归一化、标准化、缺失值填充、数据降维;
2.如何有效的提取特征,筛选特征;
3.认识xgboost的强大,学到了一些gbdt的知识;
4.如何进行模型融合,尝试了不同的算法模型。