Skip to content

feedliu/BigDataCompetition

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 

Repository files navigation

参赛总结

一.项目架构:

JD 京东算法大赛项目代码

TencentAD 腾讯社交广告大赛项目代码

二.参赛经历

1.熟悉阶段:

知道了怎么从历史信息中提取、组合、划分样本,用pandas库进行数据处理,以及如何使用xgboost训练、预测、保存数据;

2.特征提取阶段:

了解一些相关领域的知识,利用pandas库进行特征提取,寻找特征,筛选特征;

3.模型融合阶段:

  1. 简单的将几个模型结果加权平均;
  2. 利用stack进行模型融合;
  3. 将神经网络的中间层作为特征同原本特征一起加入到其他模型进行训练。

三.参赛总结

京东算法大赛一共四千多只队伍,最后获得60多名,腾讯社交广告算法大赛决赛一共两百只队伍,最后也获得60名,也不是特别好,但是学到了不少东西。

1.如何对实际历史数据进行样本提取,数据处理,比如数据归一化、标准化、缺失值填充、数据降维;
2.如何有效的提取特征,筛选特征;
3.认识xgboost的强大,学到了一些gbdt的知识;
4.如何进行模型融合,尝试了不同的算法模型。

About

the code of big data competition

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages