原文:
www.kdnuggets.com/2014/11/drivendata-data-science-competitions-social-good.html
作者:彼得·布尔(DrivenData),2014 年 11 月
当我们开始启动我们的首个竞赛时,我们认为列出我们具体想做什么以及为什么这样做会是个好主意。
如果你的目标是改变未来,那么对未来的预测非常重要。
而且,有很多人对改变未来感兴趣。亚马逊希望增加你通过他们网站订购的商品数量,因此他们会预测你可能想要下一步购买的商品以及购买时间。推特希望提升你对他们平台的使用,因此他们会预测你会忽略哪些推文以及你会互动哪些推文。Facebook 和谷歌希望增加你点击他们网站上的广告的数量,因此他们会预测你个人的点击行为。他们在进行这些预测方面已经非常擅长。
但想要改变未来的原因还有很多。教育工作者希望增加高中毕业生的数量。健康工作者希望以可持续的成本改善人口的整体健康。小额贷款机构希望为发展中国家更多的个人提供追求梦想的机会,而不必担心违约。环保主义者希望在不影响生产力的情况下遏制我们的能源使用。政府希望防止火灾摧毁生命和财产。
这就是我们介入的地方。在实现这些困难但重要的变化的过程中,我们必须装备自己,以最先进的预测技术。预测哪些学生可能在初中阶段就辍学,以便教师可以提前干预。预测哪些个人即使在过去被银行拒绝的情况下也能够偿还他们的小额贷款。预测哪里更可能发生火灾,并优先到达现场。
一种不同的大数据火灾。
在当今世界,能够比其他人更好地进行这些预测的人是数据科学家。他们是现代的预言家,但他们使用的是数据集而不是水晶球。数据科学家凭借统计学和计算机科学的技能,利用大量数据集构建智能、创新和灵活的模型,以预测未来可能发生的情况。2011 年生产的数据量超过了人类历史上所有前几年加起来的数据总和。我们所拥有的数据的数量和种类正在爆炸式增长,而那些能够操控和揭示这些数据的人具有不可估量的价值。
在 DrivenData,我们希望将数据科学和众包的前沿实践应用于世界上最大的一些社会挑战和应对这些挑战的组织。 我们举办在线挑战,通常持续 2-3 个月,全球的数据科学家社区竞争以提出最佳的统计模型来解决具有影响力的难题。
就像现在的每个大型公司一样,非营利组织和非政府组织拥有比以往更多的数据。而且像那些公司一样,他们也在努力弄清楚如何最好地利用这些数据。我们与使命驱动的组织合作,识别他们关心的具体预测问题,并利用他们的数据来应对这些问题。
在预测建模中,尝试多种不同的方法至关重要。
然后我们会举办在线竞赛,来自世界各地的专家争相提出最佳解决方案。一些竞争者是私营部门的经验丰富的数据科学家,白天分析公司数据,夜晚拯救世界,测试自己在复杂影响问题上的能力。还有一些聪明、成熟的学生和研究人员,寻求在现实数据集和实际问题上磨练自己的技能。更多的则是有着广泛社会部门数据经验的人,想要将他们的专业知识用于新的、有意义的挑战——并获得关于他们解决方案效果的即时反馈。
像任何数据竞赛平台一样,我们希望利用群众的力量与日益增多的大型相关数据集相结合。与其他数据竞赛平台不同的是,我们的主要目标是通过我们的竞赛在世界上创造实际、可衡量、持久的积极变化。在每次挑战结束时,我们会与资助组织合作,整合获胜解决方案,提供工具以推动其实际影响的改善。
“我这一代最优秀的头脑都在考虑如何让人们点击广告。这真糟糕。” — 杰夫·哈默布彻,2011
拥有良好的预测,我们有机会改变我们星球的轨迹,这是以前从未有过的。我们希望解决当今世界上最棘手、最具挑战性和最有意义的问题。我们正在建立一个能够应对这些问题的数据专家社区。这就是社会公益的新前沿。
参与其中
我们已经启动了,并且希望你能加入我们!
如果你想获取关于我们今年秋天推出的激动人心的真实竞赛的更新,请在这里注册我们的邮件列表,并在 Twitter 上关注我们:@drivendataorg。
如果你是数据科学家,可以创建一个账户并开始体验我们的第一个沙盒竞赛。
如果你是非营利或公共部门组织,并且希望从数据中榨取每一滴任务效益,查看我们网站上的信息并告诉我们!彼得·布尔是 DrivenData 的联合创始人。
原文:blog.drivendata.org/2014/09/15/introducing-drivendata/
相关:
-
数据善用:推动社会公益的数据驱动项目
-
大数据与人道主义努力
-
竞赛:预测社交网络动态图