原文:
www.kdnuggets.com/2018/09/5-resources-inspire-data-science-project.html
由 Conor Dewey,弗吉尼亚理工大学
1. Google 网络安全证书 - 快速进入网络安全职业。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你的组织 IT
我们接触到的关于数据科学职业的建议似乎无穷无尽,但有一个话题没有得到足够的关注:副项目。副项目因**许多原因而非常棒,但我喜欢Julie Zhuo**在下面简单的维恩图中对它的描述。
副项目作为一种在比工作或学校环境更少目标驱动的环境中应用数据科学的方式。它们提供了一个**玩转数据的机会**,同时学习实际技能。
除了非常有趣且是学习新技能的好方法之外,副项目还可以提高你在求职时的机会。招聘人员和经理**喜欢看到项目**,这表明你对数据的兴趣超越了课堂和工作。
你是否曾经想开始一个新项目,却不知道做什么?首先,你花几个小时来头脑风暴。然后是几天。没过多久,几周过去了,却没有推出任何新东西。
自我驱动的项目在所有领域都非常普遍,数据科学也不例外。拥有宏大的抱负很容易,但执行起来却更加困难。我发现数据科学项目中最难的部分是开始和决定走哪条路。
在这篇文章中,我的意图是提供一些有用的技巧和资源, 让你在下一个数据科学项目中获得突破。
在我们深入了解以下资源之前,有几个快速提示值得注意,那就是你的目标和兴趣。
你的目标
数据科学是一个极其多样化的领域,这意味着几乎不可能将所有概念和工具都挤入一个单一的项目中。你需要选择和决定你想进一步发展的技能。一些相关的示例包括:
-
机器学习和建模
-
探索性数据分析
-
指标和实验
-
数据可视化和沟通
-
数据挖掘和清理
请注意,虽然很难将每个概念都融入到一个项目中,但你可以将其中一些概念结合起来。例如,你可以抓取数据进行探索性数据分析,然后以有趣的方式进行可视化。
基本上,如果你想成为更高效的机器学习工程师,做一个数据可视化项目可能无法实现这个目标。你的项目应该反映你的目标。这样,即使它没有大放异彩或揭示任何突破性的见解,你仍然会收获胜利和一堆实际应用的知识。
你的兴趣
正如我们之前提到的,副项目应该是令人愉快的。无论我们意识到与否,我们每天都会问自己成百上千个问题。尝试在今天剩下的时间里更多地关注这些问题。你会对发生的事情感到惊讶。你可能会发现自己对某些事物比想象中更有创意和兴趣。
现在将这应用到你的下一个数据科学项目中。你是否对如何classify your morning runs感到好奇?想知道特朗普什么时候和如何发推特吗?对体育史上的最伟大的“一曲成名”感兴趣吗?
可能性真的无限。让你的兴趣、好奇心和目标驱动你的下一个项目。一旦你确认了这些目标,我们就可以获得灵感了。
我们容易认为自己是孤军奋战,但实际上情况很少是这样。如果你足够努力地寻找,总会有其他人有相似的兴趣和目标。这种效果对创意产生极具威力。
“没有什么是原创的。从任何激发灵感或燃料你想象力的地方偷取。” — 吉姆·贾木许
找到你喜欢或钦佩的项目,然后加入你自己的独特创意。将这些项目作为起点,生成新的、原创的独立作品。以下是一些我最喜欢的灵感来源:
我可以花几个小时仅仅浏览这个数据可视化的子版块。你会对人们想到的所有独特的想法和问题感兴趣。还有一个每月挑战的活动,选择一个数据集,用户的任务是以最有效的方式进行可视化。按最佳排序获取即时满足感。
如果不提及在线数据科学的标志性代表,那将是我的失职。有效利用 Kaggle 获得灵感有几种方法。首先,你可以查看 热门数据集 并思考如何利用这些信息。如果你对机器学习和具体示例更感兴趣,kernels 功能 随着时间的推移变得越来越好。
视觉论文确实是一种新兴的新闻形式。布丁(The Pudding)体现了这一运动的独特之处。团队使用原创数据集、原始研究和互动性来探索大量有趣的话题。
经典但至今仍然有效。我是说, Nate Silver 是那个传奇人物。这个数据驱动的博客涉及从政治到体育到文化的所有话题。更不用说,他们刚刚重新设计了改进的数据导出页面 data export。
最后,我必须向 TDS 团队 致敬,他们将这一群聪明且热衷于实现目标并帮助他人在数据科学中成长的人们汇聚在一起。浏览近期的故事,你会在任何一天发现一些有趣的项目创意。
侧项目不仅在我的发展过程中帮助了我很多,而且通常也非常有趣。最近,关于数据科学作品集的精彩内容越来越多。如果你感兴趣,我强烈推荐查看以下链接:
做任何事情最难的部分就是开始。我希望以上的建议和资源能帮助你完成并发布下一个数据科学项目。我会留意的。
个人简介: Conor Dewey (Medium) 是一位数据科学家和作家,目前在弗吉尼亚理工大学学习。
原始。已获许可转载。
相关:
-
2018 年将助你找到工作的 5 个数据科学项目
-
GitHub Python 数据科学聚焦:AutoML、NLP、可视化、ML 工作流
-
数据科学预测未来