Skip to content

Latest commit

 

History

History
99 lines (56 loc) · 7.49 KB

top-reddit-machine-learning-march.md

File metadata and controls

99 lines (56 loc) · 7.49 KB

Top /r/MachineLearning 帖子,三月:一份超级严厉的机器学习指南;是 Gaggle 还是 Koogle?!?

原文:www.kdnuggets.com/2017/04/top-reddit-machine-learning-march.html

在三月的 /r/MachineLearning 中,我们欣赏到了一份超级严厉的机器学习指南,得知 Google 正在收购 Kaggle,从 Salesforce 的首席数据科学家那里获得超监督学习建议,听到 Andrew Ng 退出百度的告别,并了解到更多有关 Distill 的激动人心的信息,这是一个基于网络的“机器学习研究互动视觉期刊”。

Reddit

过去一个月**/r/MachineLearning**的前 5 名帖子是:

1. 一份超级严厉的机器学习指南

这本简短而直白的机器学习指南由 /u/thatguydr 编写,他的简洁性令人钦佩。他的整个指南——在随后的讨论中扩展、讨论,并有其他人提供的材料——如下:

首先,阅读该死的 Hastie、Tibshirani 和其他人。第 1-4 章和第七章。如果不理解,就一直读,直到明白为止。

你可以继续阅读剩下的书。如果你愿意,你应该这么做,但我会假设你都知道了。

学习 Andrew Ng 的 Coursera 课程。在 Matlab、Python 和 R 中完成所有练习,确保它们的答案一致。

现在忘掉这些,阅读深度学习书籍。在 Linux 机器上安装 tensorflow 或 torch,并运行示例直到理解。做一些 CNN 和 RNN 的工作,并进行前馈 NNs。

完成所有这些后,去 arXiv 阅读最新的有用论文。文献每隔几个月就会变化,所以要跟上。

这样,你现在可能可以被大多数地方雇用。如果需要简历填充,可以参加一些 Kaggle 比赛。如果有调试问题,使用 StackOverflow。如果有数学问题,多读书。如果有生活问题,我无从知道。

它在诚实和准确性方面都很美妙。我有点不满的是没有生活建议,因为我期待这类人(或女士)会很擅长提供这些建议。

2. Google 收购数据科学社区 Kaggle

Google 收购了 Kaggle。这不应该是一个巨大的惊喜,考虑到以下几点:

Kaggle 与 Google 也有一段历史,不过那是最近的事。本月早些时候,Google 和 Kaggle 联手举办了一场价值 $100,000 的机器学习竞赛,主题是分类 YouTube 视频。该竞赛也与 Google Cloud Platform 进行了深度集成。

Koogles and Gaggles

我们将拭目以待谷歌在 Kaggle 上的最终目标是什么,但这里有各种交叉的可能性。根据你对潜在垄断的看法,这个事件要么令人兴奋,要么令人恐惧。但这是一个很好的品牌推广举措,并且可以帮助谷歌扩展其最近成为全球唯一机器学习巨头的兴趣。

3. Salesforce 首席数据科学家的建议

来自 Salesforce 首席科学家 Richard Socher 的一条推特建议:

Richard Socher tweet

尽管这是一个苹果和橙子的比较(“与其吃一块肉类披萨,不如去砍些木头”),我在某种程度上可以理解他的立场。这将是一个伟大的教育性项目,并且可以支持整个社区,特别是如果他鼓励分享这些精选数据集的话。但实际上,我不认为所有从事无监督学习问题的人都会或应该去标注分类数据。这显然不会推动无监督学习的进展。

4. Andrew Ng 从百度辞职

在他的 Medium 博客上,Andrew Ng 宣布了他从百度辞职以及他即将到来的计划。剧透警告:他并不会在 Van Nuys 开一家海鲜餐厅:

我将继续致力于引领这一重要的社会变革。除了将大型公司转型为使用 AI,还存在丰富的创业机会以及进一步的 AI 研究。我希望我们所有人都能拥有自动驾驶汽车;可以自然对话的计算机;以及理解我们病痛的医疗机器人。工业革命使人类摆脱了许多重复的体力劳动;我现在希望 AI 能让人类摆脱重复的脑力劳动,例如在交通中驾驶。

祝好,Ng 先生!

5. Distill:一种机器学习研究的互动视觉期刊

Distill 正式推出,由 Google Brain 的创始编辑 Chris Olah 和 Shan Carter 进行规划和管理。撰稿人 Michael Nielsen 写道:

Distill 正在认真对待网络。Distill 文章(至少在其理想和雄心勃勃的形式中)不仅仅是一篇论文。它是一个互动媒介,允许用户——“读者”已不再足够——直接与机器学习模型进行互动。

理想情况下,这类文章会将解释、代码、数据和交互式可视化整合到一个环境中。在这样的环境中,用户可以以传统静态媒体无法实现的方式进行探索。他们可以更改模型,尝试不同的假设,并立即看到结果。这将使他们能够以传统静态媒体无法实现的方式迅速建立理解。

这无疑是一个需要关注的关键资源。祝相关人员好运。

Distill

相关:

  • 顶级 /r/MachineLearning 帖子,二月:牛津深度 NLP 课程;Scikit-learn 结果的数据可视化

  • 顶级 /r/MachineLearning 帖子,一月:TensorFlow 更新;AlphaGo 野外表现;自动驾驶马里奥卡丁车

  • 顶级 /r/MachineLearning 帖子,十二月:OpenAI 宇宙;面向编码员的深度学习 MOOC;马斯克:特斯拉变得更棒


我们的前三个课程推荐

1. Google 网络安全证书 - 快速通道进入网络安全职业。

2. Google 数据分析专业证书 - 提升您的数据分析技能

3. Google IT 支持专业证书 - 支持您的组织进行 IT 工作


更多相关话题