Skip to content

Latest commit

 

History

History
28 lines (21 loc) · 904 Bytes

README.md

File metadata and controls

28 lines (21 loc) · 904 Bytes

bigdata

目前 "AI + 云 + 大数据" 做为企业标配的趋势越来越明显,本 repo 也将专注这几块内容:

  • AI 方面将主要学习使用 机器学习 + TensorFlow,若之后精力允许,将继续学习深度学习;
  • 云方面将主要学习 Docker + Kubernetes;
  • 大数据方面主要学习 Hadoop + Spark/Flink/JStorm。

本 repo 主要记录工作中学习了解的知识与遇到的问题,权当笔记使用。希望将这些知识应用于工作,毕竟专业知识只有提高生产力或变现才有价值。

Todo

  • [HBase off heap]
  • [Spark Shuffle]
  • [Spark数据倾斜]
  • RPC分析

Doing

  • Kubernetes
  • Docker

计划

  • Hive/Spark CBO
  • Spark 相关[:TODO 11月底完成][: Delay]
  • 机器学习 [:TODO 圣诞节前后开始重点学习]

Passages: