《AI 计算体系》深入深度学习计算模式,从而理解“计算”需要什么。通过AI芯片关键指标,了解AI芯片要更好的支持“计算”,需要关注那些重点工作。最后通过深度学习的计算核心“矩阵乘”来看对“计算”的实际需求和情况,为了提升计算性能、降低功耗和满足训练推理不同场景应用,对“计算”引入 TF32/BF16 等复杂多样的比特位宽。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT
和字幕
需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
大纲 | 小节 | 链接 |
---|---|---|
AI 计算体系 | 01 课程内容 | slide, video |
AI 计算体系 | 02 AI计算模式(上) | slide, video |
AI 计算体系 | 03 AI计算模式(下) | slide, video |
AI 计算体系 | 04 关键设计指标 | slide, video |
AI 计算体系 | 05 核心计算:矩阵乘 | slide, video |
AI 计算体系 | 06 数据单位:比特位 | slide, video |
AI 计算体系 | 07 AI计算体系总结 | slide, video |
:maxdepth: 2
01.introduction
02.arch_slim
03.mobile_parallel
04.metrics
05.matrix
06.bit_width
07.summary