- 該程式碼要解決的問題為何
- stakeholder
- 場景
- 方法論驗證
- 相關指標
- 復現方式
- 工程實作
- 時間區間取樣是否合理 (vs 計算負擔)
- task --> simple responsibility principle
- outflow data schema, inflow data schema
- task, outflow - idempotency (reproducible result)
- 是否有冗余的 join
- 具有風險的寫法
- e.g. size(collect_set()) - memory intensive
- 大表 join 大表
- user defined function 的濫用
- 容易產生 exception 導致失敗
- 命名
- method : v_n
- variable : a_with_b
- 資料 gaurd
- 重要資料是否前面有掛 assert