feat fused_adamw #938

zyf654321 · 2024-09-05T06:50:40Z

No description provided.

lljbash

加上单元测试

lljbash · 2024-09-25T02:49:03Z

dipu/scripts/autogen_diopi_wrapper/diopi_functions.yaml

+    std::vector<diopiTensorHandle_t> diopiTensorHandles_self(self.size());
+    for(size_t i=0; i < self.size(); ++i){
+      diopiConstTensorHandle_t const_handle = dipu::diopi_helper::toDiopiTensorHandle(self.at(i));
+      diopiTensorHandle_t handle = const_cast<diopiTensorHandle_t>(const_handle);
+      diopiTensorHandles_self[i] = handle;
+    }
+    std::vector<diopiConstTensorHandle_t> diopiTensorHandles_grads(grads.size());
+    for(size_t i=0; i < grads.size(); ++i){
+      diopiTensorHandles_grads[i] = dipu::diopi_helper::toDiopiTensorHandle(grads.at(i));
+    }
+    std::vector<diopiTensorHandle_t> diopiTensorHandles_exp_avgs(exp_avgs.size());
+    for(size_t i=0; i < exp_avgs.size(); ++i){
+      diopiConstTensorHandle_t const_handle = dipu::diopi_helper::toDiopiTensorHandle(exp_avgs.at(i));
+      diopiTensorHandle_t handle = const_cast<diopiTensorHandle_t>(const_handle);
+      diopiTensorHandles_exp_avgs[i] = handle;
+    }
+    std::vector<diopiTensorHandle_t> diopiTensorHandles_exp_avg_sqs(exp_avg_sqs.size());
+    for(size_t i=0; i < exp_avg_sqs.size(); ++i){
+      diopiConstTensorHandle_t const_handle = dipu::diopi_helper::toDiopiTensorHandle(exp_avg_sqs.at(i));
+      diopiTensorHandle_t handle = const_cast<diopiTensorHandle_t>(const_handle);
+      diopiTensorHandles_exp_avg_sqs[i] = handle;
+    }
+    std::vector<diopiTensorHandle_t> diopiTensorHandles_max_exp_avg_sqs(max_exp_avg_sqs.size());
+    for(size_t i=0; i < max_exp_avg_sqs.size(); ++i){
+      diopiConstTensorHandle_t const_handle = dipu::diopi_helper::toDiopiTensorHandle(max_exp_avg_sqs.at(i));
+      diopiTensorHandle_t handle = const_cast<diopiTensorHandle_t>(const_handle);
+      diopiTensorHandles_max_exp_avg_sqs[i] = handle;
+    }
+    std::vector<diopiConstTensorHandle_t> diopiTensorHandles_state_steps(state_steps.size(), nullptr);
+    for(size_t i=0; i < state_steps.size(); ++i){
+      diopiTensorHandles_state_steps[i] = dipu::diopi_helper::toDiopiTensorHandle(state_steps.at(i));
+    }


削减重复代码，考虑：

提取函数

使用 std::transform

toDiopiTensorHandleVector
已经有这个函数了

lljbash · 2024-09-25T02:50:05Z

dipu/tests/python/unittests/test_adamw.py

+                ),
+            )
+
+    @onlyOn("CUDA")


如果期望所有芯片都实现，应该用 skipon 比较好

feat fused_adamw

7333745

zyf654321 requested review from mrdanielw and lljbash as code owners September 5, 2024 06:50

lljbash requested changes Sep 6, 2024

View reviewed changes

zyf654321 added 4 commits September 20, 2024 17:11

add test code

e76a5bf

add test code

ffcc77f

limit only on cuda

cb2e125

limit only on cuda

1f93b60

lljbash reviewed Sep 25, 2024

View reviewed changes

zyf654321 added 3 commits October 10, 2024 11:24

Simplify code

9a8cf7d

Simplify code

a15546b

Simplify code

c21e538

ustclight-sls requested a review from lljbash October 10, 2024 07:00

Simplify code

1c97e65

lljbash approved these changes Oct 11, 2024

View reviewed changes

fandaoyi approved these changes Oct 11, 2024

View reviewed changes

fandaoyi merged commit cfec228 into DeepLink-org:main Oct 11, 2024
33 checks passed

lljbash deleted the zyf/fused_adamw_4 branch October 24, 2024 07:33

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat fused_adamw #938

feat fused_adamw #938

zyf654321 commented Sep 5, 2024

lljbash left a comment

lljbash Sep 25, 2024

lljbash Oct 9, 2024

lljbash Sep 25, 2024

feat fused_adamw #938

feat fused_adamw #938

Conversation

zyf654321 commented Sep 5, 2024

lljbash left a comment

Choose a reason for hiding this comment

lljbash Sep 25, 2024

Choose a reason for hiding this comment

lljbash Oct 9, 2024

Choose a reason for hiding this comment

lljbash Sep 25, 2024

Choose a reason for hiding this comment