[hotfix] adapt ProcessGroup and Optimizer to ColoTensor (#1388)

2025-09-05 19:13:01 +00:00 · 2022-07-29 19:33:24 +08:00
parent ad678921db
commit c7221cb2d4
7 changed files with 20 additions and 16 deletions
--- a/colossalai/nn/optimizer/hybrid_adam.py
+++ b/colossalai/nn/optimizer/hybrid_adam.py
@@ -116,9 +116,9 @@ class HybridAdam(NVMeOptimizer):
                    state['step'] = 0

                    # gradient momentums
-                    state['exp_avg'] = torch.zeros_like(p.data, dtype=torch.float, device=target_device)
+                    state['exp_avg'] = torch.zeros_like(p, dtype=torch.float, device=target_device)
                    # gradient variances
-                    state['exp_avg_sq'] = torch.zeros_like(p.data, dtype=torch.float, device=target_device)
+                    state['exp_avg_sq'] = torch.zeros_like(p, dtype=torch.float, device=target_device)
                    self._post_state_init(p)

                state['step'] += 1