[hotfix] adapt ProcessGroup and Optimizer to ColoTensor (#1388)

2025-09-13 21:22:49 +00:00 · 2022-07-29 19:33:24 +08:00
parent ad678921db
commit c7221cb2d4
7 changed files with 20 additions and 16 deletions
--- a/colossalai/nn/optimizer/fused_lamb.py
+++ b/colossalai/nn/optimizer/fused_lamb.py
@@ -162,9 +162,9 @@ class FusedLAMB(torch.optim.Optimizer):
                # State initialization
                if len(state) == 0:
                    # Exponential moving average of gradient values
-                    state['exp_avg'] = torch.zeros_like(p.data)
+                    state['exp_avg'] = torch.zeros_like(p)
                    # Exponential moving average of gradient values
-                    state['exp_avg_sq'] = torch.zeros_like(p.data)
+                    state['exp_avg_sq'] = torch.zeros_like(p)

                if p.dtype == torch.float16:
                    g_16.append(p.grad.data)