fix prepare grads in sharded optim (#749)

2025-09-25 19:55:03 +00:00 · 2022-04-13 22:36:11 +08:00
parent 097772546e
commit 4b048a8728
1 changed files with 2 additions and 0 deletions
--- a/colossalai/zero/sharded_optim/sharded_optim_v2.py
+++ b/colossalai/zero/sharded_optim/sharded_optim_v2.py
@@ -288,6 +288,8 @@ class ShardedOptimizerV2(ColossalaiOptimizer):
    def _prepare_grads(self):
        for group in self.optim.param_groups:
            for p in group['params']:
+                if p.colo_attr.saved_grad.is_null():
+                    continue
                p.colo_attr.saved_grad.trans_state(TensorState.COMPUTE)
                # FIXME(ver217): p.data here is an empty tensor on CUDA and has no useful infomation
                # If we change p.grad directly