Optimized MoE layer and fixed some bugs;

Decreased moe tests; Added FFNExperts and ViTMoE model
2025-09-21 17:40:33 +00:00 · 2022-02-18 20:42:31 +08:00
parent 3dba070580
commit 219df6e685
15 changed files with 1552 additions and 203 deletions
--- a/colossalai/global_variables.py
+++ b/colossalai/global_variables.py
@@ -56,6 +56,7 @@ class MoeEnv:
        self.data_parallel_size = None
        self.model_parallel_size = None
        self.aux_loss = None
+        self.enable_cuda = True

    def setup(self, moe_model_size):
        from .core import global_context as gpc
@@ -71,6 +72,9 @@ class MoeEnv:
    def is_initialized(self):
        return self.model_parallel_size is not None

+    def set_cuda_false(self):
+        self.enable_cuda = False
+
    def reset_loss(self):
        self.aux_loss = 0