[fp8] support gemini plugin (#5978)

* [fp8] refactor hook * [fp8] support gemini plugin * [example] add fp8 option for llama benchmark
2025-09-10 13:30:19 +00:00 · 2024-08-09 14:09:48 +08:00
parent 4b9bec8176
commit 8241c0c054
7 changed files with 21 additions and 7 deletions
--- a/tests/test_fp8/test_fp8_hook.py
+++ b/tests/test_fp8/test_fp8_hook.py
@@ -4,8 +4,8 @@ import torch.nn as nn
 import torch.nn.functional as F

 from colossalai.accelerator import get_accelerator
-from colossalai.booster.plugin.fp8_hook import FP8Hook
 from colossalai.quantization.fp8 import linear_fp8
+from colossalai.quantization.fp8_hook import FP8Hook
 from colossalai.tensor.colo_parameter import ColoParameter
 from colossalai.tensor.param_op_hook import ColoParamOpHookManager
 from colossalai.utils import get_current_device