tested after rebasing, fix importance sampling bug

2025-08-17 23:46:52 +00:00 · 2025-08-06 06:15:15 +00:00 · 2025-08-06 06:15:15 +00:00 · 32b2148670
commit 32b2148670
parent 3746f73854
4 changed files with 4 additions and 3 deletions
--- a/applications/ColossalChat/examples/requirements.txt
+++ b/applications/ColossalChat/examples/requirements.txt
@ -1,4 +1,4 @@
 pandas>=1.4.1
 sentencepiece
-colossalai==0.4.7
+colossalai>=0.4.7
 prompt_toolkit
--- a/applications/ColossalChat/requirements.txt
+++ b/applications/ColossalChat/requirements.txt
@ -1,4 +1,4 @@
-transformers==4.39.3
+transformers>=4.39.3
 tqdm
 datasets==2.14.7
 loralib
--- a/applications/ColossalChat/rl_example.py
+++ b/applications/ColossalChat/rl_example.py
@ -152,7 +152,7 @@ if __name__ == "__main__":
        "-ei",
        "--eval-interval",
        type=int,
-        default=100,
+        default=-1,
        help="Interval for evaluation. Evaluate every ei training steps.",
    )
    parser.add_argument(
--- a/colossalai/shardformer/modeling/qwen3.py
+++ b/colossalai/shardformer/modeling/qwen3.py
@ -273,6 +273,7 @@ class Qwen3PipelineForwards:
        hidden_states: Optional[torch.FloatTensor] = None,
        stage_index: Optional[List[int]] = None,
        shard_config: ShardConfig = None,
        **kwargs
    ):
        r"""
        Args: