[shardformer] update llama2/opt finetune example and fix llama2 policy (#4645)

* [shardformer] update shardformer readme [shardformer] update shardformer readme [shardformer] update shardformer readme * [shardformer] update llama2/opt finetune example and shardformer update to llama2 * [shardformer] update llama2/opt finetune example and shardformer update to llama2 * [shardformer] update llama2/opt finetune example and shardformer update to llama2 * [shardformer] change dataset * [shardformer] change dataset * [shardformer] fix CI * [shardformer] fix * [shardformer] fix * [shardformer] fix * [shardformer] fix * [shardformer] fix [example] update opt example [example] resolve comments fix fix
2025-09-04 18:40:28 +00:00 · 2023-09-09 22:45:36 +08:00
parent a686f9ddc8
commit 7486ed7d3a
12 changed files with 165 additions and 167 deletions
--- a/examples/language/opt/run_demo.sh
+++ b/examples/language/opt/run_demo.sh
@@ -9,7 +9,7 @@ OUTPUT_PATH="./output_model.bin"

 # plugin(training strategy)
 # can only be one of "torch_ddp"/"torch_ddp_fp16"/"low_level_zero"/"gemini"
-PLUGIN="gemini"
+PLUGIN="hybrid_parallel"

 # number of gpus to use
 GPUNUM=4