[example] Update Llama Inference example (#5629)

* [example] add infernece benchmark llama3 * revise inference config - arg * remove unused args * add llama generation demo script * fix init rope in llama policy * add benchmark-llama3 - cleanup
2025-09-04 18:40:28 +00:00 · 2024-04-23 22:23:07 +08:00
parent 12f10d5b0b
commit 04863a9b14
4 changed files with 323 additions and 12 deletions
--- a/colossalai/inference/modeling/policy/nopadding_llama.py
+++ b/colossalai/inference/modeling/policy/nopadding_llama.py
@@ -100,5 +100,5 @@ class NoPaddingLlamaModelInferPolicy(LlamaForCausalLMPolicy):
        return policy

    def postprocess(self):
-        init_to_get_rotary(self.model.model)
+        init_to_get_rotary(self.model.model, self.model.config.rope_theta)
        return self.model