[coati] Fix LlamaCritic (#3475)

* mv LlamaForCausalLM to LlamaModel * rm unused imports --------- Co-authored-by: gongenlei <gongenlei@baidu.com>
2025-08-31 16:40:41 +00:00 · 2023-04-07 11:39:09 +08:00
parent 8f2c55f9c9
commit a7ca297281
1 changed files with 4 additions and 5 deletions
--- a/applications/Chat/coati/models/llama/llama_critic.py
+++ b/applications/Chat/coati/models/llama/llama_critic.py
@@ -1,8 +1,7 @@
 from typing import Optional

-import torch
 import torch.nn as nn
-from transformers import AutoModelForCausalLM, LlamaConfig, LlamaForCausalLM
+from transformers import LlamaConfig, LlamaModel

 from ..base import Critic

@@ -28,11 +27,11 @@ class LlamaCritic(Critic):
                 **kwargs) -> None:

        if pretrained is not None:
-            model = LlamaForCausalLM.from_pretrained(pretrained)
+            model = LlamaModel.from_pretrained(pretrained)
        elif config is not None:
-            model = LlamaForCausalLM(config)
+            model = LlamaModel(config)
        else:
-            model = LlamaForCausalLM(LlamaConfig())
+            model = LlamaModel(LlamaConfig())

        if checkpoint:
            model.gradient_checkpointing_enable()