feature: guanaco stream output

2025-08-16 15:31:19 +00:00 · 2023-06-04 20:38:34 +08:00 · 2023-06-04 20:38:34 +08:00 · fe8291b198
commit fe8291b198
parent 32ce199173
2 changed files with 9 additions and 7 deletions
--- a/pilot/model/loader.py
+++ b/pilot/model/loader.py
@ -118,6 +118,8 @@ class ModelLoader(metaclass=Singleton):
                model.to(self.device)
            except ValueError:
                pass
+            except AttributeError:
+                pass

        if debug:
            print(model)
--- a/pilot/server/chat_adapter.py
+++ b/pilot/server/chat_adapter.py
@ -4,7 +4,7 @@
 from functools import cache
 from typing import List

-from pilot.model.inference import generate_stream
+from pilot.model.llm_out.vicuna_base_llm import generate_stream


 class BaseChatAdpter:
@ -55,7 +55,7 @@ class ChatGLMChatAdapter(BaseChatAdpter):
        return "chatglm" in model_path

    def get_generate_stream_func(self):
-        from pilot.model.chatglm_llm import chatglm_generate_stream
+        from pilot.model.llm_out.chatglm_llm import chatglm_generate_stream

        return chatglm_generate_stream

@ -91,7 +91,7 @@ class GuanacoChatAdapter(BaseChatAdpter):
        return "guanaco" in model_path

    def get_generate_stream_func(self):
-        from pilot.model.guanaco_llm import guanaco_generate_stream 
+        from pilot.model.llm_out.guanaco_llm import guanaco_generate_stream 

        return guanaco_generate_stream

@ -101,7 +101,7 @@ class ProxyllmChatAdapter(BaseChatAdpter):
        return "proxyllm" in model_path

    def get_generate_stream_func(self):
-        from pilot.model.proxy_llm import proxyllm_generate_stream
+        from pilot.model.llm_out.proxy_llm import proxyllm_generate_stream

        return proxyllm_generate_stream