Revert "typescript bindings maintenance (#2363)"

As discussed on Discord, this PR was not ready to be merged. CI fails on it. This reverts commit a602f7fde7. Signed-off-by: Jared Van Bortel <jared@nomic.ai>
2025-09-04 18:11:02 +00:00 · 2024-06-03 17:25:28 -04:00
parent a602f7fde7
commit 55d709862f
30 changed files with 876 additions and 1115 deletions
--- a/gpt4all-bindings/typescript/spec/token-callbacks.mjs
+++ b/gpt4all-bindings/typescript/spec/token-callbacks.mjs
@@ -1,6 +1,7 @@
+import { promises as fs } from "node:fs";
 import { loadModel, createCompletion } from "../src/gpt4all.js";

-const model = await loadModel("Phi-3-mini-4k-instruct.Q4_0.gguf", {
+const model = await loadModel("Nous-Hermes-2-Mistral-7B-DPO.Q4_0.gguf", {
    verbose: true,
    device: "gpu",
 });
@@ -11,15 +12,14 @@ const res = await createCompletion(
    {
        onPromptToken: (tokenId) => {
            console.debug("onPromptToken", { tokenId });
-            // errors within the callback will cancel ingestion, inference will still run
+            // throwing an error will cancel
            throw new Error("This is an error");
            // const foo = thisMethodDoesNotExist();
            // returning false will cancel as well
            // return false;
        },
-        onResponseTokens: ({ tokenIds, text }) => {
-            // console.debug("onResponseToken", { tokenIds, text });
-            process.stdout.write(text);
+        onResponseToken: (tokenId, token) => {
+            console.debug("onResponseToken", { tokenId, token });
            // same applies here
        },
    }
--- a/gpt4all-bindings/typescript/spec/context-recalc.mjs
+++ b/gpt4all-bindings/typescript/spec/context-recalc.mjs
--- a/gpt4all-bindings/typescript/spec/chat-minimal.mjs
+++ b/gpt4all-bindings/typescript/spec/chat-minimal.mjs
@@ -2,6 +2,7 @@ import { loadModel, createCompletion } from "../src/gpt4all.js";

 const model = await loadModel("orca-mini-3b-gguf2-q4_0.gguf", {
    verbose: true,
+    device: "gpu",
 });

 const chat = await model.createChatSession();
@@ -11,6 +12,8 @@ await createCompletion(
    "Why are bananas rather blue than bread at night sometimes?",
    {
        verbose: true,
-        nPredict: 10,
    }
-);
+);
+await createCompletion(chat, "Are you sure?", {
+    verbose: true,
+});
--- a/gpt4all-bindings/typescript/spec/concurrency.mjs
+++ b/gpt4all-bindings/typescript/spec/concurrency.mjs
@@ -7,12 +7,12 @@ const modelOptions = {
    verbose: true,
 };

-const model1 = await loadModel("Phi-3-mini-4k-instruct.Q4_0.gguf", {
+const model1 = await loadModel("orca-mini-3b-gguf2-q4_0.gguf", {
    ...modelOptions,
    device: "gpu", // only one model can be on gpu
 });
-const model2 = await loadModel("Phi-3-mini-4k-instruct.Q4_0.gguf", modelOptions);
-const model3 = await loadModel("Phi-3-mini-4k-instruct.Q4_0.gguf", modelOptions);
+const model2 = await loadModel("orca-mini-3b-gguf2-q4_0.gguf", modelOptions);
+const model3 = await loadModel("orca-mini-3b-gguf2-q4_0.gguf", modelOptions);

 const promptContext = {
    verbose: true,
@@ -27,6 +27,3 @@ const responses = await Promise.all([
    createCompletion(model3, "What is 1 + 3?", promptContext),
 ]);
 console.log(responses.map((res) => res.choices[0].message));
-model1.dispose();
-model2.dispose();
-model3.dispose();
--- a/gpt4all-bindings/typescript/spec/llmodel.mjs
+++ b/gpt4all-bindings/typescript/spec/llmodel.mjs
@@ -0,0 +1,61 @@
+import {
+    LLModel,
+    createCompletion,
+    DEFAULT_DIRECTORY,
+    DEFAULT_LIBRARIES_DIRECTORY,
+    loadModel,
+} from "../src/gpt4all.js";
+
+const model = await loadModel("mistral-7b-openorca.gguf2.Q4_0.gguf", {
+    verbose: true,
+    device: "gpu",
+});
+const ll = model.llm;
+
+try {
+    class Extended extends LLModel {}
+} catch (e) {
+    console.log("Extending from native class gone wrong " + e);
+}
+
+console.log("state size " + ll.stateSize());
+
+console.log("thread count " + ll.threadCount());
+ll.setThreadCount(5);
+
+console.log("thread count " + ll.threadCount());
+ll.setThreadCount(4);
+console.log("thread count " + ll.threadCount());
+console.log("name " + ll.name());
+console.log("type: " + ll.type());
+console.log("Default directory for models", DEFAULT_DIRECTORY);
+console.log("Default directory for libraries", DEFAULT_LIBRARIES_DIRECTORY);
+console.log("Has GPU", ll.hasGpuDevice());
+console.log("gpu devices", ll.listGpu());
+console.log("Required Mem in bytes", ll.memoryNeeded());
+
+// to ingest a custom system prompt without using a chat session.
+await createCompletion(
+    model,
+    "<|im_start|>system\nYou are an advanced mathematician.\n<|im_end|>\n",
+    {
+        promptTemplate: "%1",
+        nPredict: 0,
+        special: true,
+    }
+);
+const completion1 = await createCompletion(model, "What is 1 + 1?", {
+    verbose: true,
+});
+console.log(`🤖 > ${completion1.choices[0].message.content}`);
+//Very specific:
+// tested on Ubuntu 22.0, Linux Mint, if I set nPast to 100, the app hangs.
+const completion2 = await createCompletion(model, "And if we add two?", {
+    verbose: true,
+});
+console.log(`🤖 > ${completion2.choices[0].message.content}`);
+
+//CALLING DISPOSE WILL INVALID THE NATIVE MODEL. USE THIS TO CLEANUP
+model.dispose();
+
+console.log("model disposed, exiting...");
--- a/gpt4all-bindings/typescript/spec/context-large.mjs
+++ b/gpt4all-bindings/typescript/spec/context-large.mjs
--- a/gpt4all-bindings/typescript/spec/token-streaming.mjs
+++ b/gpt4all-bindings/typescript/spec/token-streaming.mjs
@@ -38,8 +38,8 @@ process.stdout.write("\n");

 process.stdout.write("### Callback:");
 await createCompletion(model, "Why not just callbacks?", {
-    onResponseTokens: ({ text }) => {
-        process.stdout.write(text);
+    onResponseToken: (tokenId, token) => {
+        process.stdout.write(token);
    },
 });
 process.stdout.write("\n");
--- a/gpt4all-bindings/typescript/spec/token-streaming-emoji.mjs
+++ b/gpt4all-bindings/typescript/spec/token-streaming-emoji.mjs
@@ -1,37 +0,0 @@
-import {
-    loadModel,
-    createCompletion,
-    createCompletionStream,
-    createCompletionGenerator,
-} from "../src/gpt4all.js";
-
-const model = await loadModel("Phi-3-mini-4k-instruct.Q4_0.gguf", {
-    device: "cpu",
-});
-
-const prompt = "Tell a short story but only use emojis. Three sentences max.";
-
-const result = await createCompletion(model, prompt, {
-    onResponseToken: (tokens) => {
-        console.debug(tokens)
-    },
-});
-
-console.debug(result.choices[0].message);
-
-process.stdout.write("### Stream:");
-const stream = createCompletionStream(model, prompt);
-stream.tokens.on("data", (data) => {
-    process.stdout.write(data);
-});
-await stream.result;
-process.stdout.write("\n");
-
-process.stdout.write("### Generator:");
-const gen = createCompletionGenerator(model, prompt);
-for await (const chunk of gen) {
-    process.stdout.write(chunk);
-}
-
-
-model.dispose();