langchain/langchain/llms at 5ef2d1e2a196e41733b94e1e445a09ab49bc582d - langchain - Gitea: Git with a cup of tea at home

github/langchain

mirror of https://github.com/hwchase17/langchain.git synced 2026-02-21 06:33:41 +00:00

Files

History

Carmen Sam d54c88aa21 Add allowed and disallowed special arguments to BaseOpenAI (#3012 )

## Background
This PR fixes this error when there are special tokens when querying the
chain:
```
Encountered text corresponding to disallowed special token '<|endofprompt|>'.
If you want this text to be encoded as a special token, pass it to `allowed_special`, e.g. `allowed_special={'<|endofprompt|>', ...}`.
If you want this text to be encoded as normal text, disable the check for this token by passing `disallowed_special=(enc.special_tokens_set - {'<|endofprompt|>'})`.
To disable this check for all special tokens, pass `disallowed_special=()`.
```

Refer to the code snippet below, it breaks in the chain line.
```
        chain = ConversationalRetrievalChain.from_llm(
            ChatOpenAI(openai_api_key=OPENAI_API_KEY),
            retriever=vectorstore.as_retriever(),
            qa_prompt=prompt,
            condense_question_prompt=condense_prompt,
        )
        answer = chain({"question": f"{question}"})
```
However `ChatOpenAI` class is not accepting `allowed_special` and
`disallowed_special` at the moment so they cannot be passed to the
`encode()` in `get_num_tokens` method to avoid the errors.


## Change
- Add `allowed_special` and `disallowed_special` attributes to
`BaseOpenAI` class.
- Pass in `allowed_special` and `disallowed_special` as arguments of
`encode()` in tiktoken.

---------

Co-authored-by: samcarmen <“carmen.samkahman@gmail.com”>

2023-04-18 09:34:08 -07:00

..

__init__.py

Add support for rwkv (#2422 )

2023-04-06 14:41:06 -07:00

ai21.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

aleph_alpha.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

anthropic.py

Fix ChatAnthropic stop_sequences error (#2919 ) (#2920 )

2023-04-14 17:22:01 -07:00

bananadev.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

base.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

cerebriumai.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

cohere.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

deepinfra.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

fake.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

forefrontai.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

gooseai.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

gpt4all.py

Add Streaming for GPT4All (#2642 )

2023-04-09 17:54:26 -07:00

huggingface_endpoint.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

huggingface_hub.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

huggingface_pipeline.py

consistently use getLogger(__name__), no root logger (#2989 )

2023-04-16 12:49:35 -07:00

llamacpp.py

Fix the unset argument in calling llama model (#2714 )

2023-04-11 11:02:39 -07:00

loading.py

Harrison/improve cache (#368 )

2022-12-18 16:22:42 -05:00

manifest.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

modal.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

nlpcloud.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

openai.py

Add allowed and disallowed special arguments to BaseOpenAI (#3012 )

2023-04-18 09:34:08 -07:00

petals.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

promptlayer_openai.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

replicate.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

rwkv.py

Harrison/rwkv utf8 (#2867 )

2023-04-13 21:31:18 -07:00

sagemaker_endpoint.py

Minor: Remove duplicated word in error message (#2706 )

2023-04-11 13:10:33 -07:00

self_hosted_hugging_face.py

consistently use getLogger(__name__), no root logger (#2989 )

2023-04-16 12:49:35 -07:00

self_hosted.py

consistently use getLogger(__name__), no root logger (#2989 )

2023-04-16 12:49:35 -07:00

stochasticai.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00

utils.py

Harrison/cleanup env check (#144 )

2022-11-14 22:05:41 -08:00

writer.py

Removed duplicate BaseModel dependencies (#2471 )

2023-04-06 12:45:16 -07:00