C Transformers

本页面介绍如何在LangChain中使用C Transformers库。它分为两个部分：安装和设置，以及对特定C Transformers包装器的引用。

安装和设置

存在一个CTransformers LLM包装器，您可以通过以下方式访问：

from langchain_community.llms import CTransformers

它为所有模型提供了统一的接口：

llm = CTransformers(model='/path/to/ggml-gpt-2.bin', model_type='gpt2')

print(llm.invoke('AI is going to'))

如果您遇到 illegal instruction 错误，请尝试使用 lib='avx' 或 lib='basic'：

llm = CTransformers(model='/path/to/ggml-gpt-2.bin', model_type='gpt2', lib='avx')

它可以与托管在 Hugging Face Hub 上的模型一起使用：

llm = CTransformers(model='marella/gpt-2-ggml')

如果一个模型库有多个模型文件（.bin 文件），请使用以下方式指定一个模型文件：

llm = CTransformers(model='marella/gpt-2-ggml', model_file='ggml-model.bin')

可以使用 config 参数传递额外的参数：

config = {'max_new_tokens': 256, 'repetition_penalty': 1.1}

llm = CTransformers(model='marella/gpt-2-ggml', config=config)

请参阅文档以获取可用参数的列表。

有关此内容的更详细说明，请参见此笔记本。