如何从大型语言模型流式传输响应
所有 LLM
都实现了 运行接口,该接口提供了标准可运行方法的 默认 实现(即 ainvoke
、batch
、abatch
、stream
、astream
、astream_events
)。
默认 流式实现提供了一个 Iterator
(或用于异步流式传输的 AsyncIterator
),它生成一个单一值:来自底层聊天大模型供应商的最终输出。
逐个令牌流式传输输出的能力取决于大模型供应商是否实现了适当的流式支持。
查看哪些 集成支持逐个令牌流式传输。
note
默认 实现 不 提供逐个令牌流式传输的支持,但它确保模型可以替换为任何其他模型,因为它支持相同的标准接口。