js-tiktoken
js-tiktoken 是由
OpenAI 创建的 BPE 分词器的 JavaScript 版本。tiktoken 通过 @[TokenTextSplitter] 估算使用的 token 数量。这对于 OpenAI 模型可能更准确。
- 文本如何拆分:按传入的字符拆分。
- 如何衡量块大小:通过
tiktoken分词器。
tiktoken 合并块,请在初始化 @[TokenTextSplitter] 时传入一个 encodingName(例如 cl100k_base)。请注意,此方法拆分出的块可能大于 tiktoken 分词器测量的块大小。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。