Question 1

我的文本会被上传吗？

Accepted Answer

不会。分块完全通过 JavaScript 在浏览器中运行 —— 你的文档永不离开设备。页面只发送匿名使用计数器(工具名称和输入大小),绝不发送内容。

Question 2

它如何保持分块连贯？

Accepted Answer

它在双换行(段落)处拆分,并完整保留代码块。只有对大于分块大小的块,才会作为最后手段使用句子或强制切分。

Question 3

有大小限制吗？

Accepted Answer

仅受设备内存限制。由于没有服务器,可拆分数 MB 的文档;超大输入处理时页面也不会卡顿。

Question 4

我应该用多大的分块？

Accepted Answer

设置为小于模型的上下文窗口,并为回复留出余量 —— 例如普通对话模型每块 8,000 至 12,000 个字符。

语义分块器 — 在本地为 LLM 拆分长文本,不在半句话处切断

Long text or code to split