跳转到内容
GitHub

语义搜索

传统搜索匹配精确的关键词。语义搜索理解查询的含义,即使用词不完全匹配也能找到相关段落。

ReadAny 使用混合检索方式:

  • 向量相似度 — 使用 embedding 模型按语义查找相似段落
  • BM25 — 传统关键词匹配,提高精确度

使用语义搜索前,需要先向量化书籍:

  1. 打开一本书
  2. 点击侧边栏的向量化按钮(或可能自动开始)
  3. 等待处理完成 — 使用本地 CPU 运行

向量化会在本地创建 embedding 索引。每本书只需处理一次。

  1. 打开侧边栏的搜索面板
  2. 输入自然语言查询(如「主角的童年回忆」)
  3. 结果按语义相关度排序
  4. 点击结果跳转到对应段落

ReadAny 使用 Transformers.js 在本地运行 embedding 模型。数据不会离开你的设备。

可在设置 → 向量模型中配置 embedding 模型。