Halo 即答 AI 客服插件
为你的 Halo 站点提供专业的 AI 智能客服系统,让 AI 成为你的第一道客服防线。
为你的 Halo 站点提供专业的实时在线客服系统。
💬交流

✨ 功能特性
🤖 AI 智能客服
- 多模型支持 - 兼容 OpenAI、DeepSeek、Claude 等所有 OpenAI 兼容 API
- RAG 知识库 - 基于站点内容自动回答,支持文章、页面、自定义知识
- 高级检索 - HyDE、混合搜索、Reranking、查询分解等先进技术
- 智能转人工 - AI 无法处理时自动转接人工客服
- 联网搜索 - 知识库无结果时自动搜索互联网(支持 Tavily、Exa、博查)
- 对话记忆 - 完整保留 AI 和人工的对话历史
💬 实时通讯
- SSE 实时推送 - 消息秒达无延迟
- 多消息类型 - 支持文字、图片、Markdown 富文本
- 图片上传 - 支持粘贴、拖拽上传,集成 ImgBB、SM.MS 图床
- 消息历史 - 持久化存储,可追溯查询
📚 知识库管理
- 多来源导入 - 支持文章、页面、自定义文本
- 智能分词 - 中英文分词,关键词提取
- 向量检索 - 基于 Lucene 的向量存储和相似度搜索
- 实时索引 - 内容更新自动重建索引
👥 访客模式
- 匿名聊天 - 访客无需注册即可发起咨询
- 登录聊天 - 自动获取用户信息,会话可追溯
- 邮箱验证 - 可选开启,有效防止恶意骚扰
- 设备信息 - 自动收集浏览器、操作系统、IP 等信息
🖥️ 客服工作台
- 多会话管理 - 并行处理多个访客会话
- 快捷回复 - 常用语一键发送
- 会话状态 - 待接入/AI 服务中/进行中/已关闭
- 历史记录 - 查询和导出历史会话
- AI 对话可见 - 客服可查看 AI 和访客的完整对话
📱 移动端适配
- 响应式设计 - 聊天窗口自适应屏幕
- 移动端全屏 - 手机端自动全屏显示
- 触屏优化 - 友好的触摸操作体验
⚙️ 丰富配置
- AI 配置 - 模型选择、温度、Token 限制、系统提示词
- 知识库配置 - 相似度阈值、检索策略、高级 RAG 开关
- 外观配置 - 主题色、窗口位置、欢迎语、离线提示
- 安全配置 - 消息频率限制、IP 会话数限制、邮箱验证
- 定时清理 - 自动清理历史聊天记录
🔔 通知提醒
- 新会话通知 - 邮件通知客服
- 超时提醒 - 客服/访客超时未回复提醒
- 自动关闭 - 长时间无响应自动关闭会话
📸 预览




🚀 快速开始
1. 安装插件
- 从 Releases 下载最新版本的 JAR 文件
- 在 Halo 后台 -> 插件管理 -> 安装插件
- 上传 JAR 文件并启用插件
2. 基础配置
- 进入插件设置,同意使用条款
- 配置外观设置(主题色、窗口位置、欢迎语等)
- 配置访客模式(匿名聊天、登录聊天、邮箱验证)
3. 配置 AI 客服(可选但推荐)
-
获取 API Key
- OpenAI: https://platform.openai.com/api-keys
- DeepSeek: https://platform.deepseek.com/
- 其他兼容服务商
-
配置 AI 设置
AI 智能客服: 启用 AI 客服: true API 设置: API URL: https://api.openai.com # 不要加 /v1 API Key: sk-xxx 模型: gpt-4o-mini Embedding 模型: text-embedding-3-small -
配置知识库
- 进入知识库管理,创建知识库
- 导入文章、页面或自定义文本
- 等待索引完成(自动进行)
-
测试 AI 回复
- 在前台打开聊天窗口
- 发送问题,查看 AI 是否正确回答
- 根据效果调整相似度阈值和系统提示词
4. 配置人工客服
- 创建客服账号(Halo 用户)
- 进入客服工作台(插件菜单)
- 等待访客会话或接入 AI 转人工的会话
📖 详细文档
💡 使用建议
AI 优先模式(推荐)
- 启用 AI 客服,配置好知识库
- AI 自动回答常见问题(80%+)
- 复杂问题或 AI 无法处理时转人工
- 客服工作量大幅降低
纯人工模式
- 不启用 AI 客服
- 所有会话进入待接入队列
- 客服手动接入处理
混合模式
- 启用 AI 客服,但显示"转人工"按钮
- 访客可随时选择转人工
- 平衡自动化和人工服务
🛠️ 开发
环境要求
- Java 21+
- Node.js 18+
- pnpm
本地开发
# 1. 克隆项目
git clone https://github.com/你的仓库/customer-service.git
cd customer-service
# 2. 安装前端依赖
cd ui && pnpm install
cd ../packages && pnpm install
# 3. 启动 Halo 开发服务器
./gradlew haloServer
# 4. 开发前端(另一个终端)
# 管理端
cd ui && pnpm dev
# 访客端
cd packages && pnpm dev
构建
# 构建前端
cd packages && pnpm build
cd ../ui && pnpm build
# 构建插件
./gradlew build
# 产物位置
# build/libs/plugin-customer-service-{version}.jar
🎯 技术栈
后端
- Java 21 + Spring Boot (Reactive)
- Halo Plugin Framework 2.22+
- LangChain4j 0.36.2 (文档分块)
- Apache Lucene 9.11.1 (向量存储)
- HanLP 1.8.4 (中文分词)
前端
- 管理端: Vue 3.5 + TypeScript + Pinia
- 访客端: Lit 3.3 (Web Components)
- Marked 12.0 (Markdown 渲染)
- DOMPurify 3.0 (XSS 防护)
🌟 核心特性
RAG 知识库系统
- HyDE (假设文档嵌入) - 提升语义检索准确率
- 混合检索 - 向量搜索 + 关键词搜索 + RRF 融合
- Reranking - LLM 重排序提升准确率
- 查询分解 - 复杂查询自动分解
- 查询压缩 - 多轮对话压缩为独立查询
- 上下文窗口扩展 - 扩展检索结果的前后文
- 联网搜索回退 - 知识库无结果时自动搜索互联网
性能指标(v1.0.1-rc4 优化后)
- 回答准确率: +25-35%
- 回答完整性: +30-40%
- 知识覆盖率: +40-60%
- API 调用: -30-40%
- 平均延迟: -40-60ms