Files
xsynergy-android/prd.md
2025-09-16 22:52:31 +08:00

14 KiB
Raw Permalink Blame History

AR远程协作APP (代号Synergy Lens) - 产品需求文档 (PRD)

1. 产品概述 (Product Overview)

1.1 产品简介

XSynergy是一款面向企业用户的AR远程协作应用。它通过结合实时音视频、增强现实AR标注和人工智能AI技术使一线现场人员能够与远程专家进行“身临其境”的互动高效解决复杂问题旨在打破地理限制降低差旅成本提升协作效率和知识传承。

1.2 目标用户 (Target Audience)

  • 一线现场人员 (Field Technician):如设备维修工程师、产线操作员、医疗巡检人员。他们需要实时、精准的远程指导。
  • 远程专家 (Remote Expert):如资深技术专家、产品设计师、医疗顾问。他们需要清晰地了解现场情况并提供精确指令。
  • 项目/团队管理者 (Manager):需要监督协作过程、回顾协作内容、管理团队知识。

1.3 核心目标 (Goals)

  • 提升问题解决效率通过AR标注和实时音视频将专家指导的平均解决时间缩短30%。
  • 降低运营成本减少专家差旅需求预计每年可为企业节省20%的相关费用。
  • 赋能一线员工通过AI知识库和会议回放帮助一线人员快速成长沉淀组织知识。

2. 功能需求详述 (Functional Requirements)

2.1 用户与账户模块 (User & Account)

  • FR-2.1.1 用户登录
    • 用户故事作为一名企业员工我希望可以通过我的企业账号如SSO、手机号/验证码安全地登录APP以便访问我的协作空间和组织信息。
    • 功能描述
      1. 支持手机号+验证码登录方式。
      2. 支持企业单点登录SSO登录企业LDAP账户。
      3. 提供“记住我”功能,保持登录状态。
      4. 包含“忘记密码”流程针对非SSO用户
    • 验收标准用户可以成功登录并进入APP主界面登录失败时有明确的错误提示。
  • FR-2.1.2 用户登出
    • 用户故事作为一名用户我希望能从APP中安全退出登录以保护我的账户信息。
    • 功能描述:在“我的”或“设置”页面提供“退出登录”按钮,点击后清除本地登录凭证并返回登录页面。
    • 验收标准:用户点击退出后,无法在未重新登录的情况下访问需要授权的页面。

2.2 协作会话模块 (Collaboration Session)

  • FR-2.2.1 发起即时协作
    • 用户故事:作为一名现场技术员,当我遇到紧急问题时,我希望能立即向组织内的专家发起视频协作请求。
    • 功能描述
      1. 主界面提供“发起协作”入口。
      2. 用户可以从组织架构中选择一位或多位成员发起呼叫。
      3. 被呼叫方会收到系统推送通知,可选择接听或拒绝。
    • 验收标准:呼叫成功发起,被叫方能收到通知并进行响应。
  • FR-2.2.2 预约协作
    • 用户故事:作为一名项目经理,我希望能提前预约一个多方协作会议,并设定主题、时间和参与人,系统能自动提醒相关人员。
    • 功能描述
      1. 提供“预约协作”功能入口。
      2. 用户可设置会议主题、选择开始/结束时间、添加参会人员、填写会议描述。
      3. 预约成功后系统向所有参会人发送日历邀请和APP内通知。
      4. 在会议开始前15分钟系统再次发送提醒通知。以日历提醒和APP内消息推送的方式
    • 验收标准预约信息准确无误所有参会人能按时收到通知和提醒。考虑到国内安卓手机限制较多且接口不统一APP内部推送消息无法在手机端弹出提醒的话不视为功能实现失败。
  • FR-2.2.3 邀请与加入
    • 用户故事:作为会议发起人,我希望能通过链接或一个简单的会议码,快速邀请组织外或未在联系人列表中的人加入协作。
    • 功能描述
      1. 每个协作会话即时或预约都生成一个唯一的分享链接和一个6位数字的会议码。
      2. 用户可以通过社交应用(微信、钉钉等)分享链接(分享为链接复制,形式同腾讯会议)。
      3. APP主界面提供“加入协作”入口用户可输入6位会议码加入。
      4. 通过链接加入时自动拉起APP并进入会议。
    • 验收标准:用户可以通过链接和会议码两种方式成功加入指定的协作会议。

2.3 协作中功能模块 (In-Session Features)

  • FR-2.3.1 基础音视频控制
    • 用户故事:作为参会者,我希望能自由控制自己的麦克风和摄像头,以便在需要时静音或关闭画面。
    • 功能描述:会议界面提供清晰的图标按钮,用于一键禁用/启用麦克风和摄像头。图标状态需明确反映当前设备状态(开/关)。
    • 验收标准:用户可以随时开启或关闭自己的音视频输入,其他参会者能实时看到状态变化。
  • FR-2.3.2 AR标注协作
    • 用户故事作为远程专家我希望能在我方屏幕上对现场人员传输回来的实时视频画面进行3D空间标注如画箭头、框选且标注能稳定地附着在现实物体上以便清晰地指示操作位置。
    • 功能描述
      1. 提供多种标注工具:箭头、自由曲线、矩形框。
      2. 支持选择不同颜色进行标注。
      3. 标注内容通过AR技术“冻结”在三维空间中即使用户移动摄像头标注也会停留在原来的物理位置上。
      4. 提供“清除”按钮,可清除自己或全部的标注。
    • 验收标准AR标注延迟低跟踪稳定在现场人员视角中清晰可见。
  • FR-2.3.3 白板涂鸦协作
    • 用户故事:作为参会者,当我们需要讨论流程图或进行头脑风暴时,我希望能打开一个共享的虚拟白板,所有人都可以在上面实时涂鸦和书写。
    • 功能描述
      1. 会议中可开启“白板模式”,视频画面切换为共享白板。
      2. 提供画笔、文本输入、形状工具和橡皮擦。
      3. 所有参会者的操作实时同步。
      4. 支持白板内容截图保存。
    • 验收标准:白板操作流畅,同步延迟低,所有用户看到的内容完全一致。
  • FR-2.3.4 激光笔标注
    • 用户故事:作为远程专家,我希望能有一个激光笔工具,在我讲解时,可以在对方的视频画面上实时指示出我正在关注的点,而不会留下永久标记。
    • 功能描述提供“激光笔”工具。专家在自己屏幕上长按并移动手指或在web端长按鼠标进行拖动现场人员的屏幕上会实时显示一个跟随移动的光点或小图标。手指松开后光点消失。
    • 验收标准:激光笔指示实时同步,无明显延迟,能准确传达专家意图。
  • FR-2.3.5 屏幕共享
    • 用户故事作为参会者我希望能将我的手机屏幕内容共享给会议中的其他人以便展示APP操作或数据图表。
    • 功能描述
      1. 提供“屏幕共享”功能按钮。
      2. 用户授权后,将其整个手机屏幕或指定应用画面作为视频流发送给其他参会者。
      3. 共享期间,屏幕边缘有明显提示(如红色边框),告知用户正在共享。
    • 验收标准:屏幕共享画面清晰流畅,其他用户可以正常观看。
  • FR-2.3.6 文件共享与播放
    • 用户故事作为专家我希望能向现场人员发送技术手册PDF/Word或操作演示视频MP4并能在会议中共同观看和讨论。
    • 功能描述
      1. 提供“发送文件”功能支持从本地上传PDF, Word, MP4等格式文件。
      2. 文件发送给指定的一位或全部参会者。
      3. 接收方收到文件后可下载到本地。
      4. 发起方可以开启“共同播放”模式,所有人的界面上会同步播放该视频或展示该文档,并支持翻页、暂停等同步操作。(此功能需要讨论,非优先项)
    • 验收标准:文件能成功发送和接收;共同播放/阅览时,所有人的视图保持同步。

2.4 AI能力模块 (AI Capabilities)

  • FR-2.4.1 实时语音转文字与会议纪要
    • 用户故事:作为一名参会者,我希望能看到实时的语音转文字字幕,并在会后自动生成一份包含关键决策和待办事项的会议纪要,以减少我的记录工作。
    • 功能描述
      1. 会议中可开启“实时字幕”功能,将所有人的发言实时转化为文字显示在屏幕上。
      2. 会议结束后AI自动处理录音生成结构化的会议纪要包括会议摘要、议题列表、关键决策、待办事项Action Items及负责人。
      3. 会议纪要与会议回放关联,存储在历史记录中。
    • 验收标准语音转文字准确率不低于90%;会议纪要能准确提炼核心信息。
  • FR-2.4.2 AI知识库查询
    • 用户故事:作为现场人员,在协作过程中,我希望能通过一个对话框,快速查询公司内部知识库(如设备故障手册、标准操作流程),以便快速找到参考信息。
    • 功能描述
      1. 会议中界面提供一个“AI助手”入口点击或语音激活后在左侧弹出对话框。
      2. 提供弹出显示对话框显示,提供“收回”按钮控制对话框隐藏
      3. 用户输入自然语言问题如“E-101泵的常见故障代码及解决方案”
      4. AI助手基于后台接入的企业知识库进行检索并以对话形式返回最相关的答案和文档链接。
      5. 在底部导航中加入“AI助手”入口供用户非会议时间使用。
    • 验收标准AI助手能理解用户意图并从知识库中返回准确、相关的答案。

2.5 其他模块 (Miscellaneous)

  • FR-2.5.1 会议回放
    • 用户故事作为一名项目经理或未能参会的人员我希望能随时查看历史会议的完整录像包含AR标注以便复盘问题或了解会议内容。
    • 功能描述
      1. 所有协作会话默认开启云端录制。
      2. 用户可以在“历史记录”中找到过去的会议列表。
      3. 点击即可播放会议录像录像需完整重现当时的视频、音频、AR标注、白板、文件共享等所有协作信息。
    • 验收标准:回放内容与实际协作过程完全一致,播放流畅。
  • FR-2.5.2 组织架构查看
    • 用户故事:作为一名员工,我希望能方便地查看公司的组织架构树,快速找到并联系到我需要的同事。
    • 功能描述
      1. 提供“通讯录”或“组织”入口。
      2. 以树状结构展示公司部门和人员。
      3. 支持按姓名、部门、职位进行搜索。
      4. 点击人员可查看其联系方式并直接发起协作。
    • 验收标准:组织架构数据准确,搜索功能可用,能快速定位到目标同事。
  • FR-2.5.3 会议纪要
    • 用户故事:作为一名项目经理或未能参会的人员,我希望能随时查看历史会议的会议纪要,以便了解会议摘要、关键决策、待办事项。
    • 功能描述
      1. 所有协作会话可以手动开启/关闭AI会议纪要功能。
      2. 用户可以在“历史记录”中找到过去的会议列表。
      3. 点击卡片式列表中“会议纪要”按钮,即可打开“会议纪要”页面查看纪要,纪要需完整包含参会人、会议开始时间和结束时间、会议摘要、关键决策、待办事项。
      4. 纪要页面提供“查看回放”按钮,提供会议回放功能。
    • 验收标准:回放内容与实际协作过程完全一致,播放流畅。

3. 非功能性需求 (Non-Functional Requirements)

  • NF-3.1 性能 (Performance)
    • 音视频通话延迟低于200ms。
    • AR标注跟踪刷新率不低于30fps。
    • APP冷启动时间小于3秒。
  • NF-3.2 兼容性 (Compatibility)
    • 支持Android 8.0及以上版本。
    • 要求设备支持ARCore。
  • NF-3.3 安全性 (Security)
    • 所有通信数据(音视频、信令、文件)均采用端到端加密。
    • 用户数据存储符合GDPR或相关数据保护法规。
  • NF-3.4 用户体验 (Usability)
    • 界面设计简洁直观,关键操作按钮尺寸足够大,易于在移动或工业环境中单手操作。
    • 网络不稳定时,应优先保证音频清晰度,并有明确的网络状态提示。

4. 设计与AI集成指南 (Design & AI Integration)

  • UI/UE设计指南
    • 核心原则信息降噪聚焦于协作视图。避免不必要的UI元素干扰现场人员的视线。
    • AR交互AR标注工具栏应设计为可收缩式默认最小化。标注的视觉效果应有足够的对比度以适应各种复杂的现场环境光线。
    • 手势操作:考虑引入简单的手势操作,如双击屏幕清除最后一次标注,以提升操作效率。
  • AI模型集成指南
    • 语音转文字 (STT):需选用或训练针对特定行业术语(如机械、医疗)进行优化的模型,以提高识别准确率。模型需在端侧或低延迟的云端运行,保证实时性。
    • 会议纪要生成采用大语言模型LLM进行文本摘要和信息提取。模型需被调整以准确识别“决策”、“任务分配”等关键意图。
    • 知识库查询建议采用RAG检索增强生成架构。后端需建立高效的文档索引前端AI助手通过语义搜索匹配最相关的知识片段并由LLM整合后生成自然语言答案。