14 KiB
14 KiB
AR远程协作APP (代号:Synergy Lens) - 产品需求文档 (PRD)
1. 产品概述 (Product Overview)
1.1 产品简介
XSynergy是一款面向企业用户的AR远程协作应用。它通过结合实时音视频、增强现实(AR)标注和人工智能(AI)技术,使一线现场人员能够与远程专家进行“身临其境”的互动,高效解决复杂问题,旨在打破地理限制,降低差旅成本,提升协作效率和知识传承。
1.2 目标用户 (Target Audience)
- 一线现场人员 (Field Technician):如设备维修工程师、产线操作员、医疗巡检人员。他们需要实时、精准的远程指导。
- 远程专家 (Remote Expert):如资深技术专家、产品设计师、医疗顾问。他们需要清晰地了解现场情况并提供精确指令。
- 项目/团队管理者 (Manager):需要监督协作过程、回顾协作内容、管理团队知识。
1.3 核心目标 (Goals)
- 提升问题解决效率:通过AR标注和实时音视频,将专家指导的平均解决时间缩短30%。
- 降低运营成本:减少专家差旅需求,预计每年可为企业节省20%的相关费用。
- 赋能一线员工:通过AI知识库和会议回放,帮助一线人员快速成长,沉淀组织知识。
2. 功能需求详述 (Functional Requirements)
2.1 用户与账户模块 (User & Account)
- FR-2.1.1 用户登录
- 用户故事:作为一名企业员工,我希望可以通过我的企业账号(如SSO、手机号/验证码)安全地登录APP,以便访问我的协作空间和组织信息。
- 功能描述:
- 支持手机号+验证码登录方式。
- 支持企业单点登录(SSO),登录企业LDAP账户。
- 提供“记住我”功能,保持登录状态。
- 包含“忘记密码”流程(针对非SSO用户)。
- 验收标准:用户可以成功登录并进入APP主界面;登录失败时有明确的错误提示。
- FR-2.1.2 用户登出
- 用户故事:作为一名用户,我希望能从APP中安全退出登录,以保护我的账户信息。
- 功能描述:在“我的”或“设置”页面提供“退出登录”按钮,点击后清除本地登录凭证并返回登录页面。
- 验收标准:用户点击退出后,无法在未重新登录的情况下访问需要授权的页面。
2.2 协作会话模块 (Collaboration Session)
- FR-2.2.1 发起即时协作
- 用户故事:作为一名现场技术员,当我遇到紧急问题时,我希望能立即向组织内的专家发起视频协作请求。
- 功能描述:
- 主界面提供“发起协作”入口。
- 用户可以从组织架构中选择一位或多位成员发起呼叫。
- 被呼叫方会收到系统推送通知,可选择接听或拒绝。
- 验收标准:呼叫成功发起,被叫方能收到通知并进行响应。
- FR-2.2.2 预约协作
- 用户故事:作为一名项目经理,我希望能提前预约一个多方协作会议,并设定主题、时间和参与人,系统能自动提醒相关人员。
- 功能描述:
- 提供“预约协作”功能入口。
- 用户可设置会议主题、选择开始/结束时间、添加参会人员、填写会议描述。
- 预约成功后,系统向所有参会人发送日历邀请和APP内通知。
- 在会议开始前15分钟,系统再次发送提醒通知。(以日历提醒和APP内消息推送的方式)
- 验收标准:预约信息准确无误,所有参会人能按时收到通知和提醒。(考虑到国内安卓手机限制较多且接口不统一,APP内部推送消息无法在手机端弹出提醒的话,不视为功能实现失败。)
- FR-2.2.3 邀请与加入
- 用户故事:作为会议发起人,我希望能通过链接或一个简单的会议码,快速邀请组织外或未在联系人列表中的人加入协作。
- 功能描述:
- 每个协作会话(即时或预约)都生成一个唯一的分享链接和一个6位数字的会议码。
- 用户可以通过社交应用(微信、钉钉等)分享链接(分享为链接复制,形式同腾讯会议)。
- APP主界面提供“加入协作”入口,用户可输入6位会议码加入。
- 通过链接加入时,自动拉起APP并进入会议。
- 验收标准:用户可以通过链接和会议码两种方式成功加入指定的协作会议。
2.3 协作中功能模块 (In-Session Features)
- FR-2.3.1 基础音视频控制
- 用户故事:作为参会者,我希望能自由控制自己的麦克风和摄像头,以便在需要时静音或关闭画面。
- 功能描述:会议界面提供清晰的图标按钮,用于一键禁用/启用麦克风和摄像头。图标状态需明确反映当前设备状态(开/关)。
- 验收标准:用户可以随时开启或关闭自己的音视频输入,其他参会者能实时看到状态变化。
- FR-2.3.2 AR标注协作
- 用户故事:作为远程专家,我希望能在我方屏幕上,对现场人员传输回来的实时视频画面进行3D空间标注(如画箭头、框选),且标注能稳定地附着在现实物体上,以便清晰地指示操作位置。
- 功能描述:
- 提供多种标注工具:箭头、自由曲线、矩形框。
- 支持选择不同颜色进行标注。
- 标注内容通过AR技术“冻结”在三维空间中,即使用户移动摄像头,标注也会停留在原来的物理位置上。
- 提供“清除”按钮,可清除自己或全部的标注。
- 验收标准:AR标注延迟低,跟踪稳定,在现场人员视角中清晰可见。
- FR-2.3.3 白板涂鸦协作
- 用户故事:作为参会者,当我们需要讨论流程图或进行头脑风暴时,我希望能打开一个共享的虚拟白板,所有人都可以在上面实时涂鸦和书写。
- 功能描述:
- 会议中可开启“白板模式”,视频画面切换为共享白板。
- 提供画笔、文本输入、形状工具和橡皮擦。
- 所有参会者的操作实时同步。
- 支持白板内容截图保存。
- 验收标准:白板操作流畅,同步延迟低,所有用户看到的内容完全一致。
- FR-2.3.4 激光笔标注
- 用户故事:作为远程专家,我希望能有一个激光笔工具,在我讲解时,可以在对方的视频画面上实时指示出我正在关注的点,而不会留下永久标记。
- 功能描述:提供“激光笔”工具。专家在自己屏幕上长按并移动手指(或在web端长按鼠标进行拖动),现场人员的屏幕上会实时显示一个跟随移动的光点或小图标。手指松开后光点消失。
- 验收标准:激光笔指示实时同步,无明显延迟,能准确传达专家意图。
- FR-2.3.5 屏幕共享
- 用户故事:作为参会者,我希望能将我的手机屏幕内容共享给会议中的其他人,以便展示APP操作或数据图表。
- 功能描述:
- 提供“屏幕共享”功能按钮。
- 用户授权后,将其整个手机屏幕或指定应用画面作为视频流发送给其他参会者。
- 共享期间,屏幕边缘有明显提示(如红色边框),告知用户正在共享。
- 验收标准:屏幕共享画面清晰流畅,其他用户可以正常观看。
- FR-2.3.6 文件共享与播放
- 用户故事:作为专家,我希望能向现场人员发送技术手册(PDF/Word)或操作演示视频(MP4),并能在会议中共同观看和讨论。
- 功能描述:
- 提供“发送文件”功能,支持从本地上传PDF, Word, MP4等格式文件。
- 文件发送给指定的一位或全部参会者。
- 接收方收到文件后可下载到本地。
- 发起方可以开启“共同播放”模式,所有人的界面上会同步播放该视频或展示该文档,并支持翻页、暂停等同步操作。(此功能需要讨论,非优先项)
- 验收标准:文件能成功发送和接收;共同播放/阅览时,所有人的视图保持同步。
2.4 AI能力模块 (AI Capabilities)
- FR-2.4.1 实时语音转文字与会议纪要
- 用户故事:作为一名参会者,我希望能看到实时的语音转文字字幕,并在会后自动生成一份包含关键决策和待办事项的会议纪要,以减少我的记录工作。
- 功能描述:
- 会议中可开启“实时字幕”功能,将所有人的发言实时转化为文字显示在屏幕上。
- 会议结束后,AI自动处理录音,生成结构化的会议纪要,包括:会议摘要、议题列表、关键决策、待办事项(Action Items)及负责人。
- 会议纪要与会议回放关联,存储在历史记录中。
- 验收标准:语音转文字准确率不低于90%;会议纪要能准确提炼核心信息。
- FR-2.4.2 AI知识库查询
- 用户故事:作为现场人员,在协作过程中,我希望能通过一个对话框,快速查询公司内部知识库(如设备故障手册、标准操作流程),以便快速找到参考信息。
- 功能描述:
- 会议中界面提供一个“AI助手”入口,点击或语音激活后在左侧弹出对话框。
- 提供弹出显示对话框显示,提供“收回”按钮控制对话框隐藏
- 用户输入自然语言问题(如“E-101泵的常见故障代码及解决方案”)。
- AI助手基于后台接入的企业知识库进行检索,并以对话形式返回最相关的答案和文档链接。
- 在底部导航中加入“AI助手”入口,供用户非会议时间使用。
- 验收标准:AI助手能理解用户意图,并从知识库中返回准确、相关的答案。
2.5 其他模块 (Miscellaneous)
- FR-2.5.1 会议回放
- 用户故事:作为一名项目经理或未能参会的人员,我希望能随时查看历史会议的完整录像(包含AR标注),以便复盘问题或了解会议内容。
- 功能描述:
- 所有协作会话默认开启云端录制。
- 用户可以在“历史记录”中找到过去的会议列表。
- 点击即可播放会议录像,录像需完整重现当时的视频、音频、AR标注、白板、文件共享等所有协作信息。
- 验收标准:回放内容与实际协作过程完全一致,播放流畅。
- FR-2.5.2 组织架构查看
- 用户故事:作为一名员工,我希望能方便地查看公司的组织架构树,快速找到并联系到我需要的同事。
- 功能描述:
- 提供“通讯录”或“组织”入口。
- 以树状结构展示公司部门和人员。
- 支持按姓名、部门、职位进行搜索。
- 点击人员可查看其联系方式并直接发起协作。
- 验收标准:组织架构数据准确,搜索功能可用,能快速定位到目标同事。
- FR-2.5.3 会议纪要
- 用户故事:作为一名项目经理或未能参会的人员,我希望能随时查看历史会议的会议纪要,以便了解会议摘要、关键决策、待办事项。
- 功能描述:
- 所有协作会话可以手动开启/关闭AI会议纪要功能。
- 用户可以在“历史记录”中找到过去的会议列表。
- 点击卡片式列表中“会议纪要”按钮,即可打开“会议纪要”页面查看纪要,纪要需完整包含参会人、会议开始时间和结束时间、会议摘要、关键决策、待办事项。
- 纪要页面提供“查看回放”按钮,提供会议回放功能。
- 验收标准:回放内容与实际协作过程完全一致,播放流畅。
3. 非功能性需求 (Non-Functional Requirements)
- NF-3.1 性能 (Performance)
- 音视频通话延迟低于200ms。
- AR标注跟踪刷新率不低于30fps。
- APP冷启动时间小于3秒。
- NF-3.2 兼容性 (Compatibility)
- 支持Android 8.0及以上版本。
- 要求设备支持ARCore。
- NF-3.3 安全性 (Security)
- 所有通信数据(音视频、信令、文件)均采用端到端加密。
- 用户数据存储符合GDPR或相关数据保护法规。
- NF-3.4 用户体验 (Usability)
- 界面设计简洁直观,关键操作按钮尺寸足够大,易于在移动或工业环境中单手操作。
- 网络不稳定时,应优先保证音频清晰度,并有明确的网络状态提示。
4. 设计与AI集成指南 (Design & AI Integration)
- UI/UE设计指南:
- 核心原则:信息降噪,聚焦于协作视图。避免不必要的UI元素干扰现场人员的视线。
- AR交互:AR标注工具栏应设计为可收缩式,默认最小化。标注的视觉效果应有足够的对比度,以适应各种复杂的现场环境光线。
- 手势操作:考虑引入简单的手势操作,如双击屏幕清除最后一次标注,以提升操作效率。
- AI模型集成指南:
- 语音转文字 (STT):需选用或训练针对特定行业术语(如机械、医疗)进行优化的模型,以提高识别准确率。模型需在端侧或低延迟的云端运行,保证实时性。
- 会议纪要生成:采用大语言模型(LLM)进行文本摘要和信息提取。模型需被调整以准确识别“决策”、“任务分配”等关键意图。
- 知识库查询:建议采用RAG(检索增强生成)架构。后端需建立高效的文档索引,前端AI助手通过语义搜索匹配最相关的知识片段,并由LLM整合后生成自然语言答案。