金子瑶

AI产品经理/Agent算法应用

查看或下载 PDF

关于我

27届硕士,深圳大学计算机科学与技术专业。曾在腾讯、百度、作业帮等公司担任AI产品/技术产品实习,专注于大模型应用落地、Agent工作流设计与智能研效平台建设。具备从需求调研到产品设计、数据驱动迭代优化的全链路经验,擅长将AI能力转化为可落地的产品方案。

专业技能

精通

Vibe-coding, Prompt工程优化, AI产品设计, 需求分析, A/B测试, 用户体验设计, n8n工作流编排, 飞书多维表格

熟练

LangChain, RAG技术栈, LangGraph, Agent工作流设计, Function Call, Multi-Agent, Neo4j, GraphRAG, 前端开发, 移动端部署

了解

大模型微调(LoRA/P-Tuning), DeepSeek, SFT训练, NLP评分策略, VLM视觉语言模型, Text2Cypher

工作经历

腾讯(深圳)有限公司

  • 技术产品 | CDG FiT 平台产品技术部
    2026.01至今

【项目一】金融知识工程体系建设

背景:金融风险管理部门存在产品文档缺失率超60%、新旧文档矛盾、知识传承依赖口口相传等痛点,新人上手周期长、跨团队协作效率低。

职责:作为技术产品实习生,负责逆向知识工程方案设计、结构化模板制定及落地推广。

核心工作

  • 设计"代码逆向推演"方案,利用 Cursor + MCP 工具链从代码仓库自动提取业务逻辑,联动 TAPD 需求文档进行知识交叉验证
  • 建立结构化知识整理模板,覆盖接口定义、业务流程、数据流向、异常处理四大维度
  • 引入置信度机制,对 AI 抽取结果标注可信度,低置信度内容标记人工复核

成果:目前已经完成 3 个核心模块的知识抽取,测试问答的内容无错误,但整体逻辑偏技术,下一步计划封装为 Skill。


【项目二】Fino 智能研效平台 - Skills 体系设计

背景:内部 AI 研效平台缺乏系统化的 Skills 能力评估体系,业务方难以选择最优 Skill,Skills 质量参差不齐。

职责:负责 Skills 体系调研、评测框架设计、最佳实践输出及内容运营工具开发。

核心工作

  • 体系梳理:系统调研业界主流开源 Skills 仓库,包括 AI agent 和 openclaw 的 Skill 的全面分类与能力边界定义
  • 评测框架设计:设计多维度评测标准(准确率、稳定性、兼容性、易用性),通过 Claude/GPT/混元等多模型交叉评测,输出最佳实践对比分析报告
  • 深度横评:重点完成 PDF、Word、Excel、PPT 四类文档处理 Skills 的横向对比,为业务选型提供数据支撑
  • 自动化评测工具(PenClaw):设计自动化评测流水线——爬取 GitHub star 高的 Skills 仓库 → 本地下载 → 自动加载评测 → 输出评分报告
  • 内容运营助手 Claw 搭建:按分类(数字分身/知识库/UI自动化/AI设计工具/模型)聚合 KM、QLearning 优质内容,自动转载至 iWiki 供 Skills 设计参考

成果:输出 Skills 评测报告 20+ 份,覆盖 7-8 个主流 Skills 仓库


【项目三】FAT-SOP Skill 设计 - 低代码工作流封装

背景:非技术团队存在大量重复性工作流(发票审核、部署报错处理等),但缺乏技术能力将其自动化,人力成本高、效率低。

职责:负责通用 SOP Skill 产品设计、模板标准化及多业务场景落地。

核心工作

  • 设计通用 SOP Skill 框架,支持非技术人员通过可视化配置将重复工作流封装为可复用 Skill
  • 定义 SOP 描述规范(触发条件 → 执行步骤 → 异常处理 → 输出格式),降低 Skill 创建门槛
  • 完成发票审核 Skill(自动识别发票信息、校验合规性、输出审批建议)、FAT 部署报错自动处理 Skill(错误日志解析、原因定位、修复建议)等多个场景落地
  • 推动与多个非技术业务团队(财务/运营/客服)对接,进行实际场景落地试验

成果:已封装 6 个 SOP Skill,正在和 3 个业务团队交流推广试用


百度(中国)有限公司

  • AI产品经理 | 百度智能云-视频云事业部
    2025.092025.12

业务背景:负责"多模态实时互动"SDK产品优化,该产品面向ToB硬件厂商(AI健康设备、AI玩具等),核心是将百度语音/视觉/大模型能力集成到智能硬件中。主要客户包括乐普(AI血压计)、真实幻想(康养机器人)、芙崽/小度熊(AI玩具)等。


【项目一】智能问答体验优化 —— 解决"问不准、答不对"的核心痛点

痛点:原有方案依赖通用意图识别,用户口语化/模糊表达时回答泛化能力差,ToC用户平均只聊5轮就放弃,客户投诉"AI听不懂人话"。

解决方案

  • 设计 Query 改写模块:针对老人口语化表达(如"那个东西帮我量一下"),改写 Prompt 将长难句重写为标准指令,结合对话上下文和用户画像进行优化
  • 优化追问策略:原方案统一回复"没听清",改为提取 Top2 意图让用户二选一,缺少参数时针对性追问(如"您想查哪一天的天气?")
  • 支持客户自建知识库:上线"上传企业私有知识库"功能,让客户导入产品说明书、高频QA等专属内容

成果:意图召回率提升显著;客户反馈用户平均会话轮数从5轮提升至8轮;乐普导入知识库后,线上客服收到"产品使用问题"咨询量每周下降约300条


【项目二】语音交互体验优化 —— 解决"回复太长用户打断"问题

痛点:康养场景中AI回复冗长,老人听不完就打断重问,语音打断率高,体验差。

解决方案:设计 A/B 测试对比不同 Prompt 的输出长度与信息密度,将康养建议平均字数缩减30%并前置核心结论

成果:用户语音打断率降低15%


【项目三】康养硬件AI能力升级 —— 从"被动播报"到"主动服务"

痛点:传统健康硬件只能读数据,用户看不懂指标含义,无法获得个性化建议。

解决方案

  • 设计"单次解读+趋势追踪"功能,将血压/体脂等结构化数据转化为拟人化健康建议
  • 建立历史趋势对比模型,自动分析指标变化斜率,异常波动时触发健康预警

成果:实现从"被动播报数据"到"主动健康管理"的产品升级


作业帮教育科技(北京)有限公司

  • AI产品经理 | 学习机部门 大模型产品组
    2025.032025.09

【项目一】AI超级老师 —— 学习机核心AI能力平台(调研→设计→落地)

背景/痛点:家长反馈学习机"AI概念大但不知道具体能帮孩子什么",售前难讲解、转化不及预期;用户调研发现:作业场景高频但AI没提供针对性方案、学科补强不如补习班。

核心工作

  • 调研阶段:追踪一期上线数据,日渗透率22%、周留存56%;访谈4位线下1对1家教,提炼核心工作流"评估学情→制定方案→带学带练→监督检查→反馈效果";输出竞品报告覆盖讯飞AI课本、小猿1v1诊断、豆包爱学讲题等
  • 设计阶段:模拟"真人1对1家教",设计作业托管(每日作业→错题分析→薄弱点强化闭环)+薄弱补强(诊断学情→推荐课包→催到课监督→学情反馈)两大模块
  • 落地阶段:协调产品、教研、技术团队完成方案评审与开发,8月中交付灰度版本

成果:灰度后日渗透率32%、周留存72%,进入学习类功能Top1梯队


【项目二】KET口语模拟测评系统 —— 从0→1构建AI口语训练产品

背景/痛点:学习机用户有大量KET口语备考需求,但传统口语练习存在真人外教成本高(1v1课时费200+/小时)、反馈不及时、练习场景单一等问题。

核心工作

  • 产品方案设计:设计"模考对话→智能评分→学情追踪"三大核心模块;针对6-12岁用户设计"友好问候→话题引导→兴趣追问→鼓励收尾"对话流程;输出20+页PRD
  • 解决"识别不准"问题:推动技术团队针对儿童语音特点优化识别方案,关键场景识别准确率从72%提升至91%
  • 解决"评分不可信"问题:参与评分模型训练全流程,制定"0-5分"评分标准(发音/语法/内容三个维度),确保AI评分与KET真实考试标准对齐

成果:上线后口语练习频率提升12%,模测完成率64%,练习时长同比增长26%


【项目三】AI背诵功能重构 —— 解决"评分不准、反馈没用"痛点

背景/痛点:原有背诵功能用户投诉集中在"明明背对了但扣分"(把发音问题当成记忆错误)和"只告诉我错了,不告诉我怎么改"(反馈没有指导价值)。

核心工作

  • 解决"误判"问题:设计双层评分策略,先判断是"记忆错误"还是"发音问题",再分别给出评分
  • 解决"反馈没用"问题:针对不同错误类型设计差异化点评话术——记忆错误推荐"再读两遍原文",发音问题推荐"跟读标准发音"

成果:低分段用户复背率提升18%


【项目四】AI诗词对话场景设计 & 客诉工单智能分析工具

  • AI诗词对话:针对李白、杜甫等不同诗人设计差异化对话风格约束,设计预设问题引导降低用户启动门槛,建立Badcase定期复盘闭环
  • 客诉工单分析:设计AI自动分类方案(Bug反馈/功能建议/无效反馈),预处理策略将口语转为标准描述,生成结构化报告

深圳清杉信息系统有限公司

  • 大模型应用开发实习生
    2024.112025.03

面向 ToB 企业内部知识助理场景,解决传统 FAQ 与规则方案在复杂意图理解、幻觉控制等方面的瓶颈。

  • 意图识别与任务路由优化:基于 DeepSeek v3 构建意图识别与路由模块,通过难负样本挖掘与 Few-shot 迭代训练,三轮优化后意图分类 F1 从 0.82 提升至 0.93
  • Multi-Agent 流程设计:基于 LangGraph 设计「意图识别 → 安全校验 → 任务拆解 → 并行工具调用 → 幻觉拦截」Agent 工作流,通过并行调用 Neo4j Text2Cypher 与 GraphRAG,将复杂知识查询平均响应时延优化至 2.1s

亚信科技(中国)有限公司

  • ToB产品经理
    2024.022024.06

负责 ToB CRM 系统 HITV 模块需求分析与产品优化,撰写 200+ 页 FPA 需求文档,梳理业务规则并推进研发落地;重构核心业务流程,解决多类高频异常问题,用户操作成功率提升 20%,有效降低系统问题与客户投诉。


实践项目

股票投资顾问Agent系统

项目介绍:针对通用大模型+网络检索方案存在的数据不一致、分析维度不足、输出不专业等问题,设计并实现了一套基于多Agent协作的智能投资顾问系统,覆盖A股4000+股票的全维度分析,工具调用成功率达98%,用户满意度接近90%。

主要工作:

  • 设计并实现了基于MCP协议的金融数据工具化方案,统一数据Schema,封装金融数据API,确保数据准确性和可追溯性,数据一致率约99%
  • 构建了ReAct框架下的多Agent协作架构,基于LangGraph实现基本面、技术面、估值、新闻四个分析Agent,支持自主调用MCP工具;由总结Agent汇总生成结构化Markdown报告
  • 训练了新闻情感与风险预测小模型,整理标注约10万条金融新闻,基于Qwen3-8B进行LoRA微调,情感/风险预测准确率分别达91%/88%
  • 设计评测体系并优化系统性能,通过并行执行与缓存策略将端到端时延从2分钟+降至90秒左右,报告生成效率提升约1.5倍
  • 参与金融专用大模型(SFT+GRPO)接入与A/B评测,引入"格式奖励+语义正确性"奖励机制,奖励较通用模型提升3–5%

教育与资质

计算机科学与技术 硕士

深圳大学, 2027

CET4: 538 | CET6: 507


计算机科学与技术 本科

江西农业大学, 2024

专业第一 | 国家奖学金 | 班级班长、兼职辅导员、学生会实践部负责人


科研经历与证书专利

图像-文本检索的不确定性感知多视图细粒度对齐方法(UMFA) | CCF-A 论文在投(2025.02-2026.01)

针对细粒度图像-文本匹配中语义交互建模不足、确定性嵌入无法表征不确定性以及假负样本干扰等问题,提出融合场景图引导生成、不确定性建模与图结构匹配的统一检索框架,在Flickr30K、MSCOCO等标准数据集上取得最优性能,并在ARO、SugarCrepe组合推理基准上显著提升细粒度理解能力。

主要工作:提出场景图引导的多粒度数据合成策略,利用Qwen-VL抽取场景语义并通过Stable Diffusion生成语义一致的图像变体,主动增强稀疏组合关系以提升模型的组合泛化能力;设计不确定性感知的细粒度对比学习模块,将区域特征建模为对角高斯分布并在概率空间执行2-Wasserstein距离匹配,结合真负样本置信度建模机制降低假负样本引发的优化偏差;引入双向图结构匹配模块,通过显式约束对象-属性-关系的跨模态一致性,有效抑制局部相似但关系冲突的错误匹配;在MSCOCO 5K测试集上T2I R@1达到64.5%,相较基线提升4.7%,在ARO关系测试任务上准确率达85.2%,超越当前最优方法,验证了生成增强与图结构匹配在困难样本挖掘方面的显著优势。

证书专利

  • "计算机硬件信息综合检测系统"软件著作权第一发明人(2021年03月)
  • "基于深度学习的灰度图像特征检测识别系统"软件著作权第一发明人(2023年07月)