jzy的个人主页

工作经历

腾讯(深圳)有限公司

技术产品 | CDG FiT 平台产品技术部
2026.01–至今

【项目一】金融知识工程体系建设

背景：金融风险管理部门存在产品文档缺失率超60%、新旧文档矛盾、知识传承依赖口口相传等痛点，新人上手周期长、跨团队协作效率低。

职责：作为技术产品实习生，负责逆向知识工程方案设计、结构化模板制定及落地推广。

核心工作：

设计"代码逆向推演"方案，利用 Cursor + MCP 工具链从代码仓库自动提取业务逻辑，联动 TAPD 需求文档进行知识交叉验证
建立结构化知识整理模板，覆盖接口定义、业务流程、数据流向、异常处理四大维度
引入置信度机制，对 AI 抽取结果标注可信度，低置信度内容标记人工复核

成果：目前已经完成 3 个核心模块的知识抽取，测试问答的内容无错误，但整体逻辑偏技术，下一步计划封装为 Skill。

【项目二】Fino 智能研效平台 - Skills 体系设计

背景：内部 AI 研效平台缺乏系统化的 Skills 能力评估体系，业务方难以选择最优 Skill，Skills 质量参差不齐。

职责：负责 Skills 体系调研、评测框架设计、最佳实践输出及内容运营工具开发。

核心工作：

体系梳理：系统调研业界主流开源 Skills 仓库，包括 AI agent 和 openclaw 的 Skill 的全面分类与能力边界定义
评测框架设计：设计多维度评测标准（准确率、稳定性、兼容性、易用性），通过 Claude/GPT/混元等多模型交叉评测，输出最佳实践对比分析报告
深度横评：重点完成 PDF、Word、Excel、PPT 四类文档处理 Skills 的横向对比，为业务选型提供数据支撑
自动化评测工具（PenClaw）：设计自动化评测流水线——爬取 GitHub star 高的 Skills 仓库 → 本地下载 → 自动加载评测 → 输出评分报告
内容运营助手 Claw 搭建：按分类（数字分身/知识库/UI自动化/AI设计工具/模型）聚合 KM、QLearning 优质内容，自动转载至 iWiki 供 Skills 设计参考

成果：输出 Skills 评测报告 20+ 份，覆盖 7-8 个主流 Skills 仓库

【项目三】FAT-SOP Skill 设计 - 低代码工作流封装

背景：非技术团队存在大量重复性工作流（发票审核、部署报错处理等），但缺乏技术能力将其自动化，人力成本高、效率低。

职责：负责通用 SOP Skill 产品设计、模板标准化及多业务场景落地。

核心工作：

设计通用 SOP Skill 框架，支持非技术人员通过可视化配置将重复工作流封装为可复用 Skill
定义 SOP 描述规范（触发条件 → 执行步骤 → 异常处理 → 输出格式），降低 Skill 创建门槛
完成发票审核 Skill（自动识别发票信息、校验合规性、输出审批建议）、FAT 部署报错自动处理 Skill（错误日志解析、原因定位、修复建议）等多个场景落地
推动与多个非技术业务团队（财务/运营/客服）对接，进行实际场景落地试验

成果：已封装 6 个 SOP Skill，正在和 3 个业务团队交流推广试用

百度(中国)有限公司

AI产品经理 | 百度智能云-视频云事业部
2025.09–2025.12

业务背景：负责"多模态实时互动"SDK产品优化，该产品面向ToB硬件厂商（AI健康设备、AI玩具等），核心是将百度语音/视觉/大模型能力集成到智能硬件中。主要客户包括乐普（AI血压计）、真实幻想（康养机器人）、芙崽/小度熊（AI玩具）等。

【项目一】智能问答体验优化 —— 解决"问不准、答不对"的核心痛点

痛点：原有方案依赖通用意图识别，用户口语化/模糊表达时回答泛化能力差，ToC用户平均只聊5轮就放弃，客户投诉"AI听不懂人话"。

解决方案：

设计 Query 改写模块：针对老人口语化表达（如"那个东西帮我量一下"），改写 Prompt 将长难句重写为标准指令，结合对话上下文和用户画像进行优化
优化追问策略：原方案统一回复"没听清"，改为提取 Top2 意图让用户二选一，缺少参数时针对性追问（如"您想查哪一天的天气？"）
支持客户自建知识库：上线"上传企业私有知识库"功能，让客户导入产品说明书、高频QA等专属内容

成果：意图召回率提升显著；客户反馈用户平均会话轮数从5轮提升至8轮；乐普导入知识库后，线上客服收到"产品使用问题"咨询量每周下降约300条

【项目二】语音交互体验优化 —— 解决"回复太长用户打断"问题

痛点：康养场景中AI回复冗长，老人听不完就打断重问，语音打断率高，体验差。

解决方案：设计 A/B 测试对比不同 Prompt 的输出长度与信息密度，将康养建议平均字数缩减30%并前置核心结论

成果：用户语音打断率降低15%

【项目三】康养硬件AI能力升级 —— 从"被动播报"到"主动服务"

痛点：传统健康硬件只能读数据，用户看不懂指标含义，无法获得个性化建议。

解决方案：

设计"单次解读+趋势追踪"功能，将血压/体脂等结构化数据转化为拟人化健康建议
建立历史趋势对比模型，自动分析指标变化斜率，异常波动时触发健康预警

成果：实现从"被动播报数据"到"主动健康管理"的产品升级

作业帮教育科技(北京)有限公司

AI产品经理 | 学习机部门大模型产品组
2025.03–2025.09

【项目一】AI超级老师 —— 学习机核心AI能力平台（调研→设计→落地）

背景/痛点：家长反馈学习机"AI概念大但不知道具体能帮孩子什么"，售前难讲解、转化不及预期；用户调研发现：作业场景高频但AI没提供针对性方案、学科补强不如补习班。

核心工作：

调研阶段：追踪一期上线数据，日渗透率22%、周留存56%；访谈4位线下1对1家教，提炼核心工作流"评估学情→制定方案→带学带练→监督检查→反馈效果"；输出竞品报告覆盖讯飞AI课本、小猿1v1诊断、豆包爱学讲题等
设计阶段：模拟"真人1对1家教"，设计作业托管（每日作业→错题分析→薄弱点强化闭环）+薄弱补强（诊断学情→推荐课包→催到课监督→学情反馈）两大模块
落地阶段：协调产品、教研、技术团队完成方案评审与开发，8月中交付灰度版本

成果：灰度后日渗透率32%、周留存72%，进入学习类功能Top1梯队

【项目二】KET口语模拟测评系统 —— 从0→1构建AI口语训练产品

背景/痛点：学习机用户有大量KET口语备考需求，但传统口语练习存在真人外教成本高（1v1课时费200+/小时）、反馈不及时、练习场景单一等问题。

核心工作：

产品方案设计：设计"模考对话→智能评分→学情追踪"三大核心模块；针对6-12岁用户设计"友好问候→话题引导→兴趣追问→鼓励收尾"对话流程；输出20+页PRD
解决"识别不准"问题：推动技术团队针对儿童语音特点优化识别方案，关键场景识别准确率从72%提升至91%
解决"评分不可信"问题：参与评分模型训练全流程，制定"0-5分"评分标准（发音/语法/内容三个维度），确保AI评分与KET真实考试标准对齐

成果：上线后口语练习频率提升12%，模测完成率64%，练习时长同比增长26%

【项目三】AI背诵功能重构 —— 解决"评分不准、反馈没用"痛点

背景/痛点：原有背诵功能用户投诉集中在"明明背对了但扣分"（把发音问题当成记忆错误）和"只告诉我错了，不告诉我怎么改"（反馈没有指导价值）。

核心工作：

解决"误判"问题：设计双层评分策略，先判断是"记忆错误"还是"发音问题"，再分别给出评分
解决"反馈没用"问题：针对不同错误类型设计差异化点评话术——记忆错误推荐"再读两遍原文"，发音问题推荐"跟读标准发音"

成果：低分段用户复背率提升18%

【项目四】AI诗词对话场景设计 & 客诉工单智能分析工具

AI诗词对话：针对李白、杜甫等不同诗人设计差异化对话风格约束，设计预设问题引导降低用户启动门槛，建立Badcase定期复盘闭环
客诉工单分析：设计AI自动分类方案（Bug反馈/功能建议/无效反馈），预处理策略将口语转为标准描述，生成结构化报告

深圳清杉信息系统有限公司

大模型应用开发实习生
2024.11–2025.03

面向 ToB 企业内部知识助理场景，解决传统 FAQ 与规则方案在复杂意图理解、幻觉控制等方面的瓶颈。

意图识别与任务路由优化：基于 DeepSeek v3 构建意图识别与路由模块，通过难负样本挖掘与 Few-shot 迭代训练，三轮优化后意图分类 F1 从 0.82 提升至 0.93
Multi-Agent 流程设计：基于 LangGraph 设计「意图识别 → 安全校验 → 任务拆解 → 并行工具调用 → 幻觉拦截」Agent 工作流，通过并行调用 Neo4j Text2Cypher 与 GraphRAG，将复杂知识查询平均响应时延优化至 2.1s

亚信科技（中国）有限公司

ToB产品经理
2024.02–2024.06

负责 ToB CRM 系统 HITV 模块需求分析与产品优化，撰写 200+ 页 FPA 需求文档，梳理业务规则并推进研发落地；重构核心业务流程，解决多类高频异常问题，用户操作成功率提升 20%，有效降低系统问题与客户投诉。

实践项目

股票投资顾问Agent系统

项目介绍：针对通用大模型+网络检索方案存在的数据不一致、分析维度不足、输出不专业等问题，设计并实现了一套基于多Agent协作的智能投资顾问系统，覆盖A股4000+股票的全维度分析，工具调用成功率达98%，用户满意度接近90%。

主要工作：

设计并实现了基于MCP协议的金融数据工具化方案，统一数据Schema，封装金融数据API，确保数据准确性和可追溯性，数据一致率约99%
构建了ReAct框架下的多Agent协作架构，基于LangGraph实现基本面、技术面、估值、新闻四个分析Agent，支持自主调用MCP工具；由总结Agent汇总生成结构化Markdown报告
训练了新闻情感与风险预测小模型，整理标注约10万条金融新闻，基于Qwen3-8B进行LoRA微调，情感/风险预测准确率分别达91%/88%
设计评测体系并优化系统性能，通过并行执行与缓存策略将端到端时延从2分钟+降至90秒左右，报告生成效率提升约1.5倍
参与金融专用大模型（SFT+GRPO）接入与A/B评测，引入"格式奖励+语义正确性"奖励机制，奖励较通用模型提升3–5%

教育与资质

计算机科学与技术硕士

深圳大学, 2027

CET4: 538 | CET6: 507

计算机科学与技术本科

江西农业大学, 2024

专业第一 | 国家奖学金 | 班级班长、兼职辅导员、学生会实践部负责人

科研经历与证书专利

图像-文本检索的不确定性感知多视图细粒度对齐方法（UMFA） | CCF-A 论文在投（2025.02-2026.01）

针对细粒度图像-文本匹配中语义交互建模不足、确定性嵌入无法表征不确定性以及假负样本干扰等问题，提出融合场景图引导生成、不确定性建模与图结构匹配的统一检索框架，在Flickr30K、MSCOCO等标准数据集上取得最优性能，并在ARO、SugarCrepe组合推理基准上显著提升细粒度理解能力。

主要工作：提出场景图引导的多粒度数据合成策略，利用Qwen-VL抽取场景语义并通过Stable Diffusion生成语义一致的图像变体，主动增强稀疏组合关系以提升模型的组合泛化能力；设计不确定性感知的细粒度对比学习模块，将区域特征建模为对角高斯分布并在概率空间执行2-Wasserstein距离匹配，结合真负样本置信度建模机制降低假负样本引发的优化偏差；引入双向图结构匹配模块，通过显式约束对象-属性-关系的跨模态一致性，有效抑制局部相似但关系冲突的错误匹配；在MSCOCO 5K测试集上T2I R@1达到64.5%，相较基线提升4.7%，在ARO关系测试任务上准确率达85.2%，超越当前最优方法，验证了生成增强与图结构匹配在困难样本挖掘方面的显著优势。

证书专利

"计算机硬件信息综合检测系统"软件著作权第一发明人（2021年03月）
"基于深度学习的灰度图像特征检测识别系统"软件著作权第一发明人（2023年07月）

金子瑶

AI产品经理/Agent算法应用

关于我

联系方式

专业技能

精通

熟练

了解

工作经历

腾讯(深圳)有限公司

百度(中国)有限公司

作业帮教育科技(北京)有限公司

深圳清杉信息系统有限公司

亚信科技（中国）有限公司

实践项目

股票投资顾问Agent系统

教育与资质

计算机科学与技术硕士

计算机科学与技术本科

科研经历与证书专利

关于我

联系方式

专业技能

精通

熟练

了解

工作经历

腾讯(深圳)有限公司

百度(中国)有限公司

作业帮教育科技(北京)有限公司

深圳清杉信息系统有限公司

亚信科技（中国）有限公司

实践项目

股票投资顾问Agent系统

教育与资质

计算机科学与技术 硕士

计算机科学与技术 本科

科研经历与证书专利

计算机科学与技术硕士

计算机科学与技术本科