关于我
27届硕士,深圳大学计算机科学与技术专业。曾在腾讯、百度、作业帮等公司担任AI产品/技术产品实习,专注于大模型应用落地、Agent工作流设计与智能研效平台建设。具备从需求调研到产品设计、数据驱动迭代优化的全链路经验,擅长将AI能力转化为可落地的产品方案。
27届硕士,深圳大学计算机科学与技术专业。曾在腾讯、百度、作业帮等公司担任AI产品/技术产品实习,专注于大模型应用落地、Agent工作流设计与智能研效平台建设。具备从需求调研到产品设计、数据驱动迭代优化的全链路经验,擅长将AI能力转化为可落地的产品方案。
Vibe-coding, Prompt工程优化, AI产品设计, 需求分析, A/B测试, 用户体验设计, n8n工作流编排, 飞书多维表格
LangChain, RAG技术栈, LangGraph, Agent工作流设计, Function Call, Multi-Agent, Neo4j, GraphRAG, 前端开发, 移动端部署
大模型微调(LoRA/P-Tuning), DeepSeek, SFT训练, NLP评分策略, VLM视觉语言模型, Text2Cypher
【项目一】金融知识工程体系建设
背景:金融风险管理部门存在产品文档缺失率超60%、新旧文档矛盾、知识传承依赖口口相传等痛点,新人上手周期长、跨团队协作效率低。
职责:作为技术产品实习生,负责逆向知识工程方案设计、结构化模板制定及落地推广。
核心工作:
成果:目前已经完成 3 个核心模块的知识抽取,测试问答的内容无错误,但整体逻辑偏技术,下一步计划封装为 Skill。
【项目二】Fino 智能研效平台 - Skills 体系设计
背景:内部 AI 研效平台缺乏系统化的 Skills 能力评估体系,业务方难以选择最优 Skill,Skills 质量参差不齐。
职责:负责 Skills 体系调研、评测框架设计、最佳实践输出及内容运营工具开发。
核心工作:
成果:输出 Skills 评测报告 20+ 份,覆盖 7-8 个主流 Skills 仓库
【项目三】FAT-SOP Skill 设计 - 低代码工作流封装
背景:非技术团队存在大量重复性工作流(发票审核、部署报错处理等),但缺乏技术能力将其自动化,人力成本高、效率低。
职责:负责通用 SOP Skill 产品设计、模板标准化及多业务场景落地。
核心工作:
成果:已封装 6 个 SOP Skill,正在和 3 个业务团队交流推广试用
业务背景:负责"多模态实时互动"SDK产品优化,该产品面向ToB硬件厂商(AI健康设备、AI玩具等),核心是将百度语音/视觉/大模型能力集成到智能硬件中。主要客户包括乐普(AI血压计)、真实幻想(康养机器人)、芙崽/小度熊(AI玩具)等。
【项目一】智能问答体验优化 —— 解决"问不准、答不对"的核心痛点
痛点:原有方案依赖通用意图识别,用户口语化/模糊表达时回答泛化能力差,ToC用户平均只聊5轮就放弃,客户投诉"AI听不懂人话"。
解决方案:
成果:意图召回率提升显著;客户反馈用户平均会话轮数从5轮提升至8轮;乐普导入知识库后,线上客服收到"产品使用问题"咨询量每周下降约300条
【项目二】语音交互体验优化 —— 解决"回复太长用户打断"问题
痛点:康养场景中AI回复冗长,老人听不完就打断重问,语音打断率高,体验差。
解决方案:设计 A/B 测试对比不同 Prompt 的输出长度与信息密度,将康养建议平均字数缩减30%并前置核心结论
成果:用户语音打断率降低15%
【项目三】康养硬件AI能力升级 —— 从"被动播报"到"主动服务"
痛点:传统健康硬件只能读数据,用户看不懂指标含义,无法获得个性化建议。
解决方案:
成果:实现从"被动播报数据"到"主动健康管理"的产品升级
【项目一】AI超级老师 —— 学习机核心AI能力平台(调研→设计→落地)
背景/痛点:家长反馈学习机"AI概念大但不知道具体能帮孩子什么",售前难讲解、转化不及预期;用户调研发现:作业场景高频但AI没提供针对性方案、学科补强不如补习班。
核心工作:
成果:灰度后日渗透率32%、周留存72%,进入学习类功能Top1梯队
【项目二】KET口语模拟测评系统 —— 从0→1构建AI口语训练产品
背景/痛点:学习机用户有大量KET口语备考需求,但传统口语练习存在真人外教成本高(1v1课时费200+/小时)、反馈不及时、练习场景单一等问题。
核心工作:
成果:上线后口语练习频率提升12%,模测完成率64%,练习时长同比增长26%
【项目三】AI背诵功能重构 —— 解决"评分不准、反馈没用"痛点
背景/痛点:原有背诵功能用户投诉集中在"明明背对了但扣分"(把发音问题当成记忆错误)和"只告诉我错了,不告诉我怎么改"(反馈没有指导价值)。
核心工作:
成果:低分段用户复背率提升18%
【项目四】AI诗词对话场景设计 & 客诉工单智能分析工具
面向 ToB 企业内部知识助理场景,解决传统 FAQ 与规则方案在复杂意图理解、幻觉控制等方面的瓶颈。
负责 ToB CRM 系统 HITV 模块需求分析与产品优化,撰写 200+ 页 FPA 需求文档,梳理业务规则并推进研发落地;重构核心业务流程,解决多类高频异常问题,用户操作成功率提升 20%,有效降低系统问题与客户投诉。
项目介绍:针对通用大模型+网络检索方案存在的数据不一致、分析维度不足、输出不专业等问题,设计并实现了一套基于多Agent协作的智能投资顾问系统,覆盖A股4000+股票的全维度分析,工具调用成功率达98%,用户满意度接近90%。
主要工作:
CET4: 538 | CET6: 507
专业第一 | 国家奖学金 | 班级班长、兼职辅导员、学生会实践部负责人
图像-文本检索的不确定性感知多视图细粒度对齐方法(UMFA) | CCF-A 论文在投(2025.02-2026.01)
针对细粒度图像-文本匹配中语义交互建模不足、确定性嵌入无法表征不确定性以及假负样本干扰等问题,提出融合场景图引导生成、不确定性建模与图结构匹配的统一检索框架,在Flickr30K、MSCOCO等标准数据集上取得最优性能,并在ARO、SugarCrepe组合推理基准上显著提升细粒度理解能力。
主要工作:提出场景图引导的多粒度数据合成策略,利用Qwen-VL抽取场景语义并通过Stable Diffusion生成语义一致的图像变体,主动增强稀疏组合关系以提升模型的组合泛化能力;设计不确定性感知的细粒度对比学习模块,将区域特征建模为对角高斯分布并在概率空间执行2-Wasserstein距离匹配,结合真负样本置信度建模机制降低假负样本引发的优化偏差;引入双向图结构匹配模块,通过显式约束对象-属性-关系的跨模态一致性,有效抑制局部相似但关系冲突的错误匹配;在MSCOCO 5K测试集上T2I R@1达到64.5%,相较基线提升4.7%,在ARO关系测试任务上准确率达85.2%,超越当前最优方法,验证了生成增强与图结构匹配在困难样本挖掘方面的显著优势。
证书专利