毕文帅

NLP算法工程师 / AI大模型开发工程师 / Agent开发工程师

biwenshuai1992@gmail.comEmail简书Botblog.app

Education

哈尔滨工业大学

2011.09 — 2015.06

本科 / 学士学位

Experience

九坤投资算力业务线高级AI应用开发工程师

2025/11 — 至今

负责企业级Agent平台、企业级上下文系统与大规模数据处理系统的设计和开发。
围绕业务意图、编排、技能和上下文四层架构构建企业级AI应用能力。
推动多模态混合检索、上下文压缩、权限管理和企业知识库自动化建设落地。

华大基因研究院自然语言处理高级工程师

2021/08 — 2024/10

负责生信分析Agent系统、时空客服问答系统、文章辅助写作系统和大模型应用基础服务模块等项目。
结合Agent、RAG、GraphRAG、向量模型微调、rerank模型微调等技术提升科研与生信场景智能化效率。
参与子痫前期预测、多组学模型融合等科研项目，产出SCI论文和发明专利。

诺基亚上海贝尔科技NLP算法工程师

2018/08 — 2021/08

负责电信与能源场景中的NLP、机器学习、知识图谱和预测建模项目。
完成深圳能源烟气预测、北京移动NPS满意度预测、北京移动告警根因分析、浙江移动供应链知识图谱构建等项目。
通过数据挖掘、图查询封装、质量监控与告警能力，支撑业务分析和流程问题发现。

中国石油集团数据库开发工程师

2015/07 — 2018/07

从事数据库开发相关工作，积累企业级数据系统开发经验。

Projects

企业级上下文系统设计以及构建企业AI平台

2026.1 — 2026.4

项目描述：将企业大量复杂非结构化信息，包括品牌内容、用户反馈、项目文档、创意过程与策略判断等，转化为可以被理解、被调用、被持续演化的上下文。
技术实现：企业知识库自动化构建，内容进入系统后自动识别、标注与结构化，从文件存储升级为语义化上下文网络。
技术实现：通过多模态混合检索打造企业专属决策知识引擎，并实现上下文压缩与渐进式披露。
技术实现：构建严格权限管理能力，使不同团队、项目和角色拥有差异化上下文管理权限。

企业级Agent平台开发企业AI平台

2025.11 — 2026.04

项目描述：基于Ironclaw打造企业级Agent平台，适配大部分企业使用场景，提高企业销量。
技术实现：构建意图层、编排层、技能层、上下文层四层架构。
编排层围绕业务意图进行发散式推理，将任务拆解为多条候选执行路径，并基于质量、成本与时延约束进行动态评估。
技能层覆盖内容生成、OA系统、智能运维和智能研究；上下文层依托企业级上下文系统承载并持续演进企业关键资产。

大规模数据处理系统数据工程 / LLM数据处理

2025.11 — 2026.04

项目描述：将约90T PDF数据转化为模型可训练的数据。
技术实现：构建大规模数据处理框架，包括状态管理、错误重试、异常识别等模块。
基于MinerU 2.5识别PDF中的文本、表格、图片和公式。
基于置信度对识别不准确模块进行标注，并使用大模型重新识别低置信度内容。

生信分析Agent系统开发生信AI / Agent系统

2024.12 — 2025.03

已部署线上，并得到客户技术团队好评

项目描述：用户输入生信相关数据或生信任务后，大模型自动进行任务拆解和任务运行。
技术实现：构建SupervisorAgent、PlanningAgent、CodeAgent、SearchAgent等多Agent系统框架。
CoreAgent将生信分析工具自动封装成MCP Server。
使用GraphRAG技术辅助生信相关代码生成，并基于生信领域语料微调工具调用模型。
整体框架基于LangGraph实现。

时空客服问答系统智能客服 / RAG

2024.03 — 2024.10

已部署线上，可以完全替代人工

项目描述：具备时空组学相关背景知识，同时能够回答时空云平台相关的各类问题。
技术实现：结合Agent和RAG技术提升客服系统整体泛化能力。
负责知识库构建和优化处理、生信领域向量模型微调、rerank模型微调。
采用混合检索技术和图增强技术提升回答准确率，并支持文本和图表输出。

文章辅助写作系统科研写作 / Agentic RAG

2024.01 — 2024.05

已部署上线，显著提升科研人员综述撰写效率和research效率

项目描述：帮助用户自动撰写生物相关领域综述文章。
技术实现：构建文献数据库、文献知识抽取流程和文献知识图谱。
设计资料收集Agent、OutlineAgent、WriteAgent、润色Agent。
实现准确知识检索模块，整体框架基于LangChain，Agentic RAG基于LlamaIndex。

子痫前期预测模型（科研）科研 / 医疗AI

2023.03 — 2024.05

发表SCI论文两篇，系统部署于广东省妇幼保健院

项目描述：对孕早期女性进行子痫风险预测，辅助提前治疗和保护。
项目总结：基于多模型融合推理提高预测准确率。

大模型应用基础服务模块LLM基础设施

2023.02 — 2024.03

显著简化大模型应用开发流程，提高开发效率

项目描述：统一API服务模块、prompt版本管理器、问答QA测试工具集、自动微调调度器、QA问答数据挖掘和大模型服务调用监控器。
项目总结：为大模型应用开发提供基础服务能力。

多组学模型融合（科研）科研 / 多组学

2021.11 — 2022.05

癌症预测准确率提高5个百分点，发表SCI一篇，发表专利一篇

项目描述：将不同组学的底层数据采用融合算法进行融合，提高下游任务准确率。

深圳能源烟气预测项目工业预测建模

2020.11 — 2021.05

线上运行结果：10%正负误差准确率达到80.5%，20%正负误差达到99.6%

项目描述：基于垃圾焚烧数据预测未来十分钟NOX和HCL值，并对现有数据进行数据质量实时监控和告警。

北京移动NPS满意度预测机器学习 / NLP

未注明

精准率0.6，召回率0.1，业务更关注精准率

项目描述：基于机器学习和NLP技术进行NPS满意度预测。

北京移动告警根因分析数据挖掘

2021.03 — 2021.05

已部署线上，帮助专家方便定位根因告警

项目描述：基于数据挖掘技术进行告警根因分析。

浙江移动供应链知识图谱构建知识图谱

2020.09 — 2021.01

项目描述：构建浙江移动供应链知识图谱，用于发现供应链流程问题和供应链可视化。
项目总结：预先封装基于图的查询语句，便于流程各环节查询、识别和发现问题。

近三年发表的论文与专利论文 / 专利

2022 — 2025

Bi W., Ma, Y., et al. (2024). An entity extraction pipeline for medical text records using large language models. JMIR, 26, e54580. DOI: 10.2196/54580.
Wang, L., Bi, W., et al. (2024). Investigating the impact of prompt engineering on the performance of large language models for standardizing obstetric diagnosis text: Comparative study. JMIR Formative Research, 8, e53216. DOI: 10.2196/53216.
Wang, L., Ma, Y., Bi, W., et al. (2024). An early screening model for preeclampsia: Utilizing zero-cost maternal predictors exclusively. Hypertens Res, 47(4), 1051-1062. DOI:10.1038/s41440-023-01573-8.
Huang R, Yao Y, Tong X, et al., Bi W, et al. (2023). Tracing the evolving dynamics and research hotspots of microbiota and immune microenvironment. Microbiol Spectr, 11(5), e0013523. DOI:10.1128/spectrum.00135-23.
Bi W, Huang R, Yao Y, Tong X, et al. (2025). Robust multi-omics subtyping of hepatocellular carcinoma. Manuscript in preparation.
毕文帅, 王雷, 等. (2023). 多源数据融合方法及装置. 中国发明专利（已公开）, 公开号CN119229962A.
毕文帅, 王雷, 等. (2022). 妊娠期风险预测方法及装置. 中国发明专利（已公开）, 公开号CN118262905A.

企业级Agent平台开发

基于Ironclaw打造企业级Agent平台，适配企业场景并提升业务销售效率。

企业级上下文系统设计以及构建

将品牌内容、用户反馈、项目文档、创意过程与策略判断转化为可理解、可调用、可演化的企业上下文。

生信分析Agent系统开发

用户输入生信相关数据或任务后，系统自动进行任务拆解、工具调用与任务运行。

Skills

大模型与LLM开发:

精通大型语言模型开发，熟悉Transformer架构、自监督学习、指令微调、模型量化等技术。, 熟练使用Hugging Face、LangChain、LlamaIndex等工具和框架。, 具备Qwen、LLaMA、DeepSeek等开源模型应用与调优经验，熟练掌握prompt优化技巧。

Agent与多Agent系统:

精通LLM应用开发和Agent开发技术栈，熟练使用LangGraph、AutoGen、CAMEL等框架。, 掌握Planning、Memory、Tools模块化构建方法，能够设计复杂任务规划、长期记忆管理和工具调用机制。, 熟练掌握MCP相关技能，能够构建高效协作的多Agent系统。

模型定制与推理优化:

熟悉Embedding、Fine-tuning、LoRA、QLoRA、量化(INT8/INT4)等大模型定制化技术。, 熟练使用PyTorch、Hugging Face Transformers、PEFT、DeepSpeed、vLLM等训练与推理加速技术。, 具备模型压缩与性能优化经验。

评测、RAG与知识平台:

熟悉大模型评估方法与指标，能够构建包含自动化评测和人工评测流程的完整评测体系。, 熟悉Milvus、Pinecone、Chroma等向量数据库和知识库构建技术。, 能够开发高效的检索增强生成(RAG)系统与企业级知识平台，掌握Graph RAG技术提升知识关联性和推理能力。

个人优势与社区贡献:

开源社区贡献者，llama3中文版开源贡献者，prompt管理插件开源共享者，langmanus代码贡献者。, 简书签约作者（机器学习、深度学习方向），Botblog.app作者，AgentShare作者。, 对AI相关技术有极大兴趣和热情，学习能力、动手能力、组织能力和抗压能力强。

毕文帅

NLP算法工程师 / AI大模型开发工程师 / Agent开发工程师

biwenshuai1992@gmail.comEmail简书Botblog.app

Education

哈尔滨工业大学

2011.09 — 2015.06

本科 / 学士学位

Experience

九坤投资算力业务线高级AI应用开发工程师

2025/11 — 至今

负责企业级Agent平台、企业级上下文系统与大规模数据处理系统的设计和开发。
围绕业务意图、编排、技能和上下文四层架构构建企业级AI应用能力。
推动多模态混合检索、上下文压缩、权限管理和企业知识库自动化建设落地。

华大基因研究院自然语言处理高级工程师

2021/08 — 2024/10

负责生信分析Agent系统、时空客服问答系统、文章辅助写作系统和大模型应用基础服务模块等项目。
结合Agent、RAG、GraphRAG、向量模型微调、rerank模型微调等技术提升科研与生信场景智能化效率。
参与子痫前期预测、多组学模型融合等科研项目，产出SCI论文和发明专利。

诺基亚上海贝尔科技NLP算法工程师

2018/08 — 2021/08

负责电信与能源场景中的NLP、机器学习、知识图谱和预测建模项目。
完成深圳能源烟气预测、北京移动NPS满意度预测、北京移动告警根因分析、浙江移动供应链知识图谱构建等项目。
通过数据挖掘、图查询封装、质量监控与告警能力，支撑业务分析和流程问题发现。

中国石油集团数据库开发工程师

2015/07 — 2018/07

从事数据库开发相关工作，积累企业级数据系统开发经验。

Projects

企业级上下文系统设计以及构建企业AI平台

2026.1 — 2026.4

项目描述：将企业大量复杂非结构化信息，包括品牌内容、用户反馈、项目文档、创意过程与策略判断等，转化为可以被理解、被调用、被持续演化的上下文。
技术实现：企业知识库自动化构建，内容进入系统后自动识别、标注与结构化，从文件存储升级为语义化上下文网络。
技术实现：通过多模态混合检索打造企业专属决策知识引擎，并实现上下文压缩与渐进式披露。
技术实现：构建严格权限管理能力，使不同团队、项目和角色拥有差异化上下文管理权限。

企业级Agent平台开发企业AI平台

2025.11 — 2026.04

项目描述：基于Ironclaw打造企业级Agent平台，适配大部分企业使用场景，提高企业销量。
技术实现：构建意图层、编排层、技能层、上下文层四层架构。
编排层围绕业务意图进行发散式推理，将任务拆解为多条候选执行路径，并基于质量、成本与时延约束进行动态评估。
技能层覆盖内容生成、OA系统、智能运维和智能研究；上下文层依托企业级上下文系统承载并持续演进企业关键资产。

大规模数据处理系统数据工程 / LLM数据处理

2025.11 — 2026.04

项目描述：将约90T PDF数据转化为模型可训练的数据。
技术实现：构建大规模数据处理框架，包括状态管理、错误重试、异常识别等模块。
基于MinerU 2.5识别PDF中的文本、表格、图片和公式。
基于置信度对识别不准确模块进行标注，并使用大模型重新识别低置信度内容。

生信分析Agent系统开发生信AI / Agent系统

2024.12 — 2025.03

已部署线上，并得到客户技术团队好评

项目描述：用户输入生信相关数据或生信任务后，大模型自动进行任务拆解和任务运行。
技术实现：构建SupervisorAgent、PlanningAgent、CodeAgent、SearchAgent等多Agent系统框架。
CoreAgent将生信分析工具自动封装成MCP Server。
使用GraphRAG技术辅助生信相关代码生成，并基于生信领域语料微调工具调用模型。
整体框架基于LangGraph实现。

时空客服问答系统智能客服 / RAG

2024.03 — 2024.10

已部署线上，可以完全替代人工

项目描述：具备时空组学相关背景知识，同时能够回答时空云平台相关的各类问题。
技术实现：结合Agent和RAG技术提升客服系统整体泛化能力。
负责知识库构建和优化处理、生信领域向量模型微调、rerank模型微调。
采用混合检索技术和图增强技术提升回答准确率，并支持文本和图表输出。

文章辅助写作系统科研写作 / Agentic RAG

2024.01 — 2024.05

已部署上线，显著提升科研人员综述撰写效率和research效率

项目描述：帮助用户自动撰写生物相关领域综述文章。
技术实现：构建文献数据库、文献知识抽取流程和文献知识图谱。
设计资料收集Agent、OutlineAgent、WriteAgent、润色Agent。
实现准确知识检索模块，整体框架基于LangChain，Agentic RAG基于LlamaIndex。

子痫前期预测模型（科研）科研 / 医疗AI

2023.03 — 2024.05

发表SCI论文两篇，系统部署于广东省妇幼保健院

项目描述：对孕早期女性进行子痫风险预测，辅助提前治疗和保护。
项目总结：基于多模型融合推理提高预测准确率。

大模型应用基础服务模块LLM基础设施

2023.02 — 2024.03

显著简化大模型应用开发流程，提高开发效率

项目描述：统一API服务模块、prompt版本管理器、问答QA测试工具集、自动微调调度器、QA问答数据挖掘和大模型服务调用监控器。
项目总结：为大模型应用开发提供基础服务能力。

多组学模型融合（科研）科研 / 多组学

2021.11 — 2022.05

癌症预测准确率提高5个百分点，发表SCI一篇，发表专利一篇

项目描述：将不同组学的底层数据采用融合算法进行融合，提高下游任务准确率。

深圳能源烟气预测项目工业预测建模

2020.11 — 2021.05

线上运行结果：10%正负误差准确率达到80.5%，20%正负误差达到99.6%

项目描述：基于垃圾焚烧数据预测未来十分钟NOX和HCL值，并对现有数据进行数据质量实时监控和告警。

北京移动NPS满意度预测机器学习 / NLP

未注明

精准率0.6，召回率0.1，业务更关注精准率

项目描述：基于机器学习和NLP技术进行NPS满意度预测。

北京移动告警根因分析数据挖掘

2021.03 — 2021.05

已部署线上，帮助专家方便定位根因告警

项目描述：基于数据挖掘技术进行告警根因分析。

浙江移动供应链知识图谱构建知识图谱

2020.09 — 2021.01

项目描述：构建浙江移动供应链知识图谱，用于发现供应链流程问题和供应链可视化。
项目总结：预先封装基于图的查询语句，便于流程各环节查询、识别和发现问题。

近三年发表的论文与专利论文 / 专利

2022 — 2025

Bi W., Ma, Y., et al. (2024). An entity extraction pipeline for medical text records using large language models. JMIR, 26, e54580. DOI: 10.2196/54580.
Wang, L., Bi, W., et al. (2024). Investigating the impact of prompt engineering on the performance of large language models for standardizing obstetric diagnosis text: Comparative study. JMIR Formative Research, 8, e53216. DOI: 10.2196/53216.
Wang, L., Ma, Y., Bi, W., et al. (2024). An early screening model for preeclampsia: Utilizing zero-cost maternal predictors exclusively. Hypertens Res, 47(4), 1051-1062. DOI:10.1038/s41440-023-01573-8.
Huang R, Yao Y, Tong X, et al., Bi W, et al. (2023). Tracing the evolving dynamics and research hotspots of microbiota and immune microenvironment. Microbiol Spectr, 11(5), e0013523. DOI:10.1128/spectrum.00135-23.
Bi W, Huang R, Yao Y, Tong X, et al. (2025). Robust multi-omics subtyping of hepatocellular carcinoma. Manuscript in preparation.
毕文帅, 王雷, 等. (2023). 多源数据融合方法及装置. 中国发明专利（已公开）, 公开号CN119229962A.
毕文帅, 王雷, 等. (2022). 妊娠期风险预测方法及装置. 中国发明专利（已公开）, 公开号CN118262905A.

企业级Agent平台开发

基于Ironclaw打造企业级Agent平台，适配企业场景并提升业务销售效率。

企业级上下文系统设计以及构建

将品牌内容、用户反馈、项目文档、创意过程与策略判断转化为可理解、可调用、可演化的企业上下文。

生信分析Agent系统开发

用户输入生信相关数据或任务后，系统自动进行任务拆解、工具调用与任务运行。

Skills

大模型与LLM开发:

Agent与多Agent系统:

模型定制与推理优化:

评测、RAG与知识平台:

个人优势与社区贡献: