高宇辰
AI 应用研发 · 全栈 · 智能体与 RAG
Education
西交利物浦大学
2024-09 — 2026-04硕士, 人机交互
聊城大学
2018-09 — 2022-06学士(季羡林学院荣誉学士), 软件工程
Experience
上海叠纸互娱网络科技有限公司AI 应用研发实习生
2025-05 — 至今- 负责公司内部 ComfyUI 的定制化开发与维护、AIGC Web 中台的前后端开发和维护,通过 Docker、Kubernetes (k8s) 部署和管理 ComfyUI 工具实例及相关服务;
- 负责公司内部 AIGC Web 中台的前后端开发和维护,实现权限控制、自定义工作流调用及相关服务;
- 参与内部大语言模型项目的调研、前后端系统开发和 RAG 服务集成,支持模型管理与调度;
- PaperHub(11月 -- 至今):负责模型 API 中转计费系统的开发(FastAPI、Python、SQLAlchemy、Redis、Docker、Milvus、React、TypeScript),实现上游提供商渠道管理配置和分配、模型计费和用量审计,采用 TDD 驱动开发;
- AI 招聘 Agent Demo(11月 -- 至今):封装 DeepSeek、豆包、通义千问等多家大模型 API,实现统一的 LLMService 抽象层,支持 SSE 流式输出,实现 Function Calling 工具调用,采用 Vercel AI SDK Streaming Protocol 协议;
- AI 招聘 Agent Demo:基于 Milvus 向量数据库构建完整 RAG pipeline,对比评估阿里云 text-embedding-v4 与本地 MiniLM 模型性能,集成 Rerank 重排序算法提升检索准确率,实现语义搜索 Top-K 召回与相似度阈值过滤;
- AI 招聘 Agent Demo:开发 Function Calling 工具注册机制,将 RAG 检索能力封装为 LLM 可调用工具,实现主动知识库查询、文档添加等 Agent 功能,通过 JSON Schema 约束工具参数和返回格式;
- 叠纸 AI 小助手(5月 -- 至今):负责聊天界面、侧边栏、历史会话、收藏、知识库等核心模块开发,构建 30+ 可复用组件库,实现完整的暗黑/明亮主题系统;
- 叠纸 AI 小助手:基于 markdown-it 开发深度思考过程可视化插件、公式转换插件、参考来源上下文渲染插件;
- 叠纸 AI 小助手:参与知识库模块重构,开发用户/部门权限管理界面,支持白名单、管理员批量操作功能;
- 叠纸 AI 小助手:实现对话分享图片生成、收藏管理等功能;
- PaperArt(7-10月):开发模型管理和案例管理完整功能模块,设计并实现 ManagerPage、ManagerDetailForm 等通用组件体系,代码复用率提升 40%;
- PaperArt:实现分页+查询状态保留机制,开发默认排序系统;
- PaperArt:开发 ModelUploader 和 CoverUploader 组件,统一图片上传格式限制;
飞利浦健康科技(中国)有限公司R&D Intern, 软件研究与开发实习生
2025-01 — 2025-05- 开发实验室管理系统 SmartLab,实现苏州、班加罗尔、阿姆斯特丹三地实验室资源的统一管理与自动化调度;
- 采用 Python + FastAPI 构建后端服务,使用 Docker 实现容器化部署;
- 基于 Vite + React + Valtio + Tailwind 技术栈开发前端,实现高效组件化开发;
- 实现多语言、多时区支持,集成 SAML SSO2 企业级单点登录,提升系统安全性;
- 整合 Power BI 数据可视化和 Power Automate 工作流自动化,优化资源管理效率;
- 系统成功上线后显著提升实验室资源利用率,减少人工审批时间,实现管理流程数字化转型。
昆山中创软件工程股份有限公司软件开发工程师、技术经理助理
2022-07 — 2024-04- 工程工具包:开发了各种开发环境和工具的 CLI 模板及插件,如 eslint、stylelint、prettier、husky、lint-staged、commitlint 等;构建了 B 端应用的公共 UI 组件和工具库,包括表单编辑器、签名组件、报表生成器等;
- 低代码编辑和渲染器:开发了基于 Web 的 B 端低代码编辑渲染器,使用 Vue.js 和 JSON Schema 设计动态表单生成系统,集成 ECharts 进行数据可视化,并支持模板导入/导出功能以便复用;
- DevOps 流水线:使用 Docker、Jenkins 和 GitLab 构建了容器化的 DevOps 流水线,优化了部门的构建、部署和测试流程;集成 Nexus 用于私有包分发,提升了 CI/CD 流程的效率;
- 数据大屏编辑渲染器:参与开发了数据可视化编辑渲染器,支持拖拽、动态缩放等交互功能,并与外部数据源进行了集成,优化了大规模数据展示的体验;
- 框架与工具优化:主导从 Vue 2 到 Vue 3 的迁移,优化了内部组件库,管理 Monorepo 项目,简化了依赖关系和版本控制。
Projects
AI 招聘 Agent Demo (叠纸互娱)work
2025-11 — 至今- 多模型 LLM 集成:封装 DeepSeek、豆包、通义千问等多家大模型 API,实现统一的 LLMService 抽象层,支持 SSE 流式输出,实现 Function Calling 工具调用,采用 Vercel AI SDK Streaming Protocol 协议,设计灵活的系统提示词工程和模块化工具框架;
- RAG 检索增强生成:基于 Milvus 向量数据库构建完整 RAG pipeline,对比评估阿里云 text-embedding-v4 与本地 MiniLM 模型性能,集成 Rerank 重排序算法提升检索准确率,实现语义搜索 Top-K 召回与相似度阈值过滤;
- AI 工具链与 Agent:开发 Function Calling 工具注册机制,将 RAG 检索能力封装为 LLM 可调用工具,实现主动知识库查询、文档添加等 Agent 功能,通过 JSON Schema 约束工具参数和返回格式;
- 全栈工程化:前端采用 TypeScript、React 18+ Hooks & Context 现代架构,Vite 构建优化,后端使用 uv 包管理器,Docker Compose 编排 Milvus/MinIO/etcd 服务栈,建立完整的 AI 应用开发工程体系;
- 后端架构设计:设计模块化 Service 服务层架构,使用 FastAPI 构建 12+ 路由模块,SQLAlchemy ORM 设计多表关联模型;实现高并发异步带进度回调的批量数据处理,实现飞书招聘数据同步。
PaperHub — 模型 API 中转计费系统 (叠纸互娱)work
2025-11 — 至今- 上游提供商渠道管理配置和分配;
- 模型计费和用量审计;
- TDD 驱动开发。
叠纸 AI 小助手 (通用 LLM 对话平台)work
2025-05 — 至今- UI/UX 架构设计:负责聊天界面、侧边栏、历史会话、收藏、知识库等核心模块开发,构建 30+ 可复用组件库,实现完整的暗黑/明亮主题系统;
- Markdown 渲染引擎:基于 markdown-it 开发深度思考过程可视化插件、公式转换插件、参考来源上下文渲染插件,提升内容展示的专业性和交互体验;
- 知识库权限管理:参与知识库模块重构,开发用户/部门权限管理界面,支持白名单、管理员批量操作功能;
- 分享与收藏系统:实现对话分享图片生成、收藏管理等功能,通过组件化设计提升代码复用率和维护效率。
PaperArt — ComfyUI Web 工作流管理出图平台work
2025-07 — 2025-10- 管理后台重构:开发模型管理和案例管理完整功能模块,设计并实现 ManagerPage、ManagerDetailForm 等通用组件体系,代码复用率提升 40%;
- 分页与状态管理:实现分页+查询状态保留机制,开发默认排序系统,通过前端状态持久化提升用户体验;
- 文件上传系统:开发 ModelUploader 和 CoverUploader 组件,统一图片上传格式限制,增强系统安全性。
2024-09 — 2025-01
- 浏览器 AI:为验证 WebGPU 能力,开发基于 Web Worker 实现的完全离线 AI 对话和语音转录功能,在浏览器端直接运行大语言模型(Llama 3.2)、Whisper 实时转录模型;
- 语音处理:集成 OpenAI Whisper 模型进行实时语音识别,支持多语言转录,通过 WebAssembly 和 Web Audio API 优化性能;
- 性能优化:模块化架构设计,通过 React.lazy 实现按需加载,优化首屏性能,通过 WebGPU 加速实现 15-30 tokens/秒的推理速度;
- 用户体验:支持 Service Worker 实现的 PWA 安装,提供原生应用的 headless 体验。
2025-08 — 2025-09
- 全栈开发:开发完整的 Quote/0 墨水屏设备 API 演示平台,实现设备管理和图像 API 功能的完整展示;
- 图像处理:实现多种抖动算法(Floyd-Steinberg、有序抖动等),支持实时图像发送到墨水屏设备;
- 系统架构:采用现代化全栈架构,前端使用 React 组件化开发,后端集成 Cloudflare KV 数据存储,实现完整的 RESTful API 设计;
- 功能特性:包含设备注册、配置管理、错误处理机制、用户权限验证和响应式设计,为开发者提供完整的 Quote/0 设备 API 集成参考。
tRPC + Prisma 全栈应用脚手架personal
2024-11 — 2025-09- 类型安全:构建现代化全栈 TypeScript 应用脚手架,采用 tRPC 提供端到端类型安全的数据通信,结合 Prisma ORM 进行数据库操作;
- 核心功能:支持用户管理、LLM 多轮对话、点数充值系统等核心功能模块,通过 context-hook、use-hook、component 三层封装简化逻辑;
- 开发工具链:包含完善的开发工具链,支持 E2E 测试(Playwright)、单元测试(Vitest)、代码规范检查等;
- 生产级别:支持 CI/CD 流程,为快速构建生产级应用提供可靠的技术基础架构。
SmartLab (飞利浦 R&D 实习)work
2025-01 — 2025-05- 开发实验室管理系统 SmartLab,实现苏州、班加罗尔、阿姆斯特丹三地实验室资源的统一管理与自动化调度;
- 采用 Python + FastAPI 构建后端服务,使用 Docker 实现容器化部署;
- 基于 Vite + React + Valtio + Tailwind 技术栈开发前端,实现高效组件化开发;
- 实现多语言、多时区支持,集成 SAML SSO2 企业级单点登录,提升系统安全性;
- 整合 Power BI 数据可视化和 Power Automate 工作流自动化,优化资源管理效率;
- 系统成功上线后显著提升实验室资源利用率,减少人工审批时间,实现管理流程数字化转型。
ai-paper (AI 写作帮) — AI 文章大纲内容生成助理freelance
2024-04 — 2024-08- 全栈开发:负责开发前端样式与用户界面,设计用户交互流程,包括步骤导航与大纲编辑、改写、上下文续写、扩充等模块化功能;后端实现任务排队处理与数据管理;
- 流式输出:实现 OpenAI 兼容接口的流式 / 非流式输出 API 解析,JSON 格式化输出;
- 大纲编辑器:扩展基于 BlockNote / ProseMirror 的 Markdown 在线大纲和文本内容 WYSIWYG 编辑器,允许用户轻松创建、修改和管理文章大纲,支持层级拖拽。
2024-10 — 2025-01
- 西交利物浦大学 Heritage, Entertaiment, and Reality (HER) Lab 项目;
- 通过增强现实 (AR) 技术展示文化遗产,使用 Unity 和 Three.js 开发 3D 场景;
- 负责将大语言模型 (LLM) 对话体验整合到 AR 场景中,实现对话互动;
- 研究并优化 AR 环境中的多模态交互,确保信息传达和交互的合理性和直观性;
- 成果:基于 AR 技术的双塔罗汉塔遗址虚拟场景,用户可通过智能对话了解历史背景和文化细节。
ARDE — 增强现实对话体验中显示位置对用户交互频率的影响 (XJTLU HER Lab)academic
2024-10 — 2024-12- 西交利物浦大学 Heritage, Entertaiment, and Reality (HER) Lab 课程项目;
- 项目目标:针对苏州双塔正殿遗址开展用户研究,研究在文化遗产环境中,增强现实对话体验 (ARDE) 的显示位置对用户交互频率的影响,假设将对话集成到 AR 场景中会比全屏显示更能提高用户参与度;
- 设计与实现:设计并采用 React Three Fiber 开发了一个 ARDE 系统,该系统包括 AR 实现部分、对话式 AI 调参组件和一个 RAG 知识库;
- 系统评估:进行用户研究 (N=8),比较了两种显示位置(对话全屏和集成到 AR 场景中)下的用户交互频率;结果表明,与全屏显示相比,将对话集成到 AR 场景中会显著增加交互频率和主观体验;
- 在沉浸式环境中进行情境化交互可以增强用户参与度和任务绩效。
SafeStride — 增强现实健身数据显示系统 (XJTLU VIS Lab)academic
2024-09 — 2025-01- 西交利物浦大学 VIS Lab 课程项目;
- 项目目标:为户外健身爱好者设计一个增强现实 (AR) 交互系统,将健身和导航数据整合,通过 AR 界面呈现给用户,提供更安全、更高效的体验,避免因查看传统健身设备而分心;
- 设计与实现:遵循尼尔森的可用性启发式原则,采用 React Three Fiber 实现系统;AR 场景作为主要数据显示区域,智能手机作为主控制终端;通过物理原型设计和用户定量数据测试以及定性反馈,不断迭代优化系统布局、视觉层次结构和交互流程;
- 系统评估:可用性研究 (N=10) 表明,AR 系统在可用性和用户满意度方面与传统智能手表相当,并提供了更新颖的体验;但 NASA-TLX 评分显示用户在某些任务中付出了更多努力,未来需进一步优化以减少认知负荷。
hht-web — 宿舍门禁动态码 PWApersonal
2024-09 — 2024-09- 原生 JS 开发的 PWA 动态码展示,service-worker 本地缓存,快速通关;
- 强制触发 HDR 实现 iOS 局部亮度调整,使二维码更清晰。
哒哒截屏日历 — 快速创建日程快捷指令personal
2021-12 — 2021-12- 调用 gpt-4o-vision,定义返回 JSON Schema,实现截屏后自动识别关键信息后添加到日历。
xjtlu-link-converter — 链接跳转插件personal
2024-12 — 2024-12- 通过 Chrome Extension API 开发,正则表达式替换链接为校园图书馆代理。
AI 招聘 Agent (叠纸互娱)
多模型 LLM 集成(DeepSeek / 豆包 / 通义千问)、Milvus RAG pipeline、Function Calling、飞书招聘数据同步。FastAPI + React + TypeScript。
叠纸 AI 小助手 (通用 LLM 对话平台)
30+ 可复用组件、Markdown 渲染引擎、知识库权限管理、分享与收藏。Next.js 14 + Zustand + Ant Design。
PaperArt — ComfyUI Web 工作流管理出图平台
模型/案例管理、分页+状态保留、ModelUploader/CoverUploader、代码复用率提升 40%。React + Redux + Node.js。
WebGPU + WebLLM 在浏览器端离线运行 Llama 3.2,Whisper 实时转录,15-30 tokens/秒,PWA via Service Worker。
Skills
智能体 / AI / LLM:
智能体 (Agent) 开发:擅长设计与优化提示词 (Prompt Engineering),有 RAG 知识库构建流程与优化,Function Calling 调优,Dify、Coze 等平台实践经验,了解智能体工作流设计与开发,ComfyUI 等 AI 内容生成工作流工具的开发与定制;, LLM 应用开发:熟悉 LangChain、LlamaIndex 等框架,有 ChatGLM、Llama2 等开源模型部署、训练、调优及应用经验;, RAG 与知识库:熟练掌握 RAG (Retrieval Augmented Generation) 知识库构建流程与优化;, 多模型集成:DeepSeek、豆包、通义千问、ChatGLM、Llama 3.2;, RAG 工具链:Milvus、text-embedding-v4、MiniLM、Rerank 重排序;, 模型部署与管理:了解 Kubernetes (k8s) 进行服务部署与管理;熟悉 Ollama、LM Studio 本地部署,有 MCP (Model Control Program/Platform) 开发经验。
前端开发:
熟悉 React、Vue.js,探索过 Svelte、Astro 等框架;熟悉 TypeScript 开发,了解微前端 qiankun、Umi.js 等;有跨端开发经验,如 React Native、Taro 和 Electron;, 状态管理:Zustand、Redux、Valtio、Pinia、React Hooks/Context;, UI 库:Ant Design、Tailwind CSS 4、Shadcn/ui、Radix UI、Element Plus;, CSS 技能:熟悉 Flexbox、Grid 布局;擅长使用 GSAP 和 framer-motion 设计和实现动态效果与动画;具备丰富的响应式设计经验;, 3D / AR:Three.js、React Three Fiber (R3F)、A-Frame、Unity;, 跨端:React Native、Electron、Taro。
后端开发:
Python:FastAPI、Flask、SQLAlchemy、Pydantic;, Node.js:tRPC、Express、MongoDB、PostgreSQL;, RESTful API 设计、OpenAI 兼容流式输出。
数据处理与可视化:
熟悉使用 Pandas、NumPy 进行数据处理;, 熟悉数据可视化库 Matplotlib、Seaborn;, 熟悉 Streamlit、Gradio 等大模型可视化调参工具;, ECharts、DataV 数据大屏集成。
DevOps 与基础设施:
Docker、Docker Compose、Kubernetes (k8s);, Jenkins、GitLab CI、GitHub Actions;, Nexus 私有仓库搭建;Cloudflare KV;, Monorepo:Lerna + pnpm workspace。
构建与测试:
熟练使用 Vite、Rollup、Webpack,有插件定制开发经验;, 熟练使用 Jest、Vitest 进行单元测试;, 熟悉 eslint、stylelint、prettier 等工具进行代码规范约束;, npm、Maven 私有仓库搭建。
UI/UX 与 HCI 研究:
擅长将产品理念转化为直观的用户界面;, 熟悉 Figma、Sketch 和 Adobe Illustrator;, 掌握 UX 研究方法、可用性测试和用户访谈技巧;, 定量用户研究:拉丁方实验设计、NASA-TLX、Cohen's d 效果量分析。
文档、语言与其他:
熟悉 Markdown、Office(计算机二级 - 良好)、LaTeX;, 中文/普通话 - 母语;英语 - 可作为交流语言,IELTS 6.5。