飞桨星河社区月度报告(2026年3月)
月度动态总览1. 产品功能更新PaddleOCR官网服务升级围绕文档解析体验、长文档处理与免费额度全面更新持续降低文档智能应用门槛。模型体验场与ARENA模型更新Playground新增11个模型支持在线体验ARENA上新7个模型支持多模型对比评测。2. 社区内容更新项目资源优质项目覆盖PaddleFormers微调、PaddleOCR-VL多模态文档解析、OpenClaw智能体集成等方向为社区开发者提供从模型训练、能力增强到应用落地的实践参考。数据集资源数据集板块新增251个数据集覆盖小说写作、代码生成、监督微调、逻辑推理等方向持续为大模型在训练、对齐、评测与专项能力验证提供数据支撑。边学边练正式推出面向开发者的技术实战专栏「星河实战派」围绕大模型、Agent与开发工具等热门方向持续输出可复现、可上手、可落地的实践内容。3. 社区生态共建重点活动PaddleOCR IP形象征集启动OCEAN生态联盟正式成立多地Deep Agents、OPC、OpenClaw技术交流会密集开展。热门赛事PaddleOCR全球衍生模型挑战赛启动飞桨黑客松第十期文心合作伙伴赛道开放报名。AICA首席AI架构师培养计划第十期开启报名。产品功能更新1. PaddleOCR优化围绕文档解析体验、长文档处理与免费额度进一步升级。访问地址https://aistudio.baidu.com/paddleocr核心更新【OCR 编辑功能全面升级】围绕复杂文档识别后的人工校正场景持续推进公式与表格的显式编辑能力升级。其中公式编辑区域支持从上下文中独立进入右侧面板并同时提供显式编辑区与Markdown直编区表格编辑区域则围绕单元格文字修改、增删行列、合并拆分单元格等能力进行优化进一步提升学术论文、财报等复杂文档的结构化修订效率。【长文档与批处理能力升级】重磅新增异步解析服务解决长耗时任务的稳定性与效率问题。【免费额度升级】单文件解析页数上限由100页提升至1000页个人每日免费解析额度由6000页提升至10000页进一步提升长文档解析体验。左右滑动查看更多2. 模型体验场和ARENA新模型上线Playground与ARENA持续补充新模型开发者可在星河平台完成模型体验、效果对比与方案筛选进一步提升选型效率。访问地址https://aistudio.baidu.com/playground/ https://aistudio.baidu.com/intro/llmarena核心更新【模型体验与对比更顺畅】新增ERNIE-5.0-Thinking-Preview等多款模型。开发者可在Playground快速体验单模型效果也可在ARENA中直观比较不同模型表现帮助开发者在同一平台内完成从体验、验证到筛选的完整流程。社区内容更新1. 项目资源新增精品项目涵盖PaddleFormers微调、多模态文档解析及OpenClaw智能体集成等方向涉及Function Call、Grounding等模型能力训练与多样化对话场景微调为模型训练、能力扩展与场景落地提供了实践参考。智能体与OpenClaw集成-【AI Studio玩转OpenClaw】从零到一搭建你的智能中枢项目项目链接https://aistudio.baidu.com/aistudio/projectdetail/10080116-【AI Studio玩转OpenClaw】打通飞书的智能协作项目链接https://aistudio.baidu.com/aistudio/projectdetail/10106735-【Agent Skill】快速上手ERINESkill项目链接https://aistudio.baidu.com/aistudio/projectdetail/10031318-带你打造一个ERNIE5.0skill的最小化Agent案例深入了解其原理项目链接https://aistudio.baidu.com/aistudio/projectdetail/10107781模型微调与风格定制-【PaddleFormers】ERINE-4.5-0.3B废话文学大师微调项目项目链接https://aistudio.baidu.com/aistudio/projectdetail/10071722-【PaddleFormers实现ERINE-4.5-0.3B-PT老北京风格微调项目项目链接https://aistudio.baidu.com/aistudio/projectdetail/1000088010分钟速通PaddleFormers微调心理咨询大模型项目链接https://aistudio.baidu.com/aistudio/projectdetail/10036961多模态与文档解析-【PaddleOCR-VL-1.5】基于微调实现区域识别能力项目项目链接https://aistudio.baidu.com/aistudio/projectdetail/10127933-【PaddleOCR-VL】基于PaddleFormers多模态文档解析微调项目项目链接https://aistudio.baidu.com/aistudio/projectdetail/10091895用PaddleOCR-VL-1.5去考古——微调甲骨文项目链接https://aistudio.baidu.com/aistudio/projectdetail/10030707行业应用与工具集成【LangChain文心大模型】构建旅游出行规划智能体项目链接https://aistudio.baidu.com/projectdetail/10070140基于百度文心大模型的智能饮品配方生成系统项目链接https://aistudio.baidu.com/aistudio/projectdetail/100315272. 数据集资源数据集板块新增251个数据集覆盖小说写作、代码生成、监督微调、逻辑推理等方向持续为大模型在训练、对齐、评测与专项能力验证提供数据支撑。访问地址https://aistudio.baidu.com/datasetoverview精选数据集1.Mixture-of-Thoughts融合多路径推理Multi-Chain-of-Thought的数据集通过构建多解法、多思维链组合样本提升模型在复杂推理任务中的鲁棒性、一致性与最终答案正确率。访问地址https://aistudio.baidu.com/dataset/detail/369339/intro2.LightNovel5000包含5000条轻小说风格长文本的数据集覆盖人物设定、情节推进与对话描写适用于训练长文本生成、剧情构建与内容创作类模型能力。访问地址https://aistudio.baidu.com/dataset/detail/369451/intro3.code_generation_lite面向代码生成任务的轻量级数据集涵盖多语言基础编程、函数生成与简单算法实现适用于代码模型的快速微调与基础能力构建。访问地址https://aistudio.baidu.com/dataset/detail/374644/intro4.deepctrl–sft–data用于大模型监督微调SFT的通用指令数据集覆盖对话生成、任务执行与多场景指令理解支持提升模型的指令跟随与泛化能力。访问地址https://aistudio.baidu.com/dataset/detail/374574/intro3. 边学边练赋能体系在“边学边练”板块星河社区正式推出面向开发者的技术实战专栏「星河实战派」围绕大模型、Agent与开发工具等热门方向持续输出可复现、可上手、可落地的实践内容。专栏希望解决开发者在学习前沿技术过程中“知道概念、但难以上手”“看过案例、但无法复现”的共性问题把内容做得更贴近真实开发场景也更贴近大家在项目中的实际需求。作为专栏第一期发布《在星河社区免费部署使用教学让你的OpenClaw真正能打》内容聚焦近期备受关注的OpenClaw围绕开发者普遍遇到的“部署门槛高、环境准备复杂、装好之后却不够好用”等痛点提供了一套更友好的上手路径。相比单纯介绍工具能力这期内容更强调“如何真正用起来”帮助开发者从“把工具跑起来”进一步走向“让工具能够解决实际问题”。后续星河社区还将围绕Agent、Tools、Skills、模型能力接入与工程实践等方向持续推出更多高质量实战内容帮助更多开发者把前沿能力真正学起来、用起来、做出来也期待与更多伙伴一起共同推动技术内容生态建设与优质实践案例沉淀专栏链接手把手部署教学官方skills在星河社区免费玩转小龙虾社区生态共建1. 重点活动1厦门站首场 OpenClaw 线下聚会圆满举办3月7日由百度飞桨厦门人工智能产业赋能中心联合多家机构主办的“AI火炬系列活动。活动吸引200余名开发者参与围绕OpenClaw、OS级智能体交互形态、端云混合架构及Crablet等议题展开交流并结合部署实践与OpenClaw PaddleOCR Skill案例集中展示了区域开发者生态在智能体方向的探索热情。左右滑动查看更多2PaddleOCR IP 形象征集启动3月18日PaddleOCR 面向开发者与生态伙伴发起IP形象征集活动邀请社区共同定义项目官方形象。活动支持设计稿、文字创意及延展设想等多种投稿形式优秀作品有机会成为PaddleOCR官方IP并落地为社区周边进一步增强项目与开发者之间的连接。3武汉站汉桨智创OPC社区政策解读及运营指南3月20日汉桨智创OPC社区政策解读及运营指南活动在武汉汉阳区举行。活动围绕《武汉市支持人工智能OPC创新发展若干措施》展开解读进一步为武汉区域开发者提供从创意验证到落地转化的现实路径。左右滑动查看更多4深圳站Deep Agents Meetup Day | LangChain x百度AI技术分享日3月21日由百度文心飞桨与LangChain社区联合主办的Deep Agents Meetup Day在深圳举行吸引数百位开发者线上线下参与。活动围绕Deep Agents、文心大模型、PaddleOCR与LangChain的集成实践展开交流并通过主题分享、Demo展示与实操演练呈现了智能体从“概念验证”走向“任务执行与业务闭环”的最新进展。左右滑动查看更多5北京站上地人工智能产业伴飞计划OPC技术交流会暨OpenClaw技术详解活动3月24日上地人工智能产业伴飞计划OPC技术交流会暨OpenClaw技术详解活动在上地汇客厅举办。活动由百度飞桨星河社区与上地街道联合发起现场围绕文心大模型生态、OpenClaw核心架构、OPC创业支持体系及AI影视自动化等议题展开分享并设置Workshop与项目路演环节帮助开发者理解OpenClaw从技术底座到场景落地的完整路径。左右滑动查看更多6上海站智能体应用实训营第三期3月25日由上海张江人工智能创新小镇联合百度飞桨、百度智能云举办的智能体应用实训营在张江AI应用商店举行。活动围绕OpenClawOPC技术体系通过生态赋能讲解、场景资源发布、应用开发实践与落地案例解析等环节帮助开发者跑通智能体应用从能力接入到工程部署的全链路流程。7青岛站首届OPC龙虾市集3月27日青岛首届OPC龙虾市集面向园内外开发者开展现场活动围绕开源智能体OpenClaw展开讲解与实操教学。活动帮助参与者快速理解OpenClaw在自动化办公、任务执行与个人效率提升等场景中的落地方式进一步推动区域开发者对OPC形态与智能体应用的认知升级。8PaddleOCR OCEAN生态联盟成立3月30日PaddleOCR OCEAN生态联盟正式成立。联盟围绕技术共建伙伴、生态平台伙伴、应用标杆伙伴三类角色展开协同聚焦开源共建、平台集成、场景共创与影响力互换推动OCR从单点能力走向覆盖“技术-平台-应用”的全链路生态共建。了解更多活动详情可访问星河社区【活动中心】板块快来参与吧访问地址https://aistudio.baidu.com/activityoverview2. 热门赛事1飞桨黑客松第十期文心合作伙伴赛道启动3月26日第十届飞桨黑客马拉松同步上线「文心合作伙伴赛道」联合国内外近20家合作伙伴覆盖云端训练、边缘推理、端侧部署、操作系统与算力平台等场景面向开发者开放打卡任务与进阶任务两条赛道。赛道围绕文心大模型、PaddleOCR-VL等能力提供开发板、线上算力资源、技术文档与社区答疑支持帮助开发者完成从模型能力适配到创新应用开发的实践闭环。访问地址https://github.com/PaddlePaddle/Paddle/issues/784852PaddleOCR 全球衍生模型挑战赛启动3月27日第十届飞桨黑客马拉松推出「PaddleOCR 全球衍生模型挑战赛」面向全球开发者围绕PaddleOCR-VL/PaddleOCR-VL-1.5系列能力开展衍生模型微调、评估集构建与开源作品共建。赛事聚焦小语种OCR、医疗处方识别、有机化学分子式识别、流程图解析等长尾场景设置总额7万元现金奖金、评估集贡献奖及算力资源支持进一步激发社区围绕文档智能能力进行创新。访问地址https://github.com/PaddlePaddle/PaddleOCR/issues/17858获取更多赛事详情可访问星河社区【热门比赛】板块赢取丰厚奖品访问地址https://aistudio.baidu.com/competition3. AICA 首席AI架构师培养计划第十期启动3月20日AICA首席AI架构师培养计划第十期正式启动。项目由百度与深度学习技术及应用国家工程研究中心联合发起历经7年沉淀已累计向能源、制造、金融、交通、消费等18行业输送569名AI架构师。本期围绕“数智融合”培养闭环新增数智创新试点班级进一步打通数据治理、技术研发、架构设计与产业落地链路持续培养兼具算法理解、工程能力与业务视野的高端复合型人才。访问地址https://iwenjuan.baidu.com/?code787mjf关注【飞桨PaddlePaddle】公众号获取更多技术内容~