本文能帮你解决的

张

张建站

2026/6/26 6:22:44

10分钟阅读

你会得到一个带请求/响应校验、环境变量管理、自动生成接口文档的最小可行 Agent 后端。内容速览· 一个让本地 LLM“开口接客”的痛点场景· 用餐厅点餐比喻拆解 Agent 到底是个啥· FastAPI Ollama Pydantic 的最小实战代码· 请求生命周期从你的问题到 Agent 那句回答· 几个一偷懒就翻车的坑帮你提前绕开第一部分那把“钥匙”到底在哪儿看个案例小媛说他在本地把 Llama3 跑起来了想给自己的客服系统加个自动回复接口。需求不复杂前端扔一段用户问题过来后端问 Ollama然后把答案送回去。她觉得这应该半小时搞定。结果呢她先是卡在“怎么把每次的提问包装成 API”然后又纠结“返回的结果该用啥格式”最后看着一堆手动拼的 JSON schema 叹了口气。这就是典型的手里有发动机却没给车架和轮胎。FastAPI 正好就是那套车架帮我们把发动机LLM稳稳地装上去还顺带送个仪表盘Swagger。第二部分Agent 这套“套餐”到底怎么理解先别急着敲代码咱们聊聊 Agent 的本质。我特别喜欢用快餐店点餐来打比方‍ LLM—— 就是后厨那个万能大厨你提啥要求他都能给整出个菜。工具—— 是大厨手边的锅铲、烤箱、菜刀。没有工具他只能干聊有了工具他才能查天气、调数据库、执行函数。编排逻辑—— 是前台那张点餐流程单先确认需求再选择合适的工具最后让大厨出餐错了还要打回重做。所以一个最简化的 Agent 接口不是直接把用户的话丢给 Ollama 完事而是要在代码里体现这三层。今天我们先把基础路走通让“大厨”先能出餐后面再加“工具”就容易了。⚡ 第三部分动手从零搭一个 /chat 端点先晒一下我们的目标——一个跑在本地、用 Swagger 就能聊天的接口。你发一段话它回一段话背后调的是 Ollama。咱们的项目目录就简简单单几个文件├── main.py # 主服务入口 ├── models.py # 请求/响应模型 ├── config.py # 环境变量配置 └── pyproject.toml好咱们先来搞定环境。我默认你已经装好了 Ollama 并且拉取了模型比如 llama3。然后一行命令把依赖装齐uv add fastapi[standard] httpx对你没看错连httpx都得装一会儿我们要用它去异步调 Ollama 的 API这时候就别用 requests 同步请求了一上量接口直接卡成 PPT。接下来重点来了定义请求和响应模型。打开 models.py用Pydantic来管住进出。我喜欢把这事儿交给 Pydantic比手写字典强一万倍——自动校验还能直接喂给 Swagger。from pydantic import BaseModel class ChatRequest(BaseModel): message: str class ChatResponse(BaseModel): reply: str这里再说个容易翻车的点模型里字段如果写成 msg 这种简写回头对接前端的人会恨你一辈子。老老实实把可读性拉满。然后是 config.py咱们用 pydantic-settings 管理环境变量。这样不用把地址硬编码在代码里随时可以通过 .env 或环境变量覆盖。from pydantic_settings import BaseSettings class Settings(BaseSettings): ollama_base_url: str http://localhost:11434 model_name: str llama3 class Config: env_file .env settings Settings()官方文档虽然默认就支持 .env但根据以往的经验一定要在根目录放一个 .env 文件并且记得加进 .gitignore。不然某天队友的 API Key 就被你公之于众了那场面可太尴尬。主角来了main.py。我们先搭个骨架再用依赖注入把 settings 传进去给 /chat 端点用。from fastapi import FastAPI, Depends from models import ChatRequest, ChatResponse from config import Settings, settings import httpx app FastAPI(titleAI Agent 接口, version0.1.0) def get_settings(): return settings app.post(/chat, response_modelChatResponse) async def chat( req: ChatRequest, config: Settings Depends(get_settings) ): async with httpx.AsyncClient() as client: resp await client.post( f{config.ollama_base_url}/api/generate, json{ model: config.model_name, prompt: req.message, stream: False }, timeout30.0 ) resp.raise_for_status() data resp.json() return ChatResponse(replydata[response])你可能会问“就这Agent 的‘工具’和‘编排’呢”别急今天咱们先把大厨请出来。后面几篇我会慢慢给这个骨架添上“菜单”——工具调用逻辑让它可以查天气、搜文档。现在先跑起来体验一下从零到一的快感。最后啰嗦一句启动命令就一行 fastapi run main.py 。然后打开 http://localhost:8000/docs 你会看到一个自带交互界面的 Swagger。直接在里面 Try it out 测试看到回复的那一瞬间你心里一定会喊一声“舒坦”。第四部分一个请求的完整生命周期为了让你心里更有谱我把整个过程拆成五步❶ 前端或 Swagger把用户的一句话按 ChatRequest 格式发到 /chat❷ FastAPI 自动校验字段不对就立刻返回 422 错误省得垃圾数据钻进大模型❸ 依赖注入把 Settings 对象默默准备好代码里直接用❹ 用 httpx 异步调用 Ollama 的 /api/generate把大厨喊醒❺ Ollama 返回的 response 字段塞进 ChatResponseSwagger 自动渲染成漂亮的 JSON 文档你瞧整个链路清晰得就像一条笔直的大路每个弯拐在哪里一目了然。以后想加缓存、加日志、加工具只要顺着这条路插进去就行。⚠️ 注意事项与进阶思考· 千万别在公网暴露 Ollama 的 11434 端口这家伙默认没鉴权· 生产环境一定要加请求频率限制大模型慢分分钟把你的 FastAPI 线程池打满。· stream: False 用着爽但做打字机效果时记得换成流式响应那又是另一个好玩的话题。· 接下来我会在这个例子上逐步加上工具调用比如用搜索引擎的 API让 Agent 真的“动手干活”。

收藏！小白程序员必看：大模型能力边界全解析，从底层原理到2026年实际应用

本文从AI的底层原理“超级猜词机”讲起，解析了Transformer架构和“涌现”现象如何推动AI能力跃迁。文章指出，尽管AI表现日益强大，但其在长上下文理解、复杂推理和Agent自主执行等方面仍存在局限，需要人类把关。最后，文…...

2026/6/26 6:18:44 阅读更多 →

传统服装制造企业转型，多赛道布局才是破局路

传统服装制造企业转型，多赛道布局才是破局路6.25跑河南调研，见识了旭瑞的转型思路我这次见的，是河南旭瑞服饰有限公司的负责人。这家公司2010年成立，一直做服装批发。年销售额卡在500到1000万，已经快十年。说白了&am…...

2026/6/26 6:18:42 阅读更多 →

正版黄金投资软件怎么下载（具体步骤大全）

下载前先做好真伪甄别，避免踩坑。正规黄金相关软件所属机构具备完备备案与合规资质，官网域名可查询备案信息，资金管理模式公开透明，不会私下引导用户向个人账户转账；山寨软件多通陌生广告链接推送，夸大收益…...

2026/6/26 6:18:04 阅读更多 →

3步解锁Adobe全家桶：Adobe-GenP 3.0智能破解工具完全指南

3步解锁Adobe全家桶：Adobe-GenP 3.0智能破解工具完全指南【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP Adobe-GenP 3.0是一款功能强大的Adobe Creativ…...

2026/6/25 5:27:05 阅读更多 →

暗黑2存档编辑器实战宝典：网页版D2/D2R角色修改工具完全解析

暗黑2存档编辑器实战宝典：网页版D2/D2R角色修改工具完全解析【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2的角色练级而烦恼吗？想测试不同的build组合却不想重复枯燥的升级过程&#…...

2026/6/25 5:27:06 阅读更多 →

基于MC56F8257 DSC的BLDC电机六步换相与速度闭环控制实战

1. 项目概述与核心价值如果你正在寻找一个既能深入理解三相无刷直流电机（BLDC）控制原理，又能快速上手实现一个稳定、低功耗驱动方案的实战项目，那么基于飞思卡尔MC56F8257 DSC的这套方案，绝对是一个教科书级的起点。我…...

2026/6/25 5:27:08 阅读更多 →

如何用AI在10分钟内完成蛋白质结构预测？AlphaFold3-PyTorch深度解析

如何用AI在10分钟内完成蛋白质结构预测？AlphaFold3-PyTorch深度解析【免费下载链接】alphafold3-pytorch Implementation of Alphafold 3 from Google Deepmind in Pytorch 项目地址: https://gitcode.com/gh_mirrors/al/alphafold3-pytorch 蛋白质结构预测…...

2026/6/25 5:27:08 阅读更多 →