AI 智能体在中小企业的落地路径

四个真实案例 · 九个判断点

郭明达 · 2026.06.21

讲者介绍

👤

郭明达

本科学的是建筑设计，毕业后跨行进入数字化与智能化转型领域
以一人公司形式，为父母创办的全过程工程咨询企业做 AI 落地改造
近半年做了四个实战项目

本次分享的所有案例都来自我的探索实践，分享给大家一同交流！

分享前的需求调研

11 位参与者 · 分享前问卷调研

输出结果不稳定、不可靠

6 票

不知道用哪些智能体产品

5 票

安全合规方面的顾虑

6 票

本场分享将逐一回应这些核心顾虑

受众最期待的分享内容

你最想听的内容（可多选，总 34 票）

实际案例和踩坑经验

10 票 · 29%

企业如何系统性地引入和落地

10 票 · 29%

AI 智能体核心原理

7 票 · 21%

对行业趋势的判断和展望

7 票 · 21%

本场分享将聚焦实践案例和落地方法论

开场互动 · 8 维 AI 适用性评估

评估对象：贵公司最值得用 AI 改造的一个工作环节 | 每项 0-5 分，总分 40 分

01

规则显性度

规则能不能写清楚：输入输出、什么算对/算错

5=白纸黑字 → 0-1=大量隐性规则

05

责任轻量度

AI 出错时，人能否及时发现和修正

5=AI主导 → 0-1=不适合 AI 接管

02

一次性交付度

做完即走 vs 长期演进

5=一次性交付 → 0-1=长期演进不能停

06

债务可控度

AI 失败的后果是否可接受

5=后果轻微 → 0-1=后果严重

03

决策简单度

目标清晰 vs 动态取舍

5=有明确标准 → 0-1=多方利益冲突

07

上下文简单度

需要的历史信息是否容易获取

5=信息完备 → 0-1=信息散落各处

04

容错空间

小错误会不会导致大损失

5=容错空间大 → 0-1=零容错

08

验证容易度

结果是否容易人工核查

5=一眼验对错 → 0-1=事故后才暴露

28 分以上具备优先落地的可行性

大模型已经足够强了。

—— 数命科技罗弼文，2025年营收2亿、2026截至5月累计3.9亿

「AI不会替代人，会放大高质量的人。」

大模型 5 年跃升

📈 上下文窗口增长

2K

2021

32K

2023

128K

2024

1M

2025

10M

2026

增长 5000 倍

AI一次对话能处理的文字量

🎯 能力基准跨越

AI 参加人类的考试（MMLU/HumanEval/GPQA）

50%

2021

→

90%+

2026

AI 在考试上从不及格到优秀

相当于从考40分到考90分

5 年 · 上下文 5000 倍 · 能力跨越 90% 关口

因为缺了 Harness

中文叫：驾驭系统

如果把模型看作 CPU，Harness 就是操作系统。
没有人会把一块焊着 CPU 的主板直接给用户用。

—— 亚马逊云科技王晓野，2026 AIGC 产业峰会

Harness Engineering 三层结构

🔧 Harness Engineering / 驾驭工程

盯着他、跑偏拉回来

📋 Context Engineering / 上下文工程

把资料给齐

💬 Prompt Engineering / 提示词工程

把话说清楚

你把任务说清楚了没？
你把资料给齐了没？
合同呢？历史记录呢？公司规定呢？
你盯着他了没？
他做对了吗？跑偏了能拉回来吗？出错了能恢复吗？

Claude Code · Codex · MiniMax

真正决定 AI 能不能落地的，从来不是模型——

是外面这套 Harness。

AI 落地的核心挑战，正在从让模型看起来更聪明，转向让模型在真实世界里稳定地工作。

—— 咸鱼（驾驭工程）

Agent 落地从「能用」到「生产级」，最致命的差距在于场景选择与知识数据的治理。

—— 顺丰集团 CIO 刘潭仁

实战演示（上半场）

现场需求采集

请一位听众用一句话描述其所在公司的一项重复性工作，作为本次演示的需求输入。

🎤 哪位愿意配合？

实战演示（上半场）

需求提交与任务启动

将上一环节采集的需求拆解为若干执行步骤，提交至 AI 工具后台执行。

演示在讲完 4 个案例后回看结果。

💻 Deepseek / MiniMax / Qwen

案例 1 · 政府招标线索抓取 · 阶段一：试运行失败

2026.03

❌ 失败结果

今日抓取：5 条
明日抓取：0 条
后日：抓偏了

复盘分析

第一层：当时产品底层 Harness 成熟度还不够
第二层：当时大模型与今天不可同日而语

算力 × Harness 双重进步 → 今天能做好的事，三个月前就是做不好

案例 1 · 政府招标线索抓取 · 阶段二：转换思路

2026.05

✅ 转换方案

换工具：Claude Code
换思路：让 AI 写代码，不是让 AI 去猜数据
你的输入：需求 + 网站结构 + 输出格式
你的输出：一行代码没写

💡 关键洞察

政府网站架构高度同质化，适配一个适配一批
从"依赖 AI 思考火花" → "稳定运行的标准化工作流"

稳定运行，持续抓取

📊 抓取信息看板

案例 1 · 核心结论：规则与 AI 的取舍

📝 规则明确的事

→ 写代码 / 算法

重复度高
判断弱化
规则明确

🤖 需要灵活判断的事

→ 用 AI

满足 → 写代码，稳定性 + 成本都最优
不满足 → 才用 AI

让 AI 帮你判断"这件事是否该 AI 做"

—— 关键洞察

能用可量化的标准来管控的流程
就不要交给大模型自主决策

—— 我从三月踩到五月悟到的

案例 2 · 投标文件撰写 · 标书拆开看

收集招标要求 → 提取评审标准 → 匹配公司资质 → 整理历史案例 → 逐章撰写 → 交叉审核 → 排版出稿

流程明确，每步边界清晰 → AI 落地最理想的场景

业务人员原话：「往常一份上百页标书，两到三天」

为什么不直接用免费 AI 写？

❌ 一次性给 AI 写数万字

上下文焦虑
写到一半丢细节
急着收尾

✅ 拆成章节节点

每次空状态执行一个子任务
稳定高质量输出
多智能体协作范式

任务原子化 = 成功关键

为什么选择用外部产品？

维度	自研标书系统	用外部产品
开发成本	中等	无
算力成本	文字成本低	文字成本低
研发费用摊销	中等	低（AI 开发的产品）

企业买的不是 prompt，是每个月少折磨几个人的流程

人 vs AI 的本质差别

👤 人

注意力会衰减，无法 8 小时高度集中

一份百页标书要 2-3 天
半数内容是范式化重复

🤖 AI

在限定上下文内可高度工业化产出

质量稳定 · 口径统一 · 不知疲倦

范式化工作交给 AI，人的精力留给真正需要判断的事

案例 3 · 项目人员调配看板

📋 问题背景

跨多个业务板块协作
谁知道谁在哪个项目？只有部门负责人
领导开会当晚，我搭了一个看板

功能：项目+人员可视化、拖拽指派、企业微信通知

💡 关键判断

这个看板本质不是智能化，是数字化

引用：数字化基础课——「如果数字化只是换个地方重复劳动，带来的是额外成本」

👥 人员调配看板

企业独特的个性化需求
通过定向研发来满足

监理行业合规约束：总监不能跨市、同市项目 ≤ 3 个
通用软件 ❌ → 自研 ✅

高度可定制的业务逻辑，忠实还原特殊场景的设计要求，通过系统策略防止人为操作失误

案例 4 · 收款追踪提醒

不及时请款，甲方就觉得拖几天也没问题。

收款延迟每增加 7 天，后续回款难度上升 30%

📝 行业痛点：建筑大单，先服务后收款，多收款节点

合同虽然有约定，但甲方形成"拖几天也没事"心理

这件事不是技术问题，是工程化设计问题

案例 4 · 收款追踪提醒 · MVP 全流程 💰 收款追踪系统

步骤	谁/什么做	输入	输出
1. 合同上传	人	合同 PDF	进入系统
2. AI 识别收款节点	AI	合同全文	节点清单 + 时间表
3. 到期自动提醒	系统	时间表	企业微信消息
4. 提醒开票	系统	业务完成信号	提醒财务
5. AI 生成请款报告	AI	发票 + 节点状态	报告草稿
6. 人核实	人	报告草稿	确认/修改
7. 一键发送	人确认后系统	确认报告	发送到甲方群

第 6 步"人核实"——这是 AI 与人之间的边界

—— 全场最重要的"人机边界"

为什么选择自研？数据治理战略

❌ 数据割裂的代价

A SaaS 做人员 + B SaaS 做项目 + C SaaS 做财务

AI 访问三套数据，需要 3 个 API、3 套权限、3 种格式

✅ 自研统一平台

数据在一个系统里，AI 一次访问全部

过去的数据平台是服务人的，今天的数据平台必须服务好 AI Agent

—— 亚马逊云科技王晓野

今天回去就做两件事

① 梳理流程

找到高净值、高重复度、标准明确的环节

② 检查 SaaS 能不能导出数据

决定你未来能不能安全拿回数据

数据是未来 AI 参与企业决策的核心依据。

从今天开始积累。

案例 5 · GEO 品牌可见度监测

定时提问机器人

→

多个 AI 平台
Claude/Gemini/Qwen

→

答案采集
公司名是否出现+排名

→

统计表
折线图

最简单的自研，也能解决最真实的商业问题

给你一个可量化的方式衡量智能营销投入的回报

📊 GEO追踪统计

实践案例路径矩阵

自研 + AI

案例 4 收款追踪
案例 5 品牌监测

有一定门槛

用外部 + AI

案例 2 标书撰写

最普适 ✓

自研 + 代码

案例 3 人员调配
案例 1 招标爬取

稳定但缺乏智能

用外部 + 代码

传统SaaS软件服务商

横轴：用 AI 还是用代码｜纵轴：自研还是用外部

智能体落地的阶段与判定标准

决策前

1 价值锚点

2 场景筛选

3 规则 vs AI

启动中

4 流程是地基

5 工具优先级

6 平台化意识

持续化

7 人机分工

8 组织进化

9 数据资产

如果你今天回去要做一个 AI 项目
按这 9 个点问自己

判断点 1 · 价值锚点

同一个项目，只锚一个价值

降本

替代重复性工作

提效

加速某个流程

控风险

避免某种损失

同时追求三个 = 范围不清 = 失败概率高

判断点 2 · 场景筛选

频次够高吗？

一月一次不算高，一天一次才算

原有成本清晰吗？

工时、外包费、周期要算得清

结果会被真实使用吗？

内部演示不算，真实业务流才算

能短周期重复跑 3 轮吗？

跑不出稳定性 = 没跑通

高频小场景会不断重复，每一次重复都在帮你校准方向

判断点 3 · 规则 vs AI

能写成规则的就不要交给 AI 猜

规则明确的事

→ 写代码

需要灵活判断的事

→ AI

四个特征：可量化 / 重复度高 / 判断弱化 / 规则明确 → 写代码

判断点 4 · 流程是地基

1

文档化

这件事写下来了吗？

2

标准化

不同人来做，结果一样吗？

3

可执行

能在真实业务里跑完吗？

4

可监控

能看到每个节点的效率吗？

5

可治理

有问题能持续优化吗？

多数中小企业第一步都没完成 —— 流程全在人脑子里

判断点 5 · 工具优先级

独立场景 + 大众化需求？

→ 优先用外部低价 AI 服务

核心流程 + 个性化需求？

→ 自研

你的数据能导出？

→ 可用 SaaS

核心业务数据不允许泄漏？

→ 必须自研

软件可以买，服务可以买，但能力不能买

判断点 6 · 平台化意识

AI 能力

算法 + Skill + 工具

载体（平台）

能接触数据、编辑数据、反馈变化

数据

业务数据、运营数据、操作数据

未来自研产品，不知人类能用，要做到 AI 也能用

判断点 7 · 人机分工

🤖

哪些环节 AI 执行？

👁️

哪些环节AI审核？

✓

哪些环节人类审批？

不要追求绝对准确率，关键节点人为把关

判断点 8 · 组织进化

AI 能力要长在组织内部，不能长期外包

FDE

Forward Deployment Engineer · 前沿部署工程师

连接业务部门与 AI 能力的角色

AI 中台

统一管理模型、知识库、Skill、Agent、权限、评测

找公司里最年轻的那个愿意折腾的人，这就是你的种子

判断点 9 · 数据资产

能导出的数据是资产，锁在 SaaS 里的数据是负债

资产

可读、可改、可迁移、可持续优化

负债

能看能动、但导出困难、迁移成本高、停服即消失

从今天开始积累业务数据、运营数据、操作数据

实战演示(下半场) · 结果展示

我们回到刚才丢给 AI 的那个任务 —— 看它跑得怎么样

适不适合 AI 化？

AI 判断适合，建议了具体的落地路径

第一步做什么？

建议先从数据梳理入手

需要什么数据？

列出了关键数据字段清单

多久能跑通？

建议两到四周的 MVP 周期

"不会"不是不开始的理由

—— "不会构建这个项目"这件事本身，都可以问 AI

你不会没关系 —— 你不会的这件事，AI 会

互动回应 · 三个高频问题

保险团队管理

人员调配看板的思路完全适用。本质都是人员分配和时效提醒的问题

文案/PPT 提效

标书就是"大型文案"的典型。AI 已经能够直接生成完整演示文稿

如何入门

今天回去就打开任何 AI 工具，把你打了分的那件事打进去

两小时
把一个审批流程的规则写清楚
你就已经开始了

AI 落地最怕的不是技术不够 —— 是永远没有一个开始

真正决定能不能落地的，从来不是模型强不强
而在于踏出作为管理者的第一步

谢谢大家 · 郭明达 · 2026.06.21

AI 智能体在中小企业的落地路径

讲者介绍

分享前的需求调研

受众最期待的分享内容

开场互动 · 8 维 AI 适用性评估

大模型已经足够强了。

大模型 5 年跃升

📈 上下文窗口增长

🎯 能力基准跨越

因为缺了 Harness

Harness Engineering 三层结构

真正决定 AI 能不能落地的，从来不是模型——

是外面这套 Harness。

实战演示（上半场）

现场需求采集

实战演示（上半场）

需求提交与任务启动

案例 1 · 政府招标线索抓取 · 阶段一：试运行失败

❌ 失败结果

复盘分析

案例 1 · 政府招标线索抓取 · 阶段二：转换思路

✅ 转换方案

💡 关键洞察

案例 1 · 核心结论：规则与 AI 的取舍

📝 规则明确的事

🤖 需要灵活判断的事

能用可量化的标准来管控的流程就不要交给大模型自主决策

案例 2 · 投标文件撰写 · 标书拆开看

为什么不直接用免费 AI 写？

❌ 一次性给 AI 写数万字

✅ 拆成章节节点

为什么选择用外部产品？

人 vs AI 的本质差别

👤 人

🤖 AI

案例 3 · 项目人员调配看板

📋 问题背景

💡 关键判断

企业独特的个性化需求通过定向研发来满足

案例 4 · 收款追踪提醒

不及时请款，甲方就觉得拖几天也没问题。

案例 4 · 收款追踪提醒 · MVP 全流程 💰 收款追踪系统

为什么选择自研？数据治理战略

❌ 数据割裂的代价

✅ 自研统一平台

今天回去就做两件事

① 梳理流程

② 检查 SaaS 能不能导出数据

数据是未来 AI 参与企业决策的核心依据。

案例 5 · GEO 品牌可见度监测

实践案例路径矩阵

自研 + AI

用外部 + AI

自研 + 代码

用外部 + 代码

智能体落地的阶段与判定标准

判断点 1 · 价值锚点

同一个项目，只锚一个价值

降本

提效

控风险

判断点 2 · 场景筛选

频次够高吗？

原有成本清晰吗？

结果会被真实使用吗？

能短周期重复跑 3 轮吗？

判断点 3 · 规则 vs AI

能写成规则的就不要交给 AI 猜

规则明确的事

需要灵活判断的事

判断点 4 · 流程是地基

文档化

标准化

可执行

可监控

可治理

判断点 5 · 工具优先级

判断点 6 · 平台化意识

AI 能力

载体（平台）

能用可量化的标准来管控的流程
就不要交给大模型自主决策

企业独特的个性化需求
通过定向研发来满足

两小时
把一个审批流程的规则写清楚
你就已经开始了

真正决定能不能落地的，从来不是模型强不强
而在于踏出作为管理者的第一步