AI 智能体在中小企业的落地路径

四个真实案例 · 九个判断点

郭明达 · 2026.06.21

二维码

讲者介绍

👤
郭明达
  • 本科学的是建筑设计,毕业后跨行进入数字化与智能化转型领域
  • 以一人公司形式,为父母创办的全过程工程咨询企业做 AI 落地改造
  • 近半年做了四个实战项目

本次分享的所有案例都来自我的探索实践,分享给大家一同交流!

分享前的需求调研

11 位参与者 · 分享前问卷调研

输出结果不稳定、不可靠
6 票
不知道用哪些智能体产品
5 票
安全合规方面的顾虑
6 票

本场分享将逐一回应这些核心顾虑

受众最期待的分享内容

你最想听的内容(可多选,总 34 票)

实际案例和踩坑经验
10 票 · 29%
企业如何系统性地引入和落地
10 票 · 29%
AI 智能体核心原理
7 票 · 21%
对行业趋势的判断和展望
7 票 · 21%

本场分享将聚焦实践案例和落地方法论

开场互动 · 8 维 AI 适用性评估

评估对象:贵公司最值得用 AI 改造的一个工作环节 | 每项 0-5 分,总分 40 分

01
规则显性度
规则能不能写清楚:输入输出、什么算对/算错
5=白纸黑字 → 0-1=大量隐性规则
05
责任轻量度
AI 出错时,人能否及时发现和修正
5=AI主导 → 0-1=不适合 AI 接管
02
一次性交付度
做完即走 vs 长期演进
5=一次性交付 → 0-1=长期演进不能停
06
债务可控度
AI 失败的后果是否可接受
5=后果轻微 → 0-1=后果严重
03
决策简单度
目标清晰 vs 动态取舍
5=有明确标准 → 0-1=多方利益冲突
07
上下文简单度
需要的历史信息是否容易获取
5=信息完备 → 0-1=信息散落各处
04
容错空间
小错误会不会导致大损失
5=容错空间大 → 0-1=零容错
08
验证容易度
结果是否容易人工核查
5=一眼验对错 → 0-1=事故后才暴露

28 分以上 具备优先落地的可行性

大模型已经足够强了。

—— 数命科技罗弼文,2025年营收2亿、2026截至5月累计3.9亿

「AI不会替代人,会放大高质量的人。」

大模型 5 年跃升

📈 上下文窗口增长

2K
2021
32K
2023
128K
2024
1M
2025
10M
2026

增长 5000 倍

AI一次对话能处理的文字量

🎯 能力基准跨越

AI 参加人类的考试(MMLU/HumanEval/GPQA)

50%

2021

90%+

2026

AI 在考试上从不及格到优秀

相当于从考40分到考90分

5 年 · 上下文 5000 倍 · 能力跨越 90% 关口

因为缺了 Harness

中文叫:驾驭系统

如果把模型看作 CPU,Harness 就是操作系统。
没有人会把一块焊着 CPU 的主板直接给用户用。
—— 亚马逊云科技 王晓野,2026 AIGC 产业峰会

Harness Engineering 三层结构

🔧 Harness Engineering / 驾驭工程

盯着他、跑偏拉回来

📋 Context Engineering / 上下文工程

把资料给齐

💬 Prompt Engineering / 提示词工程

把话说清楚

  • 你把任务说清楚了没?
  • 你把资料给齐了没?
    合同呢?历史记录呢?公司规定呢?
  • 你盯着他了没?
    他做对了吗?跑偏了能拉回来吗?出错了能恢复吗?
Claude Code · Codex · MiniMax

真正决定 AI 能不能落地的,从来不是模型——

是外面这套 Harness。

AI 落地的核心挑战,正在从让模型看起来更聪明,转向让模型在真实世界里稳定地工作。
—— 咸鱼(驾驭工程)
Agent 落地从「能用」到「生产级」,最致命的差距在于场景选择与知识数据的治理。
—— 顺丰集团 CIO 刘潭仁

实战演示(上半场)

现场需求采集

请一位听众用一句话描述其所在公司的一项重复性工作,作为本次演示的需求输入。

🎤 哪位愿意配合?

实战演示(上半场)

需求提交与任务启动

将上一环节采集的需求拆解为若干执行步骤,提交至 AI 工具后台执行。

演示在讲完 4 个案例后回看结果。

案例 1 · 政府招标线索抓取 · 阶段一:试运行失败

2026.03

❌ 失败结果

  • 今日抓取:5 条
  • 明日抓取:0 条
  • 后日:抓偏了

复盘分析

  • 第一层:当时产品底层 Harness 成熟度还不够
  • 第二层:当时大模型与今天不可同日而语

算力 × Harness 双重进步 → 今天能做好的事,三个月前就是做不好

案例 1 · 政府招标线索抓取 · 阶段二:转换思路

2026.05

✅ 转换方案

  • 换工具:Claude Code
  • 换思路:让 AI 写代码,不是让 AI 去猜数据
  • 你的输入:需求 + 网站结构 + 输出格式
  • 你的输出:一行代码没写

💡 关键洞察

  • 政府网站架构高度同质化,适配一个适配一批
  • 从"依赖 AI 思考火花" → "稳定运行的标准化工作流"

稳定运行,持续抓取

📊 抓取信息看板

案例 1 · 核心结论:规则与 AI 的取舍

📝 规则明确的事

→ 写代码 / 算法

  • 重复度高
  • 判断弱化
  • 规则明确

🤖 需要灵活判断的事

→ 用 AI

满足 → 写代码,稳定性 + 成本都最优
不满足 → 才用 AI

让 AI 帮你判断"这件事是否该 AI 做"
—— 关键洞察

能用可量化的标准来管控的流程
就不要交给大模型自主决策

—— 我从三月踩到五月悟到的

案例 2 · 投标文件撰写 · 标书拆开看

收集招标要求 提取评审标准 匹配公司资质 整理历史案例 逐章撰写 交叉审核 排版出稿

流程明确,每步边界清晰 → AI 落地最理想的场景

业务人员原话:「往常一份上百页标书,两到三天」

为什么不直接用免费 AI 写?

❌ 一次性给 AI 写数万字

  • 上下文焦虑
  • 写到一半丢细节
  • 急着收尾

✅ 拆成章节节点

  • 每次空状态执行一个子任务
  • 稳定高质量输出
  • 多智能体协作范式

任务原子化 = 成功关键

为什么选择用外部产品?

维度 自研标书系统 用外部产品
开发成本 中等
算力成本 文字成本低 文字成本低
研发费用摊销 中等 低(AI 开发的产品)
企业买的不是 prompt,是每个月少折磨几个人的流程

人 vs AI 的本质差别

👤 人

注意力会衰减,无法 8 小时高度集中

一份百页标书要 2-3 天
半数内容是范式化重复

🤖 AI

在限定上下文内可高度工业化产出

质量稳定 · 口径统一 · 不知疲倦

范式化工作交给 AI,人的精力留给真正需要判断的事

案例 3 · 项目人员调配看板

📋 问题背景

  • 跨多个业务板块协作
  • 谁知道谁在哪个项目?只有部门负责人
  • 领导开会当晚,我搭了一个看板
功能:项目+人员可视化、拖拽指派、企业微信通知

💡 关键判断

这个看板本质不是智能化,是数字化

引用:数字化基础课——「如果数字化只是换个地方重复劳动,带来的是额外成本」

👥 人员调配看板

企业独特的个性化需求
通过定向研发来满足

  • 监理行业合规约束:总监不能跨市、同市项目 ≤ 3 个
  • 通用软件 ❌ → 自研 ✅
高度可定制的业务逻辑,忠实还原特殊场景的设计要求,通过系统策略防止人为操作失误

案例 4 · 收款追踪提醒

不及时请款,甲方就觉得拖几天也没问题。

收款延迟每增加 7 天,后续回款难度上升 30%

📝 行业痛点:建筑大单,先服务后收款,多收款节点

合同虽然有约定,但甲方形成"拖几天也没事"心理

这件事不是技术问题,是工程化设计问题

案例 4 · 收款追踪提醒 · MVP 全流程 💰 收款追踪系统

步骤谁/什么做输入输出
1. 合同上传合同 PDF进入系统
2. AI 识别收款节点AI合同全文节点清单 + 时间表
3. 到期自动提醒系统时间表企业微信消息
4. 提醒开票系统业务完成信号提醒财务
5. AI 生成请款报告AI发票 + 节点状态报告草稿
6. 人核实报告草稿确认/修改
7. 一键发送人确认后系统确认报告发送到甲方群
第 6 步"人核实"——这是 AI 与人之间的边界
—— 全场最重要的"人机边界"

为什么选择自研?数据治理战略

❌ 数据割裂的代价

A SaaS 做人员 + B SaaS 做项目 + C SaaS 做财务

AI 访问三套数据,需要 3 个 API、3 套权限、3 种格式

✅ 自研统一平台

数据在一个系统里,AI 一次访问全部

过去的数据平台是服务人的,今天的数据平台必须服务好 AI Agent
—— 亚马逊云科技 王晓野

今天回去就做两件事

① 梳理流程

找到高净值、高重复度、标准明确的环节

② 检查 SaaS 能不能导出数据

决定你未来能不能安全拿回数据

数据是未来 AI 参与企业决策的核心依据。

从今天开始积累。

案例 5 · GEO 品牌可见度监测

定时提问机器人
多个 AI 平台
Claude/Gemini/Qwen
答案采集
公司名是否出现+排名
统计表
折线图

最简单的自研,也能解决最真实的商业问题

给你一个可量化的方式衡量智能营销投入的回报

📊 GEO追踪统计

实践案例路径矩阵

自研 + AI

案例 4 收款追踪
案例 5 品牌监测

有一定门槛

用外部 + AI

案例 2 标书撰写

最普适 ✓

自研 + 代码

案例 3 人员调配
案例 1 招标爬取

稳定但缺乏智能

用外部 + 代码

传统SaaS软件服务商

横轴:用 AI 还是用代码 | 纵轴:自研还是用外部

智能体落地的阶段与判定标准

决策前
1 价值锚点
2 场景筛选
3 规则 vs AI
启动中
4 流程是地基
5 工具优先级
6 平台化意识
持续化
7 人机分工
8 组织进化
9 数据资产

如果你今天回去要做一个 AI 项目
按这 9 个点问自己

判断点 1 · 价值锚点

同一个项目,只锚一个价值

降本

替代重复性工作

提效

加速某个流程

控风险

避免某种损失

同时追求三个 = 范围不清 = 失败概率高

判断点 2 · 场景筛选

频次够高吗?

一月一次不算高,一天一次才算

原有成本清晰吗?

工时、外包费、周期要算得清

结果会被真实使用吗?

内部演示不算,真实业务流才算

能短周期重复跑 3 轮吗?

跑不出稳定性 = 没跑通

高频小场景会不断重复,每一次重复都在帮你校准方向

判断点 3 · 规则 vs AI

能写成规则的就不要交给 AI 猜

规则明确的事

→ 写代码

需要灵活判断的事

→ AI

四个特征:可量化 / 重复度高 / 判断弱化 / 规则明确 → 写代码

判断点 4 · 流程是地基

1

文档化

这件事写下来了吗?

2

标准化

不同人来做,结果一样吗?

3

可执行

能在真实业务里跑完吗?

4

可监控

能看到每个节点的效率吗?

5

可治理

有问题能持续优化吗?

多数中小企业第一步都没完成 —— 流程全在人脑子里

判断点 5 · 工具优先级

独立场景 + 大众化需求?

→ 优先用外部低价 AI 服务

核心流程 + 个性化需求?

→ 自研

你的数据能导出?

→ 可用 SaaS

核心业务数据不允许泄漏?

→ 必须自研

软件可以买,服务可以买,但能力不能买

判断点 6 · 平台化意识

AI 能力

算法 + Skill + 工具

载体(平台)

能接触数据、编辑数据、反馈变化

数据

业务数据、运营数据、操作数据

未来自研产品,不知人类能用,要做到 AI 也能用

判断点 7 · 人机分工

🤖

哪些环节 AI 执行?

👁️

哪些环节AI审核?

哪些环节人类审批?

不要追求绝对准确率,关键节点人为把关

判断点 8 · 组织进化

AI 能力要长在组织内部,不能长期外包

FDE

Forward Deployment Engineer · 前沿部署工程师

连接业务部门与 AI 能力的角色

AI 中台

统一管理模型、知识库、Skill、Agent、权限、评测

找公司里最年轻的那个愿意折腾的人,这就是你的种子

判断点 9 · 数据资产

能导出的数据是资产,锁在 SaaS 里的数据是负债

资产

可读、可改、可迁移、可持续优化

负债

能看能动、但导出困难、迁移成本高、停服即消失

从今天开始积累业务数据、运营数据、操作数据

实战演示(下半场) · 结果展示

我们回到刚才丢给 AI 的那个任务 —— 看它跑得怎么样

适不适合 AI 化?

AI 判断适合,建议了具体的落地路径

第一步做什么?

建议先从数据梳理入手

需要什么数据?

列出了关键数据字段清单

多久能跑通?

建议两到四周的 MVP 周期

"不会"不是不开始的理由

—— "不会构建这个项目"这件事本身,都可以问 AI

你不会没关系 —— 你不会的这件事,AI 会

互动回应 · 三个高频问题

保险团队管理

人员调配看板的思路完全适用。本质都是人员分配和时效提醒的问题

文案/PPT 提效

标书就是"大型文案"的典型。AI 已经能够直接生成完整演示文稿

如何入门

今天回去就打开任何 AI 工具,把你打了分的那件事打进去

两小时
把一个审批流程的规则写清楚
你就已经开始了

AI 落地最怕的不是技术不够 —— 是永远没有一个开始

真正决定能不能落地的,从来不是模型强不强
而在于踏出作为管理者的第一步

二维码

谢谢大家 · 郭明达 · 2026.06.21

1 / 29