北京城建设计集团杭州分院 · AI培训

AI赋能设计
从认知到行动

不是IT技术课，而是AI赋能设计工作的认知升级与实操指南

侃姐AI进化Lab

开篇数据

AI正在加速改变产研方式

以Anthropic为镜，看AI编程的真实进化速度

🤖 Claude写的代码占比

Anthropic现在合入生产代码库的代码，超过80%是Claude写的。
2025年2月前还只是个位数，因为顶级程序员对AI写的代码更挑剔。
仅一年多，从"偶尔粘贴几段"变成了"AI主力输出"。
今年工程师日均合入代码量是 2024年的8倍。

⏱️ AI独立完成任务的时长（50%成功率）

翻倍速度从约 7个月加速到约4个月：
· 2024年3月 → 4分钟
· 2025年3月 → 1.5小时
· 2026年3月 → 12小时
照此趋势，今年可能到几天，明年可能到几周。

第一部分

11个关键概念摸底

💡 听说过的举手：先对齐语言，再看体系时不懵

1. Token（词元）

AI处理文字的最小单位。一个汉字约1-2个Token，决定一次能处理的内容量和调用成本。

2. Prompt（提示词）

你给AI的指令。Prompt质量直接决定输出质量。“问得好”比“模型强”更重要。

3. 幻觉 (Hallucination)

AI自信地输出错误信息，基于概率“合理推测”。在设计领域，这是最大的风险点。

4. RAG (检索增强生成)

让AI先从企业知识库找资料再回答。像“开卷考试”，能大幅降低幻觉发生。

5. 微调 (Fine-tuning)

在通用大模型基础上，用行业数据进一步训练，让AI更懂轨道交通设计规范。

6. Agent (智能体)

自主规划、执行、纠错的系统。Prompt是你问它答，Agent是你定目标它自己跑。

7. 知识图谱

把信息组织成“实体—关系”结构，让AI不只是搜关键词，而是真正理解概念关联。

8. 量化 (Quantization)

压缩模型体积技术。让原本需集群的70B大模型能跑在消费级显卡上，损失微小。

9. 上下文窗口

AI一次能“看到”的最大文本长度。超出的内容AI就“看不见”或遗忘了。

10. 向量化 (Embedding)

把文字变数字向量，让系统能“算”出文本相关度。是RAG和知识库检索的底层原理。

11. Harness (安全脚手架)

给AI一个受控环境试错。先在历史项目（虚拟场景）跑通，再上真实生产。

第二部分

AI工具不只是ChatGPT：五层体系

用哪一层决定了AI是"玩具"还是"工具"

层级	类型	代表工具	关键词	对应场景
Level 1	Prompt工具	DeepSeek、通义千问	你问它答，一轮结束	规范检索、摘要
Level 2	工作流工具	Coze、Dify	你画路线，它跑全程	新媒体工作流
Level 3	AI编程工具	VSCode+Cline、Codex	你提它写，从辅助到原生	Vibe Coding
Level 4	全自动Agent	Hermes、OpenClaw	你定目标，它交付产品	完整应用交付
Level 5	AI操作助理	悟空、Marvis	你下指令，操作电脑执行	跨软件操作

实战演示

Level 1：Prompt工具

对话即用，零门槛

现场实战：把一段设计规范丢给DeepSeek，提取关键参数整理成表格。

❌ 差的Prompt

“帮我看看这个规范”

结果：AI返回大段废话总结。

✅ 好的Prompt

“从以下规范中提取涉及荷载要求的参数，按'名称、数值、适用条件'整理成表格”

提示词四要素：角色 + 任务 + 背景 + 要求

实战演示

Level 2：工作流工具

把多个步骤串成流水线，让AI“专家团”自动协作

✍️

典型工作流：AI专家团协作写作

将复杂任务拆解为7个标准动作，由不同角色的AI专家（Agent）接力完成

1. 选题

策划专家：分析热点与受众需求，拟定文章核心方向与大纲。

2. 素材

搜集专家：根据大纲进行全网检索，并从知识库提取相关参考资料。

3. 核查

质检专家：对素材、数据和引用的事实进行交叉验证，确保准确性。

4. 文章

主笔专家：融合可靠素材与大纲，撰写符合特定风格要求的文章初稿。

5. 审稿

总编专家：从专业度、流畅度、逻辑性等维度对初稿进行全面审阅。

6. 修改

主笔专家：根据总编的审阅意见，对文章进行针对性修改与打磨完善。

7. 排版

运营专家：生成吸引人的标题、摘要，配置插图并完成最终的格式化排版。

实战演示

Level 3：AI编程工具

你从“写代码的人”变成“审代码的人”

🤝

辅助型 (Copilot / Cline)

夹在代码编辑器里：AI实时补全代码、解释报错、重构函数。你在主导，它打辅助。
提速 3-5 倍

🚀

原生型 (Claude Code)

直接在命令行下指令：给一个BIM插件需求描述，AI直接从零生成完整可运行的代码项目。

实战演示

Level 4：全自动Agent

你定目标，它交付产品

现场实战：打开 Hermes/OpenClaw
输入一个模糊目标，AI自己拆分任务、编写代码、运行测试、自行调试并部署。这不是demo，是真的能交付的产品。

ℹ️

人只需要在关键节点（如架构选择、功能裁剪）确认方向，执行层全权交由Agent处理。

🔗 体验 OpenClaw 全自动Agent演示 🔗 多Agent架构演示

实战演示

Level 5：AI操作助理

模型+框架融合的终极形态，自主操作电脑

🖱️

实战：跨软件操控 (悟空/Marvis)

人类指令：
“打开这个Excel，提取B列的设备数据，粘贴到Word的验收表格里，然后发邮件给项目经理。”

执行逻辑：
对话与执行不再分开。AI理解屏幕内容、寻找按钮位置、模拟鼠标键盘完成跨软件协作。

落地建议

该从哪层开始？

落地阶段	推荐层级	具体场景	预期效果
即时可用	Level 1	用DeepSeek处理规范检索、方案起草摘要	单点提效
短期部署	Level 2	用Dify搭建内部设计规范问答系统	知识库可用
中期推进	Level 2-3	工作流自动化审图，AI辅助开发内部工具	流程自动化
长期探索	Level 4-5	全自动Agent交付产品，跨软件自动操控	全自动化

认知升级

从“棍子”到“碗”

棍子思维 (Level 1)

戳一下出一个洞，用完放下。出一张图、查一个参数，效率虽高，但AI不记你上次问了什么，不记项目背景。

做碗思维 (Level 2-3)

建立企业知识库、工作流。你给AI“参考书架”，AI开始积累数据。碗越用越聪明，越沉淀越有价值。

核心隐喻：很多人的AI是“问路”，未来你需要的是“养助手”。数据沉淀是复利，效率提升是一次性。

企业落地

企业级AI路线图三阶段

阶段一：个人级（找棍子）

员工自主使用工具解决日常痛点

责任主体：人。AI是辅助，人最终把关结果。快速建立信任。

阶段二：公司级（做碗）

统一部署私有化知识库、Agent工作流

责任主体：人机混合。全院数据开始沉淀，这是下一阶段自进化的燃料。

阶段三：自进化（碗自己长）

系统从反馈中不断学习试错

责任主体：AI为主，人设边界。系统越用越准，自动修正推荐策略。

思维重构

未来的东西是写给谁看的？

你往“碗”里放的东西，不只是给自己看的，更是给AI看的。

今天你写的文档、建的图谱，如果AI能读懂，价值就不止翻倍——因为**AI读知识库比人快1000倍，跑工作流比人准100倍**。

未来的很多流程与规范，是写给AI用的，不是写给人的。

硅碳合体之问

遇到工作先问：这还需要人干吗？

1

不需要人干 → 交给AI

翻规范、写纪要、校核参数。AI比你快100倍且不走神。

2

人机协同 → 一起干

AI出三个方案对比，人来拍板选型；梳理跨专业接口。

3

必须人干 → AI别碰

签字背书担责、安全底线决策、方案的价值判断与审美。

进化控制

自进化不是放养：安全脚手架

没有脚手架的自进化一定会出事

机制1：安全框架

明确边界：什么是可以自动调的？

原则：越靠近设计决策越要人工签字；越靠近效率优化越可自动跑。

机制2：检测框架

建立评估机制防偏移

拿已知结果的老图纸定期测试AI，防止AI“自信地犯错”。

机制3：Harness (受控试错)

AI的“仿真环境”

不在生产线上直接试，先在虚拟项目/历史库跑通，再上真实项目。

🔗 点击体验 Harness 受控试错演示

能力边界

AI能做与绝对不能做的

AI擅长	处理海量文档、生成初稿、模式图纸比对、自动化
AI不擅长	突破性创新决策、多专业复杂协调
绝不可做	替工程师签字、最终安全指标审核、向公有大模型传涉密图

⚖️

判断标准：要不要负责？
探索发散、草稿类输出无需担责，大胆放开用。
涉及参数、合规图纸必须加约束，接入知识库+人工复核必不可少！

第三部分：场景实战

文档处理：让AI替你读/找/答

💡 RAG 本地知识库四步走

1. 建库

导入规范与历史图纸，自动向量化切片索引

2. 检索

自然语言提问，追溯原文出处（避免幻觉）

3. 辅助

基于准确数据生成审查回复初稿

4. 自跑

系统后台主动进行合规预检与参数推荐

🔗 点击体验 RAG 知识库演示

工具清单

主流文档与知识库工具选型

工具	特点与定位	上手难度
腾讯IMA	微信生态内拖入文档直接提问	⭐极简
千问知识库	网页端开箱即用的轻量级建库	⭐极简
Dify	可视化编排流，接多模型API	⭐⭐进阶
AnythingLLM	全本地部署，适合极高保密要求	⭐⭐进阶
Kimi	单次处理200万字（标书/合同专用）	⭐极简

场景实战

数据处理：给AI事实核查系统

解决参数散落、查询靠问人的痛点

🦴

Ontology (本体骨架)

定义世界：盾构机是设备，有功率属性。

🔗 在线体验

🩸

知识图谱 (实例血肉)

填入数据：1号线某区间用了某型号盾构机。

🔗 在线体验

🔪

SQL (精准手术刀)

条件过滤：查出该型号故障率指标。

核心认知：Ontology不是给人建的，是给AI建的。让AI从"瞎猜文本"变为"精准检索图谱"。

🗄️ 数据平台 · 在线体验

第四部分

为什么必须本地化部署？

🔒

涉密设计数据上公有云 = 保险箱钥匙挂门口

涉密图纸、重点工程坐标、未公开投标方案，严禁传入公有大模型API。
工作必须依赖局域网企业版或私有化部署算力平台！

成本账

企业私有化部署三档方案

💰 零预算个人体验

RTX 4060Ti + Ollama
跑 Qwen-7B
硬件成本：¥0.8万
体验：日常流畅

⚡ 万元级团队生产

单卡RTX 4090 + Dify
跑 Qwen-14B量化版
硬件成本：¥5万左右
体验：10人小团队

🏢 企业级高并发

2张RTX 6000 Ada + vLLM
跑 Qwen-72B量化版
硬件成本：¥20万左右
体验：接近GPT4，40人并发

📄 查看完整成本对比分析报告

部署链路

硬件参数与工具链速查（4-bit量化）

模型规模	📦 权重底线	🌊 显存要求	推荐GPU方案	体验与适用场景
7B - 8B	约4.5GB - 5GB	8GB	RTX 4060 (8G)	个人PC极速响应：基础代码补全、简单问答、个人知识库
14B - 16B	约8.5GB - 10GB	12GB - 16GB	RTX 4060 Ti (16G版)	综合能力均衡：10人以内小团队，能够处理中等长度的文档分析和RAG检索
32B - 34B	约18GB - 20GB	24GB	RTX 4090 (24G)	高性价比生产力：处理复杂推理、长文本编程、专业领域深度的极佳底座
70B - 72B	约38GB - 40GB	96GB (高并发必须)	两张RTX 6000 Ada (共96G)	企业级核心：高并发，复杂Multi-Agent协作底层模型

总显存需求 = 模型纯权重 (Weights) + 底层开销 (CUDA/框架) + 辅助模型 (Embedding) + 目标并发缓存 (KV Cache)

工具链路：Ollama/vLLM(引擎) → bge-m3(向量化) → Dify(编排) → OpenWebUI(前端)

第五部分

AI幻觉与设计合规红线

严重警告：
设计参数错误 = 安全事故
凭空编造虚假规范 = 合规事故
选型计算失误 = 重大返工

解决策略：强制RAG知识溯源、输出结果必带来源标注、核心节点人工签审。

安全控制

院级安全制度底线 (Top 5)

1️⃣ 涉密项目严禁调用外网API，强制内网大模型。
2️⃣ 即刻起草发布《分院AI工具使用安全规范守则》。
3️⃣ 正式立项启动企业级私有化模型底座评估测试。
4️⃣ 凡涉审查/合规的AI自动生成件，必留人工复核签名轨迹。
5️⃣ 落实全员每季度AI安全警示培训机制。

终极总结

带走一个判断框架

遇到任何AI工具，先灵魂三问

❓ 这是哪一层？

弄清它是聊天工具(L1)还是自动Agent(L4)，决定了你的期望值。选对层级比选对工具更重要。

🔒 数据安全吗？

明确涉密边界。不确定是否涉密的数据，一律按涉密处理，切断外网。

🥣 这是棍子还是碗？

解决一次就扔掉是棍子；工具能随你使用沉淀经验，就是碗。尽量选碗！

AI赋能设计从认知到行动

AI正在加速改变产研方式

11个关键概念摸底

AI工具不只是ChatGPT：五层体系

Level 1：Prompt工具

Level 2：工作流工具

典型工作流：AI专家团协作写作

Level 3：AI编程工具

Level 4：全自动Agent

Level 5：AI操作助理

实战：跨软件操控 (悟空/Marvis)

该从哪层开始？

从“棍子”到“碗”

企业级AI路线图三阶段

未来的东西是写给谁看的？

遇到工作先问：这还需要人干吗？

自进化不是放养：安全脚手架

AI能做与绝对不能做的

文档处理：让AI替你读/找/答

💡 RAG 本地知识库四步走

主流文档与知识库工具选型

数据处理：给AI事实核查系统

为什么必须本地化部署？

企业私有化部署三档方案

硬件参数与工具链速查（4-bit量化）

AI幻觉与设计合规红线

院级安全制度底线 (Top 5)

带走一个判断框架

AI赋能设计
从认知到行动