1 / 25
北京城建设计集团杭州分院 · AI培训

AI赋能设计
从认知到行动

不是IT技术课,而是AI赋能设计工作的认知升级与实操指南

侃姐AI进化Lab 侃姐AI进化Lab
开篇数据

AI正在加速改变产研方式

以Anthropic为镜,看AI编程的真实进化速度

AI能力进化趋势
🤖 Claude写的代码占比
Anthropic现在合入生产代码库的代码,超过80%是Claude写的
2025年2月前还只是个位数,因为顶级程序员对AI写的代码更挑剔。
仅一年多,从"偶尔粘贴几段"变成了"AI主力输出"
今年工程师日均合入代码量是 2024年的8倍
⏱️ AI独立完成任务的时长(50%成功率)
翻倍速度从约 7个月加速到约4个月
· 2024年3月 → 4分钟
· 2025年3月 → 1.5小时
· 2026年3月 → 12小时
照此趋势,今年可能到几天,明年可能到几周。
第一部分

11个关键概念摸底

💡 听说过的举手:先对齐语言,再看体系时不懵

1. Token(词元)
AI处理文字的最小单位。一个汉字约1-2个Token,决定一次能处理的内容量和调用成本。
2. Prompt(提示词)
你给AI的指令。Prompt质量直接决定输出质量。“问得好”比“模型强”更重要。
3. 幻觉 (Hallucination)
AI自信地输出错误信息,基于概率“合理推测”。在设计领域,这是最大的风险点。
4. RAG (检索增强生成)
让AI先从企业知识库找资料再回答。像“开卷考试”,能大幅降低幻觉发生。
5. 微调 (Fine-tuning)
在通用大模型基础上,用行业数据进一步训练,让AI更懂轨道交通设计规范。
6. Agent (智能体)
自主规划、执行、纠错的系统。Prompt是你问它答,Agent是你定目标它自己跑。
7. 知识图谱
把信息组织成“实体—关系”结构,让AI不只是搜关键词,而是真正理解概念关联。
8. 量化 (Quantization)
压缩模型体积技术。让原本需集群的70B大模型能跑在消费级显卡上,损失微小。
9. 上下文窗口
AI一次能“看到”的最大文本长度。超出的内容AI就“看不见”或遗忘了。
10. 向量化 (Embedding)
把文字变数字向量,让系统能“算”出文本相关度。是RAG和知识库检索的底层原理。
11. Harness (安全脚手架)
给AI一个受控环境试错。先在历史项目(虚拟场景)跑通,再上真实生产。
第二部分

AI工具不只是ChatGPT:五层体系

用哪一层决定了AI是"玩具"还是"工具"

层级类型代表工具关键词对应场景
Level 1Prompt工具DeepSeek、通义千问你问它答,一轮结束规范检索、摘要
Level 2工作流工具Coze、Dify你画路线,它跑全程新媒体工作流
Level 3AI编程工具VSCode+Cline、Codex你提它写,从辅助到原生Vibe Coding
Level 4全自动AgentHermes、OpenClaw你定目标,它交付产品完整应用交付
Level 5AI操作助理悟空、Marvis你下指令,操作电脑执行跨软件操作
实战演示

Level 1:Prompt工具

对话即用,零门槛

现场实战:把一段设计规范丢给DeepSeek,提取关键参数整理成表格。
❌ 差的Prompt
“帮我看看这个规范”

结果:AI返回大段废话总结。
✅ 好的Prompt
“从以下规范中提取涉及荷载要求的参数,按'名称、数值、适用条件'整理成表格”

提示词四要素:角色 + 任务 + 背景 + 要求

实战演示

Level 2:工作流工具

把多个步骤串成流水线,让AI“专家团”自动协作

✍️

典型工作流:AI专家团协作写作

将复杂任务拆解为7个标准动作,由不同角色的AI专家(Agent)接力完成

1. 选题
策划专家:分析热点与受众需求,拟定文章核心方向与大纲。
2. 素材
搜集专家:根据大纲进行全网检索,并从知识库提取相关参考资料。
3. 核查
质检专家:对素材、数据和引用的事实进行交叉验证,确保准确性。
4. 文章
主笔专家:融合可靠素材与大纲,撰写符合特定风格要求的文章初稿。
5. 审稿
总编专家:从专业度、流畅度、逻辑性等维度对初稿进行全面审阅。
6. 修改
主笔专家:根据总编的审阅意见,对文章进行针对性修改与打磨完善。
7. 排版
运营专家:生成吸引人的标题、摘要,配置插图并完成最终的格式化排版。
实战演示

Level 3:AI编程工具

你从“写代码的人”变成“审代码的人”

🤝
辅助型 (Copilot / Cline)
夹在代码编辑器里:AI实时补全代码、解释报错、重构函数。你在主导,它打辅助。
提速 3-5 倍
🚀
原生型 (Claude Code)
直接在命令行下指令:给一个BIM插件需求描述,AI直接从零生成完整可运行的代码项目。
实战演示

Level 4:全自动Agent

你定目标,它交付产品

现场实战:打开 Hermes/OpenClaw
输入一个模糊目标,AI自己拆分任务、编写代码、运行测试、自行调试并部署。这不是demo,是真的能交付的产品。
ℹ️
人只需要在关键节点(如架构选择、功能裁剪)确认方向,执行层全权交由Agent处理。
🔗 体验 OpenClaw 全自动Agent演示 🔗 多Agent架构演示
实战演示

Level 5:AI操作助理

模型+框架融合的终极形态,自主操作电脑

🖱️

实战:跨软件操控 (悟空/Marvis)

人类指令:
“打开这个Excel,提取B列的设备数据,粘贴到Word的验收表格里,然后发邮件给项目经理。”

执行逻辑:
对话与执行不再分开。AI理解屏幕内容、寻找按钮位置、模拟鼠标键盘完成跨软件协作。
落地建议

该从哪层开始?

落地阶段推荐层级具体场景预期效果
即时可用Level 1用DeepSeek处理规范检索、方案起草摘要单点提效
短期部署Level 2用Dify搭建内部设计规范问答系统知识库可用
中期推进Level 2-3工作流自动化审图,AI辅助开发内部工具流程自动化
长期探索Level 4-5全自动Agent交付产品,跨软件自动操控全自动化
认知升级

从“棍子”到“碗”

棍子思维 (Level 1)
戳一下出一个洞,用完放下。出一张图、查一个参数,效率虽高,但AI不记你上次问了什么,不记项目背景。
做碗思维 (Level 2-3)
建立企业知识库、工作流。你给AI“参考书架”,AI开始积累数据。碗越用越聪明,越沉淀越有价值。
核心隐喻:很多人的AI是“问路”,未来你需要的是“养助手”。数据沉淀是复利,效率提升是一次性。
企业落地

企业级AI路线图三阶段

阶段一:个人级(找棍子)
员工自主使用工具解决日常痛点
责任主体:。AI是辅助,人最终把关结果。快速建立信任。
阶段二:公司级(做碗)
统一部署私有化知识库、Agent工作流
责任主体:人机混合。全院数据开始沉淀,这是下一阶段自进化的燃料。
阶段三:自进化(碗自己长)
系统从反馈中不断学习试错
责任主体:AI为主,人设边界。系统越用越准,自动修正推荐策略。
思维重构

未来的东西是写给谁看的?

你往“碗”里放的东西,不只是给自己看的,更是给AI看的。

今天你写的文档、建的图谱,如果AI能读懂,价值就不止翻倍——因为**AI读知识库比人快1000倍,跑工作流比人准100倍**。

未来的很多流程与规范,是写给AI用的,不是写给人的。
硅碳合体之问

遇到工作先问:这还需要人干吗?

1
不需要人干 → 交给AI
翻规范、写纪要、校核参数。AI比你快100倍且不走神。
2
人机协同 → 一起干
AI出三个方案对比,人来拍板选型;梳理跨专业接口。
3
必须人干 → AI别碰
签字背书担责、安全底线决策、方案的价值判断与审美。
进化控制

自进化不是放养:安全脚手架

没有脚手架的自进化一定会出事

机制1:安全框架
明确边界:什么是可以自动调的?
原则:越靠近设计决策越要人工签字;越靠近效率优化越可自动跑。
机制2:检测框架
建立评估机制防偏移
拿已知结果的老图纸定期测试AI,防止AI“自信地犯错”。
机制3:Harness (受控试错)
AI的“仿真环境”
不在生产线上直接试,先在虚拟项目/历史库跑通,再上真实项目。
🔗 点击体验 Harness 受控试错演示
能力边界

AI能做与绝对不能做的

AI擅长处理海量文档、生成初稿、模式图纸比对、自动化
AI不擅长突破性创新决策、多专业复杂协调
绝不可做替工程师签字、最终安全指标审核、向公有大模型传涉密图
⚖️
判断标准:要不要负责?
探索发散、草稿类输出无需担责,大胆放开用。
涉及参数、合规图纸必须加约束,接入知识库+人工复核必不可少!
第三部分:场景实战

文档处理:让AI替你读/找/答

💡 RAG 本地知识库四步走

1. 建库
导入规范与历史图纸,自动向量化切片索引
2. 检索
自然语言提问,追溯原文出处(避免幻觉)
3. 辅助
基于准确数据生成审查回复初稿
4. 自跑
系统后台主动进行合规预检与参数推荐
🔗 点击体验 RAG 知识库演示
工具清单

主流文档与知识库工具选型

工具特点与定位上手难度
腾讯IMA微信生态内拖入文档直接提问⭐极简
千问知识库网页端开箱即用的轻量级建库⭐极简
Dify可视化编排流,接多模型API⭐⭐进阶
AnythingLLM全本地部署,适合极高保密要求⭐⭐进阶
Kimi单次处理200万字(标书/合同专用)⭐极简
场景实战

数据处理:给AI事实核查系统

解决参数散落、查询靠问人的痛点

🦴
Ontology (本体骨架)
定义世界:盾构机是设备,有功率属性。
🔗 在线体验
🩸
知识图谱 (实例血肉)
填入数据:1号线某区间用了某型号盾构机。
🔗 在线体验
🔪
SQL (精准手术刀)
条件过滤:查出该型号故障率指标。
核心认知:Ontology不是给人建的,是给AI建的。让AI从"瞎猜文本"变为"精准检索图谱"。
🗄️ 数据平台 · 在线体验
第四部分

为什么必须本地化部署?

🔒
涉密设计数据上公有云 = 保险箱钥匙挂门口

涉密图纸、重点工程坐标、未公开投标方案,严禁传入公有大模型API。
工作必须依赖局域网企业版或私有化部署算力平台!
成本账

企业私有化部署三档方案

💰 零预算个人体验
RTX 4060Ti + Ollama
跑 Qwen-7B
硬件成本:¥0.8万
体验:日常流畅
⚡ 万元级团队生产
单卡RTX 4090 + Dify
跑 Qwen-14B量化版
硬件成本:¥5万左右
体验:10人小团队
🏢 企业级高并发
2张RTX 6000 Ada + vLLM
跑 Qwen-72B量化版
硬件成本:¥20万左右
体验:接近GPT4,40人并发
📄 查看完整成本对比分析报告
部署链路

硬件参数与工具链速查(4-bit量化)

模型规模📦 权重底线🌊 显存要求推荐GPU方案体验与适用场景
7B - 8B约4.5GB - 5GB8GBRTX 4060 (8G)个人PC极速响应:基础代码补全、简单问答、个人知识库
14B - 16B约8.5GB - 10GB12GB - 16GBRTX 4060 Ti (16G版)综合能力均衡:10人以内小团队,能够处理中等长度的文档分析和RAG检索
32B - 34B约18GB - 20GB24GBRTX 4090 (24G)高性价比生产力:处理复杂推理、长文本编程、专业领域深度的极佳底座
70B - 72B约38GB - 40GB96GB (高并发必须)两张RTX 6000 Ada (共96G)企业级核心:高并发,复杂Multi-Agent协作底层模型
总显存需求 = 模型纯权重 (Weights) + 底层开销 (CUDA/框架) + 辅助模型 (Embedding) + 目标并发缓存 (KV Cache)

工具链路:Ollama/vLLM(引擎) → bge-m3(向量化) → Dify(编排) → OpenWebUI(前端)

第五部分

AI幻觉与设计合规红线

严重警告:
设计参数错误 = 安全事故
凭空编造虚假规范 = 合规事故
选型计算失误 = 重大返工

解决策略:强制RAG知识溯源、输出结果必带来源标注、核心节点人工签审。

安全控制

院级安全制度底线 (Top 5)

1️⃣ 涉密项目严禁调用外网API,强制内网大模型。
2️⃣ 即刻起草发布《分院AI工具使用安全规范守则》。
3️⃣ 正式立项启动企业级私有化模型底座评估测试。
4️⃣ 凡涉审查/合规的AI自动生成件,必留人工复核签名轨迹。
5️⃣ 落实全员每季度AI安全警示培训机制。
终极总结

带走一个判断框架

遇到任何AI工具,先灵魂三问

❓ 这是哪一层?
弄清它是聊天工具(L1)还是自动Agent(L4),决定了你的期望值。选对层级比选对工具更重要。
🔒 数据安全吗?
明确涉密边界。不确定是否涉密的数据,一律按涉密处理,切断外网。
🥣 这是棍子还是碗?
解决一次就扔掉是棍子;工具能随你使用沉淀经验,就是碗。尽量选碗!