AI 时代 · 如何学习与开发 —— 给赴美理科新生的一堂课

开场 · 我们要去哪

先给你一张这堂课的地图

别人分享 AI，常常是「安利 App」。我想给你的，是一副能用很多年的认知框架。三幕，十站。

👁 第一幕 · 看懂 AI

模型不是一种东西。语言、图像、视频、世界模型……先建一张全景图，再认清它们今天还做不到什么。看不懂就会被忽悠。

🛠 第二幕 · 用好 AI

「调用一个模型」和「让它发挥满血」是两回事。上下文、搜索、工具、智能体、成本——这一幕全是工程与经济学。

🚀 第三幕 · 放大自己

站在开源肩膀上、批量做内容、几天吃透一个陌生领域。AI 不替代你，它是一个放大器——放大你的判断力。

✦

贯穿全课的一句话

AI 把「执行」变便宜了，于是「提对问题」和「判断好坏」变贵了。这堂课几乎每一站，都在练这两件事。

模块 01 认知地图 · 升级版四象限

你和 AI 之间，隔着四种「不知道」

有人把「和 AI 一起干活」拆成一个经典的四象限（已知已知 / 已知未知 / 未知已知 / 未知未知）。它很好，但只停在「描述」。我们把它升级成能动手的方法——每一格，在 AI 时代都有一个具体动作。

一个侧面的头，脑中分成四个象限，其中一格隐没在雾里 — 三格是清楚的，最坑的是隐在雾里的第四格——你不知道自己不知道。

动手点开每一格

看它在 AI 时代怎么用

🧭

这就是「超越参考图」的第一步

原图告诉你「有四种不知道」。升级版告诉你：把未知未知，用一次主动的「盲点提问」变成已知未知；把已知未知，用 AI 拆解变成已知已知；而未知已知（你的品味），是你要一辈子打磨、最不可替代的东西。

模块 02 模型全景 · 一个家族，不是一个东西

「AI」这个词太糊了，先把它拆开

大多数人说「AI」，脑子里只有 ChatGPT。但今天的模型是一整个家族：有的处理语言，有的画画，有的生成视频，有的在你手机里离线跑，还有的在生成一个能玩的世界。用途不同、成本差几百倍。先认识全家，才谈得上会用。

不同类型 AI 模型像一个星座家族漂浮在一起 — 一本语言之书、一支画笔、一卷胶片、一颗种子、一个水晶球——每一个都是一类模型。

先看最熟的那个：大语言模型，本质是「猜下一个词」

GPT、Claude、Gemini 都属于大语言模型（LLM）。它听起来在「思考」，其实核心机制朴素得惊人：看着前面的文字，一个词一个词地预测「接下来最可能是什么」。把这件事在海量文本上练到极致，就长出了写作、翻译、写代码的能力。自己点一下试试：

动手一次一个词地「生成」

点候选词继续，或让它自动接

💡 每个词都是从一堆「概率候选」里挑的。这解释了两件事：为什么它同一个问题每次答得略不同，以及为什么它会一本正经地编造——它挑的是「最像对的词」，不是「查过的事实」。

按你的任务，认识整个模型家族

点一个你想做的事，看该用哪一类模型。这张表你以后每次开新项目都可以在脑子里过一遍。

动手我想做的是……

点任务 → 高亮推荐模型

📖

Large Language Model

大语言模型 LLM

把语言变成可计算的东西：读、写、总结、翻译、对话、写代码。是今天大多数 AI 应用的「大脑」。

Claude Opus 4.8 · GPT-5.6 · Gemini 3.1 · DeepSeek V4 · Qwen 3.7

🧠

Reasoning Model

推理 / 思考模型

回答前先「想」很久，用更多计算换更对的结果。适合数学、多步规划、复杂 debug。慢且贵。

Gemini 3 Deep Think · DeepSeek-R1 · 各家 thinking 档位

🔋

Small / Local Model

小模型 / 本地模型

小到能塞进手机、笔记本，断网也能跑。省钱、保护隐私、响应快。能力不如旗舰，但很多任务够用。

Gemma 4 · Qwen3.5 小尺寸 · Phi-4 · Apple 端侧 3B

🎨

Image Generation

图像生成模型

文字 → 图片，或图 → 图修改。海报、插画、产品图、换背景。这堂课的 27 张配图就是这么来的。

GPT Image 2 · Nano Banana Pro · FLUX.2 · Seedream · Midjourney V8

🎬

Video Generation

视频生成模型

文字或一张图 → 会动的画面，最新的还能带原生音效、多镜头、真实物理。最贵的一类。

Seedance 2.5 · Kling 3.0 · Veo 3.1 · Sora 2 · Wan（开源）

🌐

World Model

世界模型

生成一个能交互、有物理、会自己往下演的世界。你按一下，世界会响应。通向游戏、机器人、具身智能。

Genie 3 / Project Genie · NVIDIA Cosmos 3 · Marble（李飞飞团队）

🎙

Speech (TTS / ASR)

语音模型

文字 ↔ 声音：配音（TTS）与转写字幕（ASR）。做视频、播客、无障碍朗读都靠它。

ElevenLabs v3 · Scribe v2 · Whisper（开源）

🧲

Embedding

嵌入模型

把任意内容变成一串数字坐标，让机器判断「像不像」。是搜索、推荐、和「让 AI 记住你资料」的地基。

Gemini Embedding · Qwen3-Embedding · text-embedding-3

✳️

Multimodal

多模态 / 全模态

一个模型同时吃文字、图片、声音、视频。今天的旗舰几乎都是多模态——你可以直接把一张照片丢给它问。

旗舰 LLM 大多已多模态

几种模型，各自长什么样

给你一点直觉画面——它们不是一种东西，脾气也很不一样。

图像和视频，是怎么「无中生有」的？

画图模型用的是扩散（diffusion）：先给一张纯噪声（像老电视的雪花），再一步步「去噪」，把雪花逐渐擦成一张符合你描述的图。视频生成是同一个思路，只是要让连续的帧之间保持一致、还符合物理。右边这个动画就是去噪的过程——拖动滑块，你能看到雪花如何变成图。

理解这一点，你就懂了它的两个脾气：细节是「猜」出来的（所以偶尔多根手指、文字乱码），以及同样的描述每次结果不同（起点的噪声是随机的）。

动手从雪花到图

拖滑块 / 播放

2026 年年中，几个「旗舰」长什么样

模型迭代快到以周计，记名字没意义，记「谁擅长什么」才有用。下面这张随时会过期，但格局大致如此（以官方最新为准）。

代表模型	类型	最擅长	硬指标（2026·7）
Claude Opus 4.8 Anthropic · 5 月	LLM · 多模态 · 会思考	写代码、agent、长文档、可靠	SWE-bench 88.6% · 100 万上下文 · $5/$25 每百万 token。这堂课就是它做的。
GPT-5.6 Sol/Terra/Luna OpenAI · 6 月	LLM · 多模态 · 推理	通用最强之一、生态最广	改按「能力层」命名：Sol 顶配 / Terra 均衡 / Luna 最省。你 openclaw 反代的就是这条线。
Gemini 3.1 Pro Google · 2 月	LLM · 原生多模态	多模态、超长上下文、性价比	GPQA 94.3%（史上最高）· 100 万上下文 · $2/$12。能直接对一段视频提问。
DeepSeek V4 / Qwen 3.7 深度求索 / 阿里 · 开源	LLM · 推理 · 开源	开源可自部署、把价格打骨折	V4-Flash 输出仅 $0.28/百万 token（比 Opus 便宜近 90×），能本地跑。
Seedance 2.5 字节跳动 · 6 月公布	视频生成	影视级、原生音频、物理真实	文生视频 Elo 榜第 1（约 1221）· 原生 30 秒 · 约 $0.14/秒，很贵。
GPT Image 2 / Nano Banana Pro OpenAI / Google	图像生成 · 编辑	出图 + 精准修图、文字与一致性好	文字准确率 99%+ · 跨图人物一致约 95%。你项目的配图管线。

※ 数据基准 2026 年 7 月，经多方核查；模型每几周就迭代，具体数字以官方最新为准。原则不变：别记参数，记「用它来干嘛」。

模块 03 真实限制 · 它很强，但别信它太多

越强的模型，越会「自信地错」

这一节可能是全课最重要的。因为一个理科生用 AI 最大的风险，不是它不够聪明，而是你以为它查过、其实它在猜。认清这几堵墙，你才敢用、也才知道什么时候不能用。

一个漂亮但有裂纹的水晶大脑，投出一个和现实不符的倒影 — 漂亮、自信、有裂纹——它投出的倒影，未必是真的。

💬 幻觉

它会把「最像对的答案」讲得斩钉截铁——编造论文、编造 API、编造数据。因为它的机制是「猜下一个词」，不是「查数据库」。

📅 知识有截止

不给它联网，它只知道训练那一刻之前的世界。问它上周的事，它要么说不知道，要么一本正经地瞎编。

🕳 中间遗忘

号称能读几十万字，但塞太长时，藏在中间的关键信息容易被忽略（lost in the middle）。别指望它逐字读完你的百页 PDF。

🔢 算术是短板

它不是计算器。大数相乘、精确统计，经常错。正确做法是让它调用工具去算，而不是自己心算。

99%→70%

长文本会「读漏」。NoLiMa 基准：把关键信息藏到 32,000 字处，GPT-4o 的检索准确率从 99.3% 掉到 69.7%。上下文长 ≠ 记得牢。

<10%

长任务会「漂移」。METR 时间跨度基准：4 分钟内的任务它近乎 100% 完成，但需要连续工作 4 小时以上的任务，成功率不足 10%。

≥ 2×

幻觉是「机制内生」的。OpenAI 论文证明：幻觉率 ≥ 2× 误分类率。它不是一个能被彻底修好的 bug，而是「猜下一个词」这件事的副产品。

最危险的不是它会错，而是它不知道自己错了——它对错误答案的自信，和对正确答案的自信，看起来一模一样。所以「验证」永远是你的活，不是它的活。

真实案例 · HEATINS 工业节能平台

解药：给每个数字标一个「可信度等级」

我做的一个工业 AI 项目 HEATINS，帮钢厂算怎么省能耗。这种场景里，一个「省 20%」的数字如果是 AI 拍脑袋编的，就会出人命级别的事故。所以我们做了一件事——给每个数字强制标注它有多可信：

L0

示例演示
假数据，只看界面长啥样。

L1

工程估算
有公式，但没在真设备上验证过。

L2

已校准
和真实测量对得上，误差可量化。

L3

已验证
多批反复验证，能拿去做生产决策。

🎓

这才是「像内行」的样子

看到 AI 给的任何一个数字、任何一句「研究表明」，你的第一反应应该是：这是 L1 还是 L2？它凭什么这么说？这一个习惯，能让你在美国的实验室、论文、和未来工作里，比 90% 的人更靠谱。

🛡

怎么工程上「兜住」这些限制（后面几节会展开）

给它联网搜索治知识截止；给它工具（计算器/代码）治算术；给它你的资料库（检索）治幻觉；最后，用你的判断做终审。模型是引擎，这些是刹车和方向盘。

模块 04 调用 ≠ 满血 · harness 才是分水岭

同一个模型，为什么高手用起来判若两人

很多人以为「用 AI」就是打开对话框问问题。但你在网页里随便问的那个模型，和一个工程师精心「配置」过的同一个模型，能力差得像业余和职业。差别不在模型，在它外面那层脚手架——业内叫 harness。

动手给同一个模型「装备」

勾选，看能力条怎么涨

📚 上下文把相关资料喂给它 🔎 联网搜索让它查最新信息 🧰 工具能算、能跑代码、能调 API 💾 记忆记住你和之前的进展 🧠 思考预算允许它多想一会儿

34

📊

这不是比喻，是实测

在 SWE-bench（真实代码修复）里，同一个模型只是换了外面的脚手架，成绩能从 42% 一路飙到 78%——36 分的差距全来自 harness，模型本身一个字没改。这就是为什么「会配置」常常比「换最新模型」更值钱。

其中最关键的一件：给模型配一个「搜索」

模型本身不会上网。要让它查到最新、真实的信息，你得给它接一个专为 AI 设计的搜索 API——最常用的一个叫 Tavily。它和你在浏览器里搜 Google 不一样：它把搜索结果整理成干净、适合喂给模型的材料，还能直接抽取要点。

这里有个很多人不知道的点：这类能力要单独的 API 服务和权限。你「调用模型」是一份账；你给它配的「搜索、抓网页、跑代码」这些外挂能力，是另外一份账、另外一套 key。所谓 harness，就是把这些零件接好——这也是为什么专业的 coding agent、research agent 那么强：它们背后接了一整套服务。（Tavily 免费层每月约 1,000 次搜索，2026 年 2 月被云厂商 Nebius 以 2.75 亿美元收购——「给 AI 用的搜索」已经是一门正经的大生意。）

🔗

真实案例 · DrVideo

我的短视频自动生产线 DrVideo，第一步就是让主脑模型用 Tavily 联网做调研，再据此写脚本。没有这一步，它写的东西就是「凭记忆瞎编」。

一个发光的模型伸手到窗外，抓取外部世界的新鲜信息 — 给模型开一扇窗——联网搜索，是治「知识截止」和「幻觉」的第一味药。

✦

记住这句，你就超过大多数用户了

「换个更强的模型」常常不如「给现在的模型配好上下文和工具」。真正的高手，花在搭脚手架上的功夫，远多于换模型。

模块 05 智能体 · 用代码把模型串成一个「会干活的东西」

从「回答问题」到「自己把活干完」

一个模型只会「你问一句、它答一句」。但如果你用代码给它套一个循环，让它自己规划、调用工具、看结果、再决定下一步——它就成了一个智能体（agent）。这就是从「聊天机器人」到「数字员工」的那道门。

动手看一个 agent 跑一个真实任务

点「运行」

感知读任务

规划拆步骤

行动调工具

观察看结果

Agent
循环

🧰 工具调用

让模型能「动手」：查资料、算数、发邮件、改文件。模型负责决定「用哪个、传什么参数」，代码负责真的去执行。

🔌 MCP 协议

一个正在成为标准的「通用插座」——Model Context Protocol。把工具做成 MCP，任何 agent 都能即插即用，不用为每个模型重写一遍。

👥 多智能体

一个总指挥，派一群「子智能体」并行去干各自的活，再汇总。这堂课的前期调研，就是我派了十几个子 agent 同时上网研究出来的。

一个中心发光球，各种模块化工具像通用插头一样接上去 — MCP：让工具像标准配件一样，插到任何模型上。

你其实每天都在用 agent

你爸用的 Claude Code、Codex、Cursor 这些「会自己写代码、跑测试、改文件」的工具，本质都是包了一层强大 harness 的 coding agent。它们能干活，不是因为模型神，而是因为背后接好了：读写文件、跑命令、搜索、记忆、还有一套让它「别跑偏」的规则。

💡

给你的心智模型

一个最小的 agent = 模型 + 一个循环 + 几个工具 + 一份说明书（告诉它目标和边界）。理解了这个公式，你就能看懂几乎所有 AI 产品是怎么搭出来的。

模块 06 Token 经济学 · 会算账，才玩得起

AI 不是免费的，但也没你想的那么贵——如果你会算账

模型按 token 收费（token ≈ 半个到一个词）。真正让人踩坑的，不是单价，而是两种完全不同的「花钱方式」被搞混。搞清楚这一节，你能省下大把冤枉钱。

第一课：两本账，别记混

「包月订阅」和「按量付费的 API」是两套完全不同的心智。下面这个小实验，直接让你体感它们的区别——特别注意「跑批量出图」那一下。

动手两种花钱方式

点按钮，看两本账怎么动

🎫 订阅额度（如 Codex / Claude 包月）

一口价买一整周/月的额度，用超了就限速

100%

💳 第三方 API（按 token 后付费）

用多少算多少，月底一起结账

$0.00

每调一次，账单往上加

额度电池飞速耗尽，一个无人看管的水龙头涌出一堆一样的小图卡 — 无人看管的自动脚本 + 一键出图 = 额度一夜蒸发。下面是我真实踩过的那个坑。

真实案例 · openclaw 反代网关（我踩过的坑）

我写了个小网关 openclaw，把订阅的模型能力反代成本地 API 给别的程序用。有天一个后台出图脚本没人看着，12 小时里生成了 114 张图，直接把 Codex 的周额度从 95% 打到 80%——一晚上吃掉 15%。

114

张图 · 12 小时

15%

周额度 · 一夜蒸发

$0

额外账单（但额度是真金白银）

教训有三条，都值钱：① 能一键调用 ≠ 该无限调用。② 订阅额度不是「免费」，只是「已经付过了」。③ 自动化脚本一定要加限额和审计——这也是为什么我叮嘱出图一次只生成一张、绝不并行。

第二课：成本路由——把钱花在关键镜头上

要大批量生成内容时，「全用最好的模型」会烧钱到肉疼。高手的做法是路由（routing）：大部分用便宜的够用模型打底，只在最关键的地方用顶配。拖一拖下面的滑块，感受一下差别。

动手视频生成 · 月成本估算

拖滑块试试

每月要生成多少条视频 500 条

每条大约多少秒 6 秒

※ 单价为演示量级，会按最新官方价校准；比例关系是真实的。

任务水流在分叉管道里分层：多数走便宜通道，少数走金色顶配通道 — 智能路由：多数走便宜通道，少数关键的走顶配。

真实案例 · DrVideo 的「阶梯质检」

我的 DrVideo 短视频线用了一个叫 Cascade Gate 的省钱设计：先用免费的规则检查挡掉明显问题，再用便宜的单模型抽查，只有到最后终审，才动用三个顶级模型互相投票。贵的手段只在最关键处出手。

便宜模型 / 本地模型打底，贵模型兜底关键环节
能本地跑就本地跑（省钱、保护数据）
像 Groq 这类超快推理，用「省时间」换「省钱」
批量任务用 batch、缓存重复的上下文，都能砍成本

💰

一句话记住成本纪律

先问「这个任务，最便宜的够用方案是什么」，再决定要不要升级。默认用够用的，只为真正重要的东西付顶配的钱。

模块 07 站在开源肩膀上 · 别从零造轮子

最快的开发，是「拿来 + 改造」

在学校，老师要你「自己独立完成」。到了真实世界，规则反过来了：能复用别人做好的，就绝不从零写。全世界的工程师把海量高质量代码免费放在 GitHub、模型放在 HuggingFace、组件放在 npm——你的本事，是会挑、会拼、会改，再加上你自己那一层独特的东西。

一个人站在由积木和开源组件堆成的友善巨人肩上，够到更高处 — 牛顿说「站在巨人肩上」。今天的巨人，是开源社区。

真实案例 · WAIC-MUSIC 实时音乐视觉演出

我做的一个把地标渲染成音乐舞台的实时 3D 项目 WAIC-MUSIC，几乎全站在开源上：3D 引擎用开源的 Three.js，音频可视化直接 fork 了 GitHub 上一个现成项目再改，10 个地标 3D 模型是从 Sketchfab 拿的免费授权（CC BY，署名即可商用）模型。

但它不是「抄」——真正值钱的那 30%–80%，是我自己写的：音乐节奏怎么驱动画面、十个场景怎么编舞、灯光怎么设计。开源给你积木，你的创造力决定搭出什么。

模块	开源/别人提供	我自己的增值	自研占比
3D 引擎	Three.js 全套	场景编排、参数优化	40%
3D 模型资产	10 个 Sketchfab CC-BY 模型	程序化增强 + 编舞 + 灯光	70%
音乐响应	Web Audio 标准 + fork 的可视化框架	频谱分析、节奏引擎、编舞逻辑	80%
部署	Cloudflare 托管	打包脚本 + 自动验收	10%

⭐ 怎么挑一个开源项目

看 star 数（多≈可靠）、看最近有没有人维护（提交时间）、看 license（能不能商用、要不要署名）、看 issue 里大家踩了什么坑。

🤖 用 AI 读懂陌生代码

把一个看不懂的开源项目丢给 AI：「用大白话讲这个项目在干嘛、入口在哪、我要改 X 该动哪个文件」。几分钟顶过去几小时。

🧩 vibe coding

不纠结每一行语法，先让 AI 把能跑的版本拼出来，你在上面调、改、拼。先跑起来，再变好。

⚖️

但要守规矩

开源不等于「随便用」。license 要看清（有的要求署名、有的禁止商用、有的要求你也开源）；在学校里，哪些能用 AI、哪些必须自己写，要问清楚老师。站在肩膀上，也要站得干净。

模块 08 批量创作 · 一条龙的内容流水线

把「做一条视频」变成「一条生产线」

前面所有模型（语言、图像、视频、语音）串起来，就能做一件很实际的事：批量生产内容。不管你以后是做科普、做作品集、还是记录科研，这套流水线思路都用得上。

一条温和的流水线：一颗想法种子逐步变成脚本、图、胶片帧、声波，最后一张成品视频卡 — 一颗想法 → 脚本 → 图 → 会动的画面 → 声音 → 成品。每一环，一个模型。

1选题LLM + 联网趋势

→

2脚本 / 分镜LLM 写多版本再选

→

3画面图像 → 视频生成

→

4配音 / 字幕TTS · 时间戳对齐

→

5合成 / 发布剪辑 + 质检 + 上传

真实案例 · DrVideo 短视频自动生产线

让「大脑」做创意，让代码做执行

DrVideo 把上面这条线拆成 16 个环节，全自动跑：输入一句话或一个 PDF，输出一条带字幕、配音、卡点的竖屏短视频。它的核心哲学很值得学——所有「创意判断」交给顶级大模型，所有「执行和质检」交给代码。而且质量不是靠一个模型说了算，是让 三个不同厂家的模型互相投票，达成共识才放行。

16

全自动环节

×5

脚本先写 5 版再选最好

3 家

模型互评共识才过关

断点续跑

每步存档，坏了能接着来

🎥

给你的启发

你不用一上来就做 16 环节。但「把一件重复的事，拆成清晰的步骤，让 AI 一步步做，你在关键处把关」——这个思路，能用在写论文、做实验记录、整理文献、甚至找工作投简历上。

模块 09 压轴方法论 · 几天吃透一个新领域

这是我最想教你的一件事

你去读理科，四年里会不断遇到全新的、没人教过你的领域。过去，进入一个陌生领域要啃几个月；现在，用对方法，几天就能上手到「能对话、能判断」。这不是让你偷懒，是让你把省下的时间，花在更深的思考上。

一个学生提着一盏光的灯笼，快速登上知识的阶梯山，前方的雾在散开 — AI 像一盏灯笼——它不替你爬，但能照亮前面的路，让你爬得又快又稳。

真实案例：我用 AI，几天做出一门「7 天速成课」

工业热处理是个我原本完全不懂的领域。为了让完全零基础、甚至有阅读障碍的人也能学会，我用 AI 做了一门 7 天速成课：从「金属为什么要烧」一路讲到「这门生意怎么赚钱」，每天 15 分钟、大量配图、还能朗读。

做这门课的过程，本身就是我用 AI 吃透这个领域的过程——AI 帮我把复杂知识拆成台阶，我在每一层验证、纠错、补图。教是最好的学。

一段拾级而上的台阶，每级一个由简到繁的图标，一个小人稳步向上 — 知识金字塔：先打地基（是什么）→ 懂原理（为什么）→ 上科技（怎么做）→ 学应用（有什么用）。任何领域都能这么拆。

把「学习」做成一个闭环（这就是升级版的那张图）

你可能见过一张「Before / During / After 实施」的工作流图。它很好，但它讲的是「做项目」。我把它改造成一个「学新领域」的闭环——每一段，都配上一个具体的 AI 动作：

🗺 学之前 · 建地图

盲点扫描：「我要学 X，有哪些我根本没意识到的前提和坑？」
让 AI 先画知识地图：这个领域的主干、分支、关键人物、经典争论。
要它给你「该问的问题清单」——把未知未知变成已知未知。

✍️ 学之中 · 边做边纠

费曼追问：让 AI 用大白话讲，讲不懂就追问，直到你能复述。
用你自己的话讲回去，让它挑错——错在哪，就是你没懂的地方。
记下每一个「原来如此」和每一个卡点，它们就是你的地图。

🎯 学之后 · 检验 + 沉淀

让 AI 出测验考你，考过了才算真的会（别自我感觉良好）。
做一个小产出：一篇讲解、一个 demo、一张图——逼自己真懂。
这次学到的，变成下次的起点地图——越学越快。

⚠ 一个必须知道的研究结果

用 AI「代替思考」，会让你学得更差

Anthropic 2026 年初做过一个实验：学同一样东西，用 AI 帮忙的一组，测验平均分 50%；自己手写硬啃的一组，67%——差了整整 17 分。差距最大的地方是 debug（判断代码为什么错）。为什么？因为让 AI 直接给答案，你的大脑跳过了「挣扎」这一步，而挣扎才是学习真正发生的地方。

67%

自己硬啃组

50%

被动用 AI 组

10×

「读懂 AI 产出」的人，效率是「盲目接受」的人的约 10 倍

✅

但同一个研究也发现：会用的人，反而学得又快又好

诀窍就是上面那个闭环里的三个动作：① 先让 AI 生成，再追问「为什么这样写」；② 让它「代码 + 解释」一起给；③ 多问概念问题，而不是只要答案。做到这三点的人，是全场表现最好的。AI 是陪练，不是替考。

一个学生和一个温暖发光的导师球对话，问号变成清晰的光 — 费曼技巧：能把一件事讲给外行听懂，你才真的懂了。AI 是你 24 小时的陪练。

用 AI 学习的最高境界，不是让它替你想，而是让它陪你想——它负责耐心、广博、随叫随到；你负责好奇、追问、和最后那句「等等，这里我还是不信」。这句「我还是不信」，是你最珍贵的能力。

🏆

为什么这比参考图更进一步

参考图告诉你「学完的东西会变成下次的地图」。升级版告诉你每一步具体做什么、用 AI 的哪个动作——盲点扫描、费曼追问、自测闭环。方法论只有能落到动作，才真的有用。

模块 10 行动清单 · 带走的东西

去美国之前，把这几条装进行李

工具会变，模型会换代，但有些东西越来越值钱。这是这堂课想让你真正带走的。

越来越值钱的 5 种能力

❓ 提对问题

AI 时代，答案很便宜，好问题很贵。能把一个模糊的困惑，问成一个清晰、可回答的问题，是核心竞争力。

👁 判断好坏（品味）

AI 能给你一百个方案，「哪个对」要你定。刻意练习你的审美和标准——这是最难被替代的。

🔬 验证的习惯

永远问「它凭什么这么说、这是 L1 还是 L2」。会验证的人，用 AI 是加速；不会的，是加速犯错。

🕸 系统 + 跨界思维

会把不同领域的积木拼起来的人，在 AI 时代赢麻了。理科的底子 + 会用 AI，就是你的跨界优势。

一个罗盘和一套精巧的探索工具，一个年轻科学家正走进一道珊瑚色的光门 — 带上罗盘（判断力）和工具（AI），走进你的下一段旅程。

📋 落地清单：开学第一个月就能做的事

选一个你完全不懂的话题，用模块 9 的闭环，3 天吃透它，练手。
把一门课的教材丢给 AI，让它帮你建知识地图 + 出测验。
找一个 GitHub 开源项目，让 AI 帮你读懂，改出一个你自己的小版本。
给自己配一套工具：一个会联网的 AI、一个本地小模型（省钱/隐私）。

每次 AI 给数字/引用，养成追问来源的反射。
做科研/写论文前，先问清楚老师 AI 使用的边界，守住学术诚信。
记一个「AI 用法笔记」：什么 prompt 好用、踩了什么坑——这就是你的地图。
别把 AI 当答案机，当陪练——保留你那句「我还是不信」。

💛

最后一句，给你

AI 不会让努力过时，它让「有判断力的努力」变得前所未有地强大。带着好奇心和怀疑精神去用它——工具越强，越需要一个清醒的人握着方向盘。那个人，就是你。祝你在大洋彼岸，学得又快又深。