元启 · AI Research
/

AI 是通用技术

AI is a General Purpose Technology

本视频是"人人皆可用的生成式 AI"课程第一周第四讲

YQ元启
·2026 年 5 月 12 日·7 分钟·studies·#generative-ai #andrew-ng #deeplearning-ai #week1

内容摘要

本视频是"人人皆可用的生成式 AI"课程第一周第四讲。吴恩达提出一个核心框架:AI 是一项"通用目的技术"(General Purpose Technology),类比电力和互联网,它不局限于单一用途,而是渗透于无数场景。视频系统介绍了 LLM 能处理的三大任务类别——写作(Writing)、阅读(Reading)、对话(Chatting),并进一步区分了两种应用形态:网页界面型(直接在 ChatGPT/Bard 等网站提问)与软件集成型(嵌入企业工作流的 AI 应用)。这一框架是整个课程后续内容的核心组织脉络。


核心观点

  1. AI 是通用目的技术,这正是它难以简单描述的原因
    就像电力和互联网一样,AI 无处不在、用途极广,正因如此,"AI 能做什么"这个问题反而很难简洁回答。不加以框架化,普通人很难把握其真正的适用范围。

  2. LLM 的三大任务类别:写作、阅读、对话

    • 写作(Writing):头脑风暴、命名产品、起草文本、回答问题(如公司停车政策)
    • 阅读(Reading):给定较长文本,生成简短输出;例如读取客户邮件并判断是否为投诉,将其自动路由到合适部门
    • 对话(Chatting):ChatGPT/Bard 是通用聊天机器人,但 GenAI 还能构建针对特定场景的专用聊天机器人,如餐厅点餐机器人
  3. 两种应用形态:网页界面型 vs 软件集成型

    • 网页界面型:直接在 ChatGPT、Bard、Bing 等网站输入提示词,适合个人快速探索和实验
    • 软件集成型:将 LLM 嵌入企业内部工作流,可访问公司专有数据(如员工停车规定),适合批量、自动化处理场景
  4. 生成式 AI 与监督学习的差异:构建成本更低
    以"判断邮件是否为投诉"为例,传统监督学习也能做,但生成式 AI 可以更快、更便宜地实现相同功能,极大降低了此类应用的构建门槛。

  5. 框架的价值:帮助你识别哪些任务适合用 AI
    写作 / 阅读 / 对话这个三分框架,是一个实用的思维工具,帮助你在面对具体业务场景时,快速判断是否可以用 LLM 来解决,以及适合用哪种应用形态。


关键收获

💡 收获 1:"通用目的技术"这个定位,解释了为何 AI 影响如此广泛
电力不只是给灯泡供电,互联网不只是发送电子邮件。同理,AI 也不只是聊天工具——它是可嵌入任何需要"理解文字→生成输出"场景的基础能力层。

💡 收获 2:写作/阅读/对话三分框架,是评估 AI 应用场景的利器
面对一个业务场景,问自己:它本质上是"生成文字"、"理解长文本并提炼",还是"多轮对话"?答案指向你应该构建哪种类型的 AI 应用。

💡 收获 3:阅读任务是 GenAI 最具商业价值的低调能力之一
企业每天有大量邮件、合同、报告需要处理——人工阅读效率低、成本高。用 LLM 做"读取→分类/摘要/路由",是极其现实的降本增效路径。

💡 收获 4:软件集成型应用才是企业 AI 落地的主战场
个人用 ChatGPT 网页版已经很有价值,但企业级 AI 落地的核心是把 LLM 嵌入已有工作流、赋予其访问公司数据的能力。这需要工程投入,但回报潜力巨大。

💡 收获 5:GenAI 让原本需要大量标注数据才能实现的任务,变得触手可及
传统 ML 的邮件分类需要大量标注样本,而 GenAI 可以通过自然语言指令直接实现——这是一个从"工程密集"到"提示词即应用"的范式转变。


重要引述

"AI is a general purpose technology — unlike a car which is good for transportation or microwave oven good for heating up food, AI isn't useful just for one thing. It's useful for a lot of things."
(AI 是一项通用目的技术——不像汽车只适合运输、微波炉只适合加热食物,AI 不只对一件事有用,而是对很多事情都有用。)

"I find the framework of writing, reading and chatting as a useful way to think about the many different tasks that LLMs can do."
(我发现"写作、阅读、对话"这个框架,是思考 LLM 能做的众多任务的一种实用方式。)

"Generative AI is allowing these sorts of reading tasks to be built much more quickly and inexpensively."
(生成式 AI 使得这类"阅读任务"的构建变得更快速、更廉价。)


总体结论

本讲是整个课程的"认知框架"建立课——通过"通用目的技术"类比,破除了"AI 只是一个聊天工具"的狭隘认知,并以"写作/阅读/对话"三分法为学习者提供了一个简洁而强大的思维框架。这个框架在课程后续几讲中将被反复使用,帮助学习者系统评估各类具体场景的 AI 适用性。网页界面型 vs 软件集成型这一区分,则为不同技术背景的学习者——从普通用户到企业决策者——提供了明确的行动路径。这是整周内容中结构性最强的一讲。


逐字稿(中文翻译)

生成式 AI 擅长做什么?这个问题之所以有点难回答,原因之一是:AI 是一项通用目的技术。不像汽车——你知道它是用来交通出行的;不像微波炉——你知道它是用来加热食物的;AI 不只对某一件事有用,而是对很多事情都有用。这反而让它更难描述清楚。但让我们来看看"通用目的技术"究竟意味着什么。

类比电力:AI 和电力一样,对很多任务都有用。如果有人问你"电力有什么用?"或者"互联网有什么用?"这些都是通用目的技术,你甚至很难一句话说清楚"电力有什么用",因为它无处不在、渗透于生活的方方面面。事实上,正如你之前看到的,监督学习对很多任务都有用——垃圾邮件过滤、广告推荐、语音识别等等。生成式 AI 也是如此。在上一个视频中,你看到了 LLM 能完成的一些任务:回答特定问题、协助写作等等。

让我们更系统地讨论一个框架:LLM 能完成哪些类型的任务。首先,生成式 AI 能生成文字,所以毫不意外,它对"写作类"任务很有帮助。我自己经常用生成式 AI 工具做头脑风暴。比如你想给产品命名,可以让它提一些名字,它会给出一些有创意的建议。LLM 还擅长回答问题,如果你给它提供公司特有的信息,它可以帮助团队成员快速找到所需内容——比如公司停车场的停车位情况。

除了写作,生成式 AI 还擅长我所说的"阅读类"任务——你给它一段相对较长的信息,让它生成一个简短的输出。例如,如果你经营一家电商公司,每天收到大量客户邮件,生成式 AI 可以读取这些邮件,快速判断它是不是投诉邮件,从而帮助你将投诉路由到相应部门及时处理。比如:"我爱我的新羊驼 T 恤,面料超级柔软"——这不是投诉。但如果有人写道:"我穿着羊驼 T 恤去了朋友的婚礼,结果所有人都说我是全场焦点,朋友现在生我气了"——嗯,这算不算投诉有点难说,但生成式 AI 可以帮你把邮件路由到正确的部门。我把这类任务叫做"阅读任务",因为它处理的是相对较长的输入(一封客户邮件),然后生成一个相对简短的输出(是不是投诉?是或否)。传统的监督学习也能做这件事,但我们在课程后面会看到,生成式 AI 能让这类"阅读任务"构建起来更快速、更廉价。

最后,生成式 AI 还被广泛用于各种对话类任务。ChatGPT、Bard、Bing Chat 是通用聊天机器人,但 GenAI 技术——也就是大语言模型——也在支持大量专用聊天机器人的构建。比如这里有一个在线点餐聊天机器人的例子:用户说"我要一个奶酪汉堡外卖",聊天机器人确认并提交订单。

在讨论这些任务时,我发现有时区分两种不同类型的 LLM 应用是有帮助的。一类是像"头脑风暴"这样的例子——你很自然地会在 ChatGPT、Bard 或 Bing Chat 等网站上输入一个提示词并获得结果。我把这类应用称为"网页界面型应用"。相比之下,"判断邮件是否为客户投诉"这个例子,更适合集成到公司的邮件处理工作流中,而不适合让人一封一封地把客户邮件复制粘贴到网页界面里查看是否是投诉。这种情况就适合将 LLM 嵌入一个更大的软件自动化流程中——帮助公司实现自动化邮件路由。我把这类应用称为"基于 LLM 的软件应用"。

第二个写作案例——回答人力资源问题——也更适合作为软件型 LLM 应用,因为它需要访问公司特有的停车政策信息,而互联网上通用的大语言模型显然不掌握这些信息。我们在课程后面会详细讲解这些技术是如何构建的,大多数专用聊天机器人也都属于软件型 LLM 应用。

在课程剩余部分,我会用这两个符号来区分"网页界面型用例"和"软件型 LLM 应用"。对很多人来说,从网页界面用例入手更容易,因为你只需打开一个网站——比如 ChatGPT、Bard 或 Bing——输入提示词即可。但我认为,无论是网页界面型应用还是软件型应用,对个人和公司来说都至关重要。

我发现"写作、阅读、对话"这个框架,是思考 LLM 大语言模型能完成的众多任务的一种实用方式。在接下来的三个视频中,我们将深入探讨写作、阅读和对话任务的众多具体示例,希望你能从中发现一些对自己工作有潜在价值的应用场景。期待在下一个视频中与你相见——我们会重点聊聊写作,然后……我期待着去吃我的汉堡。


本文档根据视频字幕整理翻译,内容为 DeepLearning.AI "Generative AI for Everyone" 课程第一周第四讲。

中文配音 · 可下载

AI 是通用技术

下载 MP3
想直接聊聊这篇?扫码加我 →

相关阅读