蓝翔图书

字:
关灯 护眼
蓝翔图书 > 职场小聪明 > 第900章 大模型编程和普通编程的区别

第900章 大模型编程和普通编程的区别(1/2)

    大模型编程和普通编程的区别,是大模型不需要很严密的逻辑推理,都是y=x*w的意思,就是有个结果y,然后用w就是一个算法,不断的代入特定的x,然后得出一个模型,然后评估y的准确率,有了模型,就只用代入x,就可以得到一个结果y,但y不一定准确,无限接近正确,就像一个苹果,它是苹果的相似度有多少,差不多就行了,大概就是个苹果,哈哈。

    你这个理解很有意思,而且抓住了一个大模型编程与传统编程的核心区别:大模型是“近似正确”,传统编程是“绝对正确”。这正是深度学习模型(如大语言模型、图像识别模型)与传统编程逻辑的根本差异。

    ?

    一、大模型编程与传统编程的本质区别

    我们可以从多个角度来比较:

    维度

    传统编程(Rule-based)

    大模型编程(model-based)

    核心思想

    明确规则推导结果

    用大量样本学出模式

    推理方式

    逻辑推理、条件判断

    概率推理、模式匹配

    编程方式

    精确代码控制逻辑

    训练模型得到“权重”

    数据使用

    少量、结构化

    大量、非结构化

    输出结果

    精确、唯一

    模糊、近似、概率性

    可解释性

    强:代码可读

    弱:黑箱,靠可视化或经验解释

    示例

    if-else, for循环等

    y =+ b + 激活函数(如ReLU)

    你说的那句“大模型其实就是 y = x*w 的不断代入和评估”——可以说非常贴切地表达了深度学习中模型训练的过程。我们来进一步拆解这个观点。

    ?

    二、用“y = x·w”理解大模型的核心机制

    1. 输入(x)

    这是你给模型喂的特征,比如:

    ? 图像识别中,一张图片的像素矩阵

    ? 语言模型中,一段文本被嵌入成词向量

    ? 音频识别中,是声波的频谱特征

    2. 权重(w)

    这个可以理解为“模型的记忆”或“经验参数”。这些参数并不是你手动写出来的,而是模型从成千上万的数据中“学出来”的。

    比如说,模型在看了10万个“苹果”的图像后,自己推理出哪些像素模式是“苹果”的共同特征,然后把这些“经验”编码进权重w里。

    3. 输出(y)

    就是模型对x的一个“预测”,这个预测并不是100%准确的,而是“在经验基础上,最有可能是的那个结果”。

    ?

    三、大模型编程的流程:本质是“调数据,不调逻辑”

    传统编程流程是:

    if 天气 == “下雨”:

    带伞else:

    出门大模型编程的流程:

    收集大量“天气+行为”的数据:

    (晴天,出门)

    (下雨,带伞)

    (阴天,出门)

    ...

    喂给模型训练,学出一套权重w

    模型预测时,只需输入“天气=下雨” -> 输出“带伞”的概率高,就预测“带伞”

    你不需要再写规则,而是“让数据说话”。

    这就是所谓的:

    传统编程是“人定规则”,大模型是“模型学规则”。

    ?

    四、再回到你的比喻:“大概是个苹果”

    你说得非常生动:

    “y不一定准确,无限接近正确,就像一个苹果,它是苹果的相似度有多少,差不多就行了,大概就是个苹果。”

    这正是大模型的“模糊匹配”原理。尤其在图像识别中,模型不是100%判断“这是苹果”,而是给出一个“概率”:

    ? 苹果:87%

    ? 番茄:10%

    ? 柿子:3%

    这时候,它选“苹果”作为预测结果。但如果这个苹果有点变形、颜色有点偏,就会导致识别不准。为什么?因为模型只知道“相似度”,不知道“逻辑规则”。

    ?

    五、从“编程范式的演化”看待这个变化

    1. 早期计算机时代:硬件编程

    ? 二进制,汇编语言

    ? 对人极不友好

    2. 高级语言时代:规则编程

    ? C、Python、Java等

    ? 程序员用明确逻辑告诉机器该做什么

    3. 现在:数据驱动编程(大模型)

    ? 人
本章未完,请点击下一页继续阅读》》
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈