“弱智吧”让大模型变聪明

益读社

2024-09-18

点击蓝字关注我们

最近，AI圈里一直流传一个消息，百度的一个贴吧，叫“弱智吧”，里面的内容已经成为中文AI大模型的重要训练数据。

百度了一下，人家叫“弱智吧”没有歧视的意思，贴吧的主要内容，是各式各样的脑筋急转弯，例如：

“用一句话证明你没有看过这句话”

“生鱼片是死鱼片”

“等红灯是等绿灯”

“敬老院的新人都是老人，这世界的大人都是小人。”

……

全是这类问题，可以想象一下，假如有一天，AI能回答上面这些问题，是不是可以说说明它在一定程度上表现出了接近人类的幽默水平？

于是，中科院深圳先进技术研究院、中科院自动化研究所、滑铁卢大学等几所高校，就组成了一个联合团队，用“弱智吧”的数据来训练大模型。就在前段时间，这个课题组发布了结论。用“弱智吧”训练出的大模型，在很多项跑分测试中都遥遥领先。

为啥？

因为这些信息都带有很强的异质性。也就是说，这些信息跟过去的语料都不一样。就好比人类平时学习，整天待在一个圈子里，接触的都是差不多的信息，那么他的学习速度就很慢，如果经常接触点新鲜的，进展就快很多。

机器的学习逻辑，跟人有很多共同之处，那AI的学习方式，对人类有哪些启发呢？我们能从它们的方法里学到点什么？

得到上的万维钢老师解读过认知科学家斯坦尼斯拉斯·迪昂的《我们如何学习》，里面提到，机器学习，往往有这么几个要素：

首先，在机器学习中，有个方式叫有监督式学习，就是给机器建立一套反馈机制。它每做一个动作，这个机制都会告诉它，哪里做得不够好，哪些参数需要调整。同样，一个人不管多厉害，个人能力多强，他也需要一个这样的反馈机制。

其次，在机器学习中，还有个因素，叫随机变化。也就是，即使机器的运算结果已经很让人满意，但研究者想看看，还能不能再多出一些惊喜。这时，他们就会刻意给机器输入一些随机变量，比如，烟雾报警器，最开始是1930年，一个瑞士的物理学家，叫沃尔特·耶格，他想发明一个毒气探测器。结果实验时，这个探测器吸进去一口烟，而且反应很明显。这个发现就催生了现代的烟雾报警器。那口被吸进去的烟，就是报警器的随机变量。

学习的本质，就是从已知向未知前进。而引入随机性的本质，就是主动把这个未知加进来。

最后，在机器学习中，还有个因素叫内在知识。有种算法叫卷积算法，这个算法的特点就是，用已知观察未知。

比如，看图。卷积算法不是从零开始，而是它已经了解一些基本的图形，像圆圈、方块、三角等等。你再给它看任何新形状，它都会先把这个新形状分解成已知的形状，再去理解。说白了，它是在用已有的内在知识，去解读外部的未知信息。同样，回到人的学习，最好也先建立一点内在知识。

也就是说我们只有先精通了一个领域，才有可能在此基础上拓展并去精通第二、第三个领域。

其实总结来看，机器的学习方法，最初都是来源于人。人按照自己的思考方式，设计了机器的思考方式，在这个过程中，又让人更加了解自己。

就跟ChatGPT诞生之初，“弱智吧”的内容只是网友拿来拷打AI，搞搞节目效果收集的各种奇怪问题，现在却深度参与了大模型的发展。

直到今天，“弱智吧”的问题已经成为了每个新大模型发布要过的测试关，被戏称为“弱智吧Benchmark（基准点）”。

—- END -—

往期推荐

一个AI指数报告……

人也可以“仿AI”……

继续滑动看下一个

益读社

向上滑动看下一个

陈佩斯，这次真悬了！

不能返税、不能补贴，招商局长们怎么办？

大，无需多言，事实胜于雄辩

2024年最佳公众号排行，不用瞎忙，关注它们你就成功了一半

英美所谓联合声明无端指责中国，干涉中国内政，中方强烈不满、坚决反对！

“弱智吧”让大模型变聪明

您可能也对以下帖子感兴趣

陈佩斯，这次真悬了！

不能返税、不能补贴，招商局长们怎么办？

大，无需多言，事实胜于雄辩

2024年最佳公众号排行，不用瞎忙，关注它们你就成功了一半

英美所谓联合声明无端指责中国，干涉中国内政，中方强烈不满、坚决反对！

生成图片，分享到微信朋友圈

“弱智吧”让大模型变聪明

您可能也对以下帖子感兴趣