人也是大语言模型

2024-03-30

AI是大语言模型，投喂给它不同的语料，就训练出不同的AI。

所以，语料的筛选很重要。

一个投喂社交媒体爆款网文训练出来的AI，和一个投喂经典名著学术期刊训练出来的AI，是有天差地别的。

训练ChatGPT的语料主要是英文，中文占比不多，据说是出于信息质量的考虑。

如佛教法相唯识宗说，人不过是一串相似相续不常不断的名言概念的意识流，换句话说：人，也是大语言模型。

所以，你用什么语料训练自己这个大语言模型？

比如，一早看到有人骂我，我点进去看他的言论，花了三分钟，想争论，但一想，如果争论，对方也会争论过来，我又得看他提供的低端语料，来来回回，可能三小时都不能辩出胜负。

我想，我可是大语言模型啊！难道接下来宝贵的三小时，来用这些劣质语料来训练自己吗？

止止止！

马上打住，随手拿了一本经典大作，也就是高质量语料，对自己进行了三小时训练。

再比如，有人抱怨自己学不好英语。但一看，他多数时间都用中文语料训练自己。

消极的人，或者说，消极的大语言模型，偏爱寻找消极的语料来自我训练，于是，越老越消极。

你可要知道，人不是别的，你我都是大语言模型。

所以，今天你打算用什么语料来训练自己？接下来的这一个小时呢？接下来的十五分钟呢？