人也是大語言模型

2024-03-30

AI是大語言模型，投餵給它不同的語料，就訓練出不同的AI。

所以，語料的篩選很重要。

一個投餵社交媒體爆款網文訓練出來的AI，和一個投餵經典名著學術期刊訓練出來的AI，是有天差地別的。

訓練ChatGPT的語料主要是英文，中文佔比不多，據說是出於信息質量的考慮。

如佛教法相唯識宗說，人不過是一串相似相續不常不斷的名言概念的意識流，換句話說：人，也是大語言模型。

所以，你用什麼語料訓練自己這個大語言模型？

比如，一早看到有人罵我，我點進去看他的言論，花了三分鐘，想爭論，但一想，如果爭論，對方也會爭論過來，我又得看他提供的低端語料，來來回回，可能三小時都不能辯出勝負。

我想，我可是大語言模型啊！難道接下來寶貴的三小時，來用這些劣質語料來訓練自己嗎？

止止止！

馬上打住，隨手拿了一本經典大作，也就是高質量語料，對自己進行了三小時訓練。

再比如，有人抱怨自己學不好英語。但一看，他多數時間都用中文語料訓練自己。

消極的人，或者說，消極的大語言模型，偏愛尋找消極的語料來自我訓練，於是，越老越消極。

你可要知道，人不是別的，你我都是大語言模型。

所以，今天你打算用什麼語料來訓練自己？接下來的這一個小時呢？接下來的十五分鐘呢？