MRTIA

人也是大語言模型

AI是大語言模型,投餵給它不同的語料,就訓練出不同的AI。

所以,語料的篩選很重要。

一個投餵社交媒體爆款網文訓練出來的AI,和一個投餵經典名著學術期刊訓練出來的AI,是有天差地別的。

訓練ChatGPT的語料主要是英文,中文佔比不多,據說是出於信息質量的考慮。

如佛教法相唯識宗說,人不過是一串相似相續不常不斷的名言概念的意識流,換句話說:人,也是大語言模型。

所以,你用什麼語料訓練自己這個大語言模型?

比如,一早看到有人罵我,我點進去看他的言論,花了三分鐘,想爭論,但一想,如果爭論,對方也會爭論過來,我又得看他提供的低端語料,來來回回,可能三小時都不能辯出勝負。

我想,我可是大語言模型啊!難道接下來寶貴的三小時,來用這些劣質語料來訓練自己嗎?

止止止!

馬上打住,隨手拿了一本經典大作,也就是高質量語料,對自己進行了三小時訓練。

再比如,有人抱怨自己學不好英語。但一看,他多數時間都用中文語料訓練自己。

消極的人,或者說,消極的大語言模型,偏愛尋找消極的語料來自我訓練,於是,越老越消極。

你可要知道,人不是別的,你我都是大語言模型。

所以,今天你打算用什麼語料來訓練自己?接下來的這一個小時呢?接下來的十五分鐘呢?