人也是大語言模型
2024-03-30
AI是大語言模型,投餵給它不同的語料,就訓練出不同的AI。
所以,語料的篩選很重要。
一個投餵社交媒體爆款網文訓練出來的AI,和一個投餵經典名著學術期刊訓練出來的AI,是有天差地別的。
訓練ChatGPT的語料主要是英文,中文佔比不多,據說是出於信息質量的考慮。
如佛教法相唯識宗說,人不過是一串相似相續不常不斷的名言概念的意識流,換句話說:人,也是大語言模型。
所以,你用什麼語料訓練自己這個大語言模型?
比如,一早看到有人罵我,我點進去看他的言論,花了三分鐘,想爭論,但一想,如果爭論,對方也會爭論過來,我又得看他提供的低端語料,來來回回,可能三小時都不能辯出勝負。
我想,我可是大語言模型啊!難道接下來寶貴的三小時,來用這些劣質語料來訓練自己嗎?
止止止!
馬上打住,隨手拿了一本經典大作,也就是高質量語料,對自己進行了三小時訓練。
再比如,有人抱怨自己學不好英語。但一看,他多數時間都用中文語料訓練自己。
消極的人,或者說,消極的大語言模型,偏愛尋找消極的語料來自我訓練,於是,越老越消極。
你可要知道,人不是別的,你我都是大語言模型。
所以,今天你打算用什麼語料來訓練自己?接下來的這一個小時呢?接下來的十五分鐘呢?