人也是大语言模型
2024-03-30
AI是大语言模型,投喂给它不同的语料,就训练出不同的AI。
所以,语料的筛选很重要。
一个投喂社交媒体爆款网文训练出来的AI,和一个投喂经典名著学术期刊训练出来的AI,是有天差地别的。
训练ChatGPT的语料主要是英文,中文占比不多,据说是出于信息质量的考虑。
如佛教法相唯识宗说,人不过是一串相似相续不常不断的名言概念的意识流,换句话说:人,也是大语言模型。
所以,你用什么语料训练自己这个大语言模型?
比如,一早看到有人骂我,我点进去看他的言论,花了三分钟,想争论,但一想,如果争论,对方也会争论过来,我又得看他提供的低端语料,来来回回,可能三小时都不能辩出胜负。
我想,我可是大语言模型啊!难道接下来宝贵的三小时,来用这些劣质语料来训练自己吗?
止止止!
马上打住,随手拿了一本经典大作,也就是高质量语料,对自己进行了三小时训练。
再比如,有人抱怨自己学不好英语。但一看,他多数时间都用中文语料训练自己。
消极的人,或者说,消极的大语言模型,偏爱寻找消极的语料来自我训练,于是,越老越消极。
你可要知道,人不是别的,你我都是大语言模型。
所以,今天你打算用什么语料来训练自己?接下来的这一个小时呢?接下来的十五分钟呢?