近日,美國(guó)人工智能研究公司OpenAI推出的聊天機(jī)器人ChatGPT火爆全網(wǎng)。它能通過學(xué)習(xí)和理解人類語言進(jìn)行自然語言對(duì)話,跟人類聊天時(shí)遇到敏感問題會(huì)“打太極”,還能替打工人生成頗具幽默感的辭職信……
可以說,ChatGPT打開了自然語言處理技術(shù)商業(yè)化落地且成為消費(fèi)端爆款的大門,具有劃時(shí)代的意義。中國(guó)目前還沒有可媲美的類似應(yīng)用,會(huì)在本輪AI競(jìng)爭(zhēng)中因慢一步而落于人后嗎?不必過慮!
AI發(fā)展的三大要素是數(shù)據(jù)、算法、算力,中國(guó)在這三方面都有良好基礎(chǔ)。
AI的進(jìn)步迭代需大量數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,ChatGPT也不例外。ChatGPT的訓(xùn)練使用了約45TB數(shù)據(jù),其中包含多達(dá)近1萬億個(gè)單詞的文本內(nèi)容。從大數(shù)據(jù)資源看,中國(guó)擁有全世界最大規(guī)模的網(wǎng)民數(shù)量,有豐富的應(yīng)用場(chǎng)景,在數(shù)據(jù)積累方面優(yōu)勢(shì)明顯。
在算法方面,ChatGPT的技術(shù)底座是大型語言模型。GPT屬于自然語言處理NLP的范疇,本質(zhì)上仍是以深度學(xué)習(xí)為代表的人工智能技術(shù)長(zhǎng)期發(fā)展和積累的結(jié)果,并未出現(xiàn)算法的革命性突破,發(fā)布于2020年的GPT-3是有1750億個(gè)參數(shù)的大模型,ChatGPT正是基于它的改進(jìn)版本創(chuàng)建的。國(guó)內(nèi)也有NLP領(lǐng)域的大模型,并有智能客服、作詩(shī)機(jī)等實(shí)際應(yīng)用。雖然目前全球還沒有能跟ChatGPT驚艷表現(xiàn)相抗衡的大模型,但是業(yè)界共識(shí)是差距在兩年左右。兩年的差距并非鴻溝,有趕超可能。
AI的訓(xùn)練和使用需要強(qiáng)大的算力,算力的基礎(chǔ)是芯片,有人擔(dān)心中國(guó)在這方面會(huì)吃虧。實(shí)際上,芯片水平并不等同于算力水平,算力還需要廣闊的應(yīng)用場(chǎng)景支撐,需要具備對(duì)千萬個(gè)芯片進(jìn)行規(guī)?;{(diào)度運(yùn)行的能力?!?021—2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,美國(guó)計(jì)算力指數(shù)得分為77分,中國(guó)為70分,分列世界前兩位,中國(guó)算力水平與美國(guó)處于同一等級(jí),差距并不大。
對(duì)于中國(guó)企業(yè)來說,ChatGPT的優(yōu)點(diǎn)值得學(xué)習(xí),它的不足也正是我們參與競(jìng)爭(zhēng)的機(jī)遇。
學(xué)習(xí)它提高AI智商的新路徑。ChatGPT的聰明表現(xiàn),源自讓AI從人類反饋中進(jìn)行強(qiáng)化學(xué)習(xí)。在訓(xùn)練過程中,人類訓(xùn)練者扮演著用戶和助手的角色,這比過去AI大模型的“深度學(xué)習(xí)+人工標(biāo)注”模式省時(shí)省力、效果更好。
在它表現(xiàn)欠佳的中文領(lǐng)域錯(cuò)位競(jìng)爭(zhēng)。ChatGPT的英文水平明顯高于中文水平,這是它在訓(xùn)練階段被“喂”了更多英文素材的必然結(jié)果,也可以成為中國(guó)版ChatGPT應(yīng)用的競(jìng)爭(zhēng)切入點(diǎn)。
從它被詬病的倫理挑戰(zhàn)中尋得商機(jī)。ChatGPT會(huì)一本正經(jīng)地胡說八道,生成錯(cuò)誤信息的能力遠(yuǎn)超人類。它還會(huì)被人類不當(dāng)使用,比如學(xué)生拿它寫作業(yè),黑客拿它寫代碼用于網(wǎng)絡(luò)攻擊,詐騙犯拿它開設(shè)“殺豬盤”。防范治理這些風(fēng)險(xiǎn),一方面需要完善相關(guān)倫理法規(guī),另一方面也應(yīng)考慮到人類處理信息的速度遠(yuǎn)遜于AI的事實(shí),開發(fā)自動(dòng)判別并警示AI生成有害信息的技術(shù)。屆時(shí),反ChatGPT技術(shù)也將成為新商機(jī)。
中國(guó)版ChatGPT并不遙遠(yuǎn),已有百度等多家公司宣布將進(jìn)入此賽道。面對(duì)ChatGPT這個(gè)新晉AI網(wǎng)紅,我們應(yīng)清醒分析其優(yōu)勢(shì)和不足,學(xué)優(yōu)補(bǔ)劣。