中新網(wǎng)2月11日電 (記者 孟湘君)這幾天,ChatGPT可以說(shuō)是“火爆全宇宙”!
大家想出各種各樣奇奇怪怪的問(wèn)題,盡情“投喂”給這款聊天機(jī)器人,看它如何給出或?qū)I(yè)準(zhǔn)確的回復(fù),或驢頭不對(duì)馬嘴的搞笑答案。
記者也出了些題讓ChatGPT作答,一起來(lái)看看它的“小作文”寫得怎么樣吧!沒(méi)想到,其中一篇,記者的小編同事被戳中痛點(diǎn),破防了!
先看第一個(gè):
對(duì)于特定采訪對(duì)象,ChatGPT貼心設(shè)計(jì)了有針對(duì)性的提問(wèn),可以說(shuō)基本達(dá)到了記者們的應(yīng)有水平吧。
來(lái)看下一個(gè)題目:
ChatGPT是懂新聞行業(yè)的!這描述也太生動(dòng)貼切了吧,簡(jiǎn)直“人間真實(shí)”!
它還對(duì)從事新聞工作的意義進(jìn)行了升華,有小編看完后對(duì)記者表示,自己頓感肩頭責(zé)任重大,看著看著,不禁眼眶一熱,破防了!(強(qiáng)行與AI共鳴)
再來(lái)看幾個(gè):
從寫工作周報(bào)、寫求職信、回答公務(wù)員考試試題的情況來(lái)看,ChatGPT的表現(xiàn)還行。那么,它的工作原理是怎樣的?
根據(jù)OpenAI介紹,相比之前的GPT模型,其對(duì)ChatGPT采用了全新的訓(xùn)練方式,即為一種“從人類反饋中強(qiáng)化學(xué)習(xí)”的訓(xùn)練方式。
這意味著,用戶輸入信息越多,ChatGPT深度學(xué)習(xí)、持續(xù)改進(jìn)的機(jī)會(huì)也就越多,對(duì)人類語(yǔ)言的理解和“反芻”,也會(huì)越來(lái)越深刻。換言之,是廣大用戶義務(wù)幫OpenAI來(lái)“教”自家的“娃”。
對(duì)此,中新網(wǎng)記者專訪清華大學(xué)國(guó)強(qiáng)教授、智能產(chǎn)業(yè)研究院(AIR)首席研究員聶再清,對(duì)ChatGPT的創(chuàng)新性、特點(diǎn)以及應(yīng)用前景等,進(jìn)行深入解析。
中新網(wǎng):
ChatGPT究竟是一個(gè)什么樣的產(chǎn)品?
聶再清:
ChatGPT本質(zhì)上是一個(gè)基于統(tǒng)計(jì)的語(yǔ)言模型。當(dāng)然,它現(xiàn)在還只是一個(gè)語(yǔ)言模型,以后應(yīng)當(dāng)會(huì)逐步發(fā)展到多模態(tài),比如為圖片(擬出)對(duì)應(yīng)文字,給出對(duì)圖片的理解等。與人聊天只是它能力的一方面,更多地還是內(nèi)容生成的能力,包括未來(lái)可能更多地把它運(yùn)用到寫作上。
OpenAI官網(wǎng)介紹ChatGPT為一種“優(yōu)化對(duì)話的語(yǔ)言模型”。圖片來(lái)源:OpenAI官網(wǎng)截圖
中新網(wǎng):
大家或多或少接觸過(guò)國(guó)內(nèi)已有的一些語(yǔ)音聊天機(jī)器人,比如掃地機(jī)器人、語(yǔ)音智能助手等,ChatGPT與這類機(jī)器人相比,有哪些區(qū)別?
聶再清:
之前的聊天機(jī)器人已經(jīng)能夠通過(guò)語(yǔ)音交互,幫用戶完成很多重復(fù)性的工作。這類機(jī)器人在業(yè)界比較成功的應(yīng)用,是運(yùn)用基于任務(wù)型的對(duì)話,通過(guò)意圖理解、槽值填充,把問(wèn)題參數(shù)抽出來(lái),然后去回答用戶的問(wèn)題,比如智能客服;或幫用戶完成一個(gè)智能家居的操作,比如AIoT語(yǔ)音助手。
它們更多是屬于一些封閉域內(nèi)任務(wù)完成型的機(jī)器人,通過(guò)對(duì)話真正去執(zhí)行某些特定領(lǐng)域的功能,首先得把事情做對(duì),才能獲得用戶信任。這是這類機(jī)器人最關(guān)鍵的一項(xiàng)能力。
ChatGPT更多地則是實(shí)現(xiàn)開(kāi)放域的對(duì)話、輸出寫作內(nèi)容等。跟以前的聊天機(jī)器人比,ChatGPT最讓人印象深刻的就是能用像模像樣的“人話”來(lái)回答幾乎任何領(lǐng)域的用戶問(wèn)題,并對(duì)上下文有一定程度的理解。
資料圖:美國(guó)企業(yè)家埃隆·馬斯克。
中新網(wǎng):
一些人以 “從0到1”、“劃時(shí)代的革命性突破” 來(lái)形容ChatGPT, 美國(guó)富豪埃隆·馬斯克也發(fā)文稱“ChatGPT好得嚇人”。您認(rèn)為ChatGPT有那么厲害嗎?其創(chuàng)新性體現(xiàn)在哪些方面?
聶再清:
ChatGPT在算法層面一個(gè)比較重要的創(chuàng)新,就是把強(qiáng)化學(xué)習(xí)引入到大模型的訓(xùn)練和使用上。之前實(shí)現(xiàn)開(kāi)放域?qū)υ挼淖畲罄щy,在于用戶輸入的話題各種各樣,任務(wù)空間太大,很難有足夠的監(jiān)督信號(hào)拿來(lái)訓(xùn)練。
那么,如今ChatGPT通過(guò)利用人類反饋信號(hào)學(xué)習(xí)到的獎(jiǎng)勵(lì)模型(reward model),來(lái)為任意一個(gè)問(wèn)題自動(dòng)估算監(jiān)督信號(hào),充分利用強(qiáng)化學(xué)習(xí)的嘗試探索(exploration)能力來(lái)解決開(kāi)放域任務(wù)空間太大的挑戰(zhàn)。這是一個(gè)比較好的創(chuàng)新應(yīng)用。它在回答開(kāi)放域問(wèn)題時(shí)基本上能做到邏輯上比較通暢,句式上也像模像樣,這不是很容易就能做到的。
同時(shí)ChatGPT用到的GPT3.5,作為一個(gè)基礎(chǔ)語(yǔ)言模型的質(zhì)量也是非常高的。這需要大量的數(shù)據(jù)預(yù)處理工作,需要把各領(lǐng)域的語(yǔ)料整理好“喂”進(jìn)大模型,在訓(xùn)練過(guò)程中不斷積累能力,才能產(chǎn)生一個(gè)如此高效的基礎(chǔ)語(yǔ)言模型。
另一個(gè)比較重要的能力,就是ChatGPT能拒絕回答一些它判斷為不適合回答的問(wèn)題,懂得“拒絕”。實(shí)際上之前一些聊天機(jī)器人在設(shè)計(jì)時(shí),也會(huì)謹(jǐn)慎處理一些比較敏感的問(wèn)題,以及跟人類主流價(jià)值觀不契合的內(nèi)容。ChatGPT也在不斷提升這種能力,防范生產(chǎn)出敏感或有偏見(jiàn)的內(nèi)容。
ChatGPT的試用頁(yè)面上,標(biāo)注了偶爾可能輸出錯(cuò)誤、有害、有偏見(jiàn)信息;對(duì)2021年后的世界認(rèn)知有限等說(shuō)明。
中新網(wǎng):
大家體驗(yàn)后發(fā)現(xiàn),ChatGPT不是完美的,還是會(huì)出錯(cuò),也就是“一本正經(jīng)地胡說(shuō)八道”。您認(rèn)為它需要改進(jìn)的方面有哪些?
聶再清:
ChatGPT進(jìn)行開(kāi)放域聊天最大的好處,是它什么話題都接得住,能一直聊下去,有連續(xù)性。但最大的壞處是,有時(shí)用戶無(wú)法判斷它是否正確。如果提問(wèn)人對(duì)問(wèn)題答案不了解的話,會(huì)覺(jué)得它答得不錯(cuò);但對(duì)一些不常見(jiàn),提問(wèn)人又知道答案的問(wèn)題,就會(huì)發(fā)現(xiàn)ChatGPT有可能用一本正經(jīng)的口氣,編出了錯(cuò)誤答案。
因此,不看具體知識(shí)點(diǎn)的話,ChatGPT似乎回答得很專業(yè)。但它目前難以真正理解和回答開(kāi)放域里有具體知識(shí)點(diǎn)的問(wèn)題,在處理開(kāi)放域的問(wèn)題上實(shí)際上還是基于概率,基于前一個(gè)值來(lái)生成下一個(gè)值。要通過(guò)圖靈測(cè)試,還要繼續(xù)努力。
中新網(wǎng):
ChatGPT是把所有輸入給它的信息復(fù)制、堆砌起來(lái),還是能生成原創(chuàng)內(nèi)容?它有“創(chuàng)造力”嗎?
聶再清:
可以視為ChatGPT是在搞創(chuàng)作,因?yàn)檫@是它經(jīng)過(guò)大量學(xué)習(xí)后,基于概率自己產(chǎn)生的內(nèi)容。讓它寫一封郵件、一首詩(shī),也可以輸出看上去“長(zhǎng)得很像”用戶所要求的東西。
但比如去寫論文、搞數(shù)學(xué)論證、去做實(shí)驗(yàn)并得出結(jié)果,它現(xiàn)在應(yīng)該還沒(méi)有那么強(qiáng)大,還不能系統(tǒng)地提出具有創(chuàng)新性的觀點(diǎn),但是它輸出的一些內(nèi)容可能會(huì)對(duì)科研工作帶來(lái)一些啟發(fā)。
在誰(shuí)可能取代自己這個(gè)問(wèn)題上,ChatGPT列出了一些對(duì)象,中國(guó)企業(yè)華為的產(chǎn)品上榜。
中新網(wǎng):
您認(rèn)為中國(guó)需要擁有類似于ChatGPT這樣,屬于自己的語(yǔ)言大模型嗎?
聶再清:
我認(rèn)為我們特別有必要去構(gòu)建像ChatGPT這樣一個(gè)大的語(yǔ)言模型,中國(guó)需要有自己的這類產(chǎn)品。ChatGPT不光可以聊天、幫助寫作,也是很多下游人工智能任務(wù)的基礎(chǔ)模型(foundation model)。一些中國(guó)企業(yè)已經(jīng)在跟進(jìn),相信接下來(lái)我們國(guó)家會(huì)出現(xiàn)類似的模型。但是具體功能和質(zhì)量能否超越ChatGPT,需要等發(fā)布以后才知道。這需要我們的企業(yè)在資源和人才投入上有耐心,具備長(zhǎng)遠(yuǎn)的眼光,不能太注重短期的商業(yè)回報(bào)。
當(dāng)然,我們也不需要每個(gè)企業(yè)都做一個(gè)ChatGPT,造成資源浪費(fèi)。
中新網(wǎng):
一些觀點(diǎn)認(rèn)為,ChatGPT將來(lái)會(huì)取代部分人的職業(yè)。您怎么看?
聶再清:
我認(rèn)為,雖然有一些模板化、重復(fù)性的寫作可以被ChatGPT取代,但應(yīng)該說(shuō)它還是作為人類的助手更合適。比如幫助用戶在從事寫作、寫代碼、商業(yè)提案、廣告文案設(shè)計(jì)、翻譯等工作時(shí),可以大幅提高他們的工作效率。
它應(yīng)當(dāng)被用作一種提高效率的工具,成品最終還是要人類來(lái)把關(guān)和確認(rèn)。而且如果出了錯(cuò),責(zé)任應(yīng)該還是落到具體的人身上。
中新網(wǎng):
ChatGPT這樣的語(yǔ)言交互類產(chǎn)品,是否存在隱私泄露的風(fēng)險(xiǎn)?
聶再清:
用戶向ChatGPT提問(wèn)的問(wèn)題,本身就帶有信息量,向它輸入信息,不排除有一定的信息泄露風(fēng)險(xiǎn),包括信息跨境流動(dòng)問(wèn)題。這取決于這個(gè)產(chǎn)品的研發(fā)人員、運(yùn)營(yíng)人員、數(shù)據(jù)管理者等,是否對(duì)相關(guān)信息進(jìn)行了妥當(dāng)處理,不讓個(gè)人隱私等外泄,或用于其他用途。如果有問(wèn)題,責(zé)任應(yīng)由他們承擔(dān)。
看完專家的權(quán)威分析,再來(lái)看看我們還給ChatGPT布置了哪些有趣的“作業(yè)”吧!
如果有人發(fā)來(lái)這樣一封情書(shū),你會(huì)心動(dòng)嗎?
看到小帥、大壯、小美幾個(gè)名字,你的耳畔有沒(méi)有自動(dòng)響起一段充滿懸疑感的音樂(lè)?
這首詩(shī)說(shuō)明,對(duì)于博大精深的中華文化,ChatGPT還有很多東西要學(xué)習(xí)……
看著這“跌宕起伏”的小說(shuō)情節(jié),只能說(shuō)ChatGPT盡力了!
雖然知道ChatGPT是語(yǔ)言模型,記者還是想“逼”它畫畫,但是直接讓它畫,它回答做不到,最后記者用“打印”指令,讓它“畫”出了一只數(shù)碼小貓,送給大家。
ChatGPT,和你想象中的一樣嗎?(完)