校院概況
教學(xué)培訓(xùn)
科研咨政
桑熙:三問ChatGPT
來源:學(xué)習(xí)時報(bào)
作者:
時間:2023-05-10
10
2023-05
09:52

  ChatGPT自問世以來,立刻就成為全球科技領(lǐng)域關(guān)注的熱點(diǎn),據(jù)新華社報(bào)道,ChatGPT推出約兩個月后,活躍用戶即已達(dá)到1億,成為歷史上增長最快的消費(fèi)者應(yīng)用程序。有學(xué)者甚至把它同蒸汽機(jī)的發(fā)明、電力的應(yīng)用、個人計(jì)算機(jī)和互聯(lián)網(wǎng)的發(fā)明相提并論,認(rèn)為以ChatGPT為代表的人工智能技術(shù),將極大推動生產(chǎn)力的發(fā)展,引領(lǐng)人類社會的又一次工業(yè)革命,推動社會產(chǎn)生重大變革。也有人認(rèn)為,ChatGPT并不是取得突破性的技術(shù)革命,只不過是互聯(lián)網(wǎng)時代的又一次概念炒作。那么,ChatGPT到底是什么,會為我們帶來哪些挑戰(zhàn)和機(jī)遇?

  一問:支撐ChatGPT運(yùn)行的到底是什么?

  ChatGPT是新一代的自然語言處理模型。語言模型,故名思義,就是用來處理人類語言的。當(dāng)人們把一段文字輸入語言模型后,它經(jīng)過分析處理,輸出相對應(yīng)的結(jié)果。比如有用于翻譯外文的翻譯模型,用于對內(nèi)容進(jìn)行分類的文本分類模型,用于檢索內(nèi)容的文本匹配模型等,而ChatGPT是一個生成式的語言模型。所謂生成式語言模型,簡單來說,就是一個聊天機(jī)器人。當(dāng)你輸入一段文字后,它根據(jù)對文字含義的理解,輸出一段對應(yīng)的回答。類似這樣的聊天機(jī)器人在互聯(lián)網(wǎng)剛剛興起的時候就有,粗看起來并沒有什么特別的地方。但是ChatGPT的不同之處在于,它生成的文字并不是由人事先設(shè)定好的“標(biāo)準(zhǔn)答案”,它的每一次回答都是經(jīng)過“思考”后“創(chuàng)作”的結(jié)果。

  ChatGPT之所以具有如此驚艷的“思考”和“創(chuàng)作”能力,正是建立在大數(shù)據(jù)、大模型和大算力的基礎(chǔ)之上。據(jù)推測,ChatGPT學(xué)習(xí)了數(shù)以億計(jì)單詞量的來自書籍、文章、新聞、網(wǎng)頁、博客,以及維基百科等載體的各類資源,這些內(nèi)容涵蓋了人類社會的政治、經(jīng)濟(jì)、文化、社會、軍事、歷史等各個方面。但ChatGPT不是簡單地復(fù)制和記錄所學(xué)習(xí)的內(nèi)容,它是通過深度學(xué)習(xí)技術(shù)和自注意力機(jī)制來訓(xùn)練自己。所謂深度學(xué)習(xí),就是用計(jì)算模型模擬一種類似人類神經(jīng)系統(tǒng)的運(yùn)行機(jī)制,通過學(xué)習(xí)不斷更新模型參數(shù)。ChatGPT在學(xué)習(xí)過程中,會通過根據(jù)上文猜下文的方式,來不斷摸索所學(xué)內(nèi)容的“規(guī)律”,在這個過程中,它會對自身模型中的約1750億個參數(shù)進(jìn)行反復(fù)修正,直到它認(rèn)為根據(jù)上文所猜出的下文從統(tǒng)計(jì)規(guī)律來看是最合適的時候,參數(shù)才趨于穩(wěn)定。換句話說,它找到了所學(xué)內(nèi)容的“內(nèi)在規(guī)律”,一個訓(xùn)練成熟的語言模型就完成了。值得注意的是,ChatGPT之所以從眾多語言模型中脫穎而出還在于它使用了一種經(jīng)過改良的自注意力機(jī)制。在這種機(jī)制下,它會判斷出一句話之中需要重點(diǎn)關(guān)注的內(nèi)容是哪些,能更好地聯(lián)系上下文,聯(lián)系提出的問題和它學(xué)習(xí)的內(nèi)容,從而給出更合適的答復(fù)。學(xué)習(xí)如此大規(guī)模的數(shù)據(jù),且每一次學(xué)習(xí)都要更新和調(diào)整千億數(shù)量級的參數(shù),在投入使用后,面對海量問題快速作出響應(yīng),這離不開大算力的支持。據(jù)推測,ChatGPT的總算力消耗約為 3640PF-days(假設(shè)每秒計(jì)算一千萬億次,需要計(jì)算3640天),需要7到8個投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行,其單次訓(xùn)練成本超過千萬美元。

  二問:這樣一個自然語言模型到底有什么用?

  我們知道,自然語言是人類溝通交流、表達(dá)情感、傳播和積累知識、進(jìn)行抽象思考的重要媒介,正是因?yàn)閾碛辛苏Z言,才使得人類文明得以不斷傳承、積累和發(fā)展。ChatGPT的出現(xiàn),讓人類語言能夠直接被計(jì)算機(jī)進(jìn)行分析和處理,這就使得以自然語言為基礎(chǔ)進(jìn)行的一系列活動,不再是人類的專利。雖然,尚無研究表明ChatGPT出現(xiàn)了人類智能,但不可否認(rèn)的是,至少從語言的形式上、邏輯上,它成功地模擬了人類的話語體系。ChatGPT的最新版本在許多專業(yè)測試中表現(xiàn)出超過絕大多數(shù)人類的水平,比如模擬律師資格考試取得了前10%的好成績,在閱讀考試中排名前7%左右?;诖耍珻hatGPT可以在許多以語言為主要形式的生產(chǎn)生活活動中發(fā)揮重要作用。ChatGPT能夠快速生成高質(zhì)量的文案,大大提高了廣告、營銷等行業(yè)的生產(chǎn)效率;能夠快速分析大量數(shù)據(jù)和信息,為企業(yè)提供有價值的市場洞察和建議;作為智能客服,可以有效應(yīng)對用戶咨詢,提高客戶滿意度;作為個性化的輔導(dǎo)老師,通過問答式的方式,幫助學(xué)生更好地理解和掌握學(xué)習(xí)內(nèi)容。

  值得一提的是,ChatGPT作為處理語言的“專家”,具有很大的潛力應(yīng)用于計(jì)算機(jī)程序語言的領(lǐng)域,有望成為人和機(jī)器之間直接溝通的橋梁。當(dāng)前,ChatGPT已經(jīng)能夠根據(jù)需要編寫一些程序代碼。通過持續(xù)優(yōu)化和升級,ChatGPT可能實(shí)現(xiàn)把自然語言直接轉(zhuǎn)換為機(jī)器可以讀懂的計(jì)算機(jī)編程語言,根據(jù)人們提出的要求自動編寫代碼操作機(jī)器。這意味著,未來我們可以通過自然語言直接指揮機(jī)器執(zhí)行各類復(fù)雜的、自定義的任務(wù)。

  當(dāng)然,ChatGPT還遠(yuǎn)沒有達(dá)到完美的程度。作為一個語言模型,其學(xué)習(xí)和創(chuàng)造的內(nèi)容仍然是建立在人類所積累的知識和信息的基礎(chǔ)之上,也就是說它還不具備創(chuàng)造新知識的能力。同時,作為基于文本學(xué)習(xí)的模型使得它“只知其文”而“不知其義”,也導(dǎo)致了它經(jīng)?!巴纳x”產(chǎn)生“幻覺”。在一些具有很強(qiáng)邏輯性的問題上,也可能“理解”出錯。

  三問:如何應(yīng)對ChatGPT帶來的機(jī)遇和挑戰(zhàn)?

  面對這樣一個新事物,我們首先要深入了解它的運(yùn)行機(jī)制和最新發(fā)展。以ChatGPT為代表的人工智能并不神秘,它目前還僅是一個在先進(jìn)計(jì)算機(jī)技術(shù)支持下,通過大規(guī)模學(xué)習(xí)人類語言而生成的,能較好模擬人類神經(jīng)網(wǎng)絡(luò)工作機(jī)制,根據(jù)輸入文本生成對應(yīng)自然語言的數(shù)學(xué)概率模型。不過近日,隨著多模態(tài)版本的GPT4.0發(fā)布,這個升級版的模型不僅具備聊天能力,還能理解圖像和聲音,其“理解”和“創(chuàng)作”能力又上了一個新臺階??梢娫谌〉萌祟愓Z言學(xué)習(xí)的突破之后,人工智能領(lǐng)域的技術(shù)很有可能產(chǎn)生打通“任督二脈”的效果:實(shí)現(xiàn)跨界整合,結(jié)合多模態(tài)的輸入,帶來意想不到的機(jī)遇和挑戰(zhàn)。

  其次,要抓住機(jī)遇,充分發(fā)揮它在自然語言處理上的高效能力和優(yōu)勢,將其作為生產(chǎn)和生活工具的有力補(bǔ)充。積極探索在各行業(yè)運(yùn)用它優(yōu)化工作流程、提高工作效率、降低運(yùn)營成本、推動生產(chǎn)力的持續(xù)發(fā)展的可行性。積極探索新應(yīng)用場景、創(chuàng)新商業(yè)模式、改善社會服務(wù)、提高治理效能。積極發(fā)揮其產(chǎn)業(yè)帶動作用,推動數(shù)字基礎(chǔ)設(shè)施建設(shè),促進(jìn)芯片、網(wǎng)絡(luò)、軟件等相關(guān)產(chǎn)業(yè)發(fā)展。

  最后,要積極應(yīng)對各種潛在和未知的挑戰(zhàn)。關(guān)注其帶來的數(shù)據(jù)安全、隱私保護(hù)和知識產(chǎn)權(quán)等方面的問題,研究制定相關(guān)的法律法規(guī)。關(guān)注其可能帶來的大規(guī)模就業(yè)替代風(fēng)險(xiǎn),全面評估其在取代傳統(tǒng)職業(yè)和創(chuàng)造新興就業(yè)上可能帶來的影響,提前做好規(guī)劃、制定措施。加快國產(chǎn)自然語言模型的發(fā)展,盡快實(shí)現(xiàn)自主替代,防止其因有選擇性地學(xué)習(xí)而帶來“偏見”,保障國家的意識形態(tài)安全。加快推動人工智能相關(guān)產(chǎn)業(yè)的發(fā)展,大力推動數(shù)字產(chǎn)業(yè)關(guān)鍵核心技術(shù)的自主創(chuàng)新,防止某些國家搞技術(shù)壟斷、脫鉤斷鏈。

編輯: 杜艷敏