【香港經濟導報網訊】
2022年11月30日,美國人工智能研究公司OpenAI正式發布了一個名為ChatGPT的自然語言生成式模型,今年1月便已達到1億月活躍用戶,用戶增長速度堪稱史無前例。其優秀的通用性能力和邏輯推理能力,令人意識到人工智能的交互能力已經實現了跨越式進展。
事實上,ChatGPT之所以被人驚呼具有跨時代的意義,核心在於其大規模預訓練语言模型、通過針對具體任務的句子示例或引導的模型微調和人機互動式強化學習以及背靠微軟的強大算力。從這些維度來看,中國是否有能力創造出與ChatGPT相媲美的應用,而這款中國版的ChatGPT又將會呈現出什麼模樣?

在chat GPTdahuocheng大獲成功的鼓勵下,中國版chat GPT的到來並不遙遠。(周苑文製圖)
打造ChatGPT三要素:算力、數據和算法
“一個大家都有的共識是,人工智能的三個基本要素是算力、數據和算法。算力可以理解為是背後的資金投入,數據其實是生產資源,算法實際上可以理解為人力資源也就是人才。”粵港澳大灣區數字經濟研究院(IDEA)院長辦主任陳志鴻接受本刊記者採訪時說。
在算力方面,OpenAI背靠微軟,可用算力包括28.5萬個CPU核心、1萬個英偉達V100 GPU。據OpenAI早前對外曝光的ChatGPT訓練成本顯示,其離線訓練成本達到1200萬美元,千億參數級語料包的語言大模型,訓練一次的成本就要花掉460萬美元。2月12日,國盛證券估算,今年1月,平均每天約有1300萬獨立訪客使用ChatGPT,對應芯片需求為3萬多片英偉達A100GPU,初始投入成本約8億美元,每日電費5萬美元左右。而GPT-3訓練一次,成本約為140萬美元,對一些更大的大模型,訓練成本介於200萬美元至1200萬美元之間。
陳志鴻告訴記者,“受中美關係影響,芯片供應出現了一些問題,ChatGPT的芯片需求大概是1萬張英偉達芯片,然而目前中國,擁有超過1000張的公司或機構不超出10家,擁有1萬張的更是只有1到2家。”
數據上,資料顯示,OpenAI於2018年6月推出GPT-1,使用了5GB的預訓練數據,參數量達到1.17億;2019年2月,發布GPT-2,使用了40GB的預訓練數據,參數量達到15億;2020年5月,繼續推出GPT-3,使用了45TB的預訓練數據(3000億語料),參數量達到1750億。
鵬城實驗室副研究員曾煒等人在2022年發布一篇論文中就提到,目前已有3個100GB以上規模的中文語料數據集,分別是爬蟲公司Common Crawl抽取到的CLUECorpus2020,模型規模為100GB;阿里巴巴集團發布的M6中文多模態模型,規模為300GB;北京智源研究院面向合作者發布的300GB高質量中文語料。文章寫道,“與目前同等規模參數量的英文預訓練模型所使用的數據量相比,上面這些中文語料數據仍不能滿足訓練數據需求”。
而在算法方面,ChatGPT的核心技術之一是由谷歌的人工智能的團隊“谷歌大腦”發布的Transformer,是一種用於序列到序列(Sequence-to-Sequence)任務的神經網路模型,具有多個注意力機制,它能夠在不同文本序列中學習和捕捉長期以來性和上下文信息,這種架構可以有效地處理自然語言生成任務,例如回答問題、完成文本生成等。通信行業教授級高級工程師錢鴻生博士撰寫的《ChatGPT技術架構及中國人工智能未來發展趨勢報告》指出,Transformer的精度和性能上都比之前流行的CNN(卷積神經網路)、RNN(循環神經網路)等模型,大幅提升了模型訓練的效果,讓人工智慧在更大模型、更多數據、更強算力的基礎上進一步增強運算能力。
中國信通院雲計算與大數據研究所所長何寶宏接受《國是直通車》採訪時表示,“我國大模型底層技術不局薄弱,雖然已湧現一批大模型,但均從谷歌提出的Transformer等基礎模型衍生而來,當前大模型底層技術、基礎架構均由國外頭部企業掌握,且部分模型不開源僅提供接口服務,我國技術存在‘卡脖子’隱患。”
中國版ChatGPT何時能夠推出?
對於這個問題,記者首先問詢了下ChatGPT本尊的看法,“中國在計算機科學、人工智慧和大數據等領域有着強大的實力和發展潛力,也擁有豐富的數據資源和計算資源,因此理論上說,中國有能力推出像ChatGPT這樣的大型語言模型。但是,實現這樣的目標需要大量的投入和努力,需要各方面的支持和助力。我們可以預期中國在自然語言處理和語言模型領域會有更多的進展和創新。”
事實上,在ChatGPT大獲成功的鼓勵下,中國版ChatGPT的到來並不遙遠。記者了解到,早在2020年,北京智源研究院曾推出超大規模智能模型“悟道”項目,阿里達摩院自研預訓練模型框架ALICE。 2021年,深圳鵬城實驗室為首的聯合團隊,推出參數為2000億的大模型“鵬程·盤古”,探索通用人工智能。目前,包括百度、阿里巴巴、科大訊飛、360等多家國內知名企業和研究機構都相繼表態有相關業務的布局。
不過業界共識是,中國目前大模型研發與OpenAI仍有差距,至少需要2年才有可能實現趕超,這需要大量的研究和開發投入以及對中文語言和文化的深入理解及應用。
正如3月5日舉行的十四屆全國人大一次會議第一場“部長通道”上,科技部部長王志剛在談及ChatGPT所舉得兩個例子,“同樣一種原理,在於做得好不好。比如發動機,大家都能做出發動機,但質量是有不同的。踢足球都是盤帶、射門,但是要做到梅西那麼好也不容易。”