【中國智造面對面】源頭技術(shù)與行業(yè)場景雙輪驅(qū)動 大模型商業(yè)化落地未來可期
來源:證券時報·e公司 作者:葉玲珍 2024-01-29 12:11
Aa 大號字

過去一年多,以ChatGPT為代表的生成式AI(人工智能)技術(shù)狂飆突進,各路科技巨頭爭相入局,試圖在技術(shù)演進、應(yīng)用落地風(fēng)口搶占更多話語權(quán),“百模大戰(zhàn)”已然打響。本期“中國智造面對面”走進科大訊飛,證券時報社常務(wù)副總編輯周一對話科大訊飛AI工程院院長潘青華,解讀生成式AI技術(shù)發(fā)展現(xiàn)狀及挑戰(zhàn),展望大模型規(guī)?;瘧?yīng)用前景。

證券時報社常務(wù)副總編輯周一(左)對話科大訊飛AI工程院院長潘青華(右)

深耕人工智能賽道二十余載,科大訊飛積極擁抱“智能涌現(xiàn)”的大模型時代,依托源頭技術(shù)創(chuàng)新和成建制的行業(yè)頂尖研發(fā)團隊,通過與華為等合作伙伴強強聯(lián)合,打造了基于自主可控技術(shù)底座的訊飛星火認知大模型?!靶切侵穑梢粤窃?,歷經(jīng)數(shù)次迭代升級,訊飛星火大模型迅速在教育、醫(yī)療、工業(yè)、金融、汽車、法律、科研等應(yīng)用場景落地開花,正以更好的姿態(tài)賦能千行百業(yè),解決社會剛需。

2024年上半年對標(biāo)GPT-4

證券時報記者:能否介紹一下科大訊飛星火認知大模型最新的研發(fā)進展?

潘青華:2022年12月,科大訊飛啟動“1+N認知智能大模型技術(shù)及應(yīng)用”專項攻關(guān),并在2023年5月6日正式發(fā)布訊飛星火認知大模型。

經(jīng)過多次迭代升級,2023年10月24日,公司在全球開發(fā)者節(jié)上正式發(fā)布星火大模型V3.0,對標(biāo)ChatGPT(GPT-3.5),實現(xiàn)中文超越,英文相當(dāng)。

目前,團隊還在馬不停蹄地攻關(guān),公司將于1月30日發(fā)布星火大模型V3.5版本,各方面能力相較過去都會有非常大的提升。

預(yù)計在2024年上半年,星火大模型還將迎來新的迭代版本,屆時可實現(xiàn)全面對標(biāo)GPT-4。從現(xiàn)在的訓(xùn)練情況來看,我們對2024年上半年對標(biāo)GPT-4非常有信心。

證券時報記者:與國內(nèi)外大模型相比,科大訊飛星火認知大模型有哪些特點和優(yōu)勢?

潘青華:首先,星火大模型是在科大訊飛前期積累上自主研發(fā)的,從預(yù)訓(xùn)練到微調(diào),再到強化學(xué)習(xí),每一步訓(xùn)練都有技術(shù)上的創(chuàng)新。得益于過去十幾年在深度學(xué)習(xí)技術(shù)和自然語言處理等算法上的積累和持續(xù)創(chuàng)新,星火大模型底層技術(shù)更為扎實。

其次,星火大模型在發(fā)布之初便同時公布了在教育、汽車等領(lǐng)域的落地產(chǎn)品應(yīng)用,在過去的業(yè)務(wù)開展過程中,公司已經(jīng)在教育、醫(yī)療、工業(yè)、智慧城市等領(lǐng)域開拓了豐富的認知智能行業(yè)應(yīng)用場景,在利用大模型解決實際問題方面形成了獨特優(yōu)勢。

再次,訊飛星火大模型是國內(nèi)首個完全基于國產(chǎn)算力平臺訓(xùn)練的大模型。此前,公司兩次被美國制裁,我們堅定走軟硬一體國產(chǎn)化的必由之路。2023年10月24日,科大訊飛對外發(fā)布基于華為昇騰生態(tài)的自主可控算力平臺——“飛星一號”,通過與華為強強聯(lián)合,合力打造我國通用智能新算力底座,并在此平臺上開展更大規(guī)模的大模型訓(xùn)練。我們判斷,未來2~3年國產(chǎn)算力生態(tài)將持續(xù)繁榮,完全可以支撐通用人工智能大模型的自主研發(fā)。

證券時報記者:科大訊飛在大模型方向的研發(fā)團隊規(guī)模如何?

潘青華:此前,公司在人工智能方面已經(jīng)構(gòu)建了成建制的行業(yè)頂尖研發(fā)團隊,這也是星火認知大模型的底氣所在。

目前公司AI算法相關(guān)研發(fā)人員主要集中在AI研究院、AI工程院以及資源數(shù)據(jù)團隊,合計超過1500人,其中直接參與大模型研發(fā)的人員有幾百人。如果疊加產(chǎn)品線上從事大模型應(yīng)用開發(fā)、落地的相關(guān)團隊,以及外部合作伙伴和開發(fā)者,團隊規(guī)模會更大。

“技術(shù)+需求”雙輪驅(qū)動

證券時報記者:目前來看,訊飛星火認知大模型的迭代升級主要是技術(shù)驅(qū)動還是需求驅(qū)動?

潘青華:星火大模型的迭代其實是技術(shù)、需求兩條線并行驅(qū)動的。

目前來自于技術(shù)層面的驅(qū)動更為直接,所以我們也有比較明確的大模型升級時間節(jié)點;除此之外,需求端也是重要的驅(qū)動力。最初啟動大模型攻關(guān)的時候,公司就明確了“1+N”的路線,“1”為基礎(chǔ)模型,“N”指的便是行業(yè)應(yīng)用,即讓大模型在教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個領(lǐng)域落地。

當(dāng)然,大模型進入千行百業(yè)并不是一蹴而就的,需要在長時間的打磨中,以潛移默化的方式逐步變成常態(tài)。

不要高估技術(shù)短期的影響,也絕不能低估技術(shù)長期的影響。據(jù)我們判斷,相比于過去的人工智能技術(shù),大模型進入到實際應(yīng)用的周期可能會大幅縮短。因為大模型的認知能力一旦有突破口,會很快形成“漣漪效應(yīng)”,在應(yīng)用中讓越來越多的用戶形成使用習(xí)慣。

證券時報記者:大模型會在哪些行業(yè)率先得到大規(guī)模應(yīng)用?

潘青華:根據(jù)目前訊飛星火認知大模型的落地應(yīng)用情況來看,在代碼領(lǐng)域程序員對大模型的接受能力是最強的,還有教育、醫(yī)療、金融等領(lǐng)域也會有較快應(yīng)用。另外,還有一個重要的方向是人機交互,包括智能汽車、智能家居、智能硬件終端等,目前已經(jīng)有搭載大模型的全新交互產(chǎn)品在不斷涌現(xiàn)。

證券時報記者:您如何看待大模型對各行各業(yè)的賦能作用?會帶來替代效應(yīng)嗎?

潘青華:對于大模型的應(yīng)用前景,業(yè)內(nèi)還是比較樂觀的。我們認為,大模型對于很多崗位的工作人員,特別是腦力勞動者,比如程序員、文字工作者、工程師、醫(yī)生、教師等職業(yè),都能輔助他們更好、更高效地完成工作。

大模型帶來的提效并不意味著對原有工種的替代,它更多的是一種生產(chǎn)工具,在某種程度上改變工作模式,提升崗位生產(chǎn)效率。

規(guī)?;逃弥溉湛纱?/p>

證券時報記者:大模型進化到目前的水平,哪些方面讓您覺得驚艷?哪些方面表現(xiàn)平平?

潘青華:應(yīng)該說大模型進化到現(xiàn)在,雖然表現(xiàn)得不夠完美,但已經(jīng)足夠讓人驚奇。

我們注意到,大模型在幾個方面的能力尤為突出:首先是對復(fù)雜、深層次語義的理解能力,這種理解并不是靠死記硬背,而是結(jié)合上下文,真正理解了背后的意思;其次是跨領(lǐng)域的學(xué)習(xí)能力,大模型能夠快速調(diào)用外部插件及相關(guān)工具,在較短時間內(nèi)成為一個“全科人才”;再次是大模型已經(jīng)具備了思維鏈,能夠像人類解題一樣,對復(fù)雜任務(wù)分步驟推導(dǎo)求解。

當(dāng)然,大模型也有表現(xiàn)不盡如人意的地方,比如文本生成能力雖然在某些場合已經(jīng)夠用,但還不夠好用,不夠個性化。

我們認為,大模型最大的短板,在于目前還無法精準(zhǔn)地成為每個人的個性化助手,因為從現(xiàn)在的情況來看,為每個人定制大模型的成本是很高的;另外,與人腦相比,大模型并不是在所有的場景都表現(xiàn)得一樣聰明,一致性和穩(wěn)定性還有待提升。

證券時報記者:目前各家的大模型尚處于探索性應(yīng)用階段,您認為大模型距離規(guī)?;?、商業(yè)化應(yīng)用大概還需要多長時間?

潘青華:我們覺得,在未來一年多的時間內(nèi),就能看到大模型大規(guī)模應(yīng)用的進展。當(dāng)然,不同的應(yīng)用場景落地的速度會有差別,直接面向C端用戶的應(yīng)用應(yīng)該是最快的。

從現(xiàn)階段來說,成本是最大的制約因素。如果按照現(xiàn)有算力水平,想要大模型隨時隨地被調(diào)用,成本是無力承受的。

未來,大模型的普及一方面取決于算法的進步,另一方面取決于硬件的進步,即如何在單位芯片功耗相同的情況下,實現(xiàn)更強的計算能力。

需要說明的是,最終大模型的形態(tài)可能也會有一些變化,或許不是一個大模型部署在一個大的節(jié)點上,而是分散成一些小的輕量化節(jié)點,就能夠很好地完成任務(wù)。

證券時報記者:在您看來,應(yīng)如何打通大模型在行業(yè)落地的“最后一公里”?

潘青華:我們知道,行業(yè)模型的底座其實是基礎(chǔ)大模型,伴隨著底座模型的迭代,行業(yè)模型的落地會加速推進。

另一方面,行業(yè)模型是一個復(fù)雜的智能系統(tǒng),有賴于專家知識、行業(yè)信息、行業(yè)數(shù)據(jù)等,還需要更多理解大模型算法的人做精、做透相關(guān)應(yīng)用,才能推動大模型技術(shù)最終在行業(yè)順利落地。

共建大模型繁榮生態(tài)

證券時報記者:當(dāng)前,市場呈現(xiàn)出“百模大戰(zhàn)”的白熱化競爭態(tài)勢,您認為哪些因素會成為決定勝負的關(guān)鍵?

潘青華:我們認為,要想在“百模大戰(zhàn)”中勝出,做出效果最好的模型,不僅僅靠堆算力,也要靠原理層面的算法創(chuàng)新。基于現(xiàn)有算法框架,仍然看誰模型更大,能帶來能力提升,但無限堆算力可能不是最優(yōu)路徑,預(yù)計很快就會進入算法層面的創(chuàng)新比拼階段。

我們判斷,最終能夠走出來的通用大模型可能只有幾家。未來國內(nèi)可能就是幾個底座,大家各自選擇合適的底座去做自己上層的應(yīng)用。

證券時報記者:大模型在快速發(fā)展過程中,也引發(fā)了各界對于數(shù)據(jù)保護、合規(guī)風(fēng)險及隱私泄露等問題的擔(dān)憂。您如何看待大模型的安全問題?應(yīng)該從哪些方面規(guī)避風(fēng)險?

潘青華:我們認為,從算法原理來看,大模型距離形成自主意識還為時尚早。而從大模型本身的安全性來看,如何防止生產(chǎn)有害的、錯誤的信息,這是必須引起重視的,可以從數(shù)據(jù)源頭、訓(xùn)練方法、算法等技術(shù)層面建立配套的鑒偽等機制。與此同時,還需要從政策法規(guī)層面進行引導(dǎo),在不影響技術(shù)迭代的前提下,避免技術(shù)濫用。

證券時報記者:您對人工智能行業(yè)發(fā)展有哪些建議?

潘青華:首先還是需要鼓勵實事求是的精神,對人工智能技術(shù)不要過度包裝、“神話”,讓市場客觀理性認識技術(shù)。另外,希望更多的人能夠參與到人工智能生態(tài),以更積極的心態(tài)擁抱技術(shù),促進生態(tài)繁榮,推動社會進步。

責(zé)編:張騫爻

校對:祝甜婷

責(zé)任編輯: 張騫爻
e公司聲明:文章提及個股及內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。
更多相關(guān)文章
熱門解讀 更多
視頻推薦 更多
熱門股票 更多
股票名稱 最新價
漲跌幅