AI大模型應(yīng)該是目前整個(gè)科技行業(yè)最火熱的概念,作為國內(nèi)知名的AI領(lǐng)域的龍頭企業(yè),科大訊飛自然不會落后。很早開始,他們就在從事語音及語言、自然語言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究。并且在過去幾年,訊飛已經(jīng)將很多產(chǎn)品和技術(shù)推向了包含電子消費(fèi)、教育、醫(yī)療、辦公、車載、智慧城市在內(nèi)的多個(gè)行業(yè)和市場。

上周六,科大訊飛正式對外發(fā)布了新一代認(rèn)知智能大模型——星火。這名字取自“星星之火,可以燎原”之意,體現(xiàn)了科大訊飛對于對于AGI的遠(yuǎn)景目標(biāo)。除此之外,早在2001年科大訊飛“半場會議”上,創(chuàng)業(yè)團(tuán)隊(duì)就提出了“燃燒最亮的火把,要么率先燎原,要么最先熄滅”。同時(shí) “星火”一詞還來自中國傳統(tǒng)文化二十八星宿中的“心宿”星座,被視為吉祥的象征,代表著力量、勇氣和堅(jiān)韌不拔的精神。所以從星火這個(gè)名字,也能看到訊飛的野心。


【資料圖】

發(fā)布會后,我們第一時(shí)間深度體驗(yàn)了這款大模型,在這里我們分享一些我們對這款A(yù)I大模型的感受和體驗(yàn)。

中文自然語義理解能力更強(qiáng)

訊飛星火認(rèn)知大模型在交互和界面設(shè)計(jì)上與大家熟悉的ChatGPT比較類似。作為一款對話類的自然語言模型,它通過自然對話方式做到對用戶需求的理解與任務(wù)的執(zhí)行。

既然是對話模型,首先要考驗(yàn)的是模型對于自然語義的理解能力。這方面中文相當(dāng)有發(fā)言權(quán)。因?yàn)橹形闹詮?fù)雜,除了本身表意的屬性之外,在日常交流過程中,同樣的文字、語句所表達(dá)的含義可能會隨著語境、音調(diào)、習(xí)慣甚至是標(biāo)點(diǎn)符號的變化而截然不同、傳統(tǒng)的交互模型在面對中文這類復(fù)雜的自然語言的時(shí)候經(jīng)常翻車,就是因?yàn)闊o法準(zhǔn)確理解這些變化背后的含義。

舉個(gè)例子:我單身的原因有兩個(gè):一是誰都看不上,二是誰都看不上。兩個(gè)原因在語句上完全一樣,但含義卻截然不同。將中文作為母語的我們能夠通過對整個(gè)語境的理解,很快明白二者之間的不同。

但AI會怎么理解呢?

我們將這句話輸入ChatGPT,讓它解釋這兩種說法有何不同。ChatGPT給出的解釋是:

顯然ChatGPT認(rèn)為,這兩種表述的意思都是一樣的。只是“沒有得到注意和認(rèn)可”和“不被看重,缺乏吸引力”的區(qū)別。

再來看看訊飛星火給出的解釋:

顯然,訊飛星火模型給出的解釋更為準(zhǔn)確,它能夠判斷出這句話中“對別人的挑剔”,甚至還能夠分析出一種說法是相對自嘲的,而第二種說法“顯得自我膨脹”。這種判斷是更符合我們對于這句話的雙重理解的含義。

這里其實(shí)就體現(xiàn)了訊飛星火對于中文自然語義超高的理解能力,這主要是得益于其本身作為一款中國本土市場的AI模型,能夠基于海量中文文本語料進(jìn)行訓(xùn)練,同時(shí)在相關(guān)的核心算法上也更貼近與中文的使用環(huán)境和習(xí)慣,在對于中文自然語義的理解方面,訊飛星火認(rèn)知大模型擁有先天的優(yōu)勢。

我們還輸入了一些其他比較復(fù)雜,或者有多重含義的中文語句,訊飛星火都能夠根據(jù)所在的語境的不同給出相對準(zhǔn)確的判斷,能夠很自然的理解這些語句背后想要表達(dá)的真實(shí)意圖。

生成文本能夠“拿來即用”

相對于這些單一的自然語言的理解能力,文本生成能力應(yīng)該是這類語言大模型在當(dāng)下最具“生產(chǎn)力”的特性。訊飛星火同樣支持強(qiáng)大的文本生成能力,它能夠根據(jù)需求創(chuàng)作出郵件、講稿、文案等等任何文本內(nèi)容。

這種文本生產(chǎn)的過程非常簡單,你只需要賦予身份、描述背景、提出需求,這三個(gè)步驟就能夠讓AI模型生成文本,最后你可以再根據(jù)生成的文本進(jìn)行一些細(xì)節(jié)上的調(diào)整和條件的補(bǔ)充。經(jīng)過我們的實(shí)測,訊飛星火大部分時(shí)候生成的文本,都能夠做到“拿來即用”的水平。

還是舉例來看,我們告訴訊飛星火:你現(xiàn)在是一位小學(xué)班主任,你的一名學(xué)生因?yàn)榻?jīng)常違反課堂紀(jì)律,現(xiàn)在需要給他的家長寫一封書信,告訴他們孩子的基本情況并且希望他們能夠協(xié)助你和學(xué)校妥善的解決這個(gè)問題。

以下是訊飛星火提供給我們的內(nèi)容:

可以看到,訊飛星火能夠根據(jù)你簡單的描述,直接生成信件的基本內(nèi)容。并且這封信件的內(nèi)容本身在邏輯性、通順性、可讀性方面都沒有什么問題。你可能注意到,這封信件的措辭和一些描述可能相對比較生硬和直接,需要修改地委婉一些。于是我們向訊飛星火提出需求:希望措辭能夠委婉一些,并且淡化孩子違反紀(jì)律的描述,更注重強(qiáng)調(diào)孩子的教育和關(guān)切問題。

在我們提出了更細(xì)化的要求之后。訊飛星火能夠準(zhǔn)確理解“委婉”的含義,最終生成的文本內(nèi)容在整體的措辭和語氣方面都顯得要溫和許多。它甚至還能夠自己拿出一些可行性的建議和意見,來解決存在的問題。讓整個(gè)信件內(nèi)容傳達(dá)出了對孩子問題的關(guān)注,以及希望尋求家長的協(xié)助,共同來幫助他解決問題的態(tài)度。

現(xiàn)實(shí)中如果你真的想要借助星火來生成一些文本內(nèi)容。你可以向它提出一些更為具體和細(xì)致的要求,進(jìn)而獲得更理想的最終文本。實(shí)際上,僅從文本內(nèi)容的創(chuàng)作能力來看,訊飛星火這類AI的水平已經(jīng)超過了大多數(shù)的普通人。

未來的想象空間還很大

除了上述的這些能力之外,訊飛星火還在諸多場景化的能力方面做出了嘗試和創(chuàng)新。

比如在多題型可解析數(shù)學(xué)能力能力上,星火認(rèn)知大模型目前就具備很強(qiáng)的能力,能夠解答常見的計(jì)算、幾何、方程、代數(shù)以及情景應(yīng)用題等,我們嘗試過將一些初高中的數(shù)學(xué)題直接輸入模型,模型能夠直接生成運(yùn)算步驟和答案,準(zhǔn)確率非常高。

尤其是在一些涉及到大量中文自然語義的情景應(yīng)用題型上,星火認(rèn)知大模型能夠憑借自身更為本土化的中文語義理解能力,在運(yùn)算的精確性上很多時(shí)候比GPT還要高。我們都知道,訊飛這些年在教育領(lǐng)域一直都有深入的拓展,推出了很多面向教育市場的產(chǎn)品,后續(xù)借助訊飛星火大模型的能力,這些教育類產(chǎn)品能力將會得到飛速提升,也將會給教育行業(yè)帶來更多的賦能。從長遠(yuǎn)來看,訊飛在這方面的創(chuàng)新和布局,擁有很廣闊的應(yīng)用前景和想象空間。

和當(dāng)前行業(yè)其他的大模型相比,訊飛星火目前在核心算法、數(shù)據(jù)積累、算力支撐等方面都有自己的獨(dú)到優(yōu)勢。短期來看,立足于訊飛本身在深度學(xué)習(xí)算法、大模型技術(shù)、行業(yè)大數(shù)據(jù)、知識圖譜、多模態(tài)感知、系統(tǒng)工程技術(shù)方面優(yōu)勢積累,接下來我們有望看到訊飛星火能夠不斷地進(jìn)行技術(shù)迭代,尤其是在中文認(rèn)知的智能領(lǐng)域,有望實(shí)現(xiàn)對ChatGPT這樣的行業(yè)標(biāo)桿的追趕。

訊飛官方表示,當(dāng)前訊飛星火在文本生成、語言理解、數(shù)學(xué)能力方面已經(jīng)超過了ChatGPT。并且訊飛官方也公布了接下來的迭代升級時(shí)間節(jié)點(diǎn):6月9日,星火將突破開放式問答、多輪對話能力明顯提升、數(shù)學(xué)能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升,希望能幫助到更多的合作伙伴及開發(fā)者團(tuán)隊(duì);10月24日,將實(shí)現(xiàn)通用模型對標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。

訊飛星火采用的是“1+N”架構(gòu),其中“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺,“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)等多個(gè)行業(yè)領(lǐng)域的專用大模型版本。

在這次訊飛星火的發(fā)布會上,科大訊飛就重點(diǎn)發(fā)布了星火認(rèn)知大模型在教育、辦公、汽車、數(shù)字員工等行業(yè)的應(yīng)用成果。比如給我們留下非常深刻印象的“星火認(rèn)知大模型+訊飛聽見”。借助星火認(rèn)知模型的能力,還能夠?qū)ξ淖謨?nèi)容進(jìn)行深度分析,可以一鍵生成包括新聞稿件、宣傳文案、多語種翻譯等多種文本內(nèi)容,它甚至還可以根據(jù)內(nèi)容,進(jìn)行提問追溯。對于我們這樣的文字工作者來說,這些功能無疑是我們一直以來都夢寐以求的。

類似的應(yīng)用場景還有教育行業(yè),訊飛已經(jīng)將星火認(rèn)知大模型的強(qiáng)大能力加入到自家的學(xué)習(xí)機(jī)、辦公本、錄音筆等智能硬件設(shè)備上,實(shí)現(xiàn)諸如類人批改和修訂語篇規(guī)整等多重的智慧能力。這些新功能的加入能夠極大提升現(xiàn)有產(chǎn)品的使用體驗(yàn),真正做到生產(chǎn)力的大幅度提升。另外,當(dāng)前訊飛在國內(nèi)車載智能語音應(yīng)用已經(jīng)做到了市場占有率第一,這一次認(rèn)知大模型技術(shù)會讓車載人機(jī)交互再上一個(gè)新的臺階,實(shí)現(xiàn)更自由、更擬人化地溝通。

未來,訊飛星火認(rèn)知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),這也是接下來,訊飛這款大模型最值得關(guān)注的看點(diǎn)。

目前訊飛已經(jīng)將星火認(rèn)知大模型加入到了訊飛開放平臺,將賦能開發(fā)者打造更具價(jià)值的AI應(yīng)用。官方還宣布,首批來自36個(gè)行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型,聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài)。

這里也可以看出訊飛“星火”命名的背后含義,盡管目前它還是一個(gè)星星之火,但在可見的未來,它很有可能成長為AI領(lǐng)域的燎原之勢,能力不容小視。

標(biāo)簽: