2023年,隨著ChatGPT等應(yīng)用的爆火,以生成式AI為代表的人工智能再度成為各界的焦點(diǎn)。
【資料圖】
“從更長(zhǎng)遠(yuǎn)的角度來(lái)講,我們可以把2023年看作是AI領(lǐng)域令人振奮的一年,”5月10日,在2023年中國(guó)ICT市場(chǎng)趨勢(shì)論壇(北京站)上,IDC中國(guó)區(qū)研究副總裁鐘振山表示,“在這一年中,我們能夠看到大量語(yǔ)言及圖像模型的逐步成熟與推廣,并看到新的AIGC產(chǎn)品及企業(yè)級(jí)應(yīng)用共存,未來(lái)有望全面改寫企業(yè)數(shù)字化進(jìn)程的趨勢(shì)?!?/p>
鐘振山指出,生成式AI都是基于大模型的應(yīng)用之一。根據(jù)IDC的定義,大模型是對(duì)原有算法模型的技術(shù)升級(jí),基于海量數(shù)據(jù)開(kāi)發(fā)預(yù)訓(xùn)練模型,到最終用戶環(huán)境中使用少量數(shù)據(jù)即可獲得比之前的算法模型更好的結(jié)果。
如今大熱的ChatGPT便是建立在OpenAI的GPT-3.5系列大型語(yǔ)言模型之上的,并通過(guò)監(jiān)督和強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行了微調(diào)。
鐘振山認(rèn)為,基于大模型的AI應(yīng)用和傳統(tǒng)AI的區(qū)別,本質(zhì)上在于前者改變了用戶使用數(shù)據(jù)的方式。
根據(jù)IDC預(yù)測(cè)的數(shù)據(jù),到2026年中國(guó)地區(qū)所產(chǎn)生的數(shù)據(jù)量約為50ZB,年復(fù)合增長(zhǎng)率約為26%,遠(yuǎn)超世界上其他任何一個(gè)國(guó)家。但是,其中真正能被企業(yè)和個(gè)人所使用的數(shù)據(jù)卻不到1%。對(duì)企業(yè)來(lái)說(shuō),這意味著大部分的數(shù)據(jù)都無(wú)法產(chǎn)生價(jià)值。
不過(guò),隨著ChatGPT等基于大模型的生成式AI的出現(xiàn)與成熟,這一現(xiàn)狀有望得到改變。以ChatGPT為例,該應(yīng)用抓取了2021年之前所有的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行了預(yù)訓(xùn)練?!拔磥?lái)隨著AIGC應(yīng)用不斷成熟之后,無(wú)論企業(yè)還是個(gè)人所產(chǎn)生的任何數(shù)據(jù),都可以被用來(lái)訓(xùn)練大模型的產(chǎn)品,從而為企業(yè)帶來(lái)相關(guān)的價(jià)值?!?/p>
鐘振山認(rèn)為,對(duì)于用戶來(lái)說(shuō),大模型在降低開(kāi)發(fā)門檻和計(jì)算資源、提升預(yù)測(cè)效果等方面具有重要價(jià)值。
其中,鐘振山特別強(qiáng)調(diào),對(duì)于一個(gè)只有應(yīng)用需求的企業(yè)來(lái)說(shuō),自行搭建大模型體系的成本極高。因此大模型生成式AI的應(yīng)用往往是由相關(guān)的技術(shù)廠商進(jìn)行前期的預(yù)訓(xùn)練工作,再由企業(yè)使用少量?jī)?nèi)部數(shù)據(jù)進(jìn)行二次訓(xùn)練,即可滿足預(yù)期的需求,從而實(shí)現(xiàn)計(jì)算資源的節(jié)省。
目前在大模型的基礎(chǔ)上,生成式AI的典型應(yīng)用場(chǎng)景主要集中在數(shù)字人、藝術(shù)設(shè)計(jì)領(lǐng)域。此外,生成式AI在知識(shí)管理類應(yīng)用、銷售和營(yíng)銷、代碼生成、醫(yī)療領(lǐng)域、金融業(yè)、制造業(yè)中也均有應(yīng)用案例。以醫(yī)療領(lǐng)域?yàn)槔墒紸I已被應(yīng)用于抗體和蛋白質(zhì)的設(shè)計(jì)。
而它們均基于大模型底座。鐘振山介紹稱,目前全球范圍內(nèi),除OpenAI的GPT-3(大型語(yǔ)言模型)、DALL-E 2(圖像模型)以及Whisper(語(yǔ)言識(shí)別模型)外,包括Stable Diffusion(圖像模型)、Midjourney(圖像模型)、Make-a-Video(視頻模型)等都是典型的AIGC基礎(chǔ)模型。
不過(guò),雖然從顛覆性的功能價(jià)值與豐富的應(yīng)用場(chǎng)景來(lái)看,生成式AI的表現(xiàn)令人振奮,但是其面臨的挑戰(zhàn)也不容忽視。
鐘振山表示,生成式AI還存在不少挑戰(zhàn),包括prompt工程師等相關(guān)人才的缺乏;AI生成內(nèi)容的準(zhǔn)確度不足,版權(quán)不清,甚至可能產(chǎn)生誤導(dǎo)、有害或誤用的內(nèi)容;威脅用戶隱私安全;甚至可能造成在線社區(qū)內(nèi)的性別、種族、能力歧視等。
盡管如此面臨挑戰(zhàn),展望未來(lái),鐘振山仍對(duì)大模型所在的AI市場(chǎng)充滿信心。他預(yù)測(cè),到2026年,中國(guó)人工智能市場(chǎng)規(guī)模將達(dá)到264.36億美元左右。而市場(chǎng)增量則主要來(lái)源于基于大模型的應(yīng)用替換過(guò)去幾年建設(shè)的AI應(yīng)用,生成式AI帶來(lái)增量市場(chǎng),以及全新的AI賦能的企業(yè)級(jí)應(yīng)用。
鑒于此,鐘振山提醒道,過(guò)去通用AI市場(chǎng)將會(huì)日漸飽和甚至消失,而不具備大模型能力的廠商將難以維持競(jìng)爭(zhēng)優(yōu)勢(shì)。
(文章來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道)
標(biāo)簽: