在AI人工智能飛速發(fā)展的今天,近年大模型成了備受矚目的焦點(diǎn)?;诖竽P脱苌鰜?lái)了很多新產(chǎn)品形態(tài)和新商業(yè)模式,包括智能體AI Agent、RAG(Retrieval-augmented Generation,檢索增強(qiáng)生成)、文生內(nèi)容文生音頻文生視頻等,AI 正加速?gòu)睦碚撗芯窟~向大規(guī)模的實(shí)際應(yīng)用,深度融入各個(gè)行業(yè)領(lǐng)域,推動(dòng)生產(chǎn)力變革。
本文以非技術(shù)的通俗語(yǔ)言讓大家快速了解大模型和Al關(guān)系!
一.AI和大模型
人工智能AI是一種模擬人類智能的計(jì)算機(jī)系統(tǒng),其目標(biāo)在于使機(jī)器能夠像人一樣進(jìn)行思考、學(xué)習(xí)和自主決策,AI 涵蓋了算法、數(shù)據(jù)處理、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等多個(gè)領(lǐng)域。
AI和大模型有重疊的地方,但它們?cè)谝恍┖诵姆矫娲嬖趨^(qū)別:
1.范圍和功能:AI是一個(gè)更廣泛的概念,涵蓋了所有模擬人類智能的技術(shù)和系統(tǒng),而近期快速崛起的大模型則是AI技術(shù)中的一種特定實(shí)現(xiàn),相對(duì)傳統(tǒng)的AI實(shí)現(xiàn)技術(shù),大模型應(yīng)該算是實(shí)現(xiàn)復(fù)雜AI功能落地的一種最佳方案??梢哉J(rèn)為所有大模型都屬于AI的范疇,但并非所有AI系統(tǒng)都一定是大模型。
2.復(fù)雜性:大模型通常具有更高的復(fù)雜性和數(shù)據(jù)需求,需要的參數(shù)數(shù)量非常龐大,訓(xùn)練過(guò)程需要大量計(jì)算資源與數(shù)據(jù),而一些傳統(tǒng)的AI技術(shù)如規(guī)則引擎、決策樹(shù)等雖然功能可能不如大模型,但在特定場(chǎng)景下可以更快速、更簡(jiǎn)潔和更高效地實(shí)現(xiàn)目標(biāo)。
3.學(xué)習(xí)能力:大模型往往依賴深度學(xué)習(xí)技術(shù),具有自我學(xué)習(xí)、自我訓(xùn)練和適應(yīng)能力,能在接觸新數(shù)據(jù)后主動(dòng)調(diào)整其表現(xiàn),真正象人類一樣學(xué)習(xí)并不斷提高自己;而許多傳統(tǒng)的AI方法則以靜態(tài)算法為主,無(wú)法進(jìn)行動(dòng)態(tài)適應(yīng)。
二.2C和2B對(duì)AI和大模型的反應(yīng)
大模型和AI競(jìng)爭(zhēng)激烈,參與企業(yè)眾多,呈現(xiàn)出百芯百模的競(jìng)爭(zhēng)態(tài)勢(shì)。不少企業(yè)已籌劃建立智算中心,其核心任務(wù)是承載AI大模型的訓(xùn)練及推理等,為各行各業(yè)提供便捷、高效、領(lǐng)先和普惠的多元化“算力服務(wù)”,大模型作為智算時(shí)代的核心“產(chǎn)物”被大家廣泛關(guān)注。
中央網(wǎng)信辦等三部門:加快推進(jìn)大模型、生成式人工智能標(biāo)準(zhǔn)研制
2C領(lǐng)域的各大科技巨頭到初創(chuàng)企業(yè),都在更積極探索大模型的潛力,互聯(lián)網(wǎng)巨頭憑借海量數(shù)據(jù)優(yōu)勢(shì),在智能語(yǔ)音、圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域打造出具有國(guó)際競(jìng)爭(zhēng)力的產(chǎn)品與服務(wù);新興的 AI 創(chuàng)業(yè)公司如雨后春筍般涌現(xiàn),聚焦于特定行業(yè)應(yīng)用場(chǎng)景如智能制造、智慧醫(yī)療、智能交通等領(lǐng)域。互聯(lián)網(wǎng)公司和科技公司干AI商業(yè)模式增長(zhǎng)的新引擎,以期在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)有利地位。
2B領(lǐng)域里,近期國(guó)資委頻頻點(diǎn)題人工智能鼓勵(lì)“國(guó)家隊(duì)”帶頭加速布局AI產(chǎn)業(yè)。 2B的數(shù)據(jù)相對(duì)機(jī)密但相對(duì)互聯(lián)網(wǎng)爬取的數(shù)據(jù)會(huì)相對(duì)精準(zhǔn)!
一文回顧2024央國(guó)企行業(yè)大模型應(yīng)用

三.大模型概念和分類
大模型(Large Models):大模型通常指的是具有大量參數(shù)的機(jī)器學(xué)習(xí)模型特別是深度學(xué)習(xí)模型。
大模型的特點(diǎn)是參數(shù)數(shù)量巨大,通常在百萬(wàn)到數(shù)十億級(jí)別;能夠處理和理解大量的數(shù)據(jù);通常具有較高的泛化能力,能夠處理未見(jiàn)過(guò)的新數(shù)據(jù)。
大模型發(fā)展歷程:

大模型分類
(1).大模型按輸入數(shù)據(jù)類型分為語(yǔ)言大模型(NLP 大模型,其代表為L(zhǎng)LM)、視覺(jué)大模型(CV )和多模態(tài)大模型;

大模型技術(shù)在語(yǔ)音識(shí)別、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等任務(wù)中已經(jīng)具有相當(dāng)高的準(zhǔn)確率,泛化性能強(qiáng),在不同任務(wù)、語(yǔ)言、模態(tài)、場(chǎng)景的通用性都變得越來(lái)越好。
LLM和NLP
LLM 是 Large Language Model大語(yǔ)言模型的縮?,LLM是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理(NLP)大模型工具,能理解和生成文本。通過(guò)大量語(yǔ)料庫(kù)訓(xùn)練,LLM 在翻譯、寫作、對(duì)話等任務(wù)中展現(xiàn)出卓越的能力。常見(jiàn)的應(yīng)用包括自動(dòng)問(wèn)答、生成文本、文本摘要等。由于其多模態(tài)特性,LLM 還可用于圖像和音頻處理,為多領(lǐng)域帶來(lái)創(chuàng)新可能。
(2).大模型按應(yīng)用領(lǐng)域分為通用大模型(L0)、行業(yè)大模型(L1)和垂直大模型(L2)。

通用大模型(General-Purpose Large Models):通用大模型是指設(shè)計(jì)用來(lái)處理多種任務(wù)的模型,而不是專門針對(duì)某特定應(yīng)用,它們通常在大規(guī)模數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,并可在多種不同的任務(wù)上進(jìn)行微調(diào)。
ChatGPT、豆包、文心、Deepseek等就是一種通用大模型!
垂直大模型(Vertical Large Models):
垂直大模型是指針對(duì)特定行業(yè)或領(lǐng)域(垂直市場(chǎng))優(yōu)化的模型。這些模型在特定領(lǐng)域的數(shù)據(jù)上進(jìn)行訓(xùn)練,以更好地適應(yīng)該領(lǐng)域的特定需求。
四.機(jī)器學(xué)習(xí)ML、深度學(xué)習(xí)DL
前面講過(guò)大模型通常指的是具有大量參數(shù)的機(jī)器學(xué)習(xí)模型特別是深度學(xué)習(xí)模型。接下來(lái)聊下ML和DL,AI同ML/DL關(guān)系如下圖。


深度學(xué)習(xí)看作是機(jī)器學(xué)習(xí)技術(shù)的進(jìn)化版本,深度學(xué)習(xí)采用了更為復(fù)雜的模型和算法,專注于解決那些傳統(tǒng)機(jī)器學(xué)習(xí)方法無(wú)法處理的復(fù)雜問(wèn)題。

深度學(xué)習(xí)的根基是人工神經(jīng)網(wǎng)絡(luò)(ANN),它模擬人類大腦中神經(jīng)元的結(jié)構(gòu)與功能,神經(jīng)網(wǎng)絡(luò)由多個(gè)層次組成,每個(gè)層次包括多個(gè)節(jié)點(diǎn)/神經(jīng)元,這些節(jié)點(diǎn)通過(guò)連接形成網(wǎng)絡(luò),數(shù)據(jù)在這些節(jié)點(diǎn)之間傳遞、處理并最終產(chǎn)生輸出。
人腦是人類思維的物質(zhì)基礎(chǔ),光人類的大腦皮層就含有大約10^11個(gè)神經(jīng)元,每個(gè)神經(jīng)元又通過(guò)神經(jīng)突觸與大約103個(gè)其它神經(jīng)元相連,形成一個(gè)高度復(fù)雜高度靈活的動(dòng)態(tài)網(wǎng)絡(luò),如果說(shuō)人腦是生物神經(jīng)網(wǎng)絡(luò),電腦神經(jīng)網(wǎng)絡(luò)是人類發(fā)明的人工智能機(jī)器神經(jīng)網(wǎng)絡(luò),起碼截止到目前,人工智能還被人類操控,至于發(fā)展到一定階段,人工智能有了自我意識(shí)能否取代人類,未來(lái)誰(shuí)也不能確定!
神經(jīng)網(wǎng)絡(luò)(Neural Networks,簡(jiǎn)稱NN)有三基本層,如下圖所示:

輸入層:負(fù)責(zé)接收外部輸入的數(shù)據(jù)。
隱藏層:數(shù)據(jù)在這里進(jìn)行處理和轉(zhuǎn)換。通常,神經(jīng)網(wǎng)絡(luò)會(huì)包含多個(gè)隱藏層,因此深度學(xué)習(xí)也得名“深度”。
輸出層:產(chǎn)生最終結(jié)果或預(yù)測(cè)。
從早期的神經(jīng)網(wǎng)絡(luò)到現(xiàn)在的深度學(xué)習(xí)的演變歷程:

深度學(xué)習(xí)起源可以追溯到20世紀(jì)40年代的早期神經(jīng)網(wǎng)絡(luò),當(dāng)時(shí)科學(xué)家們通過(guò)模擬大腦的神經(jīng)元網(wǎng)絡(luò),提出了最早的人工神經(jīng)網(wǎng)絡(luò)模型。但真正的突破發(fā)生在1986年,當(dāng)時(shí)反向傳播算法的提出,讓神經(jīng)網(wǎng)絡(luò)能夠通過(guò)多層結(jié)構(gòu)不斷“學(xué)習(xí)”并調(diào)整權(quán)重,這一技術(shù)突破為如今的深度學(xué)習(xí)的興起奠定了基礎(chǔ);進(jìn)入21世紀(jì)后,隨著計(jì)算能力的提高和數(shù)據(jù)量的爆炸式增長(zhǎng),深度學(xué)習(xí)得到迅猛發(fā)展,從圖像分類到自然語(yǔ)言處理,深度學(xué)習(xí)幾乎覆蓋了所有領(lǐng)域,并快速崛起為人工智能的核心技術(shù)。
主流八大深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò):
神經(jīng)網(wǎng)絡(luò)(Neural Networks,簡(jiǎn)稱NN)目前有八種主流方式。

最常見(jiàn)的是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、深度神經(jīng)網(wǎng)絡(luò)(DNN)的近期熱炒的Transformer,它們各自有不同的“技能樹(shù)”,比如CNN特長(zhǎng)圖像處理,DNN更擅長(zhǎng)抽象特征學(xué)習(xí)。
好了,簡(jiǎn)單總結(jié):
可以簡(jiǎn)單認(rèn)為,利用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的大模型是目前實(shí)現(xiàn)復(fù)雜人工智能的一種優(yōu)秀技術(shù)方案!記住這句話即可,還有其他簡(jiǎn)單的人工智能技術(shù)實(shí)現(xiàn)方式,未來(lái)是不是有更好的Al技術(shù)實(shí)現(xiàn)方案再說(shuō),據(jù)未來(lái)學(xué)家推測(cè),強(qiáng)人工智能到來(lái),出現(xiàn)智商超10000的碳硅基混合生命,不用寒窗苦讀幾十載,幼兒園畢業(yè)連下腦機(jī)接口到"超智系統(tǒng)”,setup/install充一下"智商值",其知識(shí)儲(chǔ)備就相當(dāng)于目前全人類院士掌握的知識(shí)總和!
硅基生命或是人類進(jìn)化的新形態(tài)?為何說(shuō)宇宙的天道,是碳硅結(jié)合?
五.大模型/Al三要素
算力:GPU是關(guān)鍵
數(shù)據(jù):或稱語(yǔ)料,如果數(shù)據(jù)本身缺乏,或者質(zhì)量低劣,大模型實(shí)現(xiàn)的Al就不是人工智能,而是人工智障。
這點(diǎn)2B的數(shù)據(jù)相對(duì)會(huì)精準(zhǔn)一點(diǎn),畢竟企業(yè)同互聯(lián)網(wǎng)不一樣,企業(yè)數(shù)據(jù)有人維護(hù)。但亦不絕對(duì),試想一下,多少上市公司連財(cái)務(wù)數(shù)據(jù)都敢明目張膽造假,粉飾財(cái)報(bào)更是家常便飯;2C就更扯蛋,Al的發(fā)展本意是好的,近幾天Deepseek??了,需知不久前DeepFake亦曾??過(guò)! 本人一直強(qiáng)調(diào),基礎(chǔ)不牢地動(dòng)山搖,2B國(guó)產(chǎn)化替代連工業(yè)軟件都沒(méi)整好,其上的數(shù)據(jù)(語(yǔ)料、原料)→大模型→人工智能可能會(huì)如同建立在沙灘的大廈!
算法:大模型涉及的DL/ML包括但不限于下圖。

一文帶你了解更多大模型概念(預(yù)訓(xùn)練、剪技、知識(shí)蒸餾等)
從數(shù)字孿生、CPS、GlS到不久前熱炒的元宇宙,目前科技大佬們正在構(gòu)思元宇宙和Al技術(shù)融合形成世界大模型,想象一下,將真實(shí)世界虛擬到數(shù)字化的全球大模型,就問(wèn):這個(gè)餅畫(huà)的大不大?誰(shuí)來(lái)買單?資本的噱頭?
大數(shù)據(jù)還沒(méi)炒完,大模型又來(lái)了!感覺(jué)科技已被資本綁架,炒炒更健康!Al領(lǐng)域群雄并起,未來(lái)三年,國(guó)內(nèi)國(guó)外市場(chǎng)血拼到底,誰(shuí)能笑到最后?
全球具身大模型詳細(xì)梳理(大佬談全球大模型)
