
中國社會科學(xué)報記者 陸航
2025年春節(jié)期間,國產(chǎn)大模型DeepSeek成為全球AI領(lǐng)域的一顆新星。DeepSeek開源版本在文本生成、代碼編寫、邏輯推理等任務(wù)中表現(xiàn)優(yōu)異。這一突破不僅打破了美國在生成式AI領(lǐng)域的絕對優(yōu)勢,更以百倍性價比提升的實(shí)踐路徑,為我國AI發(fā)展注入一劑強(qiáng)心針。2月8日,“DeepSeek影響與啟示”特別論壇在西安舉行。與會學(xué)者聚焦DeepSeek的技術(shù)突破、行業(yè)變革以及對未來發(fā)展的啟示,共同探討如何通過技術(shù)創(chuàng)新與自主研發(fā)提升我國人工智能競爭力。
技術(shù)創(chuàng)新為全行業(yè)
注入新的活力與信心
DeepSeek是源于算法、軟件與硬件的系統(tǒng)性協(xié)同創(chuàng)新成果。浙江大學(xué)人工智能研究所所長吳飛認(rèn)為,DeepSeek的精彩表現(xiàn)是眾智和眾力相互疊加的成果。盡管DeepSeek模型基于Transformer架構(gòu),并非顛覆性基礎(chǔ)理論創(chuàng)新,但是DeepSeek的確是AI漫漫征途中的精彩一躍,也為AI未來發(fā)展帶來了深刻啟示。事實(shí)上,AI發(fā)展迄今取得的成就都是由過往一次次“精彩一躍”繪就而成。2024年,諾貝爾物理學(xué)獎授予AI就是這樣一個注解:約翰·霍普菲爾德和杰弗里·辛頓分別從物理學(xué)能量最小和玻爾茲曼分布角度優(yōu)化神經(jīng)網(wǎng)絡(luò)模型參數(shù),為當(dāng)下深度學(xué)習(xí)的崛起打下了堅實(shí)的歷史樁基。DeepSeek“漸進(jìn)式突破”路徑證明,通過系統(tǒng)工程優(yōu)化同樣能實(shí)現(xiàn)跨越式發(fā)展,科技創(chuàng)新中不可忽視系統(tǒng)級工程創(chuàng)新的作用。
DeepSeek之所以實(shí)現(xiàn)了百倍性價比提升,其中一個重要原因是在系統(tǒng)軟件層面的深度創(chuàng)新。在清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授翟季冬看來,算法、軟件、硬件的協(xié)同創(chuàng)新,是打破傳統(tǒng)大模型依賴算力范式的關(guān)鍵。DeepSeek首先是算法層次的創(chuàng)新,采用了新的MoE架構(gòu),即共享專家和大量細(xì)粒度路由專家架構(gòu)。通過將通用知識壓縮到共享專家中,減輕路由專家的參數(shù)冗余,提高參數(shù)效率;在保持參數(shù)總量不變的前提下,劃分更多的細(xì)粒度路由專家,通過靈活地組合路由專家,更準(zhǔn)確和有針對性地進(jìn)行知識表達(dá)。同時,通過負(fù)載均衡的算法設(shè)計,有效緩解了傳統(tǒng)MoE模型因負(fù)載不均衡帶來的訓(xùn)練效率低下問題。在系統(tǒng)軟件層次,DeepSeek采用了大量精細(xì)化的系統(tǒng)工程優(yōu)化。算法和軟件的創(chuàng)新與優(yōu)化,極大地降低了模型的訓(xùn)練成本。DeepSeek給我們的啟示,更多在于如何在有限的算力情況下,通過算法和軟件的協(xié)同創(chuàng)新,充分挖掘硬件的極致性能。這對中國未來人工智能發(fā)展至關(guān)重要,也對國內(nèi)大模型發(fā)展具有啟示意義。
隨著深度學(xué)習(xí)時代的到來,機(jī)器學(xué)習(xí)理論的緩慢演進(jìn)已逐漸落后于技術(shù)水平的飛速發(fā)展,機(jī)器學(xué)習(xí)理論與技術(shù)之間開始產(chǎn)生越來越大的鴻溝。大量“啟發(fā)式”技術(shù)發(fā)現(xiàn)的深度學(xué)習(xí)性能表現(xiàn)無法找到有效的理論解釋,重建現(xiàn)代機(jī)器學(xué)習(xí)理論體系已成為該領(lǐng)域需要迫切突破的核心瓶頸。若無法實(shí)現(xiàn)這一目標(biāo)而任由機(jī)器學(xué)習(xí)/深度學(xué)習(xí)走向“煉金術(shù)式”工程化,更多缺乏可控性、安全性、解釋性的技術(shù)難題將會不可避免地滋生,導(dǎo)致以科學(xué)性為前提的學(xué)科大廈面臨行將傾覆的危局。
西安交通大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院教授、大數(shù)據(jù)分析與計算分析工程實(shí)驗室統(tǒng)計與大數(shù)據(jù)中心常務(wù)副主任孟德宇通過分析機(jī)器學(xué)習(xí)傳統(tǒng)統(tǒng)計學(xué)習(xí)理論體系的特點(diǎn)與局限,綜合介紹了以大模型為代表的現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)廣泛呈現(xiàn)的三大難題:“任務(wù)泛化能力”現(xiàn)象所揭示的學(xué)習(xí)理論泛化范疇局限難題、“智能涌現(xiàn)”現(xiàn)象所揭示的學(xué)習(xí)理論泛化趨勢偏差難題及“魯棒—精度悖論”現(xiàn)象所揭示的學(xué)習(xí)理論泛化邊界缺失難題。他強(qiáng)調(diào),隨著現(xiàn)代工程技術(shù)的蓬勃發(fā)展,特別是DeepSeek技術(shù)使機(jī)器學(xué)習(xí)能力開始更加廣泛地普惠大眾,重塑機(jī)器學(xué)習(xí)理論根基以闡釋這些現(xiàn)象背后的數(shù)理機(jī)理,使機(jī)器學(xué)習(xí)成為一門兼具理論完備性與技術(shù)有效性的學(xué)科,已成為當(dāng)今人工智能領(lǐng)域亟須面對且不可回避的關(guān)鍵科學(xué)問題。
自主研發(fā)
提升我國人工智能競爭力
技術(shù)創(chuàng)新與自主研發(fā)對于提升我國人工智能競爭力至關(guān)重要。我們不能盲目跟隨大公司的步伐,而應(yīng)堅定地相信自身技術(shù)能力,發(fā)揮自身技術(shù)優(yōu)勢,這一點(diǎn)對于確保我國在人工智能領(lǐng)域的持續(xù)領(lǐng)先地位尤為關(guān)鍵。
DeepSeek為全球AI技術(shù)發(fā)展帶來了獨(dú)特的貢獻(xiàn)和創(chuàng)新,它在算法優(yōu)化、模型泛化能力等方面的突破,不僅推動了AI技術(shù)的邊界拓展,也為其他領(lǐng)域的技術(shù)創(chuàng)新提供了有益借鑒。論壇專家呼吁產(chǎn)業(yè)界和學(xué)術(shù)界應(yīng)合力培養(yǎng)人才、突破原始理論,在基礎(chǔ)方法和產(chǎn)業(yè)應(yīng)用研究中共同發(fā)揮創(chuàng)新優(yōu)勢。為維持并增強(qiáng)這種創(chuàng)新勢頭,政府、企業(yè)、高校和研究機(jī)構(gòu)各方需進(jìn)一步加強(qiáng)協(xié)作,共同優(yōu)化資源配置,確保人才培養(yǎng)與行業(yè)需求相匹配、教育內(nèi)容與科技前沿相銜接、科技創(chuàng)新成果迅速轉(zhuǎn)化為實(shí)際生產(chǎn)力。
自主研發(fā)是提升我國人工智能競爭力的核心路徑。當(dāng)前,全球AI技術(shù)競爭已進(jìn)入白熱化階段,我國在應(yīng)用場景、數(shù)據(jù)規(guī)模和政策支持上具有顯著優(yōu)勢,但在基礎(chǔ)算法、高端芯片、開源框架等核心技術(shù)領(lǐng)域仍存在“卡脖子”問題。如何通過自主研發(fā)實(shí)現(xiàn)技術(shù)突破、構(gòu)建自主可控的產(chǎn)業(yè)生態(tài),是我國搶占全球AI戰(zhàn)略制高點(diǎn)的關(guān)鍵。
提升AI競爭力是一場關(guān)乎國運(yùn)的戰(zhàn)略博弈。西安電子科技大學(xué)人工智能學(xué)院副院長李甫表示,通過“硬件突圍—軟件筑基—算法創(chuàng)新—應(yīng)用推廣”四位一體的自主研發(fā)路徑,我國有望在2025—2030年實(shí)現(xiàn)關(guān)鍵領(lǐng)域自主可控,構(gòu)建起具有全球影響力的AI創(chuàng)新體系。這不僅需要技術(shù)突破,更需要制度創(chuàng)新與開放合作的智慧——既要打破技術(shù)枷鎖,也要避免“閉門造車”,在自主可控與全球化協(xié)作中尋找動態(tài)平衡。
智能化技術(shù)在提升性能和增效方面發(fā)揮著不可替代的作用。DeepSeek的成功不僅在于其卓越的技術(shù),更在于它能夠與智能硬件實(shí)現(xiàn)無縫對接,形成強(qiáng)大的生態(tài)協(xié)同效應(yīng),從而極大地推動AI技術(shù)在各行各業(yè)的廣泛應(yīng)用。人工智能模型的開源為實(shí)現(xiàn)人人可用的普遍智能帶來曙光。西北工業(yè)大學(xué)計算機(jī)學(xué)院教授、智能感知與計算工信部重點(diǎn)實(shí)驗室副主任郭斌認(rèn)為,大模型推理成本的降低,將對工業(yè)界和其他多個領(lǐng)域產(chǎn)生積極影響,DeepSeek將為中國產(chǎn)業(yè)發(fā)展注入新的活力,特別是在海外市場,有望帶動國內(nèi)硬件廠商和產(chǎn)業(yè)的全球布局,為全球產(chǎn)業(yè)創(chuàng)造更多機(jī)遇,為人類進(jìn)步和發(fā)展作出貢獻(xiàn)。
DeepSeek的躍升絕非偶然,而是我國AI發(fā)展模式轉(zhuǎn)型的縮影——從“市場換技術(shù)”轉(zhuǎn)向“創(chuàng)新驅(qū)動”,從“單點(diǎn)突破”升級為“系統(tǒng)攻堅”。這條道路既非完全自主封閉,也非被動跟隨,而是在關(guān)鍵領(lǐng)域構(gòu)筑“技術(shù)主權(quán)”的同時,通過開源協(xié)作、標(biāo)準(zhǔn)輸出、生態(tài)共建,深度參與全球創(chuàng)新網(wǎng)絡(luò)。軟件生態(tài)的建設(shè)不易,硬件生態(tài)的形成則更為困難。我們只有建立起完善的創(chuàng)新生態(tài)體系,通過海外部署軟件帶動國內(nèi)硬件產(chǎn)業(yè)的發(fā)展,才能持續(xù)推動AI技術(shù)的蓬勃發(fā)展,為區(qū)域經(jīng)濟(jì)和社會發(fā)展注入強(qiáng)大動力,并為全球科技提供一個“中國選擇”。這一策略不僅能夠促進(jìn)國內(nèi)經(jīng)濟(jì)發(fā)展,也有助于提升我國在全球科技競爭中的地位。未來,隨著國家超算互聯(lián)網(wǎng)、東數(shù)西算工程等基礎(chǔ)設(shè)施的完善,我國有望在AI芯片、框架、算法三大領(lǐng)域?qū)崿F(xiàn)自主化率新突破。中國AI正以“有限算力+無限智慧”書寫智能時代的中國方案。
論壇由陜西省計算機(jī)學(xué)會、中國計算機(jī)學(xué)會(CCF)西安會員活動中心等單位聯(lián)合舉辦。
轉(zhuǎn)自:中國社會科學(xué)網(wǎng)