長期以來,美國憑藉其雄厚的科研實力、蓬勃的科技產業和寬鬆的監管環境,在人工智慧領域獨領風騷。然而,近年來,中國AI 如同 awakened giant,以驚人的速度崛起,向美國的霸主地位發起強力挑戰。
傳統上看,美國一直處於人工智慧創新的前沿,受益於領先的研究型大學、強大的技術部門以及迄今為止的支持性監管環境;然而,在過去十年中,中國已成為一個強大的競爭對手。中國的學術機構和創新研究,特別是清華大學,造就了中國大部分頂尖的人工智慧新創企業,包括目前排名前四的生成式人工智慧新創公司—智普人工智慧、百川人工智慧、探月人工智慧和MiniMax;同時,中國的人工智慧研究成果比美國還多,並且正在迅速縮小與美國法學碩士的表現差距,特別是在雙語基準方面。
雖然中國在研究數量上處於領先地位,但在私人企業的推動下,美國在將尖端研究轉化為現實產品方面表現出色,美國具備更多著名的機器學習和基礎模型就證明了這一點:根據調查,到2023 年,美國將有61 個著名的機器學習模型,而中國有15 個;美國的基礎模型有109 個,而中國有20 個。
中國的資金支持進一步證明其快速追趕的能力,儘管美國在私人人工智慧投資方面使中國相形見絀,但外國投資正開始流入中國的生成式人工智慧領域,舉例而啀,沙烏地阿拉伯國家石油公司(Aramco)的創投部門最近以4億美元的交易支持智普人工智慧,而中國政府也在介入填補資金缺口,透過國家引導的資本和財政援助支持國內人工智慧公司,事實證明,這在支持通常被私營部門忽視的地區的國內人工智慧業者方面相當有效。
同時,即便美國透過出口管制廣泛努力限制中國取得先進技術,但這些措施成效有限,事實上,這些措施反而刺激中國發展本土生態系統。中國企業正在透過盡可能在公有雲中進行培訓來規避限制,而在無法做到的情況下則透過開發本地私有雲(例如華為的「AI-in-a-box」)產品來進行創新。
整體來看,中國政府提供財政支援來培育高潛力企業,特別是在可能被忽視的地區,從而培育更廣泛的創新基礎;其次,在著名的清華大學的支持下,出現一群新興的中國人工智慧新創企業,它們不是複製現有技術,而是突破人工智慧創新的界限,特別是在生成式人工智慧領域;最後,與美國相比,中國能夠生產出有競爭力、有時甚至更優越的人工智慧模型。
中國政府為國內人工智慧企業提供財政支持
政府引導基金本質上是國家引導的資本基金。這些資金是從公共和私營部門籌集的,用於符合政府目標的項目,根據國家經濟研究局發布的2024年研究報告,2000年至2023年間,中國政府創投基金透過20,000 多筆交易投資人工智慧領域的 9,623 家「獨特公司」,總額達1,840億美元。
政府引導基金廣泛用於各種策略性產業和商業活動,但其影響卻不明顯:這些基金籌集的資金往往少於預期,並且在許多情況下未能部署投資,而且有太多優先事項重疊,導致效率低下。但評估專門為人工智慧公司創建的基金會發現三個重要優勢:首先,政府創投基金的空間分佈比私募基金更廣泛,私募基金主要集中在中國富裕的沿海地區,由於中國政府創投基金更均勻地分佈在全國各地,包括欠發達的內陸地區,因此政府正在幫助支持私人風險投資可能因流動性限制和資訊差距而忽視的地區的高潛力企業。
其次,政府創投基金投資於最初績效指標較弱的公司,但這些公司最終的成長速度快於私人創投的公司,最後,政府創投基金通常會先於私人創投基金投資人工智慧公司,而這些政府投資會吸引隨後的私人創投。當政府直接投資最初績效指標較弱的企業時,這種模式尤其明顯,這表明政府的選擇被私人投資者視為有價值的訊號。
最後,中國政府也透過補貼支持人工智慧產業,例如,北京市當局對購買國產人工智慧晶片的企業實施補貼,以促進中國半導體產業的發展並減少對外國技術的依賴,此舉措將根據企業對國產圖形處理單元(GPU)晶片的投資比例提供財政支持;此外,包括最大的上海在內的至少16個政府正在向企業招商,以獲取來自大型國有資料中心的補貼處理能力,這些資料中心整合有限的先進晶片供應。
在新創公司部分,智譜AI、百川AI、Moonshot AI、Minimax和01.AI這五家生成式人工智慧新創公司躋身中國人工智慧「獨角獸」之列,這意味著它們的估值超過10億美元,是中國生成式人工智慧生態系統的核心,業界將他們稱為「中國新人工智慧虎」,因為他們代表了新一波專注於法學碩士的人工智慧公司,就像 OpenAI 和 Anthropic 等西方同行一樣,這也是為了將它們與主要專注於臉部和影像辨識技術的商湯科技、曠視科技、雲從科技和依圖科技等所謂的老科技「龍」進行對比。
雖然許多新的中國生成式人工智慧公司正試圖透過ChatGPT 複製OpenAI 的成功,但並沒有明確的領導者或突破性應用程式成為中國最受歡迎或使用最廣泛的應用程序,一些分析師報告稱客戶很難確定哪家公司的人工智慧解決方案最適合他們的特定需求,然而,其他人則認為,智浦 AI 的模型表現穩定,是挑戰 OpenAI 的中國業者。有趣的是,這些中國新創企業的影響力如此之大,甚至連西方學研機構也開始效法他們的做法,最近涉及史丹佛大學的爭議顯示,其人工智慧模型 Llama 3-V 與清華大學自然語言處理實驗室和中國新創公司 ModelBest 開發的模型 MiniCPM-Llama3-V 2.5 相似,ModelBest 聯合創始人劉志遠強調這一轉變,他承認中國的生成式人工智慧模型與GPT-4 等西方頂級項目之間存在「巨大」差距,但依舊有機會縮小技術劣勢。
中國的策略方針優先考慮專業的工業人工智慧應用,而不是大型語言模型等更廣泛、多功能的用途,發展的重點是將人工智慧嵌入製造和原材料等領域,以提高效率和獲利能力,而不是開發面向一般、面向消費者的人工智慧技術,以更有效率地推動產業成長。
政府也透過完善政策規劃支持AI發展
中國最高立法機關和政治諮詢機構全國人民代表大會和中國人民政治協商會議於2024年3月4日至11日在北京舉行年度會議,兩會期間的重要事件之一是政府工作報告的提交,該報告強調近期進展並為未來制定新的政策目標,《政府工作報告》明確指出,中國未來一年的首要任務之一是透過將人工智慧融入經濟各領域來達到全方位數位轉型,作為新宣布的「AI+」倡議的一部分,該倡議涵蓋有四個主要類別:模型開發、資料共享、技能開發和安全,AI+計劃是中國經濟數位轉型歷史的一部分。例如,2015年政府工作報告提出「互聯網+」,2019年又提出「智能+」,今年宣布的「AI+」,中國過去的注意力主要集中在技術開發上,但它已暗示2024年將是「人工智慧應用年」。
首先,一些與會者呼籲中國專注於建立尖端人工智慧模型,以追趕OpenAI等外國競爭對手,並複製ChatGPT的成功;360集團CEO周鴻禕對AI模型的發展提出兩方面的建議,鼓勵大型科技公司與重點研究機構之間的合作,類似於微軟與OpenAI 之間的合作夥伴關係,即那些致力於人工智慧技術突破的人與資源豐富的公司結對。在第二個軌道上,他也呼籲長期的人工智慧開源項目,建立多個國家級的開源人工智慧模型和開放的創新生態系統。同時,科大訊飛董事長劉慶峰在兩會期間提出,要製定國家人工智慧發展規劃,建構國內人工智慧大模型生態系統,呼應打造國家人工智慧模式的願望。
第二,一些代表提出改進數據共享。劉還呼籲開放共享高品質數據,並指出中國應在國家層級開放和共享各行業的高品質訓練數據,以發展人工智慧產業。微博財務長曹飛提出了推動人工智慧數據交易市場發展的建議,讓中國企業更容易買賣開發領先人工智慧模型所需的高品質數據,同時保護數據主體的權利。她也呼籲加快和支持跨境資料流動新規則的實施,以促進國際計畫合作。
圖二 : 小米CEO雷軍。(source:小米發布會影片截圖) |
|
第三,部分與會者提出人工智慧人才培養的設想。小米CEO雷軍指出,人工智慧技術的快速發展對各領域人工智慧人才產生巨大需求,加強人工智慧培訓將是推動產業持續進步的關鍵因素。因此,雷軍建議將人工智慧課程納入K-12課程大綱,並在大學開設更多人工智慧相關專業,他也鼓勵公司與大學合作,幫助未來的工人適應快速變化的人工智慧環境,知乎CEO周源也對人工智慧人才培養提出了建議,要求技能人才職業培訓方案更好地與企業需求相結合,並建議技術人才學院與企業合作設置課程。
中國科學院研究員張雲泉也意識到人工智慧教育的資源缺口,他認為高品質的課程、經驗豐富的教授和先進的技術都聚集在頂尖大學和城市。他建議建立一個教育平台,分享人工智慧教學的資源和內容,從而帶來更多的教育機會,包括在農村地區,與其他代表一樣,他鼓勵公司和大學之間合作,開發適用於現實場景的人工智慧知識。
最後,一些企業代表重點討論人工智慧安全和監管問題。360集團CEO周鴻禕認為,企業和地方政府應關注人工智慧可能帶來的風險,QAX執行長齊向東建議,更重視圍繞「AI+安全」進行創新,在各行業推廣「AI+安全」產品,金杜律師事務所合夥人張毅主張盡快出台新的人工智慧法,將人工智慧演算法依照風險等級進行分類,並針對不同層級採取不同的監管措施,知乎CEO周源對大型人工智慧模型的資料收集來源、處理方法、合規性進行監督和審查,並進行社會影響和風險評估,及時發現和解決潛在問題的模型。
中國政府正在增加計算和數據資源的獲取,以支持其國內創新生態系統。其一,它計劃通過繼續實施「東方數據、西方運算」工程,「創建全國統一的計算系統」,以確保計算資源的充分利用,該措施目的為透過將數據處理需求較高的東部地區的企業與土地和能源便宜得多的西部地區的數據中心連接起來,優化中國數據中心的分佈,這些對數位基礎設施的投資將確保中國企業能夠獲得採用人工智慧所需的運算資源。
中國政府也認識到數據作為使用人工智慧的關鍵要素的重要性,2024年的目標之一是「完善基礎資料系統,大力促進資料開發、開放、分配和利用」,事實上,中國已經在這一領域取得了重大進展;2023年,政府成立了國家數據管理局,這是一個新機構,負責創建數據基礎設施並促進整個經濟的數據利用。中國也正在研究支援特定產業人工智慧創新的特定類型數據;例如,國家有多項促進國家生物數據持有的政策。其中包括國家資訊化「十四五」規劃等政策,要求醫院將健康檔案數位化;國家衛生健康委員會的「健康中國2030」倡議,促進衛生服務和機構之間的數據標準化;《生物安全法》強調國家對收集、管理和分享某些生物資料的主權。
中國公司從這些政策中受益匪淺,他們能透過廣泛獲取生物數據來開發人工智慧技術,而其他國家的類似公司必須與特定醫院或研究機構合作才能獲取某些類型的生物數據,不對稱優勢在此體現。
案例分析:智譜AI
智譜AI是中國最著名的生成式人工智慧新創企業,以員工數量而言是中國最大的人工智慧新創企業,擁有800名員工,也是中國估值最高的人工智慧新創公司之一,截至2024年5月估值為30億美元,該公司由清華大學計算機科學與技術系教授唐杰和李娟子創立,兩者皆為是該大學知識工程組(KEG)的成員,該研究實驗室專注於網路環境中的知識工程理論、方法和應用。
圖三 : 智譜AI創建ChatGLM作為基於其GLM架構的應用程式,擅長中英文雙語任務。(source:智譜AI) |
|
智譜AI於2020年開始投資和訓練大型語言模型,並領先許多其他公司,在其研究人員於2022 年4 月發表的一篇題為「GLM:使用自回歸空白填充的通用語言模型預訓練」的論文中,智譜AI介紹其語言模型GLM,並明確表示該公司正在嘗試解決與現有語言模型不同的挑戰。 BERT、GPT 和智譜AI的GLM 都基於Transformer 模型架構,該架構是Google 科學家在2017 年的一篇開創性論文《Attention is All You Need》中介紹的,但智譜AI 將創新功能整合到GLM中,製作了一個獨特的模型,對於中文和英文任務都非常準確,這些模型的介紹如下。
1. BERT(來自Transformers 的雙向編碼器表示)使用一種稱為掩碼語言建模的方法,該方法本質上隱藏輸入文字中的某些單詞,並訓練模型使用兩個方向(隱藏單詞之前和之後)的上下文來猜測這些隱藏單字。這有助於 BERT 理解上下文中單字的意思。
2. GPT(生成式預訓練變壓器)使用自回歸模型,其中每個標記都是根據其前面的標記進行預測的。這是一種單向方法,因為模型經過訓練,可以透過只查看句子前面的單字來預測句子中的下一個單字。 GPT 的優點在於在較長的段落中產生連貫且上下文適當的文本,利用其訓練根據先前的所有單字預測下一個單字。
3. GLM(通用語言模型)透過隱藏部分文字然後按順序預測丟失的部分來結合這兩種方法的特徵。這種方法可以幫助模型從兩個方向理解上下文(如 BERT),並產生如 GPT 的文本。 GLM 還使用先進的技術來有效地處理中文和英文,使其對於一系列語言任務非常通用和強大。
就像OpenAI建立ChatGPT作為GPT模型的專門應用程式一樣,智譜AI創建ChatGLM作為基於其GLM架構的應用程式,擅長中英文雙語任務。但ChatGLM並不是智譜AI唯一的產品;該公司擁有一整套產品,包括WebGLM,專為網路搜尋和檢索功能而設計 VisualGLM負責理解和產生文字和圖像; CogVLM,一種多模態理解模型,目的為有效執行需要解釋視覺資料的任務;最後是程式碼生成模型CodeGeeX2-6B。
公司的目標是追求突破性進步,而不是漸進式改進,執行長張鵬曾表示,公司的口願景是努力實現通用人工智慧(AGI),這也是OpenAI和GoogleDeepMind的使命;同時,對許多人來說,智譜AI可能會成為OpenAI的競爭對手,不希望矽谷在人工智慧領域佔據主導地位的外國投資者正在向公司投入資金:沙烏地阿拉伯的 Prosperity7 隸屬於國營石油集團阿美公司的創投部門,於 2024 年成為智譜AI的首個外國投資者,參與該公司 4 億美元的投資。