CTIMES- 親愛的我把AI模型縮小了- 模型減量與壓縮技術簡介 :AI模型

│新東西市集│東西講座│影音頻道│出版中心│

元件次系統自動控制

最新動態

【東西講座】4/18 邊緣AI的運算技術與應用｜耐能智慧現身說法

產業快訊

8/20-23自動化x機器人展立即預登參觀

CTIMES / 文章 /

親愛的我把AI模型縮小了- 模型減量與壓縮技術簡介

【vMaker Edge AI專欄 #08】

【作者： Jack OmniXRI】 2023年08月30日星期三

瀏覽人次：【3114】

1989年科幻電影「親愛的，我把孩子縮小了」，2015年「蟻人」，2017年「縮小人生」，以及我們從小看到大的多啦A夢「縮小燈」、「縮小隧道」，都不約而同的提到一個概念，就是可以透過一種神奇的機器，就能把人的體積大幅縮小但生理機能完全不減。這裡姑且不論是否符合物理定律，但如果真的能實現，就會像「縮小人生」中所提到的，可大幅減少地球資源的浪費，大幅改善人類的生存環境。雖然以上提及的技術可能我們這輩子都難以看到實現的一天，但把超巨大的AI模型縮小但仍保持推論精度不變，還是有很多方法可以達到的。接下來我們就來幫大家簡單介紹一下幾種常見技術。

1. AI模型組成元素

回顧一下本專欄三月份文章[1]第1小節提及的神經網路架構，其組成內容主要包括神經元內容（包含數量）、網路結構（神經元連接拓撲）及每個連結的權重值，如Fig. 2所示。簡單的卷積神經網路(CNN)如LeNet-5，就有約6萬個權重，而大型模型VGG16則有約1.38億個權重，到了現在流行的大型語言模型GPT-3已激激增到1750億個權重，更不要說像GPT-4已有超過一兆個權重。
...
...

使用者別	新聞閱讀限制	文章閱讀限制	出版品優惠
一般使用者	10則/每30天	0則/每30天	付費下載
VIP會員	無限制	25則/每30天	付費下載

‧	以STM32生態系統擴充套件加速AI模型部署
‧	工程師工具箱內的秘密武器：AI與模擬的交集
‧	4種經過實證的AI演算法應用
‧	自行調適運算平台帶來高效能AI加速

相關討論

相關新聞

»	鼎新AI數智攜手永豐銀以AiGP賦能數位轉型、碳管理
»	理學與臺科大共同合作推進CT掃描設備的3D影像重建技術
»	TWQR乘車碼正式上線全台行動支付再升級
»	Fortinet OT安全營運平台再升級，強化關鍵基礎設施防護
»	掌握生成式經濟創新技能 SOLIDWORKS SkillForce協助培育未來勞動力

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2025 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.1.HK93V3N2WKUSTACUKR
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw