2025年02月07日 14:58:41
華為AI模型量化相關(guān)專利公布 可減少模型占用內(nèi)存
《科創(chuàng)板日?qǐng)?bào)》7日訊,財(cái)聯(lián)社創(chuàng)投通數(shù)據(jù)顯示,華為技術(shù)有限公司申請(qǐng)的“人工智能模型的量化方法、處理系統(tǒng)和量化單元”專利近日公布。摘要顯示,量化單元可以基于運(yùn)行AI模型的計(jì)算設(shè)備的各個(gè)計(jì)算單元的處理粒度,將量化矩陣分割成多個(gè)適用于各個(gè)計(jì)算單元的處理粒度的分塊量化矩陣。量化單元可以對(duì)分塊量化矩陣進(jìn)行量化處理,以得到量化后的分塊量化矩陣,并存儲(chǔ)在存儲(chǔ)器中,可以減少AI模型占用的內(nèi)存。
我要評(píng)論
反饋意見
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
關(guān)聯(lián)話題
4.69W 人關(guān)注
+ 關(guān)注
4.82W 人關(guān)注
+ 關(guān)注