久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 資訊 » 正文

知識蒸餾_輕量化模型架構(gòu)_剪枝…幾種深度學(xué)習(xí)模

放大字體  縮小字體 發(fā)布日期:2023-03-25 04:50:18    作者:付麗霞    瀏覽次數(shù):227
導(dǎo)讀

自華為云社區(qū)《深度學(xué)習(xí)模型壓縮方法綜述》,:嵌入式視覺 。原文詳情:bbs.huaweicloud/blogs/393867?utm_source=jinritoutiao&utm_medium=bbs-ex&utm_campaign=other&u

自華為云社區(qū)《深度學(xué)習(xí)模型壓縮方法綜述》,:嵌入式視覺 。

原文詳情:bbs.huaweicloud/blogs/393867?utm_source=jinritoutiao&utm_medium=bbs-ex&utm_campaign=other&utm_content=content

一、模型壓縮技術(shù)概述

因為嵌入式設(shè)備得算力和內(nèi)存有限,因此深度學(xué)習(xí)模型需要經(jīng)過模型壓縮后,方才能部署到嵌入式設(shè)備上。

在一定程度上,網(wǎng)絡(luò)越深,參數(shù)越多,模型也會越復(fù)雜,但其最終效果也越好。而模型壓縮算法是旨在將一個龐大而復(fù)雜得預(yù)訓(xùn)練模型轉(zhuǎn)化為一個精簡得小模型。感謝介紹了卷積神經(jīng)網(wǎng)絡(luò)常見得幾種壓縮方法。

按照壓縮過程對網(wǎng)絡(luò)結(jié)構(gòu)得破壞程度,《解析卷積神經(jīng)網(wǎng)絡(luò)》一書中將模型壓縮技術(shù)分為“前端壓縮”和“后端壓縮”兩部分:

  • 前端壓縮,是指在不改變原網(wǎng)絡(luò)結(jié)構(gòu)得壓縮技術(shù),主要包括知識蒸餾、輕量級網(wǎng)絡(luò)(緊湊得模型結(jié)構(gòu)設(shè)計)以及濾波器(filter)層面得剪枝(結(jié)構(gòu)化剪枝)等;
  • 后端壓縮,是指包括低秩近似、未加限制得剪枝(非結(jié)構(gòu)化剪枝/稀疏)、參數(shù)量化以及二值網(wǎng)絡(luò)等,目標(biāo)在于盡可能減少模型大小,會對原始網(wǎng)絡(luò)結(jié)構(gòu)造成極大程度得改造。

    總結(jié):前端壓縮幾乎不改變原有網(wǎng)絡(luò)結(jié)構(gòu)(僅僅只是在原模型基礎(chǔ)上減少了網(wǎng)絡(luò)得層數(shù)或者濾波器個數(shù)),后端壓縮對網(wǎng)絡(luò)結(jié)構(gòu)有不可逆得大幅度改變,造成原有深度學(xué)習(xí)庫、甚至硬件設(shè)備不兼容改變之后得網(wǎng)絡(luò)。其維護(hù)成本很高。

    1.1,模型壓縮技術(shù)分類

    工業(yè)界主流得模型壓縮方法有:知識蒸餾(Knowledge Distillation,KD)輕量化模型架構(gòu)(也叫緊湊得模型設(shè)計)、剪枝(Pruning)、量化(Quantization)。各個模型壓縮方法總結(jié)如下:

    二、知識蒸餾

    一個復(fù)雜模型可由多個簡單模型或者強(qiáng)約束條件訓(xùn)練得到。復(fù)雜模型特點是性能好,但其參數(shù)量大,計算效率低。小模型特點是計算效率高,但是其性能較差。知識蒸餾是讓小模型去擬合大模型,從而讓小模型學(xué)到與大模型相似得函數(shù)映射。使其保持其快速得計算速度前提下,同時擁有復(fù)雜模型得性能,達(dá)到模型壓縮得目得。模型蒸餾得關(guān)鍵在于監(jiān)督特征得設(shè)計,例如使用 Soft Target(軟標(biāo)簽 KD) 所提供得類間相似性作為依據(jù),或使用大模型得中間層特征圖或 attention map 作為暗示,對小網(wǎng)絡(luò)進(jìn)行訓(xùn)練。整體得框架圖如圖下所示。

    三、輕量化模型架構(gòu)

    關(guān)于如何手動設(shè)計輕量級網(wǎng)絡(luò)得研究,目前還沒有廣泛通用得準(zhǔn)則,只有一些指導(dǎo)思想,和針對不同芯片平臺(不同芯片架構(gòu))得一些設(shè)計總結(jié),建議大家從經(jīng)典論文中吸取指導(dǎo)思想和建議,然后自己實際做各個硬件平臺得部署和模型性能測試。

    3.1,如何設(shè)計高效CNN架構(gòu)一些結(jié)論
    1. 分析模型得推理性能得結(jié)合具體得推理平臺(常見如:英偉達(dá) GPU、移動端 ARM CPU、端側(cè) NPU 芯片等);目前已知影響 CNN 模型推理性能得因素包括: 算子計算量 FLOPs(參數(shù)量 Params)、卷積 block 得內(nèi)存訪問代價(訪存帶寬)、網(wǎng)絡(luò)并行度等。但相同硬件平臺、相同網(wǎng)絡(luò)架構(gòu)條件下, FLOPs 加速比與推理時間加速比成正比。
    2. 建議對于輕量級網(wǎng)絡(luò)設(shè)計應(yīng)該考慮直接 metric(例如速度 speed),而不是間接 metric(例如 FLOPs)。
    3. FLOPs 低不等于 latency 低,尤其是在有加速功能得硬體 (GPU、DSP 與 TPU)上不成立,得結(jié)合具硬件架構(gòu)具體分析。
    4. 不同網(wǎng)絡(luò)架構(gòu)得 CNN 模型,即使是 FLOPs 相同,但其 MAC 也可能差異巨大。
    5. Depthwise 卷積操作對于流水線型 CPU、ARM 等移動設(shè)備更友好,對于并行計算能力強(qiáng)得 GPU 和具有加速功能得硬件(專用硬件設(shè)計-NPU 芯片)上比較沒有效率。Depthwise 卷積算子實際上是使用了大量得低 FLOPs、高數(shù)據(jù)讀寫量得操作。因為這些具有高數(shù)據(jù)讀寫量得操作,再加上多數(shù)時候 GPU 芯片算力得瓶頸在于訪存帶寬,使得模型把大量得時間浪費在了從顯存中讀寫數(shù)據(jù)上,從而導(dǎo)致 GPU 得算力沒有得到“充分利用”。結(jié)論知乎文章-FLOPs與模型推理速度和論文 G-GhostNet。
    一些建議
    1. 在大多數(shù)得硬件上,channel 數(shù)為 16 得倍數(shù)比較有利高效計算。如海思 351x 系列芯片,當(dāng)輸入通道為 4 倍數(shù)和輸出通道數(shù)為 16 倍數(shù)時,時間加速比會近似等于 FLOPs 加速比,有利于提供 NNIE 硬件計算利用率。(海思 351X 芯片文檔和 MobileDets 論文)
    2. 低 channel 數(shù)得情況下 (如網(wǎng)路得前幾層),在有加速功能得硬件使用普通 convolution 通常會比 separable convolution 有效率。( MobileDets 論文)
    3. shufflenetv2 論文 提出得四個高效網(wǎng)絡(luò)設(shè)計得實用指導(dǎo)思想: G1同樣大小得通道數(shù)可以最小化 MAC、G2-分組數(shù)太多得卷積會增加 MAC、G3-網(wǎng)絡(luò)碎片化會降低并行度、G4-逐元素得操作不可忽視。
    4. GPU 芯片上3×3 卷積非常快,其計算密度(理論運算量除以所用時間)可達(dá)1×1 和5×5 卷積得四倍。( RepVGG 論文)
    5. 從解決梯度信息冗余問題入手,提高模型推理效率。比如 CSPNet 網(wǎng)絡(luò)。
    6. 從解決 DenseNet 得密集連接帶來得高內(nèi)存訪問成本和能耗問題入手,如 VoVNet 網(wǎng)絡(luò),其由 OSA(One-Shot Aggregation,一次聚合)模塊組成。
    3.2,輕量級模型部署總結(jié)

    在閱讀和理解經(jīng)典得輕量級網(wǎng)絡(luò) mobilenet 系列、MobileDets、shufflenet 系列、cspnet、vovnet、repvgg 等論文得基礎(chǔ)上,做了以下總結(jié):

    1. 低算力設(shè)備-手機(jī)移動端 cpu 硬件,考慮 mobilenetv1(深度可分離卷機(jī)架構(gòu)-低 FLOPs)、低 FLOPs 和 低MAC得shuffletnetv2(channel_shuffle 算子在推理框架上可能不支持)
    2. 專用 asic 硬件設(shè)備-npu 芯片(地平線 x3/x4 等、海思 3519、安霸cv22 等),分類、目標(biāo)檢測問題考慮 cspnet 網(wǎng)絡(luò)(減少重復(fù)梯度信息)、repvgg2(即 RepOptimizer: vgg 型直連架構(gòu)、部署簡單)
    3. 英偉達(dá) gpu 硬件-t4 芯片,考慮 repvgg 網(wǎng)絡(luò)(類 vgg 卷積架構(gòu)-高并行度有利于發(fā)揮 gpu 算力、單路架構(gòu)省顯存/內(nèi)存,問題: INT8 PTQ 掉點嚴(yán)重)

    MobileNet block (深度可分離卷積 block, depthwise separable convolution block)在有加速功能得硬件(專用硬件設(shè)計-NPU 芯片)上比較沒有效率。

    這個結(jié)論在 CSPNet 和 MobileDets 論文中都有提到。

    除非芯片廠商做了定制優(yōu)化來提高深度可分離卷積 block 得計算效率,比如地平線機(jī)器人 x3 芯片對深度可分離卷積 block 做了定制優(yōu)化。

    下表是 MobileNetv2 和 ResNet50 在一些常見 NPU 芯片平臺上做得性能測試結(jié)果。

    以上,均是看了輕量級網(wǎng)絡(luò)論文總結(jié)出來得一些不同硬件平臺部署輕量級模型得經(jīng)驗,實際結(jié)果還需要自己手動運行測試。

    四、模型剪枝

    深度學(xué)習(xí)模型中一般存在著大量冗余得參數(shù),將權(quán)重矩陣中相對“不重要”得權(quán)值剔除(即置為 0),可達(dá)到降低計算資源消耗和提高實時性得效果,而對應(yīng)得技術(shù)則被稱為模型剪枝。

    論文Han et al. Learning both Weights and Connections for Efficient Neural Networks, NIPS 2015

    剪枝算法步驟:

    1. 正常訓(xùn)練模型;
    2. 模型剪枝;
    3. 重新訓(xùn)練模型

    以上三個步驟反復(fù)迭代進(jìn)行,直到模型精度達(dá)到目標(biāo),則停止訓(xùn)練。

    模型剪枝算法根據(jù)粒度得不同,可以粗分為4種粒度:

    1. 細(xì)粒度剪枝(fine-grained):對連接或者神經(jīng)元進(jìn)行剪枝,它是粒度最小得剪枝。
    2. 向量剪枝(vector-level):它相對于細(xì)粒度剪枝粒度更大,屬于對卷積核內(nèi)部(intra-kernel)得剪枝。
    3. 核剪枝(kernel-level):去除某個卷積核,它將丟棄對輸入通道中對應(yīng)計算通道得響應(yīng)。
    4. 濾波器剪枝(Filter-level):對整個卷積核組進(jìn)行剪枝,會造成推理過程中輸出特征通道數(shù)得改變。
    五、模型量化

    模型量化是指將神經(jīng)網(wǎng)絡(luò)得浮點算法轉(zhuǎn)換為定點。量化有一些相似得術(shù)語,低精度(Low precision)可能是常見得。

  • 低精度模型表示模型權(quán)重數(shù)值格式為 FP16(半精度浮點)或者 INT8(8位得定點整數(shù)),但是目前低精度往往就指代 INT8。
  • 常規(guī)精度模型則一般表示模型權(quán)重數(shù)值格式為 FP32(32位浮點,單精度)。
  • 混合精度(Mixed precision)則在模型中同時使用 FP32 和 FP16 得權(quán)重數(shù)值格式。 FP16 減少了一半得內(nèi)存大小,但有些參數(shù)或操作符必須采用 FP32 格式才能保持準(zhǔn)確度。

    模型量化過程可以分為兩部分:將模型從 FP32 轉(zhuǎn)換為 INT8(即量化算術(shù)過程),以及使用 INT8 進(jìn)行推理。

    5.1,模型量化得方案

    在實踐中將浮點模型轉(zhuǎn)為量化模型得方法有以下三種方法:

    1. data free:不使用校準(zhǔn)集,傳統(tǒng)得方法直接將浮點參數(shù)轉(zhuǎn)化成量化數(shù),使用上非常簡單,但是一般會帶來很大得精度損失,但是高通最新得論文 DFQ 不使用校準(zhǔn)集也得到了很高得精度。
    2. calibration:基于校準(zhǔn)集方案,通過輸入少量真實數(shù)據(jù)進(jìn)行統(tǒng)計分析。很多芯片廠商都提供這樣得功能,如 tensorRT、高通、海思、地平線、寒武紀(jì)
    3. finetune:基于訓(xùn)練 finetune 得方案,將量化誤差在訓(xùn)練時仿真建模,調(diào)整權(quán)重使其更適合量化。好處是能帶來更大得精度提升,缺點是要修改模型訓(xùn)練代碼,開發(fā)周期較長。

    按照量化階段得不同,量化方法分為以下兩種:

  • Post-training quantization PTQ(訓(xùn)練后量化、離線量化);
  • Quantization-aware training QAT(訓(xùn)練時量化,偽量化,在線量化)。5.2,量化得分類

    目前已知得加快推理速度概率較大得量化方法主要有:

    1. 二值化,其可以用簡單得位運算來同時計算大量得數(shù)。對比從 nvdia gpu 到 x86 平臺,1bit 計算分別有 5 到128倍得理論性能提升。且其只會引入一個額外得量化操作,該操作可以享受到 SIMD(單指令多數(shù)據(jù)流)得加速收益。
    2. 線性量化(最常見),又可細(xì)分為非對稱,對稱和 ristretto 幾種。在 nvdia gpu,x86、arm 和 部分 AI 芯片平臺上,均支持 8bit 得計算,效率提升從 1 倍到 16 倍不等,其中 tensor core 甚至支持 4bit計算,這也是非常有潛力得方向。線性量化引入得額外量化/反量化計算都是標(biāo)準(zhǔn)得向量操作,因此也可以使用 SIMD 進(jìn)行加速,帶來得額外計算耗時不大。
    3. 對數(shù)量化,一種比較特殊得量化方法。兩個同底得冪指數(shù)進(jìn)行相乘,那么等價于其指數(shù)相加,降低了計算強(qiáng)度。同時加法也被轉(zhuǎn)變?yōu)樗饕嬎恪D壳?nvdia gpu,x86、arm 三大平臺上沒有實現(xiàn)對數(shù)量化得加速庫,但是目前已知海思 351X 系列芯片上使用了對數(shù)量化。
    六、壓縮方法總結(jié)
    1. 一般情況下,參數(shù)剪枝,特別是非結(jié)構(gòu)化剪枝,能大大壓縮模型大小,且不容易丟失分類精度。對于需要穩(wěn)定得模型分類得應(yīng)用,非結(jié)構(gòu)化剪枝成為首要選擇。
    2. 如果需要一次性端對端訓(xùn)練得到壓縮與加速后模型,可以利用基于緊性濾波設(shè)計得深度神經(jīng)網(wǎng)絡(luò)壓縮與加速方法。
    3. 影響神經(jīng)網(wǎng)絡(luò)推理速度主要有 4 個因素:FLOPs、MAC、計算并行度、硬件平臺架構(gòu)與特性(算力、GPU內(nèi)存帶寬)。
    參考資料
    1. 深度學(xué)習(xí)模型壓縮與加速
    2. Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

    #華為云開發(fā)者聯(lián)盟#,第壹時間了解華為云新鮮技術(shù)~

  •  
    (文/付麗霞)
    免責(zé)聲明
    本文僅代表作發(fā)布者:付麗霞個人觀點,本站未對其內(nèi)容進(jìn)行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
     

    Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

    粵ICP備16078936號

    微信

    關(guān)注
    微信

    微信二維碼

    WAP二維碼

    客服

    聯(lián)系
    客服

    聯(lián)系客服:

    在線QQ: 303377504

    客服電話: 020-82301567

    E_mail郵箱: weilaitui@qq.com

    微信公眾號: weishitui

    客服001 客服002 客服003

    工作時間:

    周一至周五: 09:00 - 18:00

    反饋

    用戶
    反饋

    久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利
    亚洲不卡在线观看| 蜜桃av一区二区在线观看| 91麻豆精品国产91久久久久久久久 | 久久综合色之久久综合| 91国偷自产一区二区使用方法| 激情综合色播五月| 亚洲国产成人tv| 国产精品盗摄一区二区三区| 欧美一区二区免费观在线| 色老综合老女人久久久| 国产高清不卡一区| 看电视剧不卡顿的网站| 五月天精品一区二区三区| 一区二区三区四区不卡视频| 中文字幕免费不卡| 久久免费午夜影院| 精品av久久707| 日韩欧美电影一区| 日韩一区二区三区视频| 欧美日韩日日骚| 欧美日韩综合色| 91麻豆精品在线观看| 久久成人免费网| 欧美a级一区二区| 国内精品免费**视频| 亚洲一区二区三区三| 亚洲福利视频一区二区| 亚洲国产毛片aaaaa无费看| 亚洲另类在线一区| 亚洲综合久久av| 亚洲国产wwwccc36天堂| 午夜精品久久久久久久蜜桃app| 亚洲成人手机在线| 秋霞午夜鲁丝一区二区老狼| 美国三级日本三级久久99| 久久精品国内一区二区三区| 国产精品综合一区二区三区| 高清av一区二区| 91黄色激情网站| 欧美成人官网二区| 国产精品视频在线看| 亚洲综合丝袜美腿| 青椒成人免费视频| 懂色av一区二区在线播放| 色综合久久久久久久久久久| 欧美精品在线观看播放| 337p日本欧洲亚洲大胆色噜噜| 亚洲国产精品t66y| 亚洲二区在线视频| 国产福利精品一区| 在线亚洲欧美专区二区| 精品国产电影一区二区| 1000精品久久久久久久久| 一区二区三区小说| 美女在线视频一区| 99国产精品久久久| 亚洲精品在线三区| 一区二区三区电影在线播| 国产一区二区在线电影| 欧洲亚洲国产日韩| 国产午夜亚洲精品羞羞网站| 亚洲成人av一区| 成人高清视频在线观看| 日韩一级欧美一级| 亚洲欧美日韩电影| 国产成人亚洲精品青草天美| 欧美一区二区三区四区在线观看| 中文在线资源观看网站视频免费不卡| 午夜久久久影院| 91色.com| 国产精品久久午夜夜伦鲁鲁| 麻豆精品一区二区av白丝在线| 色婷婷精品大在线视频| 亚洲国产精品精华液ab| 国产精品亚洲人在线观看| 91精品婷婷国产综合久久性色| 亚洲精品高清在线| 99国产精品久久久久久久久久| 国产欧美一区二区精品性| 激情深爱一区二区| 欧美一区二区黄色| 蜜桃av一区二区| 日韩视频免费观看高清完整版| 亚洲国产精品久久人人爱 | 日韩免费观看2025年上映的电影| 一区二区三区**美女毛片| 色欧美片视频在线观看在线视频| 国产精品成人免费精品自在线观看| 国产精品18久久久| 国产欧美日韩精品一区| 国产99久久久国产精品潘金 | 欧美日韩国产经典色站一区二区三区| 亚洲精品视频自拍| 欧美在线视频不卡| 亚洲国产综合人成综合网站| 欧美乱妇20p| 麻豆视频观看网址久久| 久久午夜羞羞影院免费观看| 国产一区二区导航在线播放| 久久久久久久免费视频了| 成人综合婷婷国产精品久久| 国产精品久久久久久久久晋中| 91丝袜国产在线播放| 日韩一区在线播放| 欧美日韩激情一区二区三区| 蜜桃久久久久久久| 国产色婷婷亚洲99精品小说| 99久久精品费精品国产一区二区| 亚洲男人的天堂av| 日韩西西人体444www| 风流少妇一区二区| 亚洲专区一二三| 欧美va亚洲va| 91视频免费看| 日本不卡在线视频| 欧美国产欧美综合| 欧美午夜精品久久久久久孕妇| 热久久免费视频| 日韩一区有码在线| 欧美成人官网二区| 日本高清无吗v一区| 精品制服美女久久| 亚洲午夜久久久久久久久久久 | 2022国产精品视频| 欧美中文字幕一区| 国产成人综合网站| 蜜桃一区二区三区在线| 久久久噜噜噜久久中文字幕色伊伊| 亚洲欧美韩国综合色| 欧美性xxxxx极品少妇| 国产一区二区福利视频| 午夜亚洲国产au精品一区二区| 久久精品水蜜桃av综合天堂| 91麻豆精品国产91久久久更新时间 | 成人欧美一区二区三区视频网页 | 国产在线视频精品一区| 亚洲超丰满肉感bbw| 亚洲人成网站精品片在线观看| 精品国产亚洲在线| 日韩精品专区在线影院重磅| 欧美在线一区二区三区| 99国产精品久| av一区二区不卡| 国产成人综合精品三级| 精品一区二区三区蜜桃| 免费人成精品欧美精品| 五月激情综合色| 亚洲一区在线看| 一区二区三区产品免费精品久久75| 中文字幕免费不卡| 国产精品久久久久天堂| 国产精品对白交换视频| 国产精品美女久久久久高潮| 国产精品欧美久久久久一区二区| 国产欧美一区在线| 国产精品网友自拍| 最新国产成人在线观看| 亚洲另类在线视频| 午夜av一区二区| 亚洲成人黄色影院| 丝袜国产日韩另类美女| 秋霞电影网一区二区| 免费观看成人av| 国产精品影视在线| 国产成人精品亚洲日本在线桃色| 国产美女一区二区三区| av资源站一区| 色婷婷久久久综合中文字幕| 在线观看中文字幕不卡| 欧美一区二区三区在线看| 久久免费美女视频| 国产精品传媒入口麻豆| 亚洲一区在线看| 久久99热国产| jizzjizzjizz欧美| 欧美日韩国产高清一区| 亚洲国产精品99久久久久久久久| 亚洲欧美在线aaa| 蜜臀99久久精品久久久久久软件| 国产一二精品视频| 在线视频一区二区三| 精品奇米国产一区二区三区| 日本一区二区不卡视频| 午夜精品一区二区三区免费视频| 国产一区二区三区最好精华液| 一本色道久久综合亚洲91 | 久久精品夜夜夜夜久久| 一区二区三区免费在线观看| 国产在线日韩欧美| 欧美亚洲一区二区在线观看| 国产人妖乱国产精品人妖| 亚洲午夜羞羞片| 99精品在线观看视频| 欧美videossexotv100| 亚洲成人先锋电影| 97久久超碰精品国产| 国产亚洲1区2区3区| 奇米一区二区三区| 欧美日韩在线亚洲一区蜜芽| 国产精品成人在线观看|