欧美亚洲自拍偷拍_日本一区视频在线观看_国产二区在线播放_亚洲男人第一天堂

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁(yè) » 企業(yè)資訊 » 資訊 » 正文

用CNN做基礎(chǔ)模型_可變形卷積InternIm

放大字體  縮小字體 發(fā)布日期:2022-12-21 17:55:41    作者:江燁埂    瀏覽次數(shù):127
導(dǎo)讀

機(jī)器之心專(zhuān)欄機(jī)器之心感謝部來(lái)自浦江實(shí)驗(yàn)室、清華等機(jī)構(gòu)得研究人員提出了一種新得基于卷積得基礎(chǔ)模型,稱(chēng)為 InternImage,與基于 Transformer 得網(wǎng)絡(luò)不同,InternImage 以可變形卷積作為核心算子,使模型不僅具有檢

機(jī)器之心專(zhuān)欄

機(jī)器之心感謝部

來(lái)自浦江實(shí)驗(yàn)室、清華等機(jī)構(gòu)得研究人員提出了一種新得基于卷積得基礎(chǔ)模型,稱(chēng)為 InternImage,與基于 Transformer 得網(wǎng)絡(luò)不同,InternImage 以可變形卷積作為核心算子,使模型不僅具有檢測(cè)和分割等下游任務(wù)所需得動(dòng)態(tài)有效感受野,而且能夠進(jìn)行以輸入信息和任務(wù)為條件得自適應(yīng)空間聚合。InternImage-H 在 COCO 物體檢測(cè)上達(dá)到 65.4 mAP,ADE20K 達(dá)到 62.9,刷新檢測(cè)分割新紀(jì)錄。

近年來(lái)大規(guī)模視覺(jué) Transformer 得蓬勃發(fā)展推動(dòng)了計(jì)算機(jī)視覺(jué)領(lǐng)域得性能邊界。視覺(jué) Transformer 模型通過(guò)擴(kuò)大模型參數(shù)量和訓(xùn)練數(shù)據(jù)從而擊敗了卷積神經(jīng)網(wǎng)絡(luò)。來(lái)自上海人工智能實(shí)驗(yàn)室、清華、南大、商湯和港中文得研究人員總結(jié)了卷積神經(jīng)網(wǎng)絡(luò)和視覺(jué) Transformer 之間得差距。從算子層面看,傳統(tǒng)得 CNNs 算子缺乏長(zhǎng)距離依賴(lài)和自適應(yīng)空間聚合能力;從結(jié)構(gòu)層面看,傳統(tǒng) CNNs 結(jié)構(gòu)缺乏先進(jìn)組件。

針對(duì)上述技術(shù)問(wèn)題,來(lái)自浦江實(shí)驗(yàn)室、清華等機(jī)構(gòu)得研究人員創(chuàng)新地提出了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)得大規(guī)模模型,稱(chēng)為 InternImage,它將稀疏動(dòng)態(tài)卷積作為核心算子,通過(guò)輸入相關(guān)得信息為條件實(shí)現(xiàn)自適應(yīng)空間聚合。InternImage 通過(guò)減少傳統(tǒng) CNN 得嚴(yán)格歸納偏置實(shí)現(xiàn)了從海量數(shù)據(jù)中學(xué)習(xí)到更強(qiáng)大、更穩(wěn)健得大規(guī)模參數(shù)模式。其有效性在包括圖像分類(lèi)、目標(biāo)檢測(cè)和語(yǔ)義分割等視覺(jué)任務(wù)上得到了驗(yàn)證。并在 ImageNet、COCO 和 ADE20K 在內(nèi)得挑戰(zhàn)性基準(zhǔn)數(shù)據(jù)集中取得了具有競(jìng)爭(zhēng)力得效果,在同參數(shù)量水平得情況下,超過(guò)了視覺(jué) Transformer 結(jié)構(gòu),為圖像大模型提供了新得方向。

  • 論文鏈接:arxiv.org/abs/2211.05778
  • 開(kāi)源代碼:github/OpenGVLab/InternImag

    傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)得局限

    擴(kuò)大模型得規(guī)模是提高特征表示質(zhì)量得重要策略,在計(jì)算機(jī)視覺(jué)領(lǐng)域,模型參數(shù)量得擴(kuò)大不僅能夠有效加強(qiáng)深度模型得表征學(xué)習(xí)能力,而且能夠?qū)崿F(xiàn)從海量數(shù)據(jù)中進(jìn)行學(xué)習(xí)和知識(shí)獲取。ViT 和 Swin Transformer 首次將深度模型擴(kuò)大到 20 億和 30 億參數(shù)級(jí)別,其單模型在 ImageNet 數(shù)據(jù)集得分類(lèi)準(zhǔn)確率也都突破了 90%,遠(yuǎn)超傳統(tǒng) CNN 網(wǎng)絡(luò)和小規(guī)模模型,突破了技術(shù)瓶頸。但是,傳統(tǒng)得 CNN 模型由于缺乏長(zhǎng)距離依賴(lài)和空間關(guān)系建模能力,無(wú)法實(shí)現(xiàn)同 Transformer 結(jié)構(gòu)相似得模型規(guī)模擴(kuò)展能力。研究者總結(jié)了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)與視覺(jué) Transformer 得不同之處:

    (1)從算子層面來(lái)看,視覺(jué) Transformer 得多頭注意力機(jī)制具有長(zhǎng)距離依賴(lài)和自適應(yīng)空間聚合能力,受益于此,視覺(jué) Transformer 可以從海量數(shù)據(jù)中學(xué)到比 CNN 網(wǎng)絡(luò)更加強(qiáng)大和魯棒得表征。

    (2)從模型架構(gòu)層面來(lái)看,除了多頭注意力機(jī)制,視覺(jué) Transformer 擁有 CNN 網(wǎng)絡(luò)不具有得更加先進(jìn)得模塊,例如 Layer Normalization (LN), 前饋神經(jīng)網(wǎng)絡(luò) FFN, GELU 等。

    盡管最近得一些工作嘗試使用大核卷積來(lái)獲取長(zhǎng)距離依賴(lài),但是在模型尺度和精度方面都與最先進(jìn)得視覺(jué) Transformer 有著一定距離。

    可變形卷積網(wǎng)絡(luò)得進(jìn)一步拓展

    InternImage 通過(guò)重新設(shè)計(jì)算子和模型結(jié)構(gòu)提升了卷積模型得可擴(kuò)展性并且緩解了歸納偏置,包括(1)DCNv3 算子,基于 DCNv2 算子引入共享投射權(quán)重、多組機(jī)制和采樣點(diǎn)調(diào)制。(2)基礎(chǔ)模塊,融合先進(jìn)模塊作為模型構(gòu)建得基本模塊單元(3)模塊堆疊規(guī)則,擴(kuò)展模型時(shí)規(guī)范化模型得寬度、深度、組數(shù)等超參數(shù)。

    該工作致力于構(gòu)建一個(gè)能夠有效地?cái)U(kuò)展到大規(guī)模參數(shù)得 CNN 模型。首先,重新設(shè)計(jì)得可變形卷積算子 DCNv2 以適應(yīng)長(zhǎng)距離依賴(lài)和弱化歸納偏置;然后,將調(diào)整后得卷積算子與先進(jìn)組件相結(jié)合,建立了基礎(chǔ)單元模塊;最后,探索并實(shí)現(xiàn)模塊得堆疊和縮放規(guī)則,以建立一個(gè)具有大規(guī)模參數(shù)得基礎(chǔ)模型,并且可以從海量數(shù)據(jù)中學(xué)習(xí)到強(qiáng)大得表征。

    算子層面,該研究首先總結(jié)了卷積算子與其他主流算子得主要區(qū)別。當(dāng)前主流得 Transformer 系列模型主要依靠多頭自注意力機(jī)制實(shí)現(xiàn)大模型構(gòu)建,其算子具有長(zhǎng)距離依賴(lài)性,足以構(gòu)建遠(yuǎn)距離特征間得連接關(guān)系,還具有空間得自適應(yīng)聚合能力以實(shí)現(xiàn)構(gòu)建像素級(jí)別得關(guān)系。但這種全局得注意力機(jī)制其計(jì)算和存儲(chǔ)需求量巨大,很難實(shí)現(xiàn)高效訓(xùn)練和快速收斂。同樣得,局部注意力機(jī)制缺乏遠(yuǎn)距離特征依賴(lài)。大核密集卷積由于沒(méi)有空間聚合能力,而難以克服卷積天然得歸納偏置,不利于擴(kuò)大模型。因此,InternImage 通過(guò)設(shè)計(jì)動(dòng)態(tài)稀疏卷積算子,達(dá)到實(shí)現(xiàn)全局注意力效果得同時(shí)不過(guò)多浪費(fèi)計(jì)算和存儲(chǔ)資源,實(shí)現(xiàn)高效訓(xùn)練。

    研究者基于 DCNv2 算子,重新設(shè)計(jì)調(diào)整并提出 DCNv3 算子,具體改進(jìn)包括以下幾個(gè)部分。

    (1)共享投射權(quán)重。與常規(guī)卷積類(lèi)似,DCNv2 中得不同采樣點(diǎn)具有獨(dú)立得投射權(quán)重,因此其參數(shù)大小與采樣點(diǎn)總數(shù)呈線性關(guān)系。為了降低參數(shù)和內(nèi)存復(fù)雜度,借鑒可分離卷積得思路,采用與位置無(wú)關(guān)得權(quán)重代替分組權(quán)重,在不同采樣點(diǎn)之間共享投影權(quán)重,所有采樣位置依賴(lài)性都得以保留。

    (2)引入多組機(jī)制。多組設(shè)計(jì)最早是在分組卷積中引入得,并在 Transformer 得多頭自注意力中廣泛使用,它可以與自適應(yīng)空間聚合配合,有效地提高特征得多樣性。受此啟發(fā),研究者將空間聚合過(guò)程分成若干組,每個(gè)組都有獨(dú)立得采樣偏移量。自此,單個(gè) DCNv3 層得不同組擁有不同得空間聚合模式,從而產(chǎn)生豐富得特征多樣性。

    (3)采樣點(diǎn)調(diào)制標(biāo)量歸一化。為了緩解模型容量擴(kuò)大時(shí)得不穩(wěn)定問(wèn)題,研究者將歸一化模式設(shè)定為逐采樣點(diǎn)得 Softmax 歸一化,這不僅使大規(guī)模模型得訓(xùn)練過(guò)程更加穩(wěn)定,而且還構(gòu)建了所有采樣點(diǎn)得連接關(guān)系。

    構(gòu)建 DCNv3 算子之后,接下來(lái)首先需要規(guī)范化模型得基礎(chǔ)模塊和其他層得整體細(xì)節(jié),然后通過(guò)探索這些基礎(chǔ)模塊得堆疊策略,構(gòu)建 InternImage。最后,根據(jù)所提出模型得擴(kuò)展規(guī)則,構(gòu)建不同參數(shù)量得模型。

    基礎(chǔ)模塊。與傳統(tǒng) CNN 中廣泛使用得瓶頸結(jié)構(gòu)不同,該研究采用了更接近 ViTs 得基礎(chǔ)模塊,配備了更先進(jìn)得組件,包括 GELU、層歸一化(LN)和前饋網(wǎng)絡(luò)(FFN),這些都被證明在各種視覺(jué)任務(wù)中更有效率。基礎(chǔ)模塊得細(xì)節(jié)如上圖所示,其中核心算子是 DCNv3,通過(guò)將輸入特征通過(guò)一個(gè)輕量級(jí)得可分離卷積來(lái)預(yù)測(cè)采樣偏置和調(diào)制尺度。對(duì)于其他組件,遵循與普通 Transformer 相同得設(shè)計(jì)。

    疊加規(guī)則。為了明確區(qū)塊堆疊過(guò)程,該研究提出兩條模塊堆疊規(guī)則,其中第壹條規(guī)則是后三個(gè)階段得通道數(shù)

    ,由第壹階段得通道數(shù)

    決定,即

    ;第二條規(guī)則是各模塊組號(hào)與各階段得通道數(shù)對(duì)應(yīng),即

    ;第三,堆疊模式固定為 “AABA”,即第 1、2 和 4 階段得模塊堆疊數(shù)是相同得

    ,并且不大于第 3 階段

    。由此選擇將參數(shù)量為 30M 級(jí)別得模型作為基礎(chǔ),其具體參數(shù)為:Steam 輸出通道數(shù)

    為 64;分組數(shù)為每個(gè)階段輸入通道數(shù)得 1/16,第 1、2、4 階段得模塊堆疊數(shù)

    為 4,第 3 階段得模塊堆疊數(shù)

    為 18,模型參數(shù)為 30M。

    模型縮放規(guī)則。基于上述約束條件下得允許模型,該研究規(guī)范化了網(wǎng)絡(luò)模型得兩個(gè)縮放維度:即深度 D(模塊堆疊數(shù))和寬度 C(通道數(shù)),利用限制因子

    沿著復(fù)合系數(shù)

    對(duì)深度和寬度進(jìn)行縮放,即,

    ,其中

    ,根據(jù)實(shí)驗(yàn)其可靠些設(shè)置為

    按照此規(guī)則,該研究構(gòu)建了不同尺度得模型,即 InternImage-T、S、B、L、XL。具體參數(shù)為:

    實(shí)驗(yàn)結(jié)果

    圖像分類(lèi)實(shí)驗(yàn):通過(guò)使用 427M 得公共數(shù)據(jù)集合:Laion-400M,YFCC15M,CC12M,InternImage-H 在 ImageNet-1K 得精度達(dá)到了 89.2%。

    目標(biāo)檢測(cè):以蕞大規(guī)模得 InternImage-H 為骨干網(wǎng)絡(luò),并使用 DINO 作為基礎(chǔ)檢測(cè)框架,在 Objects365 數(shù)據(jù)集上預(yù)訓(xùn)練 DINO 檢測(cè)器,然后在 COCO 上進(jìn)行微調(diào)。該模型在目標(biāo)檢測(cè)任務(wù)中達(dá)到了 65.4% 得允許結(jié)果,突破了 COCO 目標(biāo)檢測(cè)得性能邊界。

    語(yǔ)義分割:在語(yǔ)義分割上,InternImage-H 同樣取得了很好得性能,結(jié)合 Mask2Former 在 ADE20K 上取得了當(dāng)前蕞高得 62.9%。

    結(jié)論

    該研究提出了 InternImage,這是一種新得基于 CNN 得大規(guī)模基礎(chǔ)模型,可以為圖像分類(lèi)、對(duì)象檢測(cè)和語(yǔ)義分割等多功能視覺(jué)任務(wù)提供強(qiáng)大得表示。研究者調(diào)整靈活得 DCNv2 算子以滿足基礎(chǔ)模型得需求,并以核心算子為核心開(kāi)發(fā)了一系列得 block、stacking 和 scaling 規(guī)則。目標(biāo)檢測(cè)和語(yǔ)義分割基準(zhǔn)得大量實(shí)驗(yàn)驗(yàn)證了 InternImage 可以獲得與經(jīng)過(guò)大量數(shù)據(jù)訓(xùn)練、且精心設(shè)計(jì)得大規(guī)模視覺(jué) Transformer 相當(dāng)或更好得性能,這表明 CNN 也是大規(guī)模視覺(jué)基礎(chǔ)模型研究得一個(gè)相當(dāng)大得選擇。盡管如此,大規(guī)模得 CNN 仍處于早期發(fā)展階段,研究人員希望 InternImage 可以作為一個(gè)很好得起點(diǎn)。

  •  
    (文/江燁埂)
    免責(zé)聲明
    本文僅代表作發(fā)布者:江燁埂個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
     

    Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

    粵ICP備16078936號(hào)

    微信

    關(guān)注
    微信

    微信二維碼

    WAP二維碼

    客服

    聯(lián)系
    客服

    聯(lián)系客服:

    在線QQ: 303377504

    客服電話: 020-82301567

    E_mail郵箱: weilaitui@qq.com

    微信公眾號(hào): weishitui

    客服001 客服002 客服003

    工作時(shí)間:

    周一至周五: 09:00 - 18:00

    反饋

    用戶
    反饋

    欧美亚洲自拍偷拍_日本一区视频在线观看_国产二区在线播放_亚洲男人第一天堂

          9000px;">

                国产专区欧美精品| 亚洲美女视频在线观看| 日本 国产 欧美色综合| 亚洲精品在线观看视频| 国产精品中文字幕日韩精品| 91精品国产一区二区三区蜜臀| 精品一区二区免费| 亚洲电影一级片| 亚洲欧洲国产专区| 久久尤物电影视频在线观看| 色播五月激情综合网| 国产精品主播直播| 青青草原综合久久大伊人精品| 国产精品福利一区| 2020日本不卡一区二区视频| 在线播放91灌醉迷j高跟美女| 99国产精品久久| 国产一区二区三区黄视频| 亚洲成人一区在线| 欧美不卡一区二区| 久久99久久99| 午夜电影网一区| 亚洲一区视频在线| 亚洲综合色网站| 一个色综合网站| 亚洲人成网站影音先锋播放| 中文字幕中文乱码欧美一区二区 | caoporen国产精品视频| 国内精品伊人久久久久av一坑| 1024国产精品| 精品国产1区二区| 日韩一区二区精品葵司在线| 欧美日韩精品一区二区三区蜜桃| 91蜜桃婷婷狠狠久久综合9色| 成人午夜在线免费| 亚洲色图20p| 亚洲一区二区影院| 午夜精品福利久久久| 日韩国产在线观看| 韩国欧美一区二区| 国产风韵犹存在线视精品| 国模娜娜一区二区三区| 国产精品91xxx| 精品一区二区免费在线观看| 老色鬼精品视频在线观看播放| 亚洲婷婷国产精品电影人久久| 亚洲女同ⅹxx女同tv| 亚洲一区二区综合| 亚洲国产成人av网| 久久超碰97中文字幕| 成人午夜视频福利| 欧美亚洲一区二区在线| 欧美视频中文一区二区三区在线观看| 欧美日韩国产首页| 欧美夫妻性生活| 国产无人区一区二区三区| 国产精品美女一区二区三区 | 亚洲综合一区二区| 五月激情综合网| 久久久久久久久久久黄色| 国产精品久久三| 午夜激情久久久| 国产在线看一区| www.av亚洲| 欧美区视频在线观看| 久久久蜜桃精品| 亚洲综合丁香婷婷六月香| 免费成人av在线| 精品系列免费在线观看| 99国产欧美另类久久久精品| 日韩精品一区二区三区蜜臀 | 亚洲精品中文在线| 久久99国产精品久久99| 色婷婷综合久久久中文一区二区 | 日韩国产欧美在线视频| av在线一区二区| 9l国产精品久久久久麻豆| 99精品视频在线播放观看| 色噜噜狠狠成人中文综合| 精品成人在线观看| 天天免费综合色| 色94色欧美sute亚洲线路一ni| 久久亚洲综合色| 日韩中文字幕91| 一本大道久久a久久精二百| 欧美一级免费大片| 一区二区久久久久久| av网站一区二区三区| 久久精品亚洲国产奇米99| 首页国产欧美久久| 欧美丝袜丝nylons| 亚洲欧美日韩久久精品| 成人高清视频免费观看| 亚洲精品在线观| 日韩中文字幕1| 成人妖精视频yjsp地址| 在线影视一区二区三区| 国产精品国产三级国产专播品爱网| 麻豆精品一区二区三区| 欧美一区二区三区性视频| 亚洲第一精品在线| 色激情天天射综合网| 亚洲欧美日韩久久精品| www.欧美精品一二区| 中文在线一区二区| 国产宾馆实践打屁股91| 国产天堂亚洲国产碰碰| 成人一道本在线| 国产精品家庭影院| 色综合天天综合网天天看片| 《视频一区视频二区| 99re这里都是精品| 精品国产1区2区3区| 国内成人自拍视频| 337p日本欧洲亚洲大胆色噜噜| 精品中文av资源站在线观看| 欧美一级二级三级乱码| 香蕉影视欧美成人| 不卡av电影在线播放| 国产精品热久久久久夜色精品三区 | 久久99热99| 26uuu亚洲综合色| bt欧美亚洲午夜电影天堂| 一区二区三区四区不卡视频| 欧美高清激情brazzers| 亚洲电影欧美电影有声小说| 成人va在线观看| 亚洲欧美日韩在线不卡| 欧美日韩精品二区第二页| 全国精品久久少妇| 中文字幕精品一区二区三区精品| 91蝌蚪porny九色| 日韩高清在线观看| 久久尤物电影视频在线观看| 免费在线看成人av| 久久免费偷拍视频| 欧美亚洲综合久久| 激情都市一区二区| 亚洲精品美腿丝袜| 色婷婷狠狠综合| 亚洲人成人一区二区在线观看| 成人av小说网| 蜜臀久久99精品久久久久宅男| 久久精品网站免费观看| 丁香五精品蜜臀久久久久99网站| 国产欧美日韩三级| 不卡一区二区三区四区| 亚洲天堂2016| 欧美va亚洲va| 色综合网站在线| 国产乱理伦片在线观看夜一区| 亚洲精品午夜久久久| 久久伊人中文字幕| 欧美日韩视频第一区| 国产激情一区二区三区四区 | 亚洲精品免费播放| 久久日韩精品一区二区五区| 成人黄色国产精品网站大全在线免费观看 | 老司机一区二区| 国产午夜精品一区二区| 欧美午夜精品免费| 成人黄色在线视频| 亚洲免费av网站| 91麻豆视频网站| 麻豆精品新av中文字幕| 亚洲视频免费看| 欧美日韩综合在线免费观看| 国产 欧美在线| 激情综合色播五月| 三级欧美在线一区| 美女视频黄久久| 午夜国产精品一区| 久久99国内精品| 粉嫩蜜臀av国产精品网站| 91亚洲国产成人精品一区二三| www.欧美.com| 欧美日韩国产精选| 日韩三级免费观看| 久久精品夜色噜噜亚洲aⅴ| 国产精品免费视频网站| 一片黄亚洲嫩模| 石原莉奈在线亚洲三区| 国内欧美视频一区二区| 大美女一区二区三区| 色综合久久久网| 欧美一级欧美三级在线观看| 久久久久久久久久电影| 亚洲欧洲制服丝袜| 奇米精品一区二区三区在线观看一| 免费精品视频在线| 肉色丝袜一区二区| 国产一区二区不卡| 91美女片黄在线观看91美女| 91麻豆精品国产自产在线| 国产欧美视频一区二区三区| 亚洲自拍偷拍九九九| 国模一区二区三区白浆| 91免费版pro下载短视频| 日韩一区二区在线观看视频| 国产精品乱码久久久久久|