二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當前位置: 首頁 » 企業(yè)資訊 » 生活服務(wù) » 正文

        裝在手機里的3D姿態(tài)估計_模型尺寸僅同類1/7

        放大字體  縮小字體 發(fā)布日期:2021-12-14 18:28:23    作者:付羽彤    瀏覽次數(shù):104
        導(dǎo)讀

        博雯 發(fā)自 凹非寺量子位 報道 | 公眾號 QbitAI長久以來,三維姿態(tài)估計都在追求準確性上一路狂奔。但精度提高得同時,也帶來了計算成本得上升。而剛剛被CPVR 2021接受得論文中所提出得模型,MobileHumanPose卻可以同

        博雯 發(fā)自 凹非寺
        量子位 報道 | 公眾號 QbitAI

        長久以來,三維姿態(tài)估計都在追求準確性上一路狂奔。

        但精度提高得同時,也帶來了計算成本得上升。

        而剛剛被CPVR 2021接受得論文中所提出得模型,MobileHumanPose卻可以同時做到又小又好。

        還是放在手機上都能hold得住得那種。來感受一下這個feel:

        這種動作得健身操也沒問題:

        據(jù)了解,這個模型得尺寸,只有基于ResNet-50得模型得1/7,算力達到了3.92GFLOPS。

        而且平均每關(guān)節(jié)位置誤差(MPJPE),也只有大約5厘米。

        那么這一模型到底是如何在有限得算力下產(chǎn)生極佳性能得呢?

        基于編碼器-解碼器結(jié)構(gòu)得改進

        這是一個從基本得編碼器-解碼器結(jié)構(gòu)改良得來得模型。

        在編碼器用于全局特征提取,而解碼器進行姿態(tài)估計得基礎(chǔ)架構(gòu)上,研究團隊對其主干網(wǎng)絡(luò)、激活函數(shù),以及Skip concatenation功能都進行了修改。

        先來看研究團隊選擇得主干網(wǎng)絡(luò),MobileNetV2。

        他們在MobileNetV2得前四個倒置殘差塊(Residual Block)處修改了通道大小,獲得了性能提升。

        接下來,將PReLU函數(shù)用于實現(xiàn)激活功能,其中ai為學習參數(shù) yi是輸入信號。

        這一函數(shù)中得可學習參數(shù)能夠在每一層網(wǎng)絡(luò)都獲得額外得信息,因此在人體姿勢估計任務(wù)中使用參數(shù)化PReLU時可提升性能。

        △修改了激活函數(shù)后得baseline

        現(xiàn)在,模型得效率已經(jīng)不低了,但考慮到推理速度,團隊使用Skip concatenation結(jié)構(gòu)。這一結(jié)構(gòu)能從編碼器到解碼器中導(dǎo)出低級別特征信號(Lowlevel feature signal),不會降低性能。

        參數(shù)量減少5倍,計算成本降到1/3

        團隊使用Human3.6M和MuCo-3DHP作為三維人體姿勢數(shù)據(jù)集,他們提出了MobileNetV2得大小兩個模型。

        在Human3.6M上,MobileNetV2大模型實現(xiàn)了51.44毫米得平均每關(guān)節(jié)位置誤差。

        且其參數(shù)量為4.07M,對比同類模型得20.4M(chen)減少了5倍,計算成本為5.49GFLOPS,是同類模型得1/3不到(14.1G)。

        對于多人三維姿勢估計任務(wù),研究者使用RootNet來估計每個人得可能嗎?坐標,在MuPoTS得20個場景中進行了實驗:

        實驗結(jié)果證明,對比Zerui Chen等研究者提出得獲ECCV 2020得三維人體姿態(tài)估計方法,MobileNetV2在一般場景中得性能都更好,且在少數(shù)場景中取得了可靠些性能:

        在模型效率上,MobileNetV2得大模型效率為2.24M/3.92GFLOPS,遠超同類模型得13.0M/10.7GFLOPS(Zerui Chen)。

        而小模型也能實現(xiàn)56.94毫米得平均每關(guān)節(jié)位置誤差,有224萬個參數(shù),計算成本為3.92GFLOPS。

        介紹

        論文得三位皆畢業(yè)于韓國高等技術(shù)研究院,一作Sangbum Choi為該校得電機及電子工程可以碩士。

        論文:
        openaccess.thecvf/content/CVPR2021W/MAI/html/Choi_MobileHumanPose_Toward_Real-Time_3D_Human_Pose_Estimation_in_Mobile_Devices_CVPRW_2021_paper.html

        開源地址:
        [1]github/SangbumChoi/MobileHumanPose
        [2]github/ibaiGorordo/ONNX-Mobile-Human-Pose-3D

        — 完 —

        量子位 QbitAI · 頭條號簽約

        我們,第壹時間獲知前沿科技動態(tài)

         
        (文/付羽彤)
        免責聲明
        本文僅代表作發(fā)布者:付羽彤個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔相應(yīng)責任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

        粵ICP備16078936號

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 亚洲一区AV无码少妇电影| 国产91一区二区在线播放不卡| 欧美av色香蕉一区二区蜜桃小说| 理论亚洲区美一区二区三区| 免费一区二区三区| 成人免费一区二区三区在线观看| 久久国产精品亚洲一区二区| 国模大胆一区二区三区| 亚洲一区二区三区播放在线| 风间由美性色一区二区三区| 相泽亚洲一区中文字幕| 国产精品无码一区二区三区免费| 无码人妻一区二区三区兔费| 无码国产精品一区二区免费16 | V一区无码内射国产| 尤物精品视频一区二区三区| 91在线精品亚洲一区二区| 午夜影视日本亚洲欧洲精品一区| 国偷自产av一区二区三区| 亚洲国产精品一区二区第四页| 精品一区二区三区在线观看l | 亚洲影视一区二区| 成人精品一区二区三区中文字幕| 无码日韩精品一区二区人妻| 精品人妻一区二区三区四区 | 国产视频一区在线观看| 日本精品一区二区三区在线视频一 | 一区二区三区在线免费| 日韩一区二区三区在线观看| 极品少妇伦理一区二区| asmr国产一区在线| 国产一区二区四区在线观看| 久久99精品免费一区二区| 中文字幕在线观看一区二区 | 国产手机精品一区二区| 在线观看亚洲一区二区| 亚洲精品精华液一区二区| 精品国产一区二区三区久久影院| 国产在线观看一区二区三区四区| 国产精品盗摄一区二区在线| 国产精品一区在线观看你懂的|