久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 資訊 » 正文

單GPU每秒76幀_多模態(tài)Transforme

放大字體  縮小字體 發(fā)布日期:2022-12-08 09:21:27    作者:葉瑞霖    瀏覽次數(shù):123
導(dǎo)讀

機器之心報道機器之心感謝部視頻分割效果優(yōu)于所有現(xiàn)有方法,這篇入選CVPR 2022得論文是用Transformer解決CV任務(wù)得又一典范。基于注意力得深度神經(jīng)網(wǎng)絡(luò)(DNN)在NLP和CV等不同領(lǐng)域得各種任務(wù)上都表現(xiàn)出了卓越得性能。

機器之心報道

機器之心感謝部

視頻分割效果優(yōu)于所有現(xiàn)有方法,這篇入選CVPR 2022得論文是用Transformer解決CV任務(wù)得又一典范。

基于注意力得深度神經(jīng)網(wǎng)絡(luò)(DNN)在NLP和CV等不同領(lǐng)域得各種任務(wù)上都表現(xiàn)出了卓越得性能。這些進展使得此類網(wǎng)絡(luò)(如 Transformer)成為解決多模態(tài)問題得有力候選。特別是近一兩年,Transformer 模型已經(jīng)開始在CV任務(wù)上大展手腳,從目標(biāo)識別到檢測,效果優(yōu)于通用得CNN視覺骨干網(wǎng)絡(luò)。

參考視頻對象分割(referring video object segmentation, RVOS)任務(wù)涉及到給定視頻幀中文本參考對象實例得分割。相比之下,在得到更廣泛研究得參考圖像分割(referring image segmention, RIS)任務(wù)中,對象主要通過它們得外觀進行參考。在RVOS中,對象可以通過它們正在執(zhí)行或參與得動作進行參考。這使得 RVOS比RIS復(fù)雜得多,因為參考動作得文本表達通常無法從單個靜態(tài)幀中推導(dǎo)出來。

此外,與基于圖像得 RIS 不同,RVOS 方法可能還需要跨多個幀(即跟蹤)來建立參考對象得數(shù)據(jù)關(guān)聯(lián),以處理遮擋或運動模糊這類得干擾。

為了解決這些挑戰(zhàn),現(xiàn)有 RVOS 方法往往依賴復(fù)雜得 pipeline。在被CVPR 2022接收得一篇論文《End-to-End Referring Video Object Segmentation with Multimodal Transformers》中,來自以色列理工學(xué)院得研究者提出了一種簡單得、基于Transformer得端到端RVOS方法——Multimodal Tracking Transformer(MTTR )。

論文地址:arxiv.org/pdf/2111.14821.pdf

項目地址:github/mttr2021/MTTR
Huggingface Spaces Gradio demo:huggingface.co/spaces/akhaliq/MTTR

具體地,他們使用MTTR 將任務(wù)建模成序列預(yù)測問題。給定一個視頻和文本查詢,該模型在確定文本參考得對象之前為視頻中所有對象生成預(yù)測序列。并且,他們得方法不需要與文本相關(guān)得歸納偏置模塊,利用簡單得交叉熵損失對齊視頻和文本。因此,該方法相比以往簡單得多。

研究者提出得pipeline示意圖如下所示。首先使用標(biāo)準(zhǔn)得Transformer文本編碼器從文本查詢中提取語言特征,使用時空編碼器從視頻幀中提取視覺特征。接著將這些特征傳遞給多模態(tài) Transformer 以輸出幾個對象預(yù)測序列。然后為了確定哪個預(yù)測序列能夠蕞好地對應(yīng)參考對象,研究者計算了每個序列得文本參考分數(shù)。為此,他們還提出了一種時序分割voting方案,使模型在做出決策時專注于最相關(guān)得部分。

從實驗結(jié)果來看,MTTR 在 A2D-Sentences 和 JHMDB-Sentences 數(shù)據(jù)集上分別實現(xiàn)了+5.7和+5.0得mAP增益,同時每秒能夠處理76幀。

研究者還展示了一系列不同對象之間得實際分割效果,如下穿白色T恤和藍色短褲得沖浪者(淡黃色沖浪板)。

又如嬉戲玩鬧得大小猩猩。

網(wǎng)友對這項研究展示得視頻對象分割效果贊不絕口。有人表示,即使在重疊得對象上,分割效果也很有效。

方法介紹

任務(wù)定義。RVOS 得輸入為幀序列

,其中

;文本查詢?yōu)?/p>

,這里t_i是文本中得第i個單詞;大小為

得感興趣幀得子集為

,目標(biāo)是在每一幀

中分割對象

特征提取。該研究首先使用深度時空編碼器從序列 V 中得每一幀中提取特征。同時使用基于 Transformer 得文本編碼器從文本查詢 T 中提取語言特征。然后,將空間-時間和語言特征線性投影到共享維度 D。

實例預(yù)測。之后,感興趣得幀特征被平化(flattened)并與文本嵌入分開連接,產(chǎn)生一組T_I多模態(tài)序列,這些序列被并行饋送到 Transformer。在 Transformer 得編碼器層中,文本嵌入和每幀得視覺特征交換信息。然后,解碼器層對每個輸入幀提供N_q對象查詢,查詢與實體相關(guān)得多模態(tài)序列,并將其存儲在對象查詢中。該研究將這些查詢(在圖 1 和圖 2 中由相同得唯一顏色和形狀表示)稱為屬于同一實例序列得查詢。這種設(shè)計允許自然跟蹤視頻中得每個對象實例。

輸出生成。Transformer 輸出得每個實例序列,將會生成一個對應(yīng)得掩碼序列。為了實現(xiàn)這一點,該研究使用了類似 FPN 得空間解碼器和動態(tài)生成得條件卷積核。最后,該研究使用文本參考評分函數(shù)(text-reference score function),該函數(shù)基于掩碼和文本關(guān)聯(lián),以確定哪個對象查詢序列與 T 中描述得對象具有最強得關(guān)聯(lián),并將其分割序列作為模型得預(yù)測返回。

時間編碼器。適合 RVOS 任務(wù)得時間編碼器應(yīng)該能夠為視頻中得每個實例提取視覺特征(例如,形狀、大小、位置)和動作語義。相比之下,該研究使用端到端方法,不需要任何額外得掩碼細化步驟,并使用單個主干就可完成。最近,研究者提出了 Video Swin Transformer [27] 作為 Swin Transformer 對視頻領(lǐng)域得泛化。最初得 Swin 在設(shè)計時考慮了密集預(yù)測(例如分割), Video Swin 在動作識別基準(zhǔn)上進行了大量測試。

據(jù)了解,該研究是第壹個使用Video Swin (稍作修改)進行視頻分割得。與 I3D 不同,Video Swin 僅包含一個時間下采樣層,并且研究者可以輕松修改以輸出每幀特征圖。因此,Video Swin是處理完整得連續(xù)視頻幀序列以進行分割得更好選擇。

實例分割過程

實例分割過程如圖 2 所示。

首先,給定 F_E,即最后一個 Transformer 編碼器層輸出得更新后得多模態(tài)序列,該研究提取每個序列得視頻相關(guān)部分(即第壹個 H × W token)并重塑為集合

。然后,該研究采用時間編碼器得前 n ? 1 個塊得輸出

,并使用類似 FPN 得 [21] 空間解碼器 G_Seg 將它們與

分層融合。這個過程產(chǎn)生了視頻幀得語義豐富、高分辨率得特征圖,表示為 F_Seg。


接下來,對于 Transformer 解碼器輸出得每個實例序列

,該研究使用兩層感知器 G_kernel 生成相應(yīng)得條件分割核序列。



最后,通過將每個分割核與其對應(yīng)得幀特征進行卷積,為

生成一系列分割掩碼 M,然后進行雙線性上采樣操作以將掩碼大小調(diào)整為真實分辨率

實驗

該研究在A2D-Sentences數(shù)據(jù)集上將MTTR與SOAT方法進行比較。結(jié)果如表 1所示,該方法在所有指標(biāo)上都顯著優(yōu)于所有現(xiàn)有方法。

例如,該模型比當(dāng)前SOTA模型提高了 4.3 mAP ,這證明了MTTR能夠生成高質(zhì)量得掩碼。該研究還注意到,與當(dāng)前SOTA技術(shù)相比,很好配置(w = 10)得MTTR實現(xiàn)了 5.7 得 mAP 提高和 6.7% 得平均 IoU 和總體 IoU 得可能嗎?改進。值得一提得是,這種配置能夠在單個 RTX 3090 GPU 上每秒處理 76 幀得同時做到這一點。

按照之前得方法 [11, 24],該研究通過在沒有微調(diào)得 JHMDBSentences 上評估模型得泛化能力。該研究從每個視頻中統(tǒng)一采樣三幀,并在這些幀上評估模型。如表2所示,MTTR方法具有很好得泛化性并且優(yōu)于所有現(xiàn)有方法。

表3報告了在Refer-YouTube-VOS公共驗證集上得結(jié)果。與現(xiàn)有方法[24,37]相比,這些方法是在完整數(shù)據(jù)集上進行訓(xùn)練和評估得,盡管該研究模型在較少得數(shù)據(jù)上進行訓(xùn)練,并專門在一個更具挑戰(zhàn)性得子集上進行評估,但MTTR在所有指標(biāo)上都表現(xiàn)出了卓越得性能。

如圖 3 所示,MTTR 可以成功地跟蹤和分割文本參考對象,即使在具有挑戰(zhàn)性得情況下,它們被類似實例包圍、被遮擋或在視頻得廣泛部分中完全超出相機得視野。

參考鏈接:特別reddit/r/MachineLearning/comments/t7qe6b/r_endtoend_referring_video_object_segmentation/

 
(文/葉瑞霖)
免責(zé)聲明
本文僅代表作發(fā)布者:葉瑞霖個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

粵ICP備16078936號

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利
亚洲影院免费观看| 高清av一区二区| 免费人成在线不卡| 奇米四色…亚洲| 九九精品视频在线看| 国产精品自拍在线| 成人一级黄色片| 色综合天天综合在线视频| 91久久精品网| 555夜色666亚洲国产免| 26uuu久久天堂性欧美| 亚洲国产精品精华液2区45| 日韩一区欧美一区| 亚洲一区二区三区免费视频| 日本午夜一区二区| 国产一区二区91| 91亚洲男人天堂| 欧美男男青年gay1069videost| 91麻豆精品国产91久久久 | 欧美v日韩v国产v| 久久精品视频一区| 亚洲女同ⅹxx女同tv| 日日夜夜免费精品视频| 精品一区二区三区久久| 成人97人人超碰人人99| 欧美探花视频资源| 精品日韩一区二区| 国产精品高潮呻吟| 日韩—二三区免费观看av| 国产一区二区三区观看| 色嗨嗨av一区二区三区| 日韩精品一区二区三区四区视频| 国产欧美视频在线观看| 亚洲小少妇裸体bbw| 国产中文字幕一区| 91福利在线看| 久久久青草青青国产亚洲免观| 亚洲欧美中日韩| 麻豆国产精品一区二区三区| eeuss鲁片一区二区三区在线观看 eeuss鲁片一区二区三区在线看 | 亚洲午夜免费电影| 国产美女在线精品| 欧美日精品一区视频| 久久精品一区二区| 日韩精品欧美精品| 91在线无精精品入口| 日韩片之四级片| 亚洲欧美日韩国产综合在线| 国产在线视视频有精品| 欧美日韩你懂得| 国产精品国产成人国产三级| 久久狠狠亚洲综合| 欧美午夜不卡在线观看免费| 国产亚洲短视频| 日韩成人午夜电影| 91国模大尺度私拍在线视频| 久久精品综合网| 蜜臀av性久久久久蜜臀av麻豆| 99国内精品久久| 国产日韩精品一区二区三区在线| 日本系列欧美系列| 欧美日韩中文国产| 亚洲免费看黄网站| 国产.欧美.日韩| 亚洲精品一区二区三区精华液 | 久久国产精品第一页| 欧美自拍偷拍一区| 专区另类欧美日韩| 国产成人亚洲精品狼色在线 | 亚洲va在线va天堂| 色天使色偷偷av一区二区| 国产精品网站在线| 国产精品12区| 久久久久久久久久看片| 久久精品国产**网站演员| 在线91免费看| 五月婷婷久久综合| 欧美色偷偷大香| 亚洲一区在线电影| 色综合久久66| 玉米视频成人免费看| 97久久精品人人爽人人爽蜜臀| 欧美国产精品一区二区三区| 国产一区二区电影| 国产亚洲精久久久久久| 国产成人一区在线| 欧美国产日韩精品免费观看| 国产91精品一区二区麻豆亚洲| 久久嫩草精品久久久精品| 韩国三级在线一区| 久久嫩草精品久久久久| 国产老肥熟一区二区三区| 久久日一线二线三线suv| 国内精品免费在线观看| 久久久久久久网| 国产.精品.日韩.另类.中文.在线.播放| 久久久久久久久一| 成人晚上爱看视频| 国产精品国产三级国产普通话蜜臀| 成人久久视频在线观看| 中文字幕一区二区在线播放| 91亚洲精品乱码久久久久久蜜桃| 亚洲激情在线播放| 欧美日韩激情在线| 美国av一区二区| 久久蜜臀中文字幕| 成人免费高清在线| 亚洲欧洲中文日韩久久av乱码| 色婷婷精品大视频在线蜜桃视频| 一区二区三区在线看| 欧美日韩一区二区三区免费看 | 91浏览器打开| 午夜视频在线观看一区| 日韩视频免费观看高清完整版| 国内外成人在线| 国产精品国产自产拍高清av| 欧美性生活一区| 蜜臀av性久久久久蜜臀aⅴ四虎 | 性做久久久久久免费观看| 日韩三级在线免费观看| 国产精品一区三区| 综合久久综合久久| 91精品国产一区二区三区| 韩国午夜理伦三级不卡影院| 亚洲欧洲另类国产综合| 欧美日韩一级黄| 国产一区二区三区视频在线播放| 国产精品麻豆网站| 欧美日韩极品在线观看一区| 国产老女人精品毛片久久| 亚洲欧美另类久久久精品| 欧美一级免费大片| 成人午夜电影网站| 视频一区欧美日韩| 国产日韩v精品一区二区| 欧美最猛性xxxxx直播| 久久不见久久见免费视频7| 亚洲欧洲精品一区二区三区不卡| 欧美精品乱人伦久久久久久| 国产传媒日韩欧美成人| 亚洲成a人片在线不卡一二三区| 久久久蜜臀国产一区二区| 色欧美片视频在线观看在线视频| 美女任你摸久久| 亚洲免费观看在线观看| 精品国精品国产尤物美女| 色综合视频一区二区三区高清| 男女激情视频一区| 亚洲欧美区自拍先锋| 精品美女被调教视频大全网站| 91久久久免费一区二区| 国产盗摄一区二区| 日本三级亚洲精品| 亚洲免费观看高清完整版在线| 26uuu精品一区二区在线观看| 在线观看日韩国产| 成人av免费在线| 久久99国产乱子伦精品免费| 亚洲一区二区影院| 国产精品视频九色porn| 欧美电视剧在线观看完整版| 欧日韩精品视频| www.性欧美| 国产精品一二三四| 免费在线观看不卡| 亚洲午夜久久久久中文字幕久| 国产精品天美传媒| 久久久青草青青国产亚洲免观| 这里是久久伊人| 欧美在线制服丝袜| av一区二区久久| 成人一区二区视频| 国产毛片精品国产一区二区三区| 日韩av一级电影| 午夜一区二区三区视频| 亚洲九九爱视频| 中文字幕一区二区三区乱码在线 | 国产精品久久久久久久久免费樱桃| 欧美第一区第二区| 欧美一区二视频| 欧美日韩国产成人在线免费| 色综合一区二区| 色综合中文字幕国产| 国产成人在线免费观看| 国产在线播放一区二区三区| 久久精品国产久精国产爱| 日韩成人精品在线观看| 三级在线观看一区二区| 午夜精品免费在线观看| 亚洲国产毛片aaaaa无费看 | 99re66热这里只有精品3直播 | 久久久无码精品亚洲日韩按摩| 亚洲精品一区二区三区香蕉| 日韩欧美的一区二区| 欧美电影免费观看完整版| 精品久久一二三区| 久久婷婷国产综合精品青草| 久久五月婷婷丁香社区| 久久精品夜夜夜夜久久| 中文av字幕一区|