BDL簡介 - Bidirectional Learning for Domain Adaptation of Semantic Segmentation

Yunsheng Li, Lu Yuan, Nuno Vasconcelos. “Bidirectional Learning for Domain Adaptation of Semantic Segmentation”. In CVPR’19.

CVPR 2019 Paper

Paper link : https://arxiv.org/abs/1904.10620

Github (May.02.2019,尚未釋出) : https://github.com/liyunsheng13/BDL

前備知識

如果不清楚 Domain Adaptation 或是 Domain Shift 的,

可以先看我之前寫過的 AdaptSegNet簡介

簡介

以往常見的 Domain Adaptation 的方式是透過 GAN-based 的方法,

此文也是基於此方法作延伸,

對 GAN-based 方法不清楚的可以看 AdaptSegNet簡介

此文提出 Bidirectional learning framework,

其框架包含兩個部分

  • Image-to-Image 模型做轉換,此處使用 Cycle GAN
  • Segmentation adaptation model 其包含 Semantic Segmentation model 以及 Discriminator

Image-to-Image 的想法是將 Source domain(S) 的畫風轉換為 Target domain(T) 來減緩 domain shift 所帶來的傷害(降低準確度)。

特別的是此論文的 Image-to-Image 模型會依據 Semantic Segmentation 的結果做訓練。

因此稱為 Bidirectional learning~

除此之外還提出 Self-supervised(SSL) 的方式來提升準確度。

問題設定

通常 Unsupervised domain adaptation (UDA) 在語義分割(Semantic segmentation)的任務中的定義如下

  • Source Domain:圖片 Xs,有標注正解的圖片 Ys
  • Target Domain:圖片 Xt,沒標注正解圖片

架構

Bidirectional Learning

首先訓練 Image-to-Image 的模型,

使用 S 與 T 的圖片做訓練,

訓練方式相似於以往的 Cycle-GAN。

提出了新的 Perceptual loss !!

使用轉換完的圖片輸入至 Semantic Segmentation 去做預測,

那直覺的想法是如果圖片轉換的夠好的話,

那麼輸入進模型的預測結果應該也會差不多,

備註:

F-1 可以理解使用另一個分支 T -> S,將 S’(相似 T) 轉回 S,

再來訓練 Segmentation Adaptation Model,

使用常見的 Semantic loss 以及 Adversarial 的方法訓練,

使用的事 Image-to-Image 所生成的 S’ (經由 S -> T 的分支生成) 作為輸入。

Self-supervised Learning(SSL)

如果 S 以及 T 的資料集都有 GT 的話,

那都使用 Fully Supervised 的方法做訓練是較佳的,

但是 DA 的問題是 T 的資料集沒有 GT,

但我們可以使用預測出來的 Yt 來做訓練,

這邊是選用 Yt 中擁有較高自信分數(> threshold)的 pixel 去做訓練,

對於有較高分數的 pixel 我們稱做 Y^t,

因此訓練 Segmentation adaptation model 會多一個 Segmentation loss,

上圖左方的 Step1 指的是使用 Segmentation adaptation model 完的效果,

而 Step2 指的是使用 Self-supervised Learning(SSL) 完的效果,

訓練流程步驟

  • K 為 iteration 次數:實驗設定為 2,可看下方 table 1 實驗。
  • Threshold:設定為 0.9,可看下方 table 3 實驗。
  • N 為 SSL 的次數:設定為 2,可看下方 table 4 實驗。

參數細節有點多,有興趣自己去看論文理解好了。。。

成果

對於 Row 4, 5 的 mIoU 47.2 -> 44.3 那部分挺特別的,

有興趣的去看論文,講得有點抽象呢!

參考資料:

Bidirectional Learning for Domain Adaptation of Semantic Segmentation

AdaptSegNet簡介

AdaptSegNet:Learning to Adapt Structured Output Space for Semantic Segmentation


© 2018-2024 XiaoSean. All rights reserved.

Powered by Hydejack v9.1.6