この公平性の概念を実践し、従来のグループ公平性との違いを示すために、センシティブ属性を使用する 3 つのモデルをベースライン モデルと比較します。センシティブ属性がモデルで使用される方法は、モデルの公平性とパフォーマンスに影響を与えることが知られています [3,39,41,11]。したがって、センシティブ属性を明示的に含むモデル、または逆に入力データから人口統計エンコーディングを削除するモデルを使用します。
4つのモデルは、胸部X線写真(CXR)の所見のマルチラベル分類問題でトレーニングされています。すべての設定で、この問題に対して最高のパフォーマンスを発揮することが経験的に決定されたDensenet-121 [13]バックボーンが使用されています。正確なモデルアーキテクチャは図2に示されており、以下に説明します。
– M1 : 画像を入力として使用し、データセットに関連付けられた対象となる CXR 所見を予測するようにトレーニングされたベースライン分類器。このモデルは、画像の特徴を抽出するバックボーンと、各所見の完全接続層とバイナリクロスエントロピー損失で構成される所見ブランチで構成されます。
– M2 : 画像と人種の特徴の両方を入力として使用する分類器。人種情報はカテゴリ変数の形式で提供され、これをワンホットベクトルに変換して完全接続層に送ります。完全接続層からの特徴と画像の特徴を連結してから、分岐の検索に転送します。モデルはエンドツーエンドでトレーニングされます。
– M3 : 画像を入力としてのみ使用する分類器ですが、画像所見と人種グループを予測するようにトレーニングされています (つまり、このモデルは画像に存在する人種エンコーディングを活用することを目的としています)。このモデルでは、損失関数を適応させてベースライン分類器の最終層を変更し、CXR 所見と人種グループの 2 つのタスクを最適化します。また、人種情報をワンホットエンコードされたベクトルに変換して、マルチクラス損失を適用します。人種分類ブランチは、完全接続層とクロスエントロピー損失関数で構成されています。最終的な損失は、損失重み λ を使用して、所見損失と人種損失を加算して計算されます。
– M4 : 画像を入力として用いて、画像にエンコードされた人種情報の使用を最小限に抑えながら、画像の所見を予測するようにトレーニングされた分類器。このモデルでは、[28]で説明されている勾配反転技術を実装しています。勾配反転層を人種分岐の前に適用します。
著者:
(1)Samia Belhadj∗、Lunit Inc.、ソウル、大韓民国(samia.belhadj@lunit.io)
(2) Sanguk Park [0009 -0005 -0538 -5522]*、Lunit Inc.、ソウル、韓国 (tony.superb@lunit.io)。
(3)アンビカ・セス、Lunit Inc.、ソウル、大韓民国(ambika.seth@lunit.io)
(4)ヘシャム・ダール(0009 −0003 −6458 −2097)、ルニット社、ソウル、大韓民国(heshamdar@lunit.io)
(5) Thijs Kooi [0009 -0003 -6458 -2097]、Kooi、Lunit Inc.、ソウル、韓国 (tkooi@lunit.io)。
この論文は、CC BY-NC-SA 4.0 ライセンスの下でarxiv で公開されています。