Main Images



This research aims to generate counterfactual data using Variational Autoencoder (VAE) and train a fair classifier with generated data. We proposed a Disentangled Causal Effect Variational Autoencoder (DCEVAE) which disentangles latent variables to disguise the causality and correlation of a sensitive variable. We theoretically show the disentanglement of the covariance structure in DCEVAE and good performance in estimating the causal effect and training the fair classifier.


본 연구는 변분 오토인코더를 기반으로 반사실적 데이터 생성 및 생성된 데이터를 사용한 공정한 분류자 학습을 목표로 한다. 민감 변수에 종속되는 요소와 연관되는 요소를 구분하기 위하여 잠재 변수를 분리하는 모델인 DCEVAE를 제시하였다. 공분산행렬 분석을 통해 모델의 잠재 변수가 분리됨을 이론적으로 보였으며, 인과 효과를 잘 예측하고 공정한 분류자 학습이 잘 이루어짐을 확인하였다.


Hyemi Kim, Seungjae Shin, JoonHo Jang, Kyungwoo Song, Weonyoung Joo, Wanmo Kang, and Il-Chul Moon, Counterfactual Fairness with Disentangled Causal Effect Variational Autoencoder, AAAI Conference on Artificial Intelligence (AAAI 2021), Virtual Conference, Feb. 2-9 (Acceptance Rate : 21%)