본문 바로가기

AI 논문 리뷰(AI Paper Review)/생성 모델(Generative Model)3

[논문 정리][GAN]Pix2Pix: Image-to-Image Translation with Conditional Adversarial Nets *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. 논문 링크: https://arxiv.org/abs/1611.07004 Introduction: Pix2Pix with cGAN Pix2Pix은 Conditional GAN에 기반한 모델인데요, 이름과 같이 image-to-image task를 수행하는 GAN입니다. Image-to-image이기 때문에, condition 또한 image가 되어야 되겠죠? Condition으로 image를 넣어주고, output 또한 image로 받아냅니다. 위 그림을 보시면 스케치를 주면 실제 사진과 같은 결과를 출력하기도 하고, 이렇게 낮의 사진을 넣으면 밤의 사진을 만들어내기도 합니다. 보통 저해상도에서 고해상도의 이미지를 만들 때 사용합니다. R.. 2024. 1. 2.
[논문정리][GAN] DCGAN: Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. DCGAN은 2016년에 ICLR에서 다루어졌고, Facebook Research가 발표했습니다. Development Process of GAN 이 그림은 GAN의 발전 과정에 대한 그림입니다. 보시면 GAN의 개념이 나온 뒤에 안정성 문제가 심각해 응용이 많이 생길 수 없었는데요. GAN에 Convolution 개념을 도입하여 DCGAN을 탄생시킴으로써 GAN이 폭발적으로 성장할 수 있게 되었습니다. 기본적으로 여기 보이시는 모델 거의 모두 Convolution을 기반으로 하고 있고요. 여기서 이제 저번 시간에 발표한 Conditional 조건부 개념이 들어가냐, 들어가지 않냐, 등의 기준으로 GAN의 종류를 나눈 표입니다. Why .. 2023. 11. 20.
[논문정리][GAN] Conditional GAN: Conditional Generative Adversarial Nets *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. GAN Architecture 우선 일반 GAN부터 보자면, 목적함수는 다음과 같습니다. 왼쪽 판별자 박스 먼저 보겠습니다. P_data는 원본 데이터의 분포를 의미하는데요. 이 원본 데이터 중에서 한 개의 데이터인 x를 뽑아, D라고 나와있는 판별자에 이 하나의 이미지인 x를 넣습니다. 그럼 Discriminator가 x에 대해 판별을 합니다. 판별자는 진짜 이미지에는 1, 가짜 이미지에는 0을 부여하는데요. 그래서 판별자의 아웃풋은 0에서 1 사이의 확률값으로 나오고, 그것에 log를 취한 것의 기댓값을 구합니다. 오른쪽 생성자에서는 p_z에서 하나의 노이즈 데이터인 z를 뽑습니다. 이 p_z는 정규분포나 Uniform 분포를 주로 .. 2023. 11. 14.