[2023년 2월2일 서울] 구글이 챗봇 서비스인 바드(Bard)에 생성형 이미지 모델인 '이매진 2(Imagen2)'를 탑재했다고 발표했습니다. 바드에서 사용할 수 있는 AI 그림 서비스는 무료라는 점에서, 오픈AI에 타격을 가할 것으로 보입니다. 오픈AI에서 그림을 생성하려면, 월 20달러짜리 유료버전인 챗GPT 플러스를 구독해야하기 때문입니다. 그래야만 이미지 생성기인 달리(DALLE-3)를 사용할 수 있습니다.
구글이 홈페이지를 통해 공개한 바에 따르면, 현재 이매진2에는 제한이 있습니다. 성적이고, 폭력적이며, 공격적인 프롬프트는 거절합니다. 이는 오픈AI의 달리3 역시 마찬가지입니다. 그런점에서 자유도는 스태빌리티 디퓨전, 미드저니 순으로 높은 반면, 구글 이매진2와 오픈AI 달리3는 낮다고 할 수 있습니다. 아무래도 빅테크 기업일수록 사회적 눈초리가 크기 때문입니다.
아울러 이매진2는 한국어 지원이 되지를 않습니다. 반면 챗GPT는 한국어 지원이 됩니다. 현재 번역기가 많이 나오다보니, 무료인점을 고려할 때 크게 문제가 되지는 않습니다. 마이크로소프트 코파일럿 역시 이 같은 이미지 생성 기술을 도입했는데, 그림 그리는데는 한계가 큽니다.
이번 아티클에서는, 현재 가장 문제가 되고 있는 한 이미지에 다양한 사람을 그릴 수 있는지에 대해 비교 평가해 보고자 합니다. 아래 이미지부터 봐주시면 감사하겠습니다.
일단 아래와 같은 프롬프트를 준비했습니다. 남자 3명 여자 2명, 어깨동무를 하고, 다른 인종, 다른 얼굴, 다른 옷을 입는다는 프롬프트입니다. 3번 테스트를 했습니다.
Create a very realistic photo of 3 men and 2 women standing shoulder to shoulder and smiling. The five people should be of different races, facial features, and clothing.
우선 구글 바드입니다.
이어서 오픈AI 달리3입니다.
개인적으로 만든 벤치마크를 통해 평가해보니, 구글 이매진2가 오픈AI 달리3 보다 우수한 것으로 확인이 됩니다. 달리3의 경우 한국어 지원이라는 장점에도 불구, 5명을 모두 생성하는데 실패했습니다. 또 생성된 인물간 닮아지는 이른바 간섭효과가 크게 나타났습니다. 이매진2는 비교적 간섭이 없다는 점에서 다양한 인물을 한 이미지에 생성하는데 있어서는 이매진2가 우수한 것으로 나타났습니다.
바드 이매진2 | 오픈AI 달리3 | |
5명 생성 성공 | 50% | 0% |
남자3명 여자2명 성공 | 16.7% | 0% |
인물간 상호 비간섭 여부 | 80% | 20% |
달리3를 넘어 달리3가 나올지는 아직 알 수 없지만, 구글이 갖고 있는 막대한 구글 이미지는 이매진2를 만드는데 큰 자양분이 된 것으로 보입니다. 그런 점에서 바드의 이매진2는 오픈AI 챗GPT 유료 버전에 큰 장애물이 될 것 같습니다.
3만원 가성비 마우스 로지텍 M720, 생산성 20% 향상 (1) | 2023.12.30 |
---|