상세 컨텐츠

본문 제목

구글 바드 이매진2 VS 오픈AI 챗GPT 달리3...이미지 생성기 승자 알려드립니다 [이미지AI]

SW and HW review

by 애피스트 APPIST 2024. 2. 2. 22:54

본문

반응형

구글 이매진2 무료 챗봇 바드 탑재

[2023년 2월2일 서울] 구글이 챗봇 서비스인 바드(Bard)에 생성형 이미지 모델인 '이매진 2(Imagen2)'를 탑재했다고 발표했습니다. 바드에서 사용할 수 있는 AI 그림 서비스는 무료라는 점에서, 오픈AI에 타격을 가할 것으로 보입니다. 오픈AI에서 그림을 생성하려면, 월 20달러짜리 유료버전인 챗GPT 플러스를 구독해야하기 때문입니다. 그래야만 이미지 생성기인 달리(DALLE-3)를 사용할 수 있습니다.

구글이 홈페이지를 통해 공개한 바에 따르면, 현재 이매진2에는 제한이 있습니다. 성적이고, 폭력적이며, 공격적인 프롬프트는 거절합니다. 이는 오픈AI의 달리3 역시 마찬가지입니다. 그런점에서 자유도는 스태빌리티 디퓨전, 미드저니 순으로 높은 반면, 구글 이매진2와 오픈AI 달리3는 낮다고 할 수 있습니다. 아무래도 빅테크 기업일수록 사회적 눈초리가 크기 때문입니다.

아울러 이매진2는 한국어 지원이 되지를 않습니다. 반면 챗GPT는 한국어 지원이 됩니다. 현재 번역기가 많이 나오다보니, 무료인점을 고려할 때 크게 문제가 되지는 않습니다. 마이크로소프트 코파일럿 역시 이 같은 이미지 생성 기술을 도입했는데, 그림 그리는데는 한계가 큽니다.

이번 아티클에서는, 현재 가장 문제가 되고 있는 한 이미지에 다양한 사람을 그릴 수 있는지에 대해 비교 평가해 보고자 합니다. 아래 이미지부터 봐주시면 감사하겠습니다.

일단 아래와 같은 프롬프트를 준비했습니다. 남자 3명 여자 2명, 어깨동무를 하고, 다른 인종, 다른 얼굴, 다른 옷을 입는다는 프롬프트입니다. 3번 테스트를 했습니다.

Create a very realistic photo of 3 men and 2 women standing shoulder to shoulder and smiling. The five people should be of different races, facial features, and clothing.

프롬프트를 통한 비교 평가

우선 구글 바드입니다.

바드 이매진2로 생성한 단체사진
바드 이매진2로 생성한 단체사진
바드 이매진2로 생성한 단체사진

이어서 오픈AI 달리3입니다.

챗GPT 달리3로 생성한 단체 사진
챗GPT 달리3로 생성한 사진
달리3로 생성한 단체사진

개인적으로 만든 벤치마크를 통해 평가해보니, 구글 이매진2가 오픈AI 달리3 보다 우수한 것으로 확인이 됩니다. 달리3의 경우 한국어 지원이라는 장점에도 불구, 5명을 모두 생성하는데 실패했습니다. 또 생성된 인물간 닮아지는 이른바 간섭효과가 크게 나타났습니다. 이매진2는 비교적 간섭이 없다는 점에서 다양한 인물을 한 이미지에 생성하는데 있어서는 이매진2가 우수한 것으로 나타났습니다.

  바드 이매진2 오픈AI 달리3
5명 생성 성공 50% 0%
남자3명 여자2명 성공 16.7% 0%
인물간 상호 비간섭 여부 80% 20%

달리3를 넘어 달리3가 나올지는 아직 알 수 없지만, 구글이 갖고 있는 막대한 구글 이미지는 이매진2를 만드는데 큰 자양분이 된 것으로 보입니다. 그런 점에서 바드의 이매진2는 오픈AI 챗GPT 유료 버전에 큰 장애물이 될 것 같습니다.

 

챗GPT 달리3 활용, 로고 3분 내에 만들기 [프롬프트 엔지니어링]

챗GPT-4.0 터보 2023년 10월 오픈AI는 월 22달러 요금제인 챗GPT 플러스 사용자를 위해 달리(DALL-E) 3 오픈 베타를 출시했습니다. 달리3는 이미지 생성기로, 달리2를 크게 개선한 서비스인데요. 고급 텍

appist.tistory.com

 

미드저니 V6, 문장 생성하는 프롬프트 초급편 [프롬프트 엔지니어링]

2023년 12월21일 미드저니가 V6 모델을 런칭하면서 문장을 반영한 이지미 생성이 가능해졌다. 그동안 오픈AI 챗GPT 플러스에 탑재된 DALLE-3를 통해 문장을 반영한 이미지 생성을 써 왔는데, 이번 미드

appist.tistory.com

 

미드저니 '모델 V6.0' 출시, 문장형 프롬프트 지원

미드저니가 모델 V6.0을 출시했다고 22일 발표했다. V6 모델을 사용하려면 /settings의 드롭다운 메뉴에서 V6를 선택하거나 프롬프트에 --v 6를 입력하면 된다. 미드저니 V6.0은 다음과 같은 특징이 있

appist.tistory.com

 

반응형

관련글 더보기