OpenAI는 최근 DALL·E 시리즈의 새로운 버전인 DALL·E 3을 공개했다. 이 버전은 그 전 버전인 DALL·E-2보다 현저히 발전된 기능을 제공하며 사용자의 요구와 의도를 더욱 세밀하게 파악하여 정확한 이미지를 생성할 수 있을 것으로 예상된다.
DALL·E 3은 현재, 연구용 프리뷰 단계에 있으며, 10월부터 유료버전인 챗GPT 플러스(ChatGPT Plus) 및 기업 고객에게 제공될 예정이다.
주요 특징 및 혁신적인 변화
- 향상된 이미지 생성 능력: DALL·E 3는 이전 버전보다 더욱 높은 정밀도와 디테일을 지니며, 제공된 문장이나 설명을 정확하게 따라 이미지를 생성할 수 있다.
- ChatGPT와의 통합: DALL·E 3는 ChatGPT와 네이티브로 통합될 예정이다. 이 통합을 통해 사용자는 ChatGPT를 브레인스토밍 파트너로 활용하여 프롬프트를 발전시키고, 원하는 이미지를 더욱 구체적으로 요청할 수 있다.
- 향상된 사용자 경험: 사용자는 ChatGPT에게 원하는 이미지에 대한 아이디어나 설명을 전달하면, ChatGPT는 이를 기반으로 DALL·E 3에게 최적화된 프롬프트를 전달한다. 만약 생성된 이미지가 사용자의 기대와 조금 다르다면, ChatGPT에게 간단한 피드백만으로 수정을 요청할 수 있다.
- 데이터 세트의 확장: DALL·E 3는 15.6T 픽셀의 데이터 세트 크기를 가지며, 이는 DALL·E 2의 1.56T 픽셀에 비해 약 10배의 증가를 의미한다. 이로 인해 더 높은 품질의 이미지를 생성할 수 있다.
- 안전성 강화: DALL·E 3는 사용자의 안전을 위해 여러 가지 안전장치를 도입하였다. 특히, 음란, 혐오스런 이미지나 공인의 이미지 생성을 제한하였으며, 살아있는 예술가의 스타일로의 이미지 생성 요청도 거부한다.
- 저작권 문제에 대한 해결: DALL·E 3을 통해 생성된 이미지의 저작권은 사용자에게 있으며, 상업적으로 이용할 수 있다.
이미지 샘플
결론
우선 DALL·E 3는 ChatGPT와의 결합이라는 것 만으로도 이미지 생성 AI 분야에서 일반 사용자들에게 접근성이 매우 높은 서비스가 될 것이다. 기존의 미드저니, 스테이블 디퓨전 등의 이미지 생성 AI는 프롬프트를 작성하고 파라미터를 제어하는 것이 까다로운 일이었기 때문이다.
이번 DALL·E 3의 발표는 이미지 생성 AI 분야에서의 중요한 발전을 보여주며, 사용자 친화적인 기능과 향상된 이미지 품질, 그리고 안전성 강화 등 다양한 혁신적인 변화를 가져올 것이다. OpenAI의 지속적인 연구와 발전을 통해, 미래의 이미지 생성 AI는 더욱 다양하고 풍부한 가능성을 제시할 것으로 기대된다.