상단영역

본문영역

단 3초 만에 예술 작품에 가까운 이미지를 뽑아낸다! 

  • Editor. 김경한 기자
  • 입력 2023.07.10 16:36
  • 댓글 0
이 기사를 공유합니다

카카오브레인이 단지 글자를 입력하는 것으로 3초 만에 예술 작품에 가까운 이미지를 뽑아낼 수 있는 기술을 공개했다. 무료 이미지를 60만장까지 생성할 수 있을 뿐만 아니라 오픈 API로 개방했기 때문에 이 기술을 활용해 누구나 다양한 응용 서비스를 개발할 수 있을 것으로 전망된다. 

■ 3초 만에 원하는 그림 완성

카카오브레인이 새롭게 선보인 ‘칼로(Karlo) 2.0’은 약 3억 장 규모의 텍스트-이미지 데이터셋을 학습한 초거대 AI 아티스트다. ‘칼로 2.0’은 글로벌 톱 티어(Top Tier) 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있다. 

‘칼로 2.0’의 해상도는 최대 2048×2048을 지원한다. 생성하는 이미지 해상도가 높을수록 다양한 이미지 사이즈로 작업이 가능해 사용자는 표현하고자 하는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있게 됐다. 

뿐만 아니라 이미지상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하다. 

카카오브레인, 초거대 AI 이미지 생성 모델 ‘칼로 2.0’ [사진=카카오브레인 제공]
카카오브레인,, 초거대 AI 이미지 생성 모델 ‘칼로 2.0’ 공개 [사진=카카오브레인 제공]

■ 오픈 API로 누구나 이미지 생성 모델로 개발 가능

카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0 오픈 응용프로그램 인터페이스(API)를 카카오디벨로퍼스에 공개했다. 오픈 API는 서비스와 데이터를 누구나 쉽게 이용할 수 있게 개방한 개발자를 위한 응용프로그램 인터페이스로, 이를 통해 응용프로그램과 운영체제가 유기적으로 통신하고 상호작용하도록 돕는 매개체 역할을 한다. 

기존 칼로 1.4 모델로 제공하던 오픈 API를 칼로 2.0 모델로 업그레이드한 것이다. 칼로 2.0은 기존 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 프롬프트 이해도와 더불어 부정 명령어(Negative Prompt) 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 사전에 제어한다. 이미지 생성 속도 역시 칼로 1.4 대비 단축돼 3초 만에 사용자가 원하는 이미지를 만들 수 있다.

카카오브레인은 칼로 2.0 오픈 API를 선보이면서 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만 장까지 대폭 확대했다. 일반 스타트업 기업 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대함으로써 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 카카오브레인의 의지가 담겨있다. 

김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며, “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.

저작권자 © 업다운뉴스 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

하단영역

© 2024 업다운뉴스. All rights reserved. ND소프트