News Feed

챗GPT 이미지 품질 높이는 실전 가이드

컨텐츠 정보

  • 조회 391

본문

인공지능 서비스가 이미지를 생성하는 기능은 널리 알려져 있으며 챗GPT 같은 서비스의 대표적 활용 사례로 꼽힌다. 다만 이러한 기능은 지속적인 논란도 발생시켰다. 사진작가, 예술가, 영화 제작자 상당수는 오픈AI 같은 기업이 자신의 저작물을 학습에 사용했다며 문제를 제기하고 있다.

사용자가 시도할 수 있는 방법과 더 나은 결과를 얻기 위한 조언을 정리한다.

텍스트로 이미지 만들기

챗GPT의 이미지 기능 중 가장 기본적인 활용은 완전히 새로운 이미지를 생성하는 것이다. 예를 들어 “초원에서 노는 두 마리 토끼를 그려줘”, “컴퓨터 앞에 앉아 커피를 마시는 여성을 사실적으로 만들어줘. 컵에는 ‘PC for Everyone’이 적혀 있어야 한다” 같은 프롬프트를 입력하면 생성된 이미지를 다운로드해 사용할 수 있다.

챗GPT가 만들어내는 이미지는 상당히 높은 품질을 보여주며, 적어도 활용 가능한 수준은 대부분 충족한다. 하지만 요청한 내용과 맞지 않는 결과가 나오거나 명확한 오류가 포함될 때도 있다. 과거처럼 손가락 수가 잘못되거나 군중 사진에서 손이 하나 더 보이는 문제는 줄어들었지만, 여전히 무시하기 어려운 오류가 나타난다.

이런 상황에서는 같은 대화 흐름에서 수정 요청을 반복해 품질을 개선할 수도 있고, 아예 새로운 프롬프트로 다시 생성할 수도 있다. 어떤 방식이 더 효과적인지는 상황마다 달라 직접 시도해야 한다.

Olika beskrivningar챗GPT가 처음 생성한 이미지는 왼쪽이었고, 작성자가 “여성이 컵을 왼손으로 들게 해달라”고 요청하자 오른쪽 이미지로 바뀌었다. 그러나 시선 방향이 잘못 수정된 것을 확인할 수 있다.

Bilder genererade av Chat GPT

경험상, 작은 수정 요청은 기대만큼 개선되지 않는 경우가 많고, 다양한 문구를 실험하는 이른바 프롬프트 엔지니어링 역시 과학적 규칙성을 갖기 어렵다. “한 마리 토끼는 분홍색 목줄을 착용한다”, “여성이 컵을 왼손에 든다” 같은 아주 작은 수정조차 결과물을 완전히 바꾸거나, 반대로 정확히 반영될 때도 있다.

챗GPT로 더 나은 사진을 얻는 5가지 방법

Lägg till detaljer

Skärmdump

원하는 이미지를 자세히 설명하기

머릿속에 원하는 이미지가 있다면, 그것을 보지 못하는 사람에게 설명한다는 마음가짐으로 서술해야 한다. “낡은 집, 오래된 가구가 있는 공간에서 갈색 머리와 창백한 피부를 가진 소녀가 피아노 앞에 앉아 있는 모습”은 “피아노 치는 소녀”보다 원하는 결과를 더 정확히 반영한다. 사용자의 머릿속 이미지가 명확하지 않으면 챗GPT도 정확한 기준을 확보하지 못한다.

지나치게 긴 설명은 피하기

상세한 묘사는 유용하지만 지나치게 길면, 예를 들어 A4 한 페이지 분량이라면 챗GPT가 핵심을 놓쳐 활용하기 어려운 결과가 나올 가능성이 높다. 핵심 정보만 담고 나머지는 인공지능이 자연스럽게 채우도록 해야 한다.

Äldre kvinna vid dator

InPixell_Studio

‘메타데이터’ 요소도 설명하기

이미지가 가로형인지 정사각형인지, 사진처럼 보일지 그림처럼 보일지, 색감이 선명해야 하는지 흐릿해야 하는지, 피사체가 화면에서 어느 정도 비중을 차지해야 하는지, 조명이 따뜻해야 하는지 차갑거나 부드러워야 하는지를 챗GPT에게 명확히 알려야 한다. 이미지에 무엇을 넣을지뿐 아니라 어떻게 만들어야 하는지도 설명해야 한다.

다시 시도하기

결과가 만족스럽지 않다면 다시 생성하도록 요청하거나 다른 버전의 이미지를 만들어 달라고 요구할 수 있다. 프롬프트를 바꿔가며 더 나은 결과가 나타나는지 확인하는 것도 방법이다. 처음 입력이 너무 간단했다면 세부 묘사를 늘리고, 반대로 지나치게 길었다면 더 단순하게 만드는 방식도 시도할 수 있다.

스케치에서 시작하기

원하는 이미지의 구성과 요소를 단순하게 스케치할 수 있다면, 챗GPT에게 그 스케치를 기반으로 특정 스타일의 완성된 이미지를 만들도록 요청할 수 있다. 다만 결과 품질은 크게 달라질 수 있다. 화면 구성의 비논리적 배치, 스케치와 맞지 않는 표정, 특히 시선 방향 오류가 자주 발생하는 편이다.

자신이 소유한 이미지 편집하기

새 이미지를 생성하는 것뿐 아니라, 챗GPT는 사용자 소유의 이미지를 수정하는 기능도 제공한다. 그러나 이는 전통적 편집과는 다르며, 요청할 때마다 전체 이미지를 다시 생성하는 방식이다. 다만 알고리즘이 원본을 가능한 유지하려 하기 때문에 결과는 대체로 원본과 크게 다르지 않다.

Redigera

Skärmdump

챗GPT가 이미지를 생성하면 이미지를 클릭해 편집 인터페이스로 이동할 수 있다. 인터페이스에는 사실상 하나의 편집 도구와 실행 취소·다시 실행 버튼만 제공된다. 편집 도구를 선택하면 커서가 큰 원 형태로 변하고, 드래그하면 수정하고 싶은 영역을 지정할 수 있다.

해당 도구를 사용하면 방해되는 물체를 제거하거나, 스웨터의 문양 변경 같은 세부 수정, 새로운 요소 추가 등을 수행할 수 있다.

더 전체적인 편집을 원할 경우에는 영역을 지정하지 않고 프롬프트로 직접 지시할 수 있다. “배경 제거” 같은 명령은 비교적 간단히 적용되지만, 그 외 수정은 더 구체적인 설명이 필요할 때도 있다.

Suddig bild blir skarp

Anders Lundberg

때때로 챗GPT가 요청한 부분 이상을 수정하는 경우가 있다. 이런 경우 “우산 색상을 빨간색으로 바꾸고 다른 부분은 절대 변경하지 말라”처럼 수정 범위를 명확히 제한해야 한다.

줌, 선명화 기능

영화에서는 흐릿한 CCTV 이미지를 확대한 뒤 ‘선명화’ 버튼을 누르면 마치 마법처럼 초고해상도로 바뀌는 장면이 자주 등장한다. 즉시 선명해지는 경우도 있고, 긴장감을 위해 픽셀이 하나씩 채워지는 것처럼 표현되기도 한다.

그러나 이는 허구에 가깝다. 존재하지 않는 정보를 아무리 강력한 알고리즘이나 컴퓨팅 성능으로도 실제로 복원할 수는 없다. 다만 인공지능을 이용하면 그럴듯하게 재구성한 듯한 결과를 만드는 착시 효과는 구현 가능하다.

물체나 사람을 제거한 뒤 배경을 채우는 기능은 형태는 다르지만 모두 머신러닝 기반 추정 기술을 활용한다. 포토샵의 콘텐츠 인식 채우기 기능은 비교적 단순한 방식이지만, 최신 기술은 챗GPT의 이미지 모델처럼 생성형 알고리즘을 활용한다.

Lågupplöst landskap챗GPT에 사진을 확대하고 부족한 부분을 채워 넣으라고 요청했다.

Anders Lundberg

The result ChatGPT spat out결과물은 예상보다 훨씬 자연스러웠다.

Genererad av Chat GPT

이미지 확대도 같은 원리로 작동하지만, 선명도를 높이기 위해 더 많은 작은 조각을 추론해 채워 넣는 과정이 필요하다. 원본 정보가 일부 존재하므로 완전히 엉뚱한 결과가 나올 위험은 낮다. 예를 들어 표지판 글씨가 흐릿해도 읽을 수 있는 정도라면 인공지능은 이를 더 선명하게 만들 수 있지만 ‘소실된 정보를 복구했다’고 보기는 어렵다.

이 과정으로 얻은 결과는 실제 고해상도로 촬영된 원본과 동일할 수 없다. 그러나 실사용 관점에서는 확대된 이미지가 흐릿하지 않고 사용할 수 있는지가 더 중요하다.

Suddig bild blir skarp챗GPT는 특히 사람 얼굴이나 인물 사진을 선명하게 만드는 작업에서 강점을 보인다.

Anders Lundberg

카메라 초점이 맞지 않아 흐릿한 사진을 선명하게 만드는 작업도 가능하지만, 블러가 심하면 인공지능이 추측을 과도하게 수행해 전혀 다른 인물처럼 보이는 결과가 나올 수 있다.

이미지에 특정 스타일 적용하기

챗GPT는 사진이나 다른 이미지를 특정한 스타일로 변환하는 작업에서 뛰어난 성능을 보여 왔다. 예를 들어 많은 사용자가 스튜디오 지브리 스타일, 즉 미야자키 하야오 감독 작품을 연상시키는 만화풍으로 변환을 요청한다. 챗GPT는 이러한 스타일을 자연스럽게 구현한다.
하지만 이런 스타일의 원작자 상당수는 자신의 작품이 학습에 사용된 것에 대해 공개적으로 비판하며, 일부는 오픈AI를 상대로 저작권 소송을 제기하고 있다.

반면 특정 개인의 스타일이 아닌, 일반적 표현을 요청하는 방식은 논란이 적다. 예를 들어 “이 사진을 수채화로 바꿔줘” 같은 요청이나, 렘브란트처럼 저작권이 소멸된 고전 화가의 화풍을 요구하는 경우다.

Ändra stil

Anders Lundberg, målning genererad av Chat GPT

또한 하나의 이미지를 ‘참고 이미지’로 업로드한 뒤, 다른 이미지들을 그 스타일과 유사하게 변환하도록 요청할 수 있다.

결과가 만족스럽지 않다면, 참고 이미지를 새 대화에 업로드한 뒤 “이 스타일을 적용하기 위한 설명문을 만들어줘”라고 요청한 다음, 그 설명문을 스타일 변환을 적용하고 싶은 대화에 붙여넣는 방식도 활용할 수 있다.

Galleri

Skärmdump

갤러리 기능

챗GPT 화면 왼쪽 상단의 ‘새 대화’와 ‘검색’ 아래에는 ‘갤러리’ 기능이 있다. 갤러리는 사용자가 GPT-4o 모델로 생성한 모든 이미지를 저장하는 공간이다(과거 DALL-E 생성물은 포함되지 않는다).

갤러리는 과거 생성 이미지를 쉽게 찾아 다시 수정하거나 해당 이미지 생성 당시의 프롬프트를 확인할 수 있어 편리하다. 이미지를 클릭한 뒤 ‘대화에서 열기’를 선택하면 그 이미지를 만들었던 대화로 바로 이동한다.

Sora

Skärmdump

소라로 영상 생성하기

오픈AI는 이미지 외에도 영상 생성 기술을 개발해 별도 서비스 ‘소라’를 제공하고 있다. 소라는 독립적인 웹사이트·앱 기반으로 운영되며 챗GPT에 통합되지 않는다.

소라는 실제 촬영한 것처럼 자연스러운 영상을 생성할 수 있을 정도로 성능이 뛰어나다. 영상 생성의 모든 세부 기능을 다루기에는 지면이 부족하지만, 이미지 생성과 동일한 기본 원칙을 바탕으로 활용을 시작할 수 있다.

두 번째 조언은 서비스를 적극 실험해보라는 것이다. 다만 고급 유료 구독이 없다면 하루 10초 영상 15개까지만 생성할 수 있다는 제한이 있다.

GPT

Skärmdump

프로젝트와 GPT 기능

챗GPT의 프로젝트 기능을 활용하면 여러 대화를 하나의 작업 단위로 정리하고, 프로젝트 내에서 새로 시작하는 대화마다 지정한 파일이나 지침을 자동 적용할 수 있다. 웹사이트 이미지 리소스를 일정한 스타일로 유지해야 하는 경우 특히 유용하다.

유료 플러스 사용자는 챗GPT 기반 맞춤형 GPT를 직접 만들 수 있으며, 다른 사용자가 만든 GPT를 활용하는 것도 가능하다. 이미지 고해상도 업스케일링 GPT 같은 활용 사례도 여기에 포함된다.

AI 이미지와 저작권

챗GPT나 다른 인공지능 서비스로 생성한 이미지에는 사용자에게 저작권이 부여되지 않는다. 프롬프트를 얼마나 세밀하게 작성했는지와 관계없이 생성물은 저작권 보호 대상이 아니다.

따라서 다른 사람이 사용자가 만든 이미지를 그대로 가져다 써도 이를 막을 방법이 없으며, 생성 이미지를 자신이 저작권자라고 주장하는 행위는 불법이다.

다만 생성 이미지를 포토샵 등으로 크게 수정해 새로운 창작물로 만들거나, 이를 기반으로 직접 그림을 다시 그린 경우에는 그 2차 창작물에 저작권이 인정될 수 있다.

미국 의회도서관은 인공지능과 저작권에 대한 가이드를 제공하며, 인공지능이 타인의 저작권을 침해할 위험성 또한 설명하고 있다. 개인용도에서는 위험이 크지 않지만, 사업적·상업적 활용에서는 특히 주의가 필요하다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank