최근 AI 이미지 편집 분야에서 정말 놀라운 도구가 등장했다. 바로OmniGen 2라는 오픈소스 이미지 편집기인데, 이 도구의 능력을 보면 정말 입이 떡 벌어진다. 텍스트 프롬프트만으로 이미지를 자유자재로 편집할 수 있는 이 도구에 대해 자세히 알아보자.
OmniGen 2의 놀라운 기능들
이미지 합성과 교체
OmniGen 2의 가장 인상적인 기능 중 하나는 서로 다른 이미지의 요소들을 자연스럽게 합성하는 능력이다. 예를 들어, 사과가 있는 이미지에 고양이 사진을 업로드하고 "사과를 고양이로 바꿔줘"라고 프롬프트를 입력하면, 단순히 고양이를 붙여넣는 것이 아니라 배경의 화이트 밸런스에 맞춰 고양이의 색감까지 자연스럽게 조정해준다.
더 흥미로운 예시로는 남자와 여자가 있는 사진에서 "남자와 여자가 키스하고 포옹하게 해줘"라고 입력하면, 두 사람의 포즈와 위치를 자연스럽게 변경해준다. 또한 특정 캐릭터의 레퍼런스 이미지를 업로드하고 "이 캐릭터가 아늑한 카페에서 노트북 앞에 앉아있게 해줘"라고 하면, 캐릭터의 전체적인 외모와 특징을 그대로 유지하면서 새로운 환경에 배치해준다.
다중 편집 기능
OmniGen 2의 또 다른 강력한 기능은 연속적인 편집이 가능하다는 점이다. 하나의 이미지를 시작으로 여러 단계의 편집을 거쳐 완전히 다른 이미지로 변환할 수 있다. 예를 들어:
1. 초기 이미지의 배경을 공원으로 변경
2. 오리들을 제거
3. 인물이 팔짱을 끼도록 포즈 변경
4. 지브리 스타일로 변환
5. 모자 추가
6. 리본을 스카프로 교체
7. 스카프를 분홍색으로 변경
이 모든 편집이 단순한 텍스트 프롬프트만으로 가능하다는 점이 정말 놀랍다.
실제 사용 예시들
흑백 사진 컬러화
복잡한 가족 사진을 흑백에서 컬러로 변환하는 작업도 "colorize this"라는 간단한 프롬프트만으로 가능하다. 여러 명의 인물과 복잡한 배경이 있는 사진임에도 불구하고 매우 자연스럽게 색상을 입혀준다.
스타일 변환
컬러화된 이미지를 다시 업로드하고 "지브리 스타일로 바꿔줘" 또는 "3D 디즈니 픽사 스타일로 바꿔줘"라고 입력하면, 해당 스타일의 특징을 잘 살린 이미지로 변환해준다. 이는 유료 서비스인 GPT-4o와 비슷한 수준의 결과를 무료로 제공한다는 점에서 매우 의미가 크다.
배경 교체
도시에 있는 여성의 사진에 "눈이 내리고 있어"라고 입력하면, 단순히 눈만 추가하는 것이 아니라 도로와 자동차까지 눈으로 덮인 자연스러운 장면을 만들어준다. 또한 "배경을 해변 석양으로 바꿔줘"라고 하면 인물의 화이트 밸런스까지 석양 배경에 맞춰 조정해준다.
텍스트 편집
이미지 내의 텍스트도 편집할 수 있다. "AI Search Conference"라는 텍스트가 있는 이미지에서 "텍스트를 Meet Up으로 바꿔줘"라고 하면, 원본의 폰트 스타일과 디자인을 유지하면서 텍스트만 자연스럽게 변경해준다.
설치 및 사용 방법
온라인 사용
가장 간단한 방법은 공식 GitHub 저장소에서 제공하는 Hugging Face 스페이스를 이용하는 것이다. 여러 개의 온라인 데모가 제공되며, 하루에 몇 장의 이미지를 무료로 편집할 수 있다.
로컬 설치
무제한으로 사용하고 싶다면 로컬에 설치하는 것이 좋다. 놀랍게도 CPU 오프로드 설정을 사용하면 3GB 미만의 VRAM으로도 실행이 가능하다. 물론 속도를 위해서는 17GB 이상의 VRAM을 가진 GPU를 권장한다.
#### 설치 과정
1.Git 설치: 먼저 Git이 설치되어 있어야 한다. Windows 사용자는 공식 Git 웹사이트에서 최신 버전을 다운로드하여 설치하면 된다.
2.저장소 클론: 원하는 위치에서 명령 프롬프트를 열고 `git clone` 명령어로 OmniGen 2 저장소를 복제한다.
3.Conda 설치: 가상 환경 관리를 위해 Miniconda를 설치한다. 전체 Anaconda보다는 Miniconda가 더 가볍고 효율적이다. Python 3.11 또는 3.12 버전을 권장한다.
4.가상 환경 생성: `conda create -n omnigen2 python=3.11` 명령어로 전용 가상 환경을 생성한다.
5.환경 활성화: `conda activate omnigen2`로 가상 환경을 활성화한다.
6.PyTorch 설치: CUDA 버전에 맞는 PyTorch를 설치한다. `nvcc --version` 명령어로 CUDA 버전을 확인할 수 있다.
7.의존성 설치: `pip install -r requirements.txt`로 필요한 모든 패키지를 설치한다.
8.Flash Attention 설치(선택사항): 생성 속도를 향상시키기 위해 Flash Attention을 설치할 수 있다. 미리 빌드된 wheel 파일을 사용하면 설치 시간을 크게 단축할 수 있다.
9.Gradio 설치: 웹 인터페이스를 위해 `pip install gradio`를 실행한다.
실행 방법
설치가 완료되면 `python app.py` 명령어로 웹 인터페이스를 실행할 수 있다. 처음 실행할 때는 추가 모델들을 다운로드하므로 시간이 걸릴 수 있다.
인터페이스 설정 옵션들
웹 인터페이스에는 다양한 설정 옵션들이 있다:
-프롬프트: 원하는 편집 내용을 텍스트로 입력
-참조 이미지: 최대 3개까지 업로드 가능
-네거티브 프롬프트: 제외하고 싶은 요소들 입력
-이미지 크기: 최대 1024x1024까지 지원
-텍스트 가이던스: 프롬프트가 결과에 미치는 영향 정도
-이미지 가이던스: 참조 이미지가 결과에 미치는 영향 정도
-CFG 범위: 낮은 VRAM 환경에서 속도 향상을 위한 설정
-스케줄러: 이미지 생성 알고리즘 선택
-추론 단계: 품질과 속도의 균형을 조절
다른 도구들과의 비교
현재 시장에는 여러 AI 이미지 편집 도구들이 있다. OpenAI의 GPT-4o와 Google의 Gemini 2.0도 비슷한 기능을 제공하지만, 이들은 유료 서비스이거나 사용량에 제한이 있다.
최근 출시된 FluxContext는 더욱 인상적인 결과를 보여주지만 아직 클로즈드 소스이다. 오픈소스 버전인 FluxContextDev가 예정되어 있지만 아직 출시되지 않았다.
이런 상황에서 OmniGen 2는 완전히 무료이면서 오픈소스인 최고의 선택지 중 하나라고 할 수 있다. 특히 로컬에서 무제한으로 사용할 수 있다는 점이 큰 장점이다.
결론
OmniGen 2는 AI 이미지 편집 분야에서 정말 혁신적인 도구다. 복잡한 포토샵 작업 없이도 텍스트 프롬프트만으로 전문가 수준의 이미지 편집이 가능하다. 특히 머리카락 같은 복잡한 부분의 마스킹 작업을 자동으로 처리해주는 능력은 정말 놀랍다.
무료이면서 오픈소스라는 점, 그리고 로컬에서 무제한으로 사용할 수 있다는 점을 고려하면, 이미지 편집 작업을 자주 하는 사람들에게는 정말 유용한 도구가 될 것이다. 물론 아직 완벽하지는 않고 때로는 스케일이나 세부사항에서 아쉬운 부분이 있지만, 지속적인 개발과 개선을 통해 더욱 발전할 것으로 기대된다.
AI 기술의 발전 속도를 고려할 때, 이런 도구들이 앞으로 어떻게 발전할지 정말 기대가 된다. 창작자들과 디자이너들에게는 새로운 가능성을 열어주는 도구가 될 것이고, 일반 사용자들에게도 전문적인 이미지 편집을 쉽게 할 수 있는 기회를 제공할 것이다.