Image Manipulation in Diffusion Model withDrag Input using Self-Attention Control

SungYoon Lim;YoungJoo Jo;Yong-Ju Lee;

doi:10.3745/PKIPS.y2023m11a.465

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

한국정보처리학회 2023년도 추계학술발표대회
/
Pages.465-468
/
2023
/
2005-0011(pISSN)
/
2671-7298(eISSN)

한국정보처리학회 (Korea Information Processing Society)

DOI QR Code

디퓨전 모델에서의 전 범위적 이미지 조작을 위한 셀프 어텐션 제어 및 드래그 특징 반영 연구

Image Manipulation in Diffusion Model withDrag Input using Self-Attention Control

임성윤 (숭실대학교 글로벌미디어학부) ;
조영주 (한국전자통신연구원) ;
이용주 (한국전자통신연구원)

SungYoon Lim (Dept. of Global Media, Soongsil University) ;
YoungJoo Jo (Electronics and Telecommunications Research Institute) ;
Yong-Ju Lee (Electronics and Telecommunications Research Institute)

발행 : 2023.11.02

https://doi.org/10.3745/PKIPS.y2023m11a.465 인용 PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

디퓨전 모델에서 생성한 이미지를 조작하는 기존 프롬프트 기반 방법과 포인트 기반 방법에는 각각의 단점이 있다. 프롬프트 기반은 프롬프트로만 조작이 가능하고 세세하지 못하다. 포인트 기반은 입력 이미지의 스타일을 보존하려면 파인튜닝이 필요하다. 본 논문은 디퓨전 생성 모델에 셀프 어텐션 제어와 드래그 조작을 통해, 파라미터 학습 없이, 이미지의 스타일을 보존하며 다양한 범위의 이미지 조작이 가능한 방법을 제안한다.

키워드

과제정보

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.RS-2022-00187238, 효율적 사전학습이 가능한 한국어 대형 언어모델 사전학습 기술개발)

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

디퓨전 모델에서의 전 범위적 이미지 조작을 위한 셀프 어텐션 제어 및 드래그 특징 반영 연구

Image Manipulation in Diffusion Model withDrag Input using Self-Attention Control

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)