• 제목/요약/키워드: Image-to-Image Translation

검색결과 303건 처리시간 0.036초

딥러닝 모델 병렬 처리 (Deep Learning Model Parallelism)

  • 박유미;안신영;임은지;최용석;우영춘;최완
    • 전자통신동향분석
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2018
  • Deep learning (DL) models have been widely applied to AI applications such image recognition and language translation with big data. Recently, DL models have becomes larger and more complicated, and have merged together. For the accelerated training of a large-scale deep learning model, model parallelism that partitions the model parameters for non-shared parallel access and updates across multiple machines was provided by a few distributed deep learning frameworks. Model parallelism as a training acceleration method, however, is not as commonly used as data parallelism owing to the difficulty of efficient model parallelism. This paper provides a comprehensive survey of the state of the art in model parallelism by comparing the implementation technologies in several deep learning frameworks that support model parallelism, and suggests a future research directions for improving model parallelism technology.

A Novel Cross Channel Self-Attention based Approach for Facial Attribute Editing

  • Xu, Meng;Jin, Rize;Lu, Liangfu;Chung, Tae-Sun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2115-2127
    • /
    • 2021
  • Although significant progress has been made in synthesizing visually realistic face images by Generative Adversarial Networks (GANs), there still lacks effective approaches to provide fine-grained control over the generation process for semantic facial attribute editing. In this work, we propose a novel cross channel self-attention based generative adversarial network (CCA-GAN), which weights the importance of multiple channels of features and archives pixel-level feature alignment and conversion, to reduce the impact on irrelevant attributes while editing the target attributes. Evaluation results show that CCA-GAN outperforms state-of-the-art models on the CelebA dataset, reducing Fréchet Inception Distance (FID) and Kernel Inception Distance (KID) by 15~28% and 25~100%, respectively. Furthermore, visualization of generated samples confirms the effect of disentanglement of the proposed model.

건설 시공 현장 3차원 층 단위 레이아웃 생성 모델 기초 연구 (Preliminary Study on Generating Three-Dimensional Floor Layout of Construction Sites)

  • 홍성원;김태진;박지원;이수형;김태훈
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 봄 학술논문 발표대회
    • /
    • pp.285-286
    • /
    • 2023
  • The visualization of information serves as a valuable tool for facilitating communication and exchange of opinions among stakeholders by conveying information in an intuitive and clear manner. As a preliminary study of visualization for construction field, this study proposed a model for generating three-dimensional floor layout using 360-degree panoramic cameras. The model integrates the layouts by calculating normal vectors of the plane which has openings, and applying translation and rotation matrices between the normal vectors. The results of this study can contribute to improving communication in construction sites by incorporating visualization, and further to the digital transformation of the construction industry.

  • PDF

뇌의 단일 광자 방출 전산화 단층촬영 영상, 양전자 방출 단층 촬영 영상 그리고 핵자기공명 영상의 융합과 등록에 관한 연구 (A study on image registration and fusion of MRI and SPECT/PET)

  • 주라형;최용;권수일;허수진
    • 한국의학물리학회지:의학물리
    • /
    • 제9권1호
    • /
    • pp.47-53
    • /
    • 1998
  • 방사성 의약품 또는 방사성 동위원소를 이용하여 동적 상태의 변화를 측정하고 핵자기 공명 영상에서 해부학적 기준 정보를 얻어 영상을 융합, 등록하고 같은 대상에서 비슷한 검사를 계속해서 비교하게 되며 해부학적 기준 정보나 다른 검사 기기 종류에서 반복되는 검사의 비교를 위해 영상 합성 연구가 유효하며 기능적 특성 때문에 단일 광자 방출 전산화 단층 촬영과 양전자 방출 단층 촬영은 해부학적 기준 정보가 필요하게 되고 같은 대상에서 이러한 해부학적 기준 정보를 얻고 기능적인 이상과 상관관계를 찾아내고 반복되는 진단에 대한 비교를 위해서 영상등록과 융합을 시행하였다. 해부학적 구조가 같은 특성을 갖는 여러 영상 시스템들을 이용하여 해부학적기준과 동적 정보를 함께 얻고 등록하기 위해 짝을 이루는 점올 이용하여 2 가지 영상 데이터에서 4 점 쌍 이상을 선택하여 등록하였다. 기준 영상과 짝을 이루는 점과 대응한 영상은 다른 색을 선택하여 영상을 구분하였으며 핵자기 공명영상을 기준영상으로 하고 단일 광자 방출 컴퓨터 단층 촬영 영상, 양전자 방출 전산화 단층 촬영 영상을 기준영상에 1:1 대응하여 영상을 등록하기 위해서 변환한다. 핵자기 공명 영상이 기준 영상으로 사용되지만 인터폴레이션 에러는 주어진 영상의 공간 주파수에 따라 달라지므로 낮은 해상도를 갖는 양전자 방출 전산화 단층 촬영 영상과 단일 광자 방출 컴퓨터 단층 촬영 영상의 인터폴레이션 에러는 적다. 따라서 방사성 동위원소를 이용하여 질병의 진단 및 질환의 병태 생리 생화학적 연구를 통한 신체의 동역학적 상태의 변화를 측정할 수 있는 이런 정량적이고 기능적인 정보를 해부학적 기준 정보를 주는 핵자기 공명 영상이나 컴퓨터 단층 촬영에서 반복 시행하여 검사와 진단에 용이하게 이용하고, 비교를 위해서 영상을 등록하고 융합하여 진단에 보다 좋은 결과를 얻을 수 있도록 하였다.

  • PDF

RST변환에 강인한 이미지 워터마킹 방법 (Image Watermarking Robust to Rotation, Scale and Translation Distortion)

  • 추현곤;임삼;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.209-212
    • /
    • 2001
  • 오늘날, 디지털 워터마크에 대하여 기하학적 변환에 대한 강인성이 요구되고 있다. 본 논문에서는 회전, 이동 및 크기변화에 강인한 워터마킹 방법을 제안한다. 영상의 푸리에 변환 계수를 이용하여 이동에 대한 강인한 속성을 가지도록 하며, 입력 마스크의 상호 관계가 회전, 크기 변화에 강인하도록 워터마크 마스크를 생성한 후 영상에 삽입한다. 삽입된 워터마크의 검출은 영상의 주파수 영역의 radial projection 에 대한 워터마크 신호의 상관도를 이용하여 검출한다. 실험을 통하여 제안된 방법이 여러 가지 기하학적 변환에 강인함을 보여준다.

  • PDF

MRI Data 가시화용 후처리 프로그램 개발 (DEVELOPMENT OF A POST-PROCESSING PROGRAM FOR VISUALIZATION OF MRI DATA)

  • 명현국;최훈희
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2007년도 추계 학술대회논문집
    • /
    • pp.67-72
    • /
    • 2007
  • A post-processing program based on the OOP(Object-Oriented Programming) concept has been developed for visualization of MRI. User-friendly GUl(Graphic User Interface) has been built on the base of MFC(Microsoft Foundation Class). The program is organized as modules by classes based on VTK-library, and these classes are made to function through inheritance and cooperation which are an important and valuable concept of object-oriented programming. The major functions of this post-processor program are introduced and demonstrated, which include contour plot, surface plots, cut plot and clip plot as well as view manipulation (translation, rotation, scaling etc).

  • PDF

연삭가공 중인 피스톤 링 그루브의 실시간 연삭폭 측정법 개발 (Real-time measurement of the width of piston ring groove on the grinding process)

  • 김병창
    • 한국기계가공학회지
    • /
    • 제13권2호
    • /
    • pp.28-34
    • /
    • 2014
  • A non-contact type measurement system is specially devised to measure the width of a piston ring groove in the grinding process. This system comprises a line camera with an imaging lens, collimated white light source, and a one axis translation stage. When the measurement system movesalong the diagonal direction of the cylinder, the line camera captures an image. By analyzing such images, the width of the piston ring groove can be determined. The experimental results prove that the proposed system is useful, especially as a monitoring system in grinding piston ring grooves on cylinders with accuracy of several micrometers in an area of dozens of millimeters.

점성 유체중에 자유낙하 하는 니들과 스프링의 거동에 관한 연구 (STUDY ON THE BEHAVIOR OF NEEDLES AND SPRINGS FALLING FREELY IN A VISCOUS FLUID)

  • 고담;서용권
    • 한국전산유체공학회지
    • /
    • 제19권2호
    • /
    • pp.30-39
    • /
    • 2014
  • We report in this paper the analysis of the motion of a needle and a spring in a viscous fluid under the influence of gravitational force. Lateral shift as well as vertical motion of a needle falling in a viscous fluid has been observed from a simple experiment. We also observed the combined rotation and translation of a falling spring. The trajectory and velocity of the falling needle and the spring were obtained by using an image processing technique. We also conducted numerical simulation for both problems. For the falling-needle problem, we employed a theory; but it turns out that significant correction is required for the solutions to match the numerical and experimental data. For the falling spring problem various theoretical formula were tested for their justification, but none of the existing theories can successfully predict the numerical and experimental results.

셀룰라 비선형 회로 구조를 이용한 optical flow 검출 (Detecton of OPtical Flow Using Cellular Nonlinear Neural Networks)

  • 손홍락;김형석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.3053-3055
    • /
    • 2000
  • The Cellular Nonlinear Networks structure for Distance Transform (DT) and the robust optical flow detection algorithm based on the DT are proposed. The proposed algorithm is for detecting the optical flows on the trajectories only of the feature points. The translation lengths and the directions of feature movements are detected on the trajectories of feature points on which Distance Transform Field is developed. The robustness caused from the use of the Distance Transform and the easiness of hardware implementation with local analog circuits are the properties of the proposed structure, To verify the performance of the proposed structure and the algorithm, simulation has been done about zooming image.

  • PDF

Generative Adversarial Network 를 이용한 야간 도로 영상 보정 시스템 (Night to day image translation with Generative Adversarial Network)

  • 안남현;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.347-348
    • /
    • 2018
  • 본 논문에서는 야간 도로 영상을 보정하여 주간 영상으로 변환하는 알고리즘을 제안한다. 영상 변환 딥러닝 알고리즘인 Generative Adversarial Network(GAN)를 기반으로 주야간 도로 영상을 학습시켜 주야간 상호 변환이 가능한 시스템을 구현한다. 우선, 입력 영상에 대해 변환된 영상을 출력하는 generative network 를 정의한다. 또한, 변환된 영상을 다시 본래 영상으로 변환하는 inverse network 를 정의한다. Generative network 와 inverse network 를 모두 통과한 결과 영상과 본래 영상의 차 영상을 통해 손실 함수를 정의함으로써 파라미터를 목적에 맞게 학습시킬 수 있다. 또한, generative network 를 통과한 결과 영상과 목적하는 영상을 구분하는 discrimination network 를 정의하여 discrimination network 와 generative network 의 minimax two- player game 을 통해 변환된 영상이 실제 목적 영상과 유사하도록 유도한다. 제안하는 알고리즘을 적용하여 야간 도로 영상의 보정을 수행하면 주변 물체 인식이 어려운 야간 영상을 물체 인식이 용이한 주간 영상으로 변환 할 수 있다.

  • PDF