• 제목/요약/키워드: Image-to-Image translation

검색결과 303건 처리시간 0.026초

Application of Artificial Neural Network For Sign Language Translation

  • Cho, Jeong-Ran;Kim, Hyung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.185-192
    • /
    • 2019
  • In the case of a hearing impaired person using sign language, there are many difficulties in communicating with a normal person who does not understand sign language. The sign language translation system is a system that enables communication between the hearing impaired person using sign language and the normal person who does not understand sign language in this situation. Previous studies on sign language translation systems for communication between normal people and hearing impaired people using sign language are classified into two types using video image system and shape input device. However, the existing sign language translation system does not solve such difficulties due to some problems. Existing sign language translation systems have some problems that they do not recognize various sign language expressions of sign language users and require special devices. Therefore, in this paper, a sign language translation system using an artificial neural network is devised to overcome the problems of the existing system.

A Study on Improving the Accuracy of Medical Images Classification Using Data Augmentation

  • Cheon-Ho Park;Min-Guan Kim;Seung-Zoon Lee;Jeongil Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.167-174
    • /
    • 2023
  • 본 연구는 합성곱 신경망 모델에서 이미지 데이터 증강을 통하여 대장암 진단 모델의 정확도를 개선하고자 하였다. 이미지 데이터 증강은 기초 이미지 조작 방법을 이용하여 뒤집기, 회전, 이동, 밀림, 주밍을 사용하였다. 본 연구에서는 실험설계를 위해 보유하고 있는 5000개의 이미지 데이터에 대해 훈련 데이터와 평가 데이터로 각각 4000개와 1000개로 나누었으며, 훈련 데이터 4000개에 대해 이미지 데이터 증강 기법으로 4000개와 8000개의 이미지를 추가하여 모델을 학습시켰다. 평가 결과는 훈련 데이터 4000개, 8000개, 12000개에 대한 분류 정확도가 각각 85.1%, 87.0%, 90.2%로 나왔으며 이미지 데이터 증강에 따른 개선 효과를 확인하였다.

복구패턴 정합을 통한 기하학적 왜곡에 적응적인 워터마킹 (Watermarking Algorithm that is Adaptive on Geometric Distortion in consequence of Restoration Pattern Matching)

  • 전영민;고일주;김동호
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.283-290
    • /
    • 2005
  • 워터마킹에서 영상의 평행이동, 회전, 크기변환 왜곡에 기인한 워터마크 삽입 위치와 추출 위치의 불일치는 해결해야 하는 문제이다. 본 논문에서는 복구패턴 정합을 통한 영상동기화를 이용함으로써 기하학적 왜곡에 강인한 워터마킹 방법을 제안한다. 제안하는 방법은 복구패턴을 정의하여 워터마크가 삽입된 영상에 복구패턴을 삽입 배포한다. 그리고 배포된 영상으로부터 복구패턴을 추출하여 삽입한 복구패턴과 비교함으로써 기하학적 왜곡 여부를 확인한다 기하학적 왜곡이 발생하였다면 왜곡된 만큼 역변환을 함으로써 워터마크 삽입 위치와 추출 위치를 동기화 한다. 제안한 방법의 성능을 평가하기 위하여 이동, 회전, 스케일링 공격에 대한 실험결과를 보인다.

A Data Hiding Scheme for Grayscale Images Using a Square Function

  • Kwon, Hyejin;Kim, Haemun;Kim, Soonja
    • 한국멀티미디어학회논문지
    • /
    • 제17권4호
    • /
    • pp.466-477
    • /
    • 2014
  • Many image hiding schemes based on least significant bit (LSB) transformation have been proposed. One of the LSB-based image hiding schemes that employs diamond encoding was proposed in 2008. In this scheme, the binary secret data is converted into base n representation, and the converted secret data is concealed in the cover image. Here, we show that this scheme has two vulnerabilities: noticeable spots in the stego-image, i.e., a non-smooth embedding result, and inefficiency caused by rough re-adjustment of falling-off-boundary value and impractical base translation. Moreover, we propose a new scheme that is efficient and produces a smooth and high quality embedding result by restricting n to power of 2 and using a sophisticated re-adjustment procedure. Our experimental results show that our scheme yields high quality stego-images and is secure against RS detection attack.

Imaging a scene from experience given verbal experssions

  • Sakai, Y.;Kitazawa, M.;Takahashi, S.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1995년도 Proceedings of the Korea Automation Control Conference, 10th (KACC); Seoul, Korea; 23-25 Oct. 1995
    • /
    • pp.307-310
    • /
    • 1995
  • In the conventional systems, a human must have knowledge of machines and of their special language in communicating with machines. In one side, it is desirable for a human but in another side, it is true that achieving it is very elaborate and is also a significant cause of human error. To reduce this sort of human load, an intelligent man-machine interface is desirable to exist between a human operator and machines to be operated. In the ordinary human communication, not only linguistic information but also visual information is effective, compensating for each others defect. From this viewpoint, problem of translating verbal expressions to some visual image is discussed here in this paper. The location relation between any two objects in a visual scene is a key in translating verbal information to visual information, as is the case in Fig.l. The present translation system advances in knowledge with experience. It consists of Japanese Language processing, image processing, and Japanese-scene translation functions.

  • PDF

R2와 어텐션을 적용한 유넷 기반의 영상 간 변환에 관한 연구 (Image-to-Image Translation Based on U-Net with R2 and Attention)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 영상 처리 및 컴퓨터 비전 분야에서 하나의 영상을 통해 다른 영상으로 재구성하거나 새로운 영상을 생성하는 문제는 하드웨어의 발전에 따라 꾸준히 주목받고 있다. 그러나 컴퓨터를 통해 생성한 이미지를 사람의 눈으로 바라봤을 때 자연스럽지 않다는 문제 또한 계속해서 대두되고 있다. 최근 딥러닝 분야에 대한 연구가 활발히 진행됨에 따라 이를 활용한 영상 생성 및 개선 문제 또한 활발히 연구되고 있으며 그 중에서도 적대적 생성 신경망(Generative Adversarial Network)이라는 네트워크가 영상 생성 분야에 있어 좋은 결과를 보이고 있다. 적대적 생성 신경망이 제안된 이후 이를 기반으로 하는 다양한 네트워크가 제시됨에 따라 영상 생성 분야에서 더 자연스러운 영상을 생성하는 것이 가능해졌다. 그 중 pix2pix은 조건 적대적 생성 신경망 모델로 다양한 데이터셋에서도 좋은 성능을 보이는 범용적인 네트워크이다. pix2pix는 U-Net을 기반으로 두고 있으나 U-Net을 기반으로 하는 네트워크 중에서는 더 좋은 성능을 보이는 네트워크가 다수 존재한다. 때문에 본 연구에서는 pix2pix의 U-Net에 다양한 네트워크를 적용해 영상을 생성하고 그 결과를 상호 비교 평가한다. 각 네트워크를 통해 생성된 영상을 통해 기존의 U-Net을 사용한 pix2pix 모델보다 어텐션, R2, 어텐션-R2 네트워크를 적용한 pix2pix 모델이 더 좋은 성능을 보이는 것을 확인하고 그 중 가장 성능이 뛰어난 네트워크의 한계점을 향후 연구로 제시한다.

잡음과 회전에 강인한 SIFT 기반 PCB 영상 정렬 알고리즘 개발 (Robust PCB Image Alignment using SIFT)

  • 김준철;최학남;박은수;최효훈;김학일
    • 제어로봇시스템학회논문지
    • /
    • 제16권7호
    • /
    • pp.695-702
    • /
    • 2010
  • This paper presents an image alignment algorithm for application of AOI (Automatic Optical Inspection) based on SIFT. Since the correspondences result using SIFT descriptor have many wrong points for aligning, this paper modified and classified those points by five measures called the CCFMR (Cascade Classifier for False Matching Reduction) After reduced the false matching, rotation and translation are estimated by point selection method. Experimental results show that the proposed method has fewer fail matching in comparison to commercial software MIL 8.0, and specially, less than twice with the well-controlled environment’s data sets (such as AOI system). The rotation and translation accuracy is robust than MIL in the noise data sets, but the errors are higher than in a rotation variation data sets although that also meaningful result in the practical system. In addition to, the computational time consumed by the proposed method is four times shorter than that by MIL which increases linearly according to noise.

단안영상에서 움직임 벡터를 이용한 영역의 깊이추정 (A Region Depth Estimation Algorithm using Motion Vector from Monocular Video Sequence)

  • 손정만;박영민;윤영우
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.96-105
    • /
    • 2004
  • 2차원 이미지로부터 3차원 이미지 복원은 각 픽셀까지의 깊이 정보가 필요하고, 3차원 모델의 복원에 관한 일반적인 수작업은 많은 시간과 비용이 소모된다. 본 논문의 목표는 카메라가 이동하는 중에, 획득된 단안 영상에서 영역의 상대적인 깊이 정보를 추출하는 것이다. 카메라 이동에 의한 영상의 모든 점들의 움직임은 깊이 정보에 종속적이라는 사실에 기반을 두고 있다. 전역 탐색 기법을 사용하여 획득한 움직임 벡터에서 카메라 회전과 배율에 관해서 보상을 한다. 움직임 벡터를 분석하여 평균 깊이를 측정하고, 평균 깊이에 대한 각 영역의 상대적 깊이를 구하였다. 실험결과 영역의 상대적인 깊이는 인간이 인식하는 상대적인 깊이와 일치한다는 것을 보였다.

  • PDF

깊이 정보를 이용한 실시간 다시점 스테레오 영상 합성 (Real-time Multiple Stereo Image Synthesis using Depth Information)

  • 장세훈;한충신;배진우;유지상
    • 한국통신학회논문지
    • /
    • 제30권4C호
    • /
    • pp.239-246
    • /
    • 2005
  • 본 논문에서는 영상의 RGB 정보와 화소단위의 8비트 깊이 정보를 이용하여 현재의 영상과 스테레오 쌍이 되는 가상의 우 영상을 생성한다. 이 과정에서 깊이 정보를 시차 정보로 변환하고, 생성된 시차정보를 이용하여 우 영상을 생성하게 된다. 또한 스테레오 영상을 합성한 후 회전(rotation)과 이동(translation) 등의 기하학적 변환을 이용하여 관찰자의 위치를 고려한 다시점 스테레오 영상을 합성하는 기법을 제안하고, 깊이 정보와 시차 정보와의 관계를 분석하여 화소 단위의 실시간 처리를 위한 LUT(look-up table) 방식의 고속 기법도 제안한다. 실험 결과 SD급 영상의 경우 8비트 깊이 정보만을 가지고 11시점의 스테레오 영상을 실시간으로 합성할 수 있다.

영상의 시점변화와 악의적 공격에 대한 디지털 워터마킹 (Digital Watermarking on Image for View-point Change and Malicious Attacks)

  • 김보라;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.342-354
    • /
    • 2014
  • 본 논문에서는 사용자 측에서 임의의 시점 영상을 렌더링하여야 하는 초다시점 또는 자유시점 영상서비스를 타겟으로 소유자의 지적재산권을 보호하기 위한 디지털 워터마킹 방법을 다룬다. 본 논문의 주된 목적은 기존방법들에 비해 우수한 방법을 제안하는 것보다는 시점이동 공격을 이겨내는 워터마킹 방법이 얼마나 어려운지를 보이는 것이다. 따라서 대상 영상은 시점이동을 포함한 다양한 공격을 가한 영상이다. 본 논문은 먼저 2D영상에 대한 워터마킹 방법 중 2DDCT(2D discrete cosine transform)를 사용하는 방법과 2DDWT(2D discrete wavelet transform)를 사용하는 방법의 기본적인 scheme으로 시점이동이 추출한 워터마크 데이터의 오차율을 얼마나 높이는 지를 보인다. 시점이동된 영상에 대한 워터마킹의 어려움은 이동된 시점을 모르기 때문이며, 따라서 본 논문에서는 이동된 시점을 찾는 방법을 제안한다. 이 방법은 원시점의 영상과 해당 깊이정보를 사용한다. 또한 이 방법을 사용한 non-blind 워터마킹 방법을 제안하여, 이동된 시점을 복원하는 것이 추출된 워터마크의 오차율에 큰 영향을 미친다는 것을 보인다. 제안한 방법과 기존 방법의 성능을 비교하여, 비록 non-blind 방법이기는 하지만 기존 방법보다 비가시성 및 강인성에서 우수함을 보인다.