• 제목/요약/키워드: Computer Vision

검색결과 2,208건 처리시간 0.029초

GAN으로 합성한 음성의 충실도 향상 (Improving Fidelity of Synthesized Voices Generated by Using GANs)

  • 백문기;윤승원;이상백;이규철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.9-18
    • /
    • 2021
  • 생성적 적대 신경망(Generative Adversarial Networks, GANs)은 컴퓨터 비전 분야와 관련 분야에서 큰 인기를 얻었으나, 아직까지는 오디오 신호를 직접적으로 생성하는 GAN이 제시되지 못했다. 오디오 신호는 이미지와 다르게 이산 값으로 구성된 생플링된 신호이므로, 이미지 생성에 널리 사용되는 CNN 구조로 학습하기 어렵다. 이러한 제약을 해결하고자, 최근 GAN 연구자들은 오디오 신호의 시간-주파수 표현을 기존 이미지 생성 GAN에 적용하는 전략을 제안했다. 본 논문은 이 전략을 따르면서 GAN을 사용해 생성된 오디오 신호의 충실도를 높이기 위한 개선된 방법을 제안한다. 본 방법은 공개된 스피치 데이터세트를 사용해 검증했으며, 프레쳇 인셉션 거리(Fréchet Inception Distance, FID)를 사용해 평가했다. 기존의 최신(state-of-the-art) 방법은 11.973의 FID를, 본 연구에서 제안하는 방법은 10.504의 FID를 보였다(FID가 낮을수록 충실도는 높다).

효율적인 그래프 기반 2단계 슈퍼픽셀 생성 방법 (Efficient graph-based two-stage superpixel generation method)

  • 박상현
    • 한국정보통신학회논문지
    • /
    • 제23권12호
    • /
    • pp.1520-1527
    • /
    • 2019
  • 컴퓨터 비전 분야에서 영상의 특성을 유지하면서 영상을 간소화하여 계산량을 줄이는 방법으로 전처리 단계에서 슈퍼픽셀 방법이 많이 사용되고 있다. 하지만 슈퍼픽셀 단계에서는 영상의 특성을 고려하는 것 보다는 화소의 값을 기준으로 일정한 크기와 형태의 슈퍼픽셀을 생성하는 것이 일반적이다. 본 논문에서는 응용에 맞게 영상의 특성을 고려하여 슈퍼픽셀을 생성할 수 있는 방법을 제안한다. 제안하는 방법은 두 단계로 이루어지며, 첫 번째 단계에서 영상을 과분할 하여 영상의 경계 정보들이 잘 보존되게 한다. 두 번째 단계에서는 과분할 된 슈퍼픽셀들을 유사도를 기준으로 병합하여 원하는 개수의 슈퍼픽셀을 생성한다. 이때 슈퍼픽셀의 최대 크기를 제한함으로써 슈퍼픽셀의 형태를 제어한다. 실험 결과는 제안하는 방법으로 생성된 슈퍼픽셀이 기존 방법에 의해 생성된 슈퍼픽셀 보다 정확하게 경계 정보를 보존하는 것을 보여준다.

딥러닝을 이용한 실시간 말벌 분류 시스템 (Real Time Hornet Classification System Based on Deep Learning)

  • 정윤주;이영학;이스라필 안사리;이철희
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1141-1147
    • /
    • 2020
  • 말벌 종은 모양이 매우 유사하기 때문에 비전문가가 분류하기 어렵고, 객체의 크기가 작고 빠르게 움직이기 때문에 실시간으로 탐지하여 종을 분류하는 것은 더욱 어렵다. 본 논문에서는 바운딩 박스를 이용한 딥러닝 알고리즘을 기반으로 말벌 종을 실시간으로 분류하는 시스템을 개발하였다. 훈련 영상의 레이블링 작업 시 바운딩 박스 안에 포함되는 배경 영역을 최소화하기 위하여 말벌의 머리와 몸통 부분만을 선택하는 방법을 제안한다. 또한 실시간으로 말벌을 탐지하고 그 종을 분류할 수 있는 최선의 알고리즘을 찾기 위하여 기존의 바운딩 박스 기반 객체 인식 알고리즘들을 실험을 통하여 비교한다. 실험 결과 컨볼루션 레이어의 활성함수로 mish 함수를 적용하고, 객체 검출 블록 전에 공간집중모듈(Spatial Attention Module, SAM)을 적용한 YOLOv4 모델을 사용하여 말벌 영상을 테스트한 경우 평균 97.89%의 정밀도(Precision)와 98.69%의 재현율(Recall)을 나타내었다.

실시간 이미지 처리 방법을 이용한 개선된 차선 인식 경로 추종 알고리즘 개발 (Development of an Improved Geometric Path Tracking Algorithm with Real Time Image Processing Methods)

  • 서은빈;이승기;여호영;신관준;최경호;임용섭
    • 자동차안전학회지
    • /
    • 제13권2호
    • /
    • pp.35-41
    • /
    • 2021
  • In this study, improved path tracking control algorithm based on pure pursuit algorithm is newly proposed by using improved lane detection algorithm through real time post-processing with interpolation methodology. Since the original pure pursuit works well only at speeds below 20 km/h, the look-ahead distance is implemented as a sigmoid function to work well at an average speed of 45 km/h to improve tracking performance. In addition, a smoothing filter was added to reduce the steering angle vibration of the original algorithm, and the stability of the steering angle was improved. The post-processing algorithm presented has implemented more robust lane recognition system using real-time pre/post processing method with deep learning and estimated interpolation. Real time processing is more cost-effective than the method using lots of computing resources and building abundant datasets for improving the performance of deep learning networks. Therefore, this paper also presents improved lane detection performance by using the final results with naive computer vision codes and pre/post processing. Firstly, the pre-processing was newly designed for real-time processing and robust recognition performance of augmentation. Secondly, the post-processing was designed to detect lanes by receiving the segmentation results based on the estimated interpolation in consideration of the properties of the continuous lanes. Consequently, experimental results by utilizing driving guidance line information from processing parts show that the improved lane detection algorithm is effective to minimize the lateral offset error in the diverse maneuvering roads.

깊이 영상 카메라로부터 획득된 3D 영상의 품질 향상 방법 (A method of improving the quality of 3D images acquired from RGB-depth camera)

  • 박병서;김동욱;서영호
    • 한국정보통신학회논문지
    • /
    • 제25권5호
    • /
    • pp.637-644
    • /
    • 2021
  • 일반적으로, 컴퓨터 비전, 로보틱스, 증강현실 분야에서 3차원 공간 및 3차원 객체 검출 및 인식기술의 중요성이 대두되고 있다. 특히, 마이크로소프트사의 키넥트(Microsoft Kinect) 방식을 사용하는 영상 센서를 통하여 RGB 영상과 깊이 영상을 실시간 획득하는 것이 가능해짐으로 인하여 객체 검출, 추적 및 인식 연구에 많은 변화를 가져오고 있다. 본 논문에서는 다시점 카메라 시스템 상에서의 깊이 기반(RGB-Depth) 카메라를 통해 획득된 영상을 처리하여 3D 복원 영상의 품질을 향상하는 방법을 제안한다. 본 논문에서는 컬러 영상으로부터 획득한 마스크 적용을 통해 객체 바깥쪽 잡음을 제거하는 방법과 객체 안쪽의 픽셀 간 깊이 정보 차이를 구하는 필터링 연산을 결합하여 적용하는 방법을 제시하였다. 각 실험 결과를 통해 제시한 방법이 효과적으로 잡음을 제거하여 3D 복원 영상의 품질을 향상할 수 있음을 확인하였다.

스마트 감시 애플리케이션을 위해 Deep CNN을 이용한 폭력인식 (Violence Recognition using Deep CNN for Smart Surveillance Applications)

  • 파튜 유 민 울라;아민 울라;칸 무함마드;이미영;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.53-59
    • /
    • 2018
  • 최근 컴퓨터 비전 기술의 발전으로 스마트도시에서는 합리적인 정확도로 복잡한 동작을 인식할 수 있다. 이와는 대조적으로, 싸움과 칼에 관련된 사건과 같은 폭력적인 인식은 관심을 덜 이끌었다. 시각적인 감시 능력은 거리나 교도소에서의 싸움을 감지하는데 사용될 수 있다. 이 논문에서 우리는 감시 카메라에 대한 심층 학습 기반의 폭력 인식 방법을 제안했다. 컨볼루션 뉴럴 네트워크(CNN) 모델은 폭력 인식을 위한 싸움과 칼의 벤치마크 데이터 셋에 대해 훈련하고 세부적으로 조정된다. 비정상적인 이벤트가 감지되면 가장 가까운 경찰서로 경보를 보내는 즉각적인 조치를 취할 수 있다. 제안된 방법의 실험 결과는 99.21%의 정확도를 달성함으로써 다른 최첨단 CNN모델을 능가했다.

이어핀 삽입 자동화 시스템을 위한 템플릿 매칭 기반 삽입 위치 판별 방법 (Hole Identification Method Based on Template Matching for the Ear-Pins Insertion Automation System)

  • 백종환;이재열;정명수;장민우;신동호;서갑호;홍성호
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권1호
    • /
    • pp.7-14
    • /
    • 2021
  • 장신구 산업은 인건비의 비중이 높고 노동자의 역량에 따라 제품의 제작 작업 시간 및 품질의 편차가 심하다. 이에 산업계의 수요에 맞추어 귀걸이 제품을 위한 실리콘 몰드 표면 지름 0.75mm 홀에 이어핀을 삽입하는 공정을 자동화하기 위하여 삽입 자동화 시스템이 연구되고 있다. 본 논문에서는 다양한 실리콘 몰드에 대한 이어핀 삽입 공정 자동화를 위하여 산업용 카메라를 이용한 이진화 및 템플릿 매칭 기법 기반의 이어핀 삽입 위치 검출 방법을 기술한다. 제안하는 방법은 입력 영상을 이진화와 템플릿 매칭을 이용하여 홀의 위치와 개수를 판단할 수 있다. 성능 시험을 통하여, 적용한 방법은 98.5%의 정확도와 Otsu 방법에 비해 0.5초 빠른 처리속도를 가지는 것을 보였다. 비전 기반 이어핀 삽입 자동화 시스템을 통해 원가 절감 및 작업 시간 절감과 생산성 향상에 기여할 수 있을 것이다.

필터링 기반의 잡음 제거를 통한 피부 영역의 추출 (Extraction of Skin Regions through Filtering-based Noise Removal)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.672-678
    • /
    • 2020
  • 최근 들어 초고속의 영상 촬영이 가능한 저가이며 성능이 우수한 카메라가 등장함에 따라서 물체의 미세한 움직임까지 정확하게 묘사한 초고속의 영상들이 보편화되고 있는 실정이다. 본 논문에서는 빠른 속도로 입력되는 초고속의 영상으로부터 예기치 않게 포함된 잡음을 제거한 다음, 잡음이 제거된 영상으로부터 피부 영역과 같이 개인 정보를 대표할 수 있는 관심 영역을 추출하는 방법을 제안한다. 본 논문에서는 먼저 입력받은 초고속의 영상으로부터 비정상적인 전기 신호로 인해 발생한 잡음을 양방향의 필터를 적용하여 제거한다. 그런 다음, 사전 학습을 통해 생성한 색상 분포 모델을 사용하여 영상 내에 포함된 개인 정보를 대표하는 관심 영역인 피부 영역을 정확하게 추출한다. 실험 결과에서는 본 연구에서 소개된 알고리즘이 여러 가지의 초고속 영상으로부터 잡음을 제거한 다음 관심 영역을 강인하게 추출한다는 것을 보여준다. 본 논문에서 제시된 접근 방법은 영상 전처리, 잡음 제거, 목표 영역의 추적 및 감시 등과 같은 컴퓨터 비전 및 패턴인식과 관련된 여러 가지의 응용 분야에서 유용하게 사용될 것으로 예상된다.

적응적 가우시안 혼합 모델을 이용한 불법주정차 무인단속시스템 (Unmanned Enforcement System for Illegal Parking and Stopping Vehicle using Adaptive Gaussian Mixture Model)

  • 염성관;신성윤;신광성;박상현
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.396-402
    • /
    • 2021
  • 최근 스마트 도시를 구축하기 위해 무인 차량 관제 시스템의 보급이 활성화 되고 있다. 본 논문은 적응적 배경영상 모델링 방법을 이용한 불법주정차 무인단속시스템에 관한 것으로서, 적응적 가우시안 혼합 모델로 배경 영상을 모델링할 때, 이동 물체의 상황 변화에 따라 전역적으로 배경 영상을 업데이트하거나 국소적으로 배경 영상을 업데이트하는 방법에 대해 기술한다. 특히, 이동 물체가 배경 영상에 미치는 영향을 최소화하는 방법과 배경 영상을 정확하게 업데이트하기 위한 방법을 제안한다. 본 논문에서는 시스템의 구현을 통해 제안하는 시스템이 이동하고 있는 물체 또는 정지상태의 물체를 신속하고 정확하게 구분할 수 있음을 증명하였다.

객체 인식 정확도 개선을 위한 이미지 초해상도 기술 (Image Super-Resolution for Improving Object Recognition Accuracy)

  • 이성진;김태준;이충헌;유석봉
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.774-784
    • /
    • 2021
  • 객체 검출 및 인식 과정은 컴퓨터비전 분야에서 매우 중요한 과업으로써, 관련 연구가 활발하게 진행되고 있다. 그러나 실제 객체 인식 과정에서는 학습된 이미지 데이터와 테스트 이미지 데이터간 해상도 차이로 인하여 인식기의 정확도 성능이 저하되는 문제가 종종 발생한다. 이를 해결하기 위해 본 논문에서는 객체 인식 정확도 향상을 위한 이미지 초해상도 기법을 제안하여 객체 인식 및 초해상도 통합 프레임워크를 설계하고 개발하였다. 세부적으로는 11,231장의 차량 번호판 훈련용 이미지를 웹 크롤링, 인조데이터 생성 등을 통해 자체적으로 구축하고, 이를 활용하여 이미지 좌우 반전에 강인하도록 목적함수를 정의하여 이미지 초해상도 인공 신경망을 훈련시켰다. 제안 방법의 성능을 검증하기 위해 훈련된 이미지 초해상도 및 번호 인식기 1,999장의 테스트 이미지에 실험하였고, 이를 통해 제안한 초해상도 기법이 문자 인식 정확도 개선 효과가 있음을 확인하였다.