• 제목/요약/키워드: 이미지 결함 검출

검색결과 358건 처리시간 0.029초

발화구간 검출을 위해 학습된 CNN 기반 입 모양 인식 방법 (Lip Reading Method Using CNN for Utterance Period Detection)

  • 김용기;임종관;김미혜
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.233-243
    • /
    • 2016
  • 소음환경에서의 음성인식 문제점으로 인해 1990년대 중반부터 음성정보와 영양정보를 결합한 AVSR(Audio Visual Speech Recognition) 시스템이 제안되었고, Lip Reading은 AVSR 시스템에서 시각적 특징으로 사용되었다. 본 연구는 효율적인 AVSR 시스템을 구축하기 위해 입 모양만을 이용한 발화 단어 인식률을 극대화하는데 목적이 있다. 본 연구에서는 입 모양 인식을 위해 실험단어를 발화한 입력 영상으로부터 영상의 전처리 과정을 수행하고 입술 영역을 검출한다. 이후 DNN(Deep Neural Network)의 일종인 CNN(Convolution Neural Network)을 이용하여 발화구간을 검출하고, 동일한 네트워크를 사용하여 입 모양 특징 벡터를 추출하여 HMM(Hidden Markov Mode)으로 인식 실험을 진행하였다. 그 결과 발화구간 검출 결과는 91%의 인식률을 보임으로써 Threshold를 이용한 방법에 비해 높은 성능을 나타냈다. 또한 입모양 인식 실험에서 화자종속 실험은 88.5%, 화자 독립 실험은 80.2%로 이전 연구들에 비해 높은 결과를 보였다.

정지영상에서 저작권 보호 및 위변조 검출을 위한 하이브리드 디지털 워터마킹 기법 (A Hybrid Digital Watermarking Technique for Copyright Protection and Tamper Detection on Still images)

  • 유길상;송근실;최혁;이원형
    • 인터넷정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.27-34
    • /
    • 2003
  • 오늘날, 디지털 이미지 도구 프로그램은 전문가가 아니더라도 누구나 개인용 컴퓨터를 이용하여 쉽고 빠르게 영상을 조작하여 사용할 수 있게 되었다. 그 결과 디지털 컨텐츠의 저작권 보호 및 변조된 영상의 무결성을 보증하는 것이 주요 문제가 되고있다. 본 논문에서는 워터마크 정보는 물론 조작된 영상의 위치까지 검출할 수 있는 하이브리드 워터마킹 알고리즘을 설계하였다. 이를 위해 이산 웨이블릿 변환을 이용하여 영상의 저주파 대역에 PN-시권스를 워터마크로 삽입하였고, 원영상 없이도 검출이 가능하게 하였다. 워터마크 신호를 파괴하기 위한 다양한 공격의 실험 결과 제안한 알고리즘은 강인성을 나타내었고 추출 후 변조된 영상의 위치도 확인할 수 있었다.

  • PDF

SAD 알고리즘을 이용한 차량 속도 측정 (Vehicle Speed Measurement using SAD Algorithm)

  • 박성일;문종대;고영혁
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.73-79
    • /
    • 2014
  • 본 논문에서는 비디오 시?스에서 차들을 추적하고 검출하기 위해서 비디오와 이미지 처리를 활용하여 고속도로 및 일반 도로상의 교통흐름과 차량의 속도를 계측하는 기법을 제안했다. 제안된 기법은 배경이미지를 평가하기 위해서 비디오 스트림의 처음 프레임을 활용하였다. 비쥬얼 추적 시스템은 프레임 절대 차의 합을 토대로 한 단순한 알고리즘이다. 그것은 각 비디오 프레임으로부터 전경 이미지를 산출하기 위해서 배경화면을 빼고, 각 전경 이미지에 형태적 제거를 실행하고 임계값화 함으로서 임계치 윈도우에서 보인 이진이미지를 산출한다. 첫 번째 하얀 라인과 두번째 하얀 라인사이 거리를 측정하여 차의 위치를 찾았다. 평균속도는 물체의 위치 변화를 장소가 변하는 시간으로 나눔으로서 정의했다. 제시된 기법의 결과는 측정된 데이터와 잘 일치되었고, 실시간으로 결과를 본다.

Mobile Display 장치를 위한 Adaptive-Filter 기반형 선명도 향상 알고리즘의 하드웨어 구현 (Implementation of Sharpness-Enhancement Algorithm based on Adaptive-Filter for Mobile-Display Apparatuses)

  • 임정욱;송진근;이성진;민경중;강봉순
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.109-112
    • /
    • 2007
  • 디지털 카메라의 출현과 Mobile 장비에서의 카메라 적용으로 인하여 디지털화된 이미지의 화질개선이 지속적으로 연구되고 있다. 특히, 센서로부터 입력된 이미지는 영상으로 출려되기 전 ISP(Image Signal Process) 과정을 거치게 되는데, 이 단계에서 이미지는 고주파 성분의 Noise 제거를 위한 LPF(Low Pass Filter)에 의해 고역의 주파수 성분이 상쇄되는 결과를 가진다. 이에 본 논문에서는 LPF(Low Pass Filter)에 의해 고역의 주파수 성분이 상쇄되는 결과를 가진다. 이에 본 논문에서는 LPF에 의해 Blurring된 이미지를 윤곽선 검출 알고리즘을 사용하지 않고, 이미지 윤곽선이 가질 수 있는 다양한 상태를 고려하여 적절한 계수를 가지는 Adaptive-HPF(High Pass Filter)를 사용함으로써 더욱 선명한 영상을 출력하는 알고리즘을 제안한다. 제안된 알고리즘의 하드웨어 구현시 Total Gate Count는 8700여 개로 Mobile 장치에 적용될 수 있다는 것을 검증하였다.

  • PDF

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.

영상인식 기반의 위치기반서비스를 위한 실내위치인식 시스템 (Indoor Location Positioning System for Image Recognition based LBS)

  • 김종배
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권2호
    • /
    • pp.49-62
    • /
    • 2008
  • 본 논문은 영상인식 기반의 위치기반서비스를 위한 실내위치인식 시스템을 제안한다. 제안한 시스템은 실내 환경에 적용 가능한 비젼 기반의 위치 인식 시스템으로 위치 인식 결과를 사용자의 시야에 자연스럽게 중첩함으로써 증강 현실을 구현한다. 제안한 방법은 기존의 위치인식 방법과 달리 부가적 인 위치 인식 하드웨어 사용없이 컴퓨터 비젼 기술을 이용한 위치 인식 방법이다. 이를 위해 사용자에 의해 착용된 모바일 PC와 함께 카메라를 통해 영상을 입력하고, 입력된 영상에서 패턴매칭과 위치모델을 참조하여 사용자의 위치를 판별한다. 제안한 시스템은 이미지 시퀀스 매칭 방법과 마크 검출을 통해 위치를 추정하고, 사전에 정의한 위치모델을 사용함으로써 최종 위치를 인식한다. 제안한 시스템은 마크 검출을 위해 적응적 암계치 방법을 제안하고, 위치 판별을 위해 위치모델을 사용함으로써 보다 정확하고 효율적인 위치 인식 결과를 얻을 수 있다. 실내 환경의 위치 인식을 위해 제안한 시스템을 적용한 결과, 실내 환경에 대해 익숙지 않은 사용자들에게 효과적으로 위치인식 서비스에 적용할 수 있다.

  • PDF

딥러닝 기반의 의미론적 영상 분할을 이용한 주행 보조 시스템 (Driving Assist System using Semantic Segmentation based on Deep Learning)

  • 김정환;이태민;임준홍
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.147-153
    • /
    • 2020
  • 기존의 차선 검출 방법들은 곡률과 날씨 변화가 큰 도로 환경에서 검출률이 낮다. 확률적 허프 변환을 이용한 방법은 에지와 직선의 각도를 이용해서 차선을 검출함으로 곡선과 악천후일 때 검출률이 낮다. 슬라이딩 윈도우 방법은 윈도우로 이미지를 분할해서 검출하기 때문에 곡선 형태의 차선도 검출하지만 어파인 변환을 사용하기 때문에 도로의 경사율에 영향을 받는다. 본 논문에서는 다양한 외부 환경에서도 차선을 강인하게 검출하고 장애물을 회피하기 위한 딥러닝 기반의 주행 보조 시스템을 제안한다. VGG-16기반의 SegNet으로 입력 영상을 의미론적으로 분할해서 차선을 검출한다. 검출한 차선과의 이격거리를 계산하고 안전범위를 산출해서 차량이 차선의 중앙을 주행하도록 제어한다. 또한, 전방의 미확인 물체와 충돌이 예상되면 운전자에게 경보를 주고 Adaptive-MPC로 차량을 제어해서 충돌을 회피하는 알고리즘도 제안한다. CARLA로 시뮬레이션한 결과 제안한 알고리즘은 곡률이 큰 차선과 다양한 환경에서도 강인하게 차선을 검출하고 전방의 안전범위를 계산하여 충돌을 회피하는 것을 볼 수 있다.

개선된 Active Net Model을 이용한 이미지 영역검출 (Improvement of Active Net model for Region Detection in an Image)

  • 남기환;배철수;설증보;나상동
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.243-246
    • /
    • 2004
  • 본 논문은 영상인식 방법으로 개선된 Active Model을 이용한 방법을 제안한다. 제안된 방법은 모든 격자 블록 영역이 동일한 구조를 가지며, 기존의 Active net에서 문제가 되었던 목표물을 탐지하는 능력이 개선되었다. 실험 결과로서 제안된 방법이 수직, 수평 방향에서 목표물 포착에 효과적임을 보여주었으며, 실제 도로 영상에 적용한 결과 제안한 방법의 효율성을 입증할 수 있었다.

  • PDF

CMOS 이미지 센서에서의 효율적인 불량화소 검출을 위한 알고리듬 및 하드웨어 설계 (An Efficient Dead Pixel Detection Algorithm Implementation for CMOS Image Sensor)

  • 안지훈;신성기;이원재;김재석
    • 대한전자공학회논문지SD
    • /
    • 제44권4호
    • /
    • pp.55-62
    • /
    • 2007
  • 본 논문에서는 이미지 센서에서 불량 화소를 자동으로 검출하기 위한 알고리듬을 제안하고, 그에 따른 하드웨어 구조를 제시하였다. 기존에 제안된 방법은 영상의 특징을 고려하지 않고 단순히 주위 화소들 값과의 차이가 일정 이상이면 불량 화소로 간주하였다. 그러나 이러한 방식은 영상에 따라서 불량 화소가 아닌 화소를 불량 화소로 간주하거나, 불량 화소를 정상 화소로 판단하는 일이 발생한다. 이러한 단점을 보완하기 위해 여러 프레임에 걸쳐 확인하는 방법도 제안되었으나, 불량 화소 검출시간이 오래 걸리는 단점이 있다. 이러한 기존 방식의 단점을 해결하기 위해, 제안된 불량 화소 검출 기법은 단일화면 내에서는 경계 영역을 고려하여 불량 화소를 검출하고, 여러 프레임에 걸친 확인 과정을 거치되, 화면 전환 여부를 확인하여 화면 전환이 일어날 때마다 검출된 화소의 불량 화소 여부를 판단하고 확인한다. 실험 결과, 단일 화면 내에서의 검출률은 기존 대비 6% 향상되었고, 100%의 불량화소 검출까지 걸리는 시간은 평균적으로 3배 이상 단축되었다. 본 논문에서 제안된 알고리듬은 하드웨어로 구현되었고, 하드웨어 구현 시 색 보간 블록에서 사용되는 경계 영역 표시자를 그대로 활용함으로써 0.25um 표준 셀 라이브러리를 이용하여 합성했을 때, 5.4K gate의 낮은 복잡도로 구현할 수 있었다.

딥러닝 기반의 돌출 객체 검출을 위한 Saliency Attention 방법 (Saliency Attention Method for Salient Object Detection Based on Deep Learning)

  • 김회준;이상훈;한현호;김진수
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.39-47
    • /
    • 2020
  • 본 논문에서는 이미지에서 돌출되는 객체를 검출하기 위해 Saliency Attention을 이용한 딥러닝 기반의 검출 방법을 제안하였다. 돌출 객체 검출은 사람의 시선이 집중되는 물체를 배경으로부터 분리시키는 것이며, 이미지에서 관련성이 높은 부분을 결정한다. 객체 추적 및 검출, 인식 등의 다양한 분야에서 유용하게 사용된다. 기존의 딥러닝 기반 방법들은 대부분 오토인코더 구조로, 특징을 압축 및 추출하는 인코더와 추출된 특징을 복원 및 확장하는 디코더에서 많은 특징 손실이 발생한다. 이러한 손실로 돌출 객체 영역에 손실이 발생하거나 배경을 객체로 검출하는 문제가 있다. 제안하는 방법은 오토인코더 구조에서 특징 손실을 감소시키고 배경 영역을 억제하기 위해 Saliency Attention을 제안하였다. ELU 활성화 함수를 이용해 특징 값의 영향력을 결정하며 각각 정규화된 음수 및 양수 영역의 특징값에 Attention을 진행하였다. 제안하는 Attention 기법을 통해 배경 영역을 억제하며 돌출 객체 영역을 강조하였다. 실험 결과에서는 제안하는 방법이 기존 방법과 비교하여 향상된 검출 결과를 보였다.