• Title/Summary/Keyword: 인식적경계

Search Result 482, Processing Time 0.024 seconds

An Efficient Approach to Quality Check of Image for Iris Recognition (홍채인식을 위한 효과적인 영상 선택 방법)

  • 이현주;이관용;변혜란;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.535-537
    • /
    • 2001
  • 본 논문에서는 홍채인식 시스템에서의 효율적으로 영상을 획득하기 위한 방법으로, 고정초점 카메라로부터 연속적으로 입력되는 복수 개의 영상 중 간결한 적합성 평가 과정을 통해 인식에 효율적으로 사용될 수 있는 영상을 선정하는 방법을 제안한다. CCD 카메라에 의해 영상을 자동으로 획득하기 위해서는 주어진 시간 내에 복수 개의 영상들을 입력받아 적절한 처리 과정을 수행하게 된다. 이 때 모든 입력 영상에 대해 인식 과정을 거치는 대신, 실시간의 영상 적합성 처리를 통해 동영상 프레임의 순위를 결정한 후 인식 시스템에 제공하는 방법을 사용한다. 이와 같은 과정을 통해 처리 시간의 단축과 동시에 인식기의 인식성능을 높일 수 있게 된다. 이를 위해 본 논문에서는 입력 영상의 화소 값 분포와 경계 값의 성분비를 이용하여 빠르고 쉽게 영상을 선정하는 기법을 제안한다.

  • PDF

Perceptual Model-Based Image Transcoding for UMA (지각도 모델에 근거한 UMA를 위한 영상 변환 기법)

  • 이건섭;김유남;설상훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.356-358
    • /
    • 2000
  • 본 논문에서는 인간의 시각적인 감각을 멀티미디어 컨텐츠의 UMA 변환 서비스에 적용하여 영상의 다양한 디스플레이 크기의 사용자 단말기에 맞게 효율적으로 변화(해상도 축소나 Cropping) 기법을 제안하고 있다. 즉, 영상의 중요한 객체를 사각형 경계박스로 표시한 후 각각의 객체의 저자의 의도대로 사용자가 지각적으로 인식할 수 있는 최소의 공간 해상도 축소 정보를 정의하여, 영상의 변환 시 각각 객체를 사용자가 충분히 인식할 수 있는 한계치로 사용하여 효율적인 UMA 서비스를 보장하는 사용자 자원 재분배 기법을 제안한다. 또한, 본 논문에서 제안된 알고리즘을 기존의 방식과 비교하여 실험적으로 그 장단점을 비교한다.

  • PDF

A License-Plate Image Binarization Algorithm Based on Least Squares Method for License-Plate Recognition of Automobile Black-Box Image (블랙박스 영상용 자동차 번호판 인식을 위한 최소 자승법 기반의 번호판 영상 이진화 알고리즘)

  • Kim, Jin-young;Lim, Jongtae;Heo, Seo Weon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.22 no.5
    • /
    • pp.747-753
    • /
    • 2018
  • In the license-plate recognition systems for automobile black Image, the license-plate image frequently has a shadow due to outdoor environments which are frequently changing. Such a shadow makes unpredictable errors in the segmentation process of individual characters and numbers of the license plate image, and reduces the overall recognition rate. In this paper, to improve the recognition rate in these circumstance, a license-plate image binarization algorithm is proposed removing the shadow effectively. The propose algorithm splits the license-plate image into the regions with the shadow and without. To find out the boundary of two regions, the algorithm estimates the curve for shadow boundary using the least-squares method. The simulation is performed for the license-plate image having its shadow, and the results show much higher recognition rate than the previous algorithm.

Efficient Iris Region Detection (효율적인 홍채영역 검출)

  • 오종환;박철현;오상근;박길흠
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.267-270
    • /
    • 2001
  • 홍채인식 시스템에서 입력된 영상으로부터 정합(matching)에 사용될 홍채 영역을 추출해 내는 과정은 필수적인 과정으로 빠른 처리 속도와 정확성을 요구한다. 기존의 원형검출기나 허프(Hough) 변환을 이용한 방법 등은 홍채의 바깥쪽과 안쪽 경계를 비교적 정확하게 검출해내는 장점이 있으나 탐색영역이 커서 수행시 간이 매우 많이 걸리는 단점이 있다. 따라서 본 논문에서는 이진화와 형태학적 연산(morphology)을 이용하는 새로운 탐색 영역 단축 방법을 제안한다. 제안한 방법은 기존의 홍채영역 검출 방법에 적용할 경우 수행 시간을 효율적으로 단축시킬 수 있다. 검출된 영역에 대해서 주성분 분석법(principal component analysis, PCA)을 이용해 매칭을 수행한 결과 약 95%의 인식율을 나타내었다.

  • PDF

Phoneme Segmentation Using Voice/Unvoiced/Silence Classifier and Spectral Information (유성/무성/묵음 분류기와 주파수 스펙트럼을 이용한 음소 경계 검출)

  • Lee Sang-Rae;Han Hyun-Bae;Hahn Minsoo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.86-91
    • /
    • 1999
  • 본 논문에서는 유성/무성/묵음 분류기와 주파수 스펙트럼 비교를 통하여 음소 경계 검출기를 구현하였다. 음소경계 검출은 음성 인식, 합성 및 분석 둥의 분야에서 매우 중요하다 유성/무성/묵음 분류기를 이용하여 유성음으로 판별되는 구간은 스펙트럼 비교를 통하여 음소 단위로 세분하였고 무성음으로 판별되는 구간은 한국어의 음성 특성을 고려하여 하나의 음소 단위로 간주하였다. 유성음 구간에 대한 스펙트럼 비교는 수정된 Itakura-Saito distance measure 와 Euclidean MFCC(Mel Frequency Cepstrum Coeffcients) distance measure를 사용하였고 비교 프레임은한 프레임을 건너 윈 경우가 가장 결과가 좋았다. 최종적으로 평균 음소 길이 정보를 이용하여 음소의 경계로 검출된 구간을 더 세분하거나 통합하였다. 유성/무성/묵음 분류기의 경우는 사무실에서 녹음한 고립단어에 대하여 $94.247\%$의 정확도를 보였고 음소 경계 검출의 경우는 $72.8\%$의 정확도를 보였다.

  • PDF

Shot Boundary Detection Model using Knowledge Distillation (지식의 증류기법을 이용한 샷 경계 검출 모델)

  • Park, Sung Min;Yoon, Ui Nyoung;Jo, Geun-Sik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.29-31
    • /
    • 2019
  • 샷 경계 검출(Shot Boundary Detection)은 영상 콘텐츠 분석을 위한 필수적인 기술이며, 다양한 방식으로 편집된 영상의 샷 경계를 정확하게 검출하기 위한 연구가 지속되어 왔다. 그러나 기존에 연구들은 고정된 샷 경계 검출 알고리즘이나 매뉴얼한 작업과 같이 학습이 불가능한 과정이 포함되어 있어 성능 개선에 한계가 있었다. 본 논문에서는 이러한 과정을 제거한 End-to-End 모델을 제안한다. 제안하는 모델은 시공간 정보 추출성능을 높이기 위해 행동 인식 데이터셋을 이용한 전이학습을 사용하고, 샷 경계 검출 성능을 높이기 위해 개선된 지식의 증류기법(Knowledge Distillation)을 결합한다. 제안하는 모델은 ClipShots 데이터셋에서 DeepSBD 에 비해 cut transition 과 gradual transition 이 각각 5.4%, 41.29% 높은 성능을 보였고, DSM 과의 비교에서 cut transition 의 정확도가 1.3% 더 높은 결과를 보였다.

  • PDF

Performance Improvement of Connected Digit Recognition by Considering Phoneme Variations in Korean Digit. (한국어 숫자음에서의 음운변화를 고려한 연결숫자 인식의 성능향상)

  • Song Myung Gyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.105-108
    • /
    • 2001
  • 한국어 숫자는 각 숫자가 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 한편 연속적인 숫자의 발성을 기대하는 인식시스템에 반하여 일부 사용자는 숫자들을 고려시켜서 발성하기도 한다. 이는 연결숫자의 음운현상만을 고려한 인식 시스템에서는 성능저하의 한 원인이 된다 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운 변화를 고려하여 변이음군을 정하였으며, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수 할 수 있도록 인식 네트웍을 구성하는 방식을 검토하였다. 전화망 4연숫자음을 이용한 화자독립 인식실험을 통해서 한국어 숫자에서 자주 오인식 되는 '이', '오', '일' 인식 성능이 각각 $4..2\%$, $4.2\%$, $2.9\%$씩 향상되었으며, 인식속도도 $33\%$의 개선이 있었다

  • PDF

A Morphology Technique-Based Boundary Detection in a Two-Dimensional QR Code (2차원 QR코드에서 모폴로지 기반의 경계선 검출 방법)

  • Park, Kwang Wook;Lee, Jong Yun
    • Journal of Digital Convergence
    • /
    • v.13 no.2
    • /
    • pp.159-175
    • /
    • 2015
  • The two-dimensional QR code has advantages such as directional nature, enough data storage capacity, ability of error correction, and ability of data restoration. There are two major issues like speed and correctiveness of recognition in the two-dimensional QR code. Therefore, this paper proposes a morphology-based algorithm of detecting the interest region of a barcode. Our research contents can be summarized as follows. First, the interest region of a barcode image was detected by close operations in morphology. Second, after that, the boundary of the barcode are detected by intersecting four cross line outside in a code. Three, the projected image is then rectified into a two-dimensional barcode in a square shape by the reverse-perspective transform. In result, it shows that our detection and recognition rates for the barcode image is also 97.20% and 94.80%, respectively and that outperforms than previous methods in various illumination and distorted image environments.

A Study on Preprocessing for Efficient Character Recognization of Shipping Container Image (운송 컨테이너 영상의 효율적인 문자인식을 위한 전처리에 관한 연구)

  • Choi, Jae-Young;Kim, Nak-Bin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.1077-1083
    • /
    • 2000
  • 본 논문은 운송 컨테이너 식별자의 자동화 처리를 위한 문자 인식의 단계중 최종 문자 인식 전단계 까지의 처리 과정을 컨테이너의 특성에 맞게 제안하였으며, 이러한 전처리 과정은 문자 인식 시스템의 성능에 중요한 영향을 미친다. 제안한 방법은 먼저 입력된 컨테이너 컬러 영상을 명암 영상으로 바꾸고 전체 영상중 인식에 필요한 식별자 영역만을 경계선 검출과 형태학적 연산을 이용하여 추출한다. 이어서 다양한 배경색과 문자색을 판단하여 일반 문서와 같이 일관성있게 통일한 후, DCT를 이용한 명암도별 이진영역으로 분할한 후에 Otsu방법과 새로운 이진화방법을 자동으로 선택하여 효율적인 이진화가 이루어지도록 하였다. 이렇게 얻어진 이진 영상은 문자인식 단계로 넘어갈 수 있도록 개별 문자로 분할한다. 이 방법은 컨테이너 영상의 불균등한 배경색과 잡음으로 인하여 문자인식에 오류가 생기는 단점을 보완하였으며 컨테이너 특성을 최대한 반영함으로써 효과적인 전처리 결과를 얻을 수 있었다. 또한, 제안한 방법의 응용은 컨테이너 이외의 다른 상황에서도 매우 효과적으로 사용될 수 있으리라 본다.

  • PDF

Phoneme Segmentation in Consideration of Speech feature in Korean Speech Recognition (한국어 음성인식에서 음성의 특성을 고려한 음소 경계 검출)

  • 서영완;송점동;이정현
    • Journal of Internet Computing and Services
    • /
    • v.2 no.1
    • /
    • pp.31-38
    • /
    • 2001
  • Speech database built of phonemes is significant in the studies of speech recognition, speech synthesis and analysis, Phoneme, consist of voiced sounds and unvoiced ones, Though there are many feature differences in voiced and unvoiced sounds, the traditional algorithms for detecting the boundary between phonemes do not reflect on them and determine the boundary between phonemes by comparing parameters of current frame with those of previous frame in time domain, In this paper, we propose the assort algorithm, which is based on a block and reflecting upon the feature differences between voiced and unvoiced sounds for phoneme segmentation, The assort algorithm uses the distance measure based upon MFCC(Mel-Frequency Cepstrum Coefficient) as a comparing spectrum measure, and uses the energy, zero crossing rate, spectral energy ratio, the formant frequency to separate voiced sounds from unvoiced sounds, N, the result of out experiment, the proposed system showed about 79 percents precision subject to the 3 or 4 syllables isolated words, and improved about 8 percents in the precision over the existing phonemes segmentation system.

  • PDF