• 제목/요약/키워드: Recognition Speed

검색결과 770건 처리시간 0.031초

인쇄 악보의 인식과 병렬 알고리즘에 관한 연구 (A Study of Printed Score Recognition and its Parallel Algorithm)

  • 황영길;김성천
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.959-970
    • /
    • 1994
  • 본 논문에서는 핸디 스캐너를 사용하여 인쇄 악보를 읽어들여서 이를 최종적으로 매쉬 컴퓨터에서 병렬 수행 하도록 한다. 일차적으로 특정 패턴에 따란 분류하고, 지식을 기반으로하여 인식하게 된다. 본 논문에서 제안하는 알고리즘은 전처리 과정을 최소화하고 단순한 연산을 사용한다. 인쇄 악보의 악상 기호 크기는 여러 가지가 허용되도록하며 악상 기호의 종류의 다양성 때문에 모든 기호를 인식하는 것은 어려운 일이므로 우선 사용 빈도수가 높은 몇가지 기호를 인식하도록 한다. 인식된 결과는 미디 표준파일 형식으로 변환하도록 한다. 영상 처리의 고속성이 요구되므로 다중프로세서를 갖는 병렬처리 시스템이 필요하다. 이차원적인 디지털화된 영상은 SIMD 메쉬 컴퓨터 구조에서 처리되기에 적합하므로 이 구조에 대해서 설명하고 n의 프로세서를 갖는 SIMD 메쉬 컴퓨터 구조상에서의 시간복잡도가 0(n)인 병렬 알고리즘을 기술한다.

  • PDF

사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구 (A Study on VoiceXML Application of User-Controlled Form Dialog System)

  • 권형준;노용완;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML은 음성을 통해 웹 자원 탐색을 제공하기 위한 목적으로 설계된 XML 기반의 새로운 마크업 언어이다. VoiceXML로 만들어진 어플리케이션은 기계 주도 폼 다이얼로그 구조와 상호 주도 폼 다이얼로그 구조로 분류된다. 이와 같은 다이얼로그 구조들은 어플리케이션 개발자에 의해 서비스 시나리오가 결정되기 때문에 사용자가 자유롭게 웹 자원을 탐색하는 서비스를 구축할 수 없다. 본 논문에서는 사용자의 의도에 따라 서비스 시나리오가 결정되는 음성 웹 서비스의 구축을 위해 사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션 구조를 제안한다. 제안하는 어플리케이션은 사용자에 의해 요청된 정보로부터 인식 후보들을 자동적으로 검출하여 음성 앵커로 사용하고 각각의 음성 앵커론 새로운 음성 노드로 연결한다. 제안하는 시스템의 예로 IT 용어사전을 내장한 뉴스 서비스를 구현하여 음성 앵커의 검출 및 등록 여부를 확인하였고, 음성 인식률 및 사용자가 의도한 정보를 성공적으로 제공했는지 판단하는 척도가 되는 적중률과 응답 속도를 측정하였다. 실험 결과, 제안한 시스템이 기존의 VoiceXML 폼 다이얼로그 구조의 시스템보다 더 자유로운 웹 자원의 탐색이 가능함을 확인하였다.

Haar-like와 베지어 곡선을 이용한 얼굴 성분 검출 (Facial Detection using Haar-like Feature and Bezier Curve)

  • 안경준;이상용
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.311-318
    • /
    • 2013
  • 얼굴 검출 기법들의 경우 조명과 배경에 따라 검출의 정확도가 떨어지는 현상이 발생하여, 이를 해결하기 위한 기법들이 요구되고 있다. 본 연구에서는 얼굴의 눈과 입의 성분을 분석하여 인간의 감성 정보를 추출하기 위한 데이터를 획득하고자 한다. 이를 위해 처리속도가 빠르고 환경 요소들에 강인한 검출율을 보이는 얼굴 특징 검출 방법을 제안하였다. 본 방법은 적분 이미지를 적용한 Haar-like Feature기법을 이용하여 얼굴 성분(두 눈, 입)을 검출한 후, 색상 정보를 바탕으로 검출된 성분들을 이진화하고 피부영역과 얼굴 성분영역을 구분한다. 그 후, 빠르고 정확한 shape를 생성하기 위해 베지어 곡선을 이용하여 검출된 성분들의 shape를 생성한다. 제안된 방법의 성능을 평가하기 위하여 Face Recognition Homepage의 데이터를 이용하여 실험을 진행하였으며, 이를 통해 정교한 얼굴 성분 검출이 가능함을 확인하였다.

CDHMM의 화자적응에 관한 연구 (A Study on the Speaker Adaptation in CDHMM)

  • 김광태
    • 대한전자공학회논문지SP
    • /
    • 제39권2호
    • /
    • pp.116-127
    • /
    • 2002
  • 본 논문에서는 CDHMM 음성인식기의 인식성능을 향상시키기 위해 상태 당 관측밀도함수 수 변화에 의한 화자적응 알고리듬을 제안하였다. 제안한 방법은 CDHMM의 각 상태마다 관측 확률밀도함수의 가지 수가 두 개 이상이 릴 수도 있게 하여 발음특성의 다양성을 반영할 수 있게 하였다. 가지 수는 각 상태에 속하는 적응음성의 프레임 수에 따라 정하는 방법과 특징벡터 행렬식에 따라 정하는 방법으로 하였다 이두 방법중의 어느 하나로 관측 확률밀도함수의 가지가 결정되면, 세분화된 각 가지로부터 MAP 파라미터를 추출함으로써 정밀한 화자적응모델의 파라미터를 구할 수 있었다. 아울러 적응음성을 상태분할 할 때 기존의 화자독립모델을 사전정보로 이용함으로써 ML 추정시의 초기 상태분할 오류의 영향을 줄여 기존 상태분 할 방법의 단점을 개선하였다 그리고 상태지속분포를 화자에 적응시킴으로써 화자 고유의 발음속도와 발음 패턴 등의 음성특성을 흡수하도록 하였다. 제안한 방법들의 타당성을 확인하기 위한 실험에서 제안한 방법이 기존 방법에 비해 높은 인식률을 얻음을 확인하였다.

필기체 숫자와 비숫자의 인식을 위한 MLP 인식기의 구현 방법에 관한 연구 (A Study on the Implementation Methods of the MLP Recognizer for Handwritten Numerals and Non-Numerals)

  • 임길택
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1119-1122
    • /
    • 2005
  • 본 논문은 MLP (multilayered perceptrons) 를 이용하여 필기체 숫자와 비숫자를 인식할 경우의 MLP 인식기의 구현 방법에 관한 것이다. MLP는 인식률 및 속도, 메모리 요구량 등에 있어서 필기체 숫자인식에 매우 효율적인 인식기로 알려져 있다. 그러나 기존 연구에서의 MLP는 숫자 입력에 대해서만 인식을 하고 있으며 비숫자 입력에 대해서는 인식률, 기각률 및 동작 특성에 대해서는 연구된 바가 거의 없다. 본 논문에서는 숫자와 비숫자가 혼재하는 경우의 MLP 인식기의 구현방법에 대해서 논한다. MLP 인식기는 세 가지 방법으로 구현되며, 세 가지의 오류 유형을 정의하여 각 인식 방법의 인식 특성을 분석하였다. 인식 실험은 약 63,000여자의 필기체 숫자와 비숫자를 이용하여 이루어지며, 세가지 오류 유형의 측면에서 숫자와 비숫자에 대한 가장 적절한 인식 방법이 논의된다.

  • PDF

지문분류 기술 동향 분석 (Technical Trend Analysis of Fingerprint Classification)

  • 정혜욱;이승
    • 한국콘텐츠학회논문지
    • /
    • 제17권9호
    • /
    • pp.132-144
    • /
    • 2017
  • 대용량 지문 데이터베이스를 사용하는 지문인식 시스템에서 처리 속도와 정확성을 높이기 위해서는 지문을 클래스별로 카테고리화하는 지문분류 기술을 사용해야 한다. 지문분류 방법은 지문 융선으로부터 특징을 추출하고 지문 융선의 흐름과 형상에 따라 정의되어 있는 클래스를 기준으로 학습 및 추론 기법을 이용하여 분류한다. 기존에는 종이에 회전 날인하여 습득된 NIST 데이터베이스를 이용한 연구가 많이 수행되었지만, 지문인식 입력 센서를 이용한 자동화된 시스템이 보편화됨에 따라 FVC에서 공개한 지문 데이터와 같이 센서로부터 입력된 지문 이미지를 이용한 연구가 증가하고 있으며, 최근에는 딥러닝을 이용한 지문분류 방법이 제안되고 있다. 본 논문에서는 지문분류를 위한 특징 추출 및 분류 기술의 동향을 살펴보고 분류성능을 비교한다. 또한 센서 기반 지문 이미지의 다양한 품질을 고려한 지문분류 기술 연구의 필요성에 대하여 정리하고, 딥러닝 기술을 적용한 지문분류 방법을 분석해 봄으로써 지속적으로 사용이 증가되고 있는 대용량 지문 데이터베이스의 분류 기술 연구에 대한 성능향상에 보탬이 되고자 한다.

난수를 이용하여 동기화를 제공하는 RFID 프라이버시 보호 기법에 관한 연구 (A Study on Privacy Protect Scheme of RFID Provide Synchronization using Random Number)

  • 강수영;이임영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.623-630
    • /
    • 2007
  • IT 기술의 발전으로 사용자 편의성 요구에 따라 빠른 속도로 유비쿼터스(Ubiquitous) 환경이 조성되고 있다. 유비쿼터스 환경에서는 서비스 제공을 위한 개개인 식별이 중요하기 때문에 RFID(Radio Frequency IDentification) 기술을 핵심적으로 사용하고 있다. RFID란 무선 주파수 인식 기술로 리더의 신호에 의하여 태그가 저장하고 있는 정보를 제공하여 사용자를 식별할 수 있는 기술이다. 높은 인식률과 빠른 인식 속도 등 많은 장점을 가지고 있지만 무선 통신으로 인하여 불법적인 사용자로부터의 도청이 가능하며, 리더의 신호에 의하여 태그가 쉽게 동작하기 때문에 사용자 정보 노출에 대한 문제가 발생하고 있다. 이를 해결하기 위하여 많은 연구가 진행되고 있지만 저가의 수동형 태그에 적용할 수 있는 보안에는 한계가 있기 때문에 일반적으로 해쉬 함수 및 난수를 이용하며, 한 세션에 사용된 값들을 갱신하여 다음 세션에 사용함으로써 보안을 제공하고 있다. 따라서 본 방식은 난수를 이용하여 사용자 프라이버시를 보호하고 값을 갱신하지 않고 가변적인 값을 생성함으로써 동기화를 제공할 수 있도록 하였다.

  • PDF

주변 전기장 측정센서를 이용한 손동작 신호 검출을 위한 신호처리시스템 연구 (Study on Signal Processing Method for Extracting Hand-Gesture Signals Using Sensors Measuring Surrounding Electric Field Disturbance)

  • 천우영;김영철
    • 스마트미디어저널
    • /
    • 제6권2호
    • /
    • pp.26-32
    • /
    • 2017
  • 본 논문에서는 지구전기장 왜란신호를 전위차로 변환하는 EPIC(Electric Potential Integrated Circuit) 센서를 이용한 NUI(Natural User Interface) 기술의 요소기술인 신호검출 전자회로를 기반으로 LED 조명을 제어하는 시스템을 구현하였다. 기존에는 CIB 개발 장비를 통해서만 제한적인 형태로 이용 가능했던 신호를 모든 EPIC 센서 각각의 신호를 추출할 수 있도록 개발된 신호검출 전자회로를 이용하였다. 이렇게 추출한 신호는 이후 손동작 인식프로세스에서 특징추출 등의 과정에서 더 많은 자유도와 성능개선 효과를 보여준다. 설계되어 제작된 회로의 실제 응용시스템으로서 적용성을 검증하기 위하여 4개의 손동작으로 LED 조명의 on/off 와 밝기를 조정할 수 있는 시스템을 설계하였다. 기존의 EPIC 센서를 이용하여 명령체계를 구축하고 인터페이스 제어신호를 이용하여 보다 빠른 패턴인식 처리 속도를 얻을 수 있었다.

임베디드 환경에서의 실시간 립리딩 시스템 구현 (Real Time Lip Reading System Implementation in Embedded Environment)

  • 김영운;강선경;정성태
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.227-232
    • /
    • 2010
  • 본 논문은 임베디드 환경에서의 실시간 립리딩 방법을 제안한다. 기존 PC 환경에 비하여 임베디드 환경은 사용할 수 있는 자원이 제한적이므로, 기존 PC 환경의 립리딩 시스템을 임베디드 환경에서 실시간으로 구동하기는 어렵다. 이러한 문제를 해결하기 위해 본 논문은 임베디드 환경에 적합한 입술영역 검출 방법과 입술 특징추출 방법, 그리고 발성 단어 인식 방법을 제안한다. 먼저 정확한 입술영역을 찾기 위해 얼굴 색상정보를 이용해 얼굴영역을 검출하고 검출된 얼굴 영역에서 양쪽 두 눈의 위치를 찾아 기하학적 관계를 이용해 정확한 입술영역을 검출한다. 검출된 입술영역에서 주위 환경 변화에 따른 조명 변화에 강인한 특징을 추출하기위해 히스토그램 매칭과 입술 폴딩, RASTA 필터를 적용하고 주성분 분석(PCA)을 이용한 특징계수를 추출해 인식에 사용하였다. 실험결과 CPU 806Mhz, RAM 128MB 사양의 임베디드 환경에서 발성 단어에 따라 1.15초에서 2.35초까지의 처리 속도를 보였으며, 180개의 단어 중 139개의 단어를 인식해 77%의 인식률을 얻을 수 있었다.

중심이동과 독립기저영상을 이용한 얼굴인식 (Face Recognitions Using Centroid Shift and Independent Basis Images)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제15권5호
    • /
    • pp.581-587
    • /
    • 2005
  • 본 논문에서는 1차 모멘트와 뉴우턴법의 고정점 알고리즘 독립성분분석을 조합한 얼굴인식 기법을 제안하였다. 여기서 1차 모멘트는 입력되는 얼굴영상의 중심좌표를 계산하는 것이며, 이는 얼굴을 중심 이동하여 인식에 불필요한 배경을 배제시킴으로써 인식성능을 개선시키기 위함이다. 고정점 알고리즘의 독립성분분석은 통계적으로 독립인 얼굴특징들의 집합인 기저영상을 빠르게 얻기 위함이다. 제안된 기법을 64*64 픽셀의 48개(12명*4장) 얼굴영상을 대상으로 city-block, Euclidean, 그리고 negative angle의 3가지 거리 척도를 분류척도로 이용하여 실험하였다. 실험결과, 제안된 기법은 전처리과정을 거치지 않는 단순히 독립기저영상만을 이용하는 기법보다 우수한 인식성능이 있음을 확인하였다. 특히 city-block이 Euclidean이나 negative angle의 거리척도보다 상대적으로 정확하게 유사성을 측정할 수 있었다.