• 제목/요약/키워드: 인식 알고리즘

검색결과 4,224건 처리시간 0.034초

웨이블렛 필터뱅크를 이용한 자동차 소음에 강인한 고립단어 음성인식 (Robust Speech Recognition with Car Noise based on the Wavelet Filter Banks)

  • 이대종;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권2호
    • /
    • pp.115-122
    • /
    • 2002
  • 본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 외부 잡음에 강인한 고립단어 음성인식 알고리즘을 제안하고자 한다. 음성인식에 있어서 외부잡음은 음성인식 알고리듬의 인식률을 저하시키는 주요 원인으로 지적되므로 음성인식기의 성능을 향상시키기 위해서 무엇보다도 잡음에 강인한 음성인식 알고리즘의 개발이 절실히 요구되고 있다. 제안된 알고리즘의 타당성을 검증하기 위하여 다양한 자동차 소음하에서 한국어 단독 숫자음 10단어의 인식률 변동을 알아 보았다. 그 결과 현재 음성인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 9~25%의 향상된 인식률을 보였다.

바코드 인식/검사를 위한 영상인식 알고리즘 (In Image Recognition Algorithm for Bar-Code Recognition/Inspection)

  • 김기순;최종문;김준식
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.1-8
    • /
    • 2001
  • 본 논문에서는 산업용으로 주로 사용되고 있는 바코드(code 93)를 비전시스템을 이용하여 자동으로 인식할 수 있는 알고리즘을 제안하였다. 제안된 알고리즘은 입력된 바코드 영상에 대해 회전에 관계없이 각도를 자동 추출하여, 모듈 (module)을 구성하는 화소들을 추출한다. 각 모듈에 대해 적웅적인 방법으로 바(bar)와 스페이스(space)를 구성하는 엘리먼트(element) 값을 구하고, 심벌 문자들의 엘리먼트 값을 9개의 그룹으로 나누어 바코드 값을 인식한다. 여러 종류의 바코드 영상을 대상으로 모의실험을 수행하여, 제안한 알고리즘의 성능을 검증하였다.

  • PDF

얼굴 특징자와 구조적 특징 각을 이용한 얼굴인식 알고리즘 (Face Recognition Algorithm Using Facial Features And Structural Feature Angles of Face)

  • 김정훈;김영일;이응주
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.143-146
    • /
    • 2001
  • 본 논문에서는 칼라 CCD 카메라로부터 입력된 얼굴 영상에서 HSI 정보와 눈, 코, 입 등의 얼굴 영역 특징자와 특징자들의 구조적 특징각을 이용한 얼굴 인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 인간의 시각 체계와 비교적 유사한 HSI좌표계 상에서 피부색에 대한 색상 정보와 명암값 정보를 함께 이용함으로써 얼굴영역 추출의 효율을 높였고, 또한 추출된 얼굴 영역에서 얼굴 인식을 개선을 위해 눈, 코, 입 등의 구조적 위치 정보와 특징자들의 구조적 특징각인 θ/sub 1(ACRCD)/, θ/sub 2(ACRMD)/, θ/sub 3(ANRED)/, θ/sub 4(AMRED)/를 이용하여 얼굴 인식율을 개선하였다. 제안한 알고리즘에서는 기존의 명암 정보를 이용하는 방법과는 달리 색상 정보와 명암 정보 그리고 구조적특징각을 함께 이용함으로써 정확한 얼굴 영역의 검출이 가능하였으며 인식 방법에 있어서 특징자들의 구조적 관계값을 이용함으로써 인식 효율을 개선하였다.

  • PDF

음성인식을 위한 새로운 포만트트랙킹 알고리즘의 제안과 평가 (An Proposal and Evaluation of the New formant Tracking Algorithm for Speech Recognition)

  • 송정영
    • 인터넷정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.51-59
    • /
    • 2002
  • 본 논문에서는, 음성인식을 위한 한가지 방법으로 새로운 포만트 트랙킹 알고리즘을 제안한다. 본 연구에서는 실험을 위한 인식 데이터로 한국어 숫자음성을 사용하였다. 새롭게 제안한 알고리즘을 사용하여 인식실험을 한 결과, 숫자음성 300개에 대한 인식률은 91%의 결과를 얻었다. 본 연구의 새로운 알고리즘은, 인식실험을 통하여 그 유효성이 확인되었다.

  • PDF

유성/무성/묵음 정보론 이용한 동적 시간 정합 알고리즘 개선 (Improvement of Dynamic Time Warping Algorithm by Using Voice/Unvoiced/Silence Information)

  • 최민석;한현배;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.40-43
    • /
    • 1999
  • 본 연구에서는 고립단어 인식시스템에 사용되고 있는 DTW(DynamicTimeWarping) 알고리즘의 계산량을 줄일 수 있는 방법을 제안한다. 일반적으로 고립단어 인식시 가장 인식률이 좋은 알고리즘은 DW라고 알려져 있으나, 인식대상어휘가 늘어나면 계산량이 비례해서 늘어나고 인식률이 저하되는 단점이 있으므로 일반적으로 200단어 이하의 어휘에만 사용되고 있다. 따라서 대상어휘를 감소시켜 계산량을 줄이기 위해 본 논문에서는 유성/무성/묵음 (V/U/S) 정보를 이용하여 코드워드를 구성하고 같은 코드워드에 해당되는 단어들을 추출해이들 만을 비교대상 어휘로 제한하므로서 DW 알고리즘을 적용할 대상 어휘수를 줄이는 방법을 사용하여 계산 속도를 향상시켰다 또한 입력 단어와 대상 단어와의 누적거리 계산 시 끝점 정보 뿐 만 아니라 유성/무성/묵음 경계 정보를 이용하여 piecewise DTW를 구현함으로서 탐색 영역을 축소함으로써 추가적인 계산량 감소가 가능하다. 따라서 상기 기법들을 이용하면 PC상에서도 DTW를 이용한 대어휘 고립단어 음성 인식기의 구현이 가능할 것이다.

  • PDF

HSI 정보와 얼굴 특징자들의 기하학적 특징각을 이용한 얼굴 인식 알고리즘 (Human Face Recognition Algorithm Using HSI Informations and Geometrical Feature Angle of Face Features)

  • 김영일;김정훈;이응주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.859-862
    • /
    • 2001
  • 본 논문에서는 칼라 CCB 카메라로부터 입력된 얼굴 영상에서 HSI 정보와 눈, 코, 입 등의 얼굴 영역 특징자 및 특징자의 기하학적 특징각을 이용한 얼굴 인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 인간의 시각 체계와 비교적 유사한 HSI좌표계 상에서 피부색에 대한 색상 정보와 명암값 정보를 함에 이용함으로써 얼굴영역 추출의 효율을 높였고, 또한 추출된 얼굴 영역에서 얼굴 인식율 개선을 위해 눈, 코, 입 등의 구조적 위치 정보와 특징자들의 기하학적 특징각을 이용하여 얼굴 인식율을 개선하였다. 제안한 알고리즘에서는 기존의 명암 정보를 이용하는 방법과는 달리 색상 정보와 명암 정보를 함께 이용함으로써 정확한 얼굴 영역의 검출이 가능하였으며 인식 방법에 있어서 특징자들의 기하학적 관계값을 이용함으로써 인식 효율을 개선하였다.

  • PDF

한국어 동사와 명사 관용구 인식 알고리즘 (A recognition algorithm of Korean verb and noun idiomatic phrases)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

칼라정보와 턱선의 구조적 특징자를 이용한 얼굴 인식 알고리즘 (Human Face Recognition Using Color Informations and Geometrical Features of Chin line)

  • 이명영;문인수;이응주
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.209-212
    • /
    • 2000
  • 본 논문에서는 칼라 CCD 카메라로부터 입력된 얼굴 영상에서 칼라 정보와 눈, 코, 입 등의 얼굴 영역 특징자 및 턱선의 선형적 특징을 이용한 얼굴 인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 인간의 시각 체계와 비교적 유사한 HSI좌표계 상에서 피부색에 대한 색상 정보와 명암값 정보를 함께 이용함으로써 얼굴영역 추출의 효율을 높였고, 적응적인 추출이 가능하도록 하였다. 또한 추출된 얼굴 영역에서 얼굴 인식율 개선을 위해 눈, 코, 입 등의 구조적 위치 정보와 턱선의 선형적인 특징값을 이용하여 얼굴 인식율을 개선하였다. 제안한 알고리즘에서는 기존의 명암 정보를 이용하는 방법과는 달리 색상 정보와 명암 정보를 함께 이용함으로써 정확한 얼굴 영역의 검출이 가능하였으며 인식 방법에 있어서 구조적 특징자 외에 턱선의 선형적인 관계값을 이용함으로써 인식 효율을 개선하였다.

  • PDF

특징점 Appearance Model을 이용한 3차원 물체 인식 (3D Object Recognition Using Appearance Model of Feature Point)

  • 주성문;박재완;이칠우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1536-1539
    • /
    • 2013
  • 3차원 물체는 카메라의 시선 방향에 따라 다른 영상을 생성하므로 2차원 영상만으로 3차원 물체를 인식하는 것은 쉬운 일이 아니다. 특히 영상생성 시 강한 perspective transformation 이 발생할 경우 2차원 국소 특징을 이용하는 SIFT(Scale-Invariant Feature Transform) 알고리즘은 매칭에 활용하기 어렵다. 본 논문에서는 3차원 물체를 하나의 특정 축 중심으로 회전시키면서 얻은 복수의 영상을 학습 데이터로 활용하여 SIFT 알고리즘을 개선한 물체인식 방법을 제안한다. 이 방법은 복수 영상의 특징점들을 하나의 특징 공간으로 합성하고 그 특징점들 간의 기하학적인 제약조건을 확인하여 3차원 물체를 인식하는 방법이다. 실험에서는 알고리즘의 유용성을 먼저 확인하기 위해 조명조건과 카메라의 위치를 일정하게 유지하였다. 이 방법에 의해 SIFT 알고리즘만으로 인식이 힘들었던 3차원 물체의 다양한 외관(appearance) 인식이 가능하게 되었다.

휘도 영역 기반 정지영상 인식자 최적화 (Optimization of Luminance Area based Image Identifier)

  • 김성민;박제호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.407-409
    • /
    • 2011
  • 멀티미디어 데이터베이스에서 특정 정지영상의 연관성을 설정하기 위해 임의적인 인식자를 사용하는 것은 인식자의 분실 시 원래 사용하였던 값을 복구할 수 없다는 단점을 가지고 있다. 따라서, 정지영상의 내부 속성을 이용한 인식자를 데이터베이스의 인덱싱에 적용하여 이 문제를 해결할 수 있다. 정지영상 인식자 생성을 위해 정지영상 전체를 대상으로 알고리즘을 적용하면 정지영상의 크기에 따라 알고리즘의 수행 시간이 증가 하게 된다. 이를 최적화하기 위해서는 정지영상 전체 데이터를 필요로 하지 않고, 특징적인 부분만을 고려하는 알고리즘이 필요하다. 본 논문에서는 휘도 영역을 이용한 정지영상 인식자 생성 알고리즘을 최적화하고, 그에 따른 검증을 예시한다.