• 제목/요약/키워드: 인식 개선

검색결과 5,314건 처리시간 0.032초

1차 모멘트와 주요성분분석을 이용한 얼굴표정 인식 (Recognizing Facial Expression Using 1-order Moment and Principal Component Analysis)

  • 조용현;홍성준
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.405-408
    • /
    • 2006
  • 본 논문에서는 영상의 1차 모멘트와 주요성분분석을 이용한 효율적인 얼굴표정 인식방법을 제안하였다. 여기서 1차 모멘트는 영상의 중심이동을 위한 전처리 과정으로 인식에 불필요한 배경의 배제와 계산시간의 감소로 인식성능을 개선하기 위함이다. 또한 주요성분분석은 얼굴표정의 특징인 고유영상을 추출하는 것으로, 이는 2차의 통계성을 고려한 중복신호의 제거로 인식성능을 개선하기 위함이다. 제안된 방법을 각각 320*243 픽셀의 48개(4명*6장*2그룹) 얼굴표정을 대상으로 Euclidean 분류척도를 이용하여 실험한 결과 전처리를 수행하지 않는 기존 방법보다 우수한 인식성능이 있음을 확인하였다.

  • PDF

타원 모델기반의 전처리 기법에 의한 얼굴 인식률 개선 (Improvement of Face Recognition Rate by Preprocessing Based on Elliptical Model)

  • 원철호
    • 한국산업정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.56-63
    • /
    • 2008
  • 얼굴 인식률 향상을 위해서는 전처리 단계에서의 영상 보정이 매우 중요하며, 특히 배경 잡음 제거는 얼굴 인식의 정확도에 중대한 영향을 미친다. 본 논문에서는 얼굴 인식률 향상을 위하여 전처리 단계에서 타원 모델을 이용하여 배경 영역을 제거하는 방법을 제안하였다. 사람의 얼굴 윤곽은 타원의 형태를 나타내기 때문에 얼굴 영상에서 타원 모델을 이용할 경우 얼굴 영역을 용이하게 검출할 수 있다. ETRI, ORL, 및 XM2VTS 얼굴 데이터베이스에 대한 실험 분석을 통하여 제안된 방법이 얼굴 인식 성능을 뚜렷하게 개선시켰음을 알 수 있었다.

  • PDF

음성 인식을 위한 후처리에 관한 연구 (A Study on the Post-processing for Speech Recognition)

  • 김원구
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.421-424
    • /
    • 2008
  • 음성 다이얼링 시스템은 화자의 음성을 인식하여 원하는 전화번호로 자동으로 전화를 걸어주는 시스템으로 주로 이동 전화나 휴대형 통신 장비에 유용하게 사용된다. 개인 음성 다이얼링 시스템의 경우, 다이얼링에 사용되는 모든 구문은 사용자가 선택하고 사용자의 음성을 사용하여 학습되어 음성 인식을 위한 HMM을 생성한다. 이러한 시스템은 화자독립 시스템보다 매우 적은 메모리 공간과 계산량으로 구현이 가능하다. 그러나 이러한 시스템은 학습시 각 단어랑 2-3개의 음성만을 사용하므로 음성인식 시스템의 성능을 개선하기 위한 각 상태에서의 상태지속분포을 추정하기는 매우 어렵다. 따라서 본 논문에서는 성능개선을 위한 후처리기를 제안하였다. 전화선을 통하여 구성된 데이터베이스를 이용한 실험에서 제안된 후처리기가 인식 시스템의 성능을 향상시킴을 확인하였다.

  • PDF

실시간 다중 객체인식 알고리즘 구현 (Implementation of Real time based Multi-object recognition algorithm)

  • 박태룡
    • 전기전자학회논문지
    • /
    • 제17권1호
    • /
    • pp.51-56
    • /
    • 2013
  • 본 논문에서는 ORB 알고리즘을 기반으로 하는 다중객체 인식 구현을 위하여 개선된 매칭 기법을 제안한다. 객체 인식 알고리즘으로 잘 알려진 SURF 알고리즘은 객체인식에 강인하지만 연산량이 많아 실시간으로 구현하기에는 어려운 단점이 있다. 따라서 ORB 알고리즘을 활용하여 객체를 인식하였고, 실시간 다중객체인식을 위해 매칭 단계를 개선하여 속도를 약 70% 향상 시켰다.

음성인식 개발 프로젝트 위험 요인에 관한 연구 (A Study on Risk Factors of Speech Recognition Development Project)

  • 김선교;박준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.733-734
    • /
    • 2020
  • 음성인식은 음향모델, 언어모델, 디코더 등의 기술을 이용한다. 음성인식은 하드웨어와 소프트웨어 구성이 정확하게 설계가 되어야 한다. 음성인식 프로젝트는 인프라 구성과 도입되는 음성인식 엔진도입, 인식률 그리고 시스템과의 연계가 중요하다. 하지만 음성인식 프로젝트는 솔루션 도입으로 인지하고 수행할 경우에는 많은 위험이 발생한다. 이 중 가장 문제가 되는 것이 인식률이다. 본 논문에서 음성인식 개발 프로젝트 수행에 도출되는 인식률을 개선하는 방안을 제시하겠다.

ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘 (Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method)

  • 백인호;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

모바일 기반 OpenCV 라이브러리를 이용한 마커리스 객체 인식 성능 향상 (Performance improvement for marker-less object recognition through OpenCV mobile library)

  • 정현섭;윤희원;김신덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.61-64
    • /
    • 2013
  • 본 논문에서는 모바일 기반 OpenCV 라이브러리를 이용한 마커리스 객체 인석 성능 향상을 위한 소프트웨어적인 관점의 방법을 제안한다. 기존의 마커리스 기반 알고리즘을 이용하여 테스트를 수행한 후 성능에 저하를 발생시키는 요인들을 분석하고 그에 따른 상황별 적절한 해결책을 제시한다. 이에 따라 크게 프로그램 코드 개선, 마커리스 기반 알고리즘 코드 개선, 센서를 활용한 성능 향상을 도모한다. 프로그램 코드 개선은 테스트 결과를 분석 한 후 수행시간이 가장 많이 소요되는 함수를 최적화하고 또한 최적의 특징점의 수를 제한한다. 마커리스 기반 알고리즘 코드 개선은 병렬 처리가 제공되는 모바일에 한하여 병렬처리기법으로 코드를 수정한다. 마지막 센서를 활용한 성능향상은 실시간 작업 처리 단위를 묶음으로 처리하였을 때 발생하는 품질의 저하를 보정하는 역할을 수행한다. 본 논문에서는 이러한 마커리스 객체 인식 성능 향상 방법을 소프트웨어적인 관점에서 제안하고 이에 대한 결과 모바일 기반 실시간 증강현실 서비스를 위한 성능 향상 면에서 효과적이다.

  • PDF

상관도에 의한 실시간 안면 추출과 조명 평면을 이용한 영상 개선 (A Realtime Facial Region Extraction by Correlation and Image Enhancement Using illumination Plane)

  • 김도현;강동구;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.508-510
    • /
    • 2002
  • 본 연구에서는 실시간으로 얼굴을 인식, 검증하기 위한 전처리 단계로써 얼굴을 고속으로 추출하고 추출된 영상을 개선하기 위한 효율적인 기법들을 소개한다. 먼저 RGB로 획득되는 영상을 인간의 시각 구조와 유사한 HSI 컬러 모델로 변환하고 여기서 인간의 피부 영역에 해당하는 컬러 분포를 조사하여 대강의 얼굴 영역을 찾고 이 영역을 대상으로 두 개의 가변 템플릿과의 상관도(Correlation)를 이용하여 최적의 얼굴 안면을 찾는다. 보다 나은 얼굴 인식을 위하여 검출된 얼굴 안면 이미지에서 조명 평면(Illumination plane) 이미지를 추출하여 먼저 불균일성을 보정한 다음 평활화(Equalization)를 수행함으로써 영상을 개선한다.

  • PDF

형태학적 정보와 개선된 신경망을 이용한 차량 번호판 인식 (Car Plate Recognition using Morphological Information and Enhanced Neural Network)

  • 김광백
    • 한국정보통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.684-689
    • /
    • 2005
  • 본 논문에서는 수평$\cdot$수직 에지의 형태학적 정보를 이용한 차량 번호판 추출과 개선된 신경망을 이용한 차량 번호판 인식 시스템을 제안한다. 번호판 영역은 수평 수직에지의 형태학적 정보를 이용하여 추출하고 개별 문자는 히스토그램 방법과 위치 정보를 이용한 방법에 윤곽선 추적 알고리즘을 병합하여 추출한다. 개별 문자 인식은 ART-1 알고리즘을 지도 학습 방법과 결합한 개선된 신경망을 제안하여 차량 번호판 인식에 적용한다. 제안된 방법의 성능을 확인하기 위하여 실제 차량 번호판들을 대상으로 실험한 결과, 수평$GF(2^m)$수직 에지의 형태학적 정보를 이용한 차량 번호판 추출 방법이 임계화를 이용한 차량 번호판 추출 방법, RGB와 HSI 컬러 정보를 각각 이용한 차량 번호판 추출 방법보다 추출룰이 개선되었으며, 인식 성능도 개선된 신경망의 학습 알고리즘이 기존의 학습 알고리즘들 보다 우수한 성능이 있음을 확인하였다.

개선된 Max-Min 신경망을 이용한 콘크리트 균열 인식 (Recognition of Concrete Surface Cracks Using Enhanced Max-Min Neural Networks)

  • 김광백;박현정
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.77-82
    • /
    • 2007
  • 본 논문에서는 콘크리트 표면 균열의 방향성을 효율적으로 인식하기 위하여 영상처리 기법을 적용하여 균열을 자동으로 검출하고 개선된 Max-Min 신경망을 제안하여 균열의 방향성을 자동으로 인식하는 기법을 제안한다. 균열 영상에서 빛의 영향을 효율적으로 보정하기 위해 모폴로지 기법인 채움 연산을 적용하고 Sobel 마스크를 적용하여 균열의 에지를 추출한 후, 반복 이진화를 적용하여 균열 영상을 이진화한다. 이진화된 균열 영상에서 2차례에 걸쳐 잡음 제거 연산을 수행한 후, 균열을 추출한다. 본 논문에서는 Max-Min 신경망을 개선하여 추출된 균열의 방향성을 자동으로 인식한다. 개선된 Max-Min 신경망은 delta-bar-delta 알고리즘을 적용하여 학습률을 자동으로 조정한다. 실제 콘크리트 표면 균열 영상을 대상으로 실험한 결과, 개선된 Max-Min 신경망이 균열의 방향성 인식에 효율적임을 확인하였다.

  • PDF