• 제목/요약/키워드: 인식 비교

검색결과 6,342건 처리시간 0.036초

포즈 변화에 강인한 얼굴 인식 (Face Recognition Robust to Pose Variations)

  • 노진우;문인혁;고한석
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.63-69
    • /
    • 2004
  • 본 논문에서는 포즈 변화에 강인한 얼굴 인식을 위하여 원통 모델을 이용하는 방법을 제안한다. 얼굴 모양이 원통형이라는 가정 하에 입력 영상으로부터 대상의 포즈를 예측하고, 예측된 포즈 각도만큼 포즈 변환을 실시하여 정면 얼굴 영상을 획득한다. 이렇게 획득한 정면 영상을 얼굴 인식에 적용함으로써 얼굴 인식률을 향상시킬 수 있다. 실험 결과, 포즈 변환을 통하여 인식률이 61.43%에서 93.76%로 향상되었음을 볼 수 있었으며, 보다 복잡한 3차원 얼굴 모델을 이용한 결과와 비교하였을 때 비교적 양호한 인식률을 갖는 것을 확인하였다.

음성 신호를 사용한 감정인식의 특징 파라메터 비교 (Comparison of feature parameters for emotion recognition using speech signal)

  • 김원구
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.371-377
    • /
    • 2003
  • 본 논문에서 음성신호를 사용하여 인간의 감정를 인식하기 위한 특징 파라메터 비교에 관하여 연구하였다. 이를 위하여 여러 가지 감정 상태에 따라 분류된 한국어 음성 데이터 베이스를 이용하여 얻어진 음성 신호의 피치와 에너지의 평균, 표준편차와 최대 값 등 통계적인 정보 나타내는 파라메터와 음소의 특성을 나타내는 MFCC 파라메터가 사용되었다. 파라메터들의 성능을 평가하기 위하여 문장 및 화자 독립 감정 인식 시스템을 구현하여 인식 실험을 수행하였다. 성능 평가를 위한 실험에서는 운율적 특징으로 피치와 에너지와 각각의 미분 값을 사용하였고, 음소의 특성을 나타내는 특징으로 MFCC와 그 미분 값을 사용하였다. 벡터 양자화 방법을 사용한 화자 및 문장 독립 인식 시스템을 사용한 실험 결과에서 MFCC와 델타 MFCC를 사용한 경우가 피치와 에너지를 사용한 방법보다 우수한 성능을 나타내었다.

2층 구조의 입체 시각형 신경망 기반 음소인식 (Phoneme Recognition based on Two-Layered Stereo Vision Neural Network)

  • Kim, Sung-Ill;Kim, Nag-Cheol
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.523-529
    • /
    • 2002
  • 본 연구는 입체 시각을 위한 신경망에 대한 연구 결과로서 인간의 음성을 인식하는데 적용된다. 입체 시각신경망(SVNN)에 기반한 음성인식에서, 먼저 입력된 음성 신호를 표준 모델과 비교함으로써 유사성이 얻어진다. 이 값들은 다이나믹한 처리 과정으로 주어지고 이웃한 신경소자들 사이에서 경쟁적이고 협력적인 처리를 거치게 된다. 이러한 다이나믹한 처리과정을 통해 단 하나의 가장 우수한 신경세포(winner neuron)만이 최후에 검출된다. 비교연구에서 2층 구조의 SVNN은 HMM 인식기보다 인식정확도 측면에서 7.7% 더 높았다. 평가 결과. SVNN은 기손리 HMM 인식기 성능을 능가하는 것으로 나타났다.

  • PDF

독립 성분 분석을 이용한 얼굴인식 (Face recognition by using independent component analysis)

  • 김종규;장주석;김영일
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.48-58
    • /
    • 1998
  • 신호처리 분야에서 미지의 신호원 분리에 주로 응용되는 독립 성분 분석법을 이용하여 얼굴인식을 할 수 있는 한 방식을 제안하였다. 하나의 얼굴영상 자체가 통계적으로 서로 독립인 어떤 미지의 특징영상의 합으로 표현될 수 있다고 가정하고 이 특징영상을 독립성분분석을 이용하여 구한 후, 새로운 얼굴이나 변화된 얼굴을 특징영상의 공간에 투영시켜 투영된 성분을 기준 얼굴영상과 비교하는 방법으로 인식을 수행하였다. 변화가 심한 여러 얼굴영상으로 구성된 데이터베이스(한 사람 당 10개씩의 변화된 400개의 얼굴 영상)에 대해 얼굴인식 실험을 수행하였고 또한 주성분 분석에 기초한 고유얼굴을 이용한 인식률과 비교 분석하였다. 제안된 방식은 주성분 분석법에 비해 높은 인식률을 제공하며, 특히 입력 얼굴 영상에 첨가되는 랜덤 잡음에 대단히 강한 특성을 갖는다.

  • PDF

중앙은행 CBDC에 대한 공공 및 민간 관점의 인식 비교연구- 한국 사례를 중심으로 (Comparison of Public and Private Perspectives on Central Bank CBDC - Focusing on Korean Case)

  • 김봉규;이원부
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.360-371
    • /
    • 2021
  • 가상화폐의 등장은 최근 발전하고 있는 분산원장기술과 함께 중앙은행에서 발행하는 CBDC(Central Bank Digital Currency)에 대한 관심을 고조시키고 있다. 최근 전자화폐의 등장으로 현금 사용이 지속적으로 감소 추이를 보이고 있으며, 일부 국가들(특히, 인구가 적은 편이며, 현금이용 감소에 따른 부작용이 우려되는 국가와 금융 포용수준이 낮은 일부 국가들의 경우)은 이미 중앙은행이 CBDC에 대한 발행을 결정하거나 시험단계에 있다. CBDC 발행이 도래하고 새로운 금융환경이 조성되는 상황에서 정부 및 공공기관의 이를 바라보는 인식이나 태도에 대한 연구는 많이 부족한 상황이다. 실제 정책 입안자들이나 실행자들이 인식하는 CBDC 제도에 대한 태도와 대안이 그 정책의 영향을 받는 일반 사람들이 생각하는 인식과 어떠한 공통점과 차이점이 있는지에 대해 충분히 연구 혹은 분석된 바가 없다. 따라서 본 연구는 빅데이터 분석 방법을 통하여 중앙은행의 CBDC에 대한 공공의 인식과 민간의 인식에 대해 비교해 보고 향후 CBDC의 도입과 관련한 여러 쟁점들을 미리 점검할 수 있는 기회가 될 것이다.

한국어 변이음 인식을 위한 시간지연 신경망의 확장방법 (A Method of Scaling Time-Delay Neural Networks for Korean Allophone Recognition)

  • 김수일
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.229-234
    • /
    • 1994
  • 본 논문에서는 한국어 변이음을 인식하기 위한 시간지연 신경망의 확장 방법을 살펴보고 한국어 파열음의 벼이음을 인식하는 실험을 통해 각 확장 방법의 인식 성능을 비교한다. 먼저 변이음을 연속음성인식의 인식단위로 사용하기 위하여 한 음소이모든 변이음을 고려하면서 서로 유사한 변이음을 통합 분류하여 3개의 변이음 군으로 나눈다. 한국어 파열음에 대한 인식 실험결과, 음향 음성학적인 특성에 따라 나누어진 trbah 시간지연 신경망들을 모듈 별로 학습한 후, 계층적으로 통합하여 전체적인 시간지연 신경망을 구성하는 방법이 가장 좋은 성능을 나타내었다. 또한, 변이음 단위 인식이 음소 단위 인식에서 문제가 되는 조음 결합 현상을 해결할 수 있음을 확인하였고, 변이음 인식의 결과인 변이음 열이 제공하는 부가적인 정보를 음운파상에 이용하는 방법에 대해 고찰하였다.

  • PDF

한국어 음소인식을 위한 기준 프레임 추출 (Typical Frame Etraction for Korean Phoneme Recognition)

  • 김범국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.121-124
    • /
    • 1994
  • 음소를 인식의 기본으로 하는 한국어 음성인식 시스템을 구현하기 위한 기초 연구의 일환으로서 각 음소의 특징 가장 잘 표현하는 기준프레임 추출을 위한 연구를 수행하였다. 이를 위하여 먼저 선행 실험과 분산비 분석을 통해서 인식에 필요로한 시간 패턴의 길이를 추출한 후 이를 바탕으로 통계적 인식방법인 베이즈 결정법칙을 이용하여 시단 프레임으로부터 3프레임씩 시점을 1프레임씩 옮기면서 인식 실험을 해?여, 각 음소별 특징이 가장 풍부한 기준 프레임을 추출하였다. 그리고 이 기준 프레임을 중심으로 각 음소군별 인식 실험을 수행하여 그 결과를 시단을 기준으로 한 경우와 비교 검토하고 한국어 전 음소별로 확장하여 인식 실험을 실시하였다. 이 실험 결과 모음의 경우 시단으로부터 5프레임, 파열음은 시단에서부터 5프레임사이, 마찰음은 3프레임에서부터 10프레임까지, 파찰음은 5프레임까지, 비음과 유음의 경우 초성은 시단 프레임에서 6프레임, 종성은 종단으로부터 전 4프레임 구간이 인식률이 높게 나타나 이 부분의 특징이 인식에 가장 유효함을 알 수 있었다.

  • PDF

PCA와 퍼지 가중치 평균 기법을 이용한 얼굴 인식 (Face Recognition Using PCA and Fuzzy Weighted Average Method)

  • 우영운;김형수;박재민;조재현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.315-316
    • /
    • 2011
  • 일반적으로 영상에서 얼굴 영상을 검출하고 인식하는 알고리즘은 패턴 인식 연구에 있어서 인간과 컴퓨터의 상호작용의 연구라는 면에서 아주 중요한 문제로 연구되어 왔다. 본 논문에서는 고유얼굴을 이용하여 유클리디언 거리법과 퍼지기법의 인식률을 비교해보고자 한다. PCA(Principal Component Analysis) 방식은 우수한 인식 결과를 보장하는 얼굴인식 기법중의 하나이며, 얼굴 영상을 이용하여 공분산 행렬을 계산하고, 공분산 행렬을 통해 생성된 저차원의 벡터, 즉 고유얼굴(Eigenface)을 이용하여 가중치를 계산하고, 이 가중치를 기준으로 인식을 수행하는 기법이다. 이를 기반으로 하여, 본 논문에서는 전처리 과정, 고유얼굴 과정, 유클리디언 거리법 및 퍼지 소속도 함수 설계 과정, 신경망 학습과정, 인식과정으로 구성된 5단계의 얼굴 인식 알고리즘을 제안한다.

  • PDF

피춰 추출 관점에서 기준 화자 수 증가에 따른 음성 인식 성능 분석 (Performance Analysis of Speech Recognition by Increasing the Number of Reference Speaker)

  • 이철희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.111-114
    • /
    • 1998
  • 음성을 인식하기 위해서는 주어진 음성을 미리 정한 기준 음성과 비교하여 가장 유사한 것을 갖는 과정을 거치게 된다. 같은 단어라도 화자에 따라서 발음 속도, 음의 강약이 틀리므로 화자 독립 음성 인식을 위해서는 여러 화자가 발음한 음성을 기준 음성으로 사용하여 인식 성능을 향상시킬 수 있다. 그러나 화자 수를 증가시켜도 인식 성능의 향상에는 한계를 보이고 있다. 이러한 문제점은 현재 음성에서 추출되는 피춰가 인식에 필요한 정보를 충분히 포함하지 않는 것과 인식 알고리즘의 효율성 등에서 원인을 찾을 수 있다. 본 논문에서는 남자 10명과 여자 10명이 발음한 한국어 숫자음을 인식 대상으로 하여 멜켑스트럼을 추출하고 DTW에 의해 인식을 수행하여 피춰 추출의 관점에서 화자 수 증가에 따른 인식률의 변화와 그 한계에 대해서 분석한다.

  • PDF

게임 사용자 얼굴표정 인식을 위한 얼굴인식 기법 분석 (An Analysis of Face Recognition Methods for Recognition of Game Player's Facial Expression)

  • 유채곤
    • 한국게임학회 논문지
    • /
    • 제3권2호
    • /
    • pp.19-23
    • /
    • 2003
  • 컴퓨터 기술의 발전에 따라서 게임분야 역시 다양한 첨단 기술이 적용되고 있다. 예를 들면 강력한 3D가속 기능을 가진 비디오카드, 5.1 채널 사운드, 포스피드백 지원 입력 장치, 운전대, 적외선 센서, 음성 감지기 등이 게임의 입출력 인터페이스로서 이용되고 있다. 전형적인 방법 이외에도 광학방식이나 휴대용 게임기에 대한 플레이 방식에 대한 연구도 활발하다. 최근에는 비디오 게임기에도 사람의 동작을 인식하여 게임의 입력으로 받아들이는 기술이 상용화되기도 하였다. 본 논문에서는 이런 발전 방향을 고려하여 차세대 게임 인터페이스의 방식으로서 사용될 수 있는 사람의 표정 인식을 통한 인터페이스 구현을 위한 접근 방법들에 대하여 고찰을 하고자 한다. 사람의 표정을 입력으로 사용하는 게임은 심리적인 변화를 게임에 적용시킬 수 있으며, 유아나 장애자들이 게임을 플레이하기 위한 수단으로도 유용하게 사용될 수 있다. 영상을 통한 자동 얼굴 인식 및 분석 기술은 다양한 응용분야에 적용될 수 있는 관계로 많은 연구가 진행되어 왔다. 얼굴 인식은 동영상이나 정지영상과 같은 영상의 형태, 해상도, 조명의 정도 등에 따른 요소에 의하여 인식률이나 인식의 목적이 달라진다. 게임플레이어의 표정인식을 위해서는 얼굴의 정확한 인식 방법을 필요로 하며, 이를 위한 비교적 최근의 연구 동향을 살펴보고자 한다.

  • PDF