• Title/Summary/Keyword: 개인 인식

검색결과 7,893건 처리시간 0.046초

문장종속형 화자확인에서의 관측확률 가중기법 (Observation Probability Weighting Method for Text-Dependent Speaker Verification)

  • 김세현;장길진;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.28-31
    • /
    • 1999
  • 기존의 문장종속형 화자인식 방법들은 대부분 음성인식에서 사용되는 방법을 그대로 적용하기 때문에, 화자의 개인성 정보보다 음운정보에 더 민감한 단점이 있다. 화자인식 시스템의 성능향상을 위해서는 음운정보보다는 화자의 개인성 정보가 잘 반영되도록 하는 것이 중요하다. 본 논문에서는 HMM(hidden Maxkov model)을 기반으로 한 문장종속형 화자확인 시스템의 성능향상을 위한 관측확률 가중 반법을 제안한다. 먼저 주어진 학습자료에서 화자의 개인성이 잘 반영된 프레임들을 예측한다. 임의의 입력음성에 대한 인식점수는 화자의 특징이 잘 반영된 프레임의 관측확률에 가중치를 주어 구한다. 제안한 방법을 적용한 결과 기존의 우도비(likelihood ratio) 정규화 점수를 사용하는 방법에 비해 동일오류율(EER, equal error rate)을 $2\~3\%$정도 줄여 인식율 향상을 얻을 수 있었다.

  • PDF

부분방전 패턴인식을 위한 퍼지뉴럴네트워크의 유전자적 최적 설계 (Genetically Optimized Design of Fuzzy Neural Networks for Partial Discharge Pattern Recognition)

  • 박건준;김길성;오성권;최원;김정태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1891-1892
    • /
    • 2008
  • 본 논문에서는 부분방전 패턴인식을 위한 퍼지뉴럴네크워크(Fuzzy-Nueral Network를 설계한다. 퍼지뉴럴네트워크의 구조에서 규칙의 전반부는 개별적인 입력 공간을 분할하여 표현하고, 규칙의 후반부는 다항식으로서 표현되며 오류역전파 알고리즘을 이용하여 연결가중치인 후반부 다항식의 계수를 학습한다. 또한, 유전자 알고리즘을 이용하여 각 입력에 대한 전반부 멤버쉽함수의 정점과 학습률 및 모멤텀 계수를 최적으로 동조한다. 제안된 네트워크는 부분방전 패턴인식을 위해 다중 출력을 가지며, 초고압 XLPE 케이블 절연접속함의 모의결함에 대해 부분방전 신호를 패턴인식한다. 부분방전 신호는 PRPDA 방법을 통해 256개의 입력 벡터와 4개의 출력 벡터를 가지며, 보이드 방전, 코로나 방전, 표면 방전, 노이즈의 4개 클래스를 분류하며, 패턴인식률로서 결과를 분석한다.

  • PDF

정신분열증 환자의 얼굴표정을 통한 정서 인식 특성 (Emotion Recognition of Schizophrenics)

  • 박수경;오경자
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.356-361
    • /
    • 1999
  • 본 연구에서는 정신분열증 환자들이 인식하는 타인의 얼굴표정에 관한 정보를 정상집단과 비교해보았다. 정신분열증환자 30명과 정상인 31명을 대상으로 얼굴 계인 검사와 28개의 얼굴표정에 대한 명명과제를 실시하였다. 연구 결과, 얼굴표정에 대한 명명에서 정신분열증 환자집단은 정상집단에 비해 얼굴표정을 명명하는 일치율이 낮았고 흐뭇함과 두려움을 표현하는 표정을 인식하는데 어려움을 나타냈다. 또한, 28개의 얼굴표정들 중, 정신분열증 환자들은 7개의 표정(흐뭇함 3, 두려움 2, 경멸 1, 나른한 1)을 정상집단과 다른 정서로 명명하였다. 연구 결과를 통해, 정신분열증 환자들은 타인의 얼굴정서를 인식하는데 정상인들과 차이를 나타낸다는 것을 알 수 있었으며 이러한 결과를 토대로 정신분열증 환자들의 타인의 정서인식능력의 결핍에 대해서 논의하였다.

  • PDF

스마트폰 내장형 가속도 센서를 이용한 사용자 행위 인식 (Activity Recognition with Accelerometer-Embedded SmartPhones)

  • 김주희;남상하;허세경;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.427-430
    • /
    • 2012
  • 스마트폰의 내장형 3축 가속도 센서를 이용한 사용자 행위 인식은 사용자 개개인의 행위 패턴이 모두 달라 사용자에 따른 의존성이 크고, 스마트폰의 위치나 방향이 일정하게 고정되어 있지 않기 때문에 센서 데이터를 토대로 서로 다른 행위들을 정확히 분류하는데 어려움이 있다. 본 논문에서는 특정 사용자나 스마트폰의 특정 위치에 대한 의존성이 적은 효과적인 행위 인식 방식을 제안하고, 이를 기초로 안드로이드 스마트폰 기반의 실시간 행위 인식 시스템을 구현하였다. 총 6642개의 데이터 집합을 이용하여 본 논문에서 제안한 행위 인식 시스템의 사용자 의존성 및 폰 위치 의존성 분석 실험을 수행하고, 그 결과를 소개한다.

개인별 고유얼굴 공간을 이용한 얼굴 인식 방법 (Face Recognition Method using Individual Eigenfaces Space)

  • 이경희
    • 정보보호학회논문지
    • /
    • 제16권5호
    • /
    • pp.119-123
    • /
    • 2006
  • 본 논문에서는 얼굴인식에 널리 사용되는 고유얼굴(eigenfaces)을 이용한 방법에서 고유얼굴들을 고유치(eigenvalues)의 크기에 따라 사용하는 기존의 방식과는 달리, 개인별로 인식에 사용될 고유얼굴들을 선택하여 인식하는 방법을 제안한다. YALE, ORL(Olivetti Research Laboratory) 데이터베이스에 대하여, 기존의 방법과 제안한 방법에 의한 선택에 따른 고유얼굴들을 사용한 경우를 비교 실험하였다. 실험결과, 개인별로 선택된 고유얼굴들에 의한 특징벡터를 이용한 인식이 더 우수한 성능을 보였다.

SNS 활동성이 4차산업혁명 기대에 미치는 영향에 있어 개인정보보호태도의 조절효과 (Moderating Effect of Privacy Attitude on SNS Activity and Expectations of the 4th Industrial Revolution)

  • 홍재원;박승배
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.111-112
    • /
    • 2020
  • 본 논문에서는 소비자들의 4차 산업혁명에 대한 인식이 어떠한지를 살펴보고, 그러한 인식들은 개별 소비주체들의 SNS 지향적인 활동에 따라 다를 것이라는 가정을 두고 분석을 시작하였다. 즉, SNS 지향적인 활동을 하는 사람일수록 4차 산업혁명에 대한 인식이 잘 되어 있을 것이다. 하지만 그러한 개방적인 인식도 프라이버시의 수준에 따라 의존적일 수 있을 것이므로 이에 대한 조절효과를 살펴보고자 하였다. 그 결과, SNS 지향적인 소비자일수록 4차 산업혁명에 대한 인식이 높게 나타났으며 이러한 관계는 개인들이 프라이버시에 대해 자유로울수록 더 증폭되는 것으로 나타났다. 본 연구는 4차 산업혁명에 당면한 경제구조 속에서 보다 적극적인 대응을 하기 위한 기초자료로 기여를 할 것으로 판단된다.

  • PDF

N개의최적문장을 찾을 수 있는 한국어 연속음성인식 시스템 (A Korean Continuous Speech Recognition System for finding N-best Sentence Hypotheses)

  • 구명완
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.48-51
    • /
    • 1994
  • 본 논문은 N개의 최적문장을 찾을 수 있는 한국어 연속 음성인식시스템 개발과 성능실험에 관한 것이다. 개발된 연속 음성인식시스템은 462개의 단어로 이루어지며 언어 복잡도가 30인 연속문장을 인식할 수 있으며 언어처리, 기계번역 등과 같이 쉽게 정합되어 문장 인식률을 향상시킬 수 있도록 N개의 최적문장도 찾을 수 있다. 또한 인식의 기본단위로 triphone을 사용하였으며 단어간, 단어내의 조음현상도 모델링하였다. 남성화자 3인에 대한 화자독립 실험 결과 단어 인식율은 95.7%을 얻었으며 문장 인식율은 하개의 최적문장인 경우 88.5%, 5개의 최적문장을 고려하면 98.6% 문장 인식률을 얻었다.

  • PDF

유사지명 인식시의 성능 개선 연구 (A study on the improvement of speech recognition for similar place names)

  • 백승권;양희식;한민수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.49-53
    • /
    • 2000
  • 본 연구에서는 DAB(Digital Audio Broadcasting) 시스템의 교통정보 검색 서비스를 위하여 경부선 및 호남선의 톨게이트가 위치한 49 개의 지명을 대상으로 이를 인식하고자 할 때 인식 율을 개선하였다. 지명 어휘의 특성을 분석한 결과 전체 지명의 81.6%가 2 음절이었으며 동일한 음절을 포함하는 지명이 전체의 구성된 어휘가 61%로 조사되었다. 시스템에서 인식율을 개선하기 위하여 인식 대상어휘를 3개의 set로 재분류하고 인식 대상 어휘로 판정된 후보 어휘에 대하여 인식 성공여부에 핵심이 되는 음절의 위치에 따라 가중치 윈도우를 적용하였다. 그 결과 화자 독립의 인식율 테스트에서 남성의 경우 7.2%, 여성의 경우 5.1%의 인식율 향상을 보였다.

  • PDF

CHMM을 이용한 발매기 명령어의 음성인식에 관한 연구 (A Study on the Speech Recognition for Commands of Ticketing Machine using CHMM)

  • 김범승;김순협
    • 한국철도학회논문집
    • /
    • 제12권2호
    • /
    • pp.285-290
    • /
    • 2009
  • 논문에서는 연속HMM(Continuos Hidden Markov Model)을 이용하여 실시간으로 발매기 명령어(314개 역명)를 인식 할 수 있도록 음성인식 시스템을 구현하였다. 특징 벡터로 39 MFCC를 사용하였으며, 인식률 향상을 위하여 895개의 tied-state 트라이폰 음소 모델을 구성하였다. 시스템 성능 평가 결과 다중 화자 종속 인식률은 99.24%, 다중화자 독립 인식률은 98.02%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 다중 화자 독립 실험의 경우 93.91%의 인식률을 나타내었다.

가변어휘 음성인식기 구현에 관한 연구 (A Study on the Implementatin of Vocalbulary Independent Korean Speech Recognizer)

  • 황병한
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제5권
    • /
    • pp.60-63
    • /
    • 1998
  • 본 논문에서는 사용자가 별도의 훈련과정 없이 인식대상 어휘를 추가 및 변경이 가능한 가변어휘 인식시스템에 관하여 기술한다. 가변어휘 음성인식에서는 미리 구성된 음소모델을 토대로 인식대상 어휘가 결정되명 발음사전에 의거하여 이들 어휘에 해당하는 음소모델을 연결함으로써 단어모델을 만든다. 사용된 음소모델은 현재 음소의 앞뒤의 음소 context를 고려한 문맥종속형(Context-Dependent)음소모델인 triphone을 사용하였고, 연속확률분포를 가지는 Hidden Markov Model(HMM)기반의 고립단어인식 시스템을 구현하였다. 비교를 위해 문맥 독립형 음소모델인 monophone으로 인식실험을 병행하였다. 개발된 시스템은 음성특징벡터로 MFCC(Mel Frequency Cepstrum Coefficient)를 사용하였으며, test 환경에서 나타나지 않은 unseen triphone 문제를 해결하기 위하여 state-tying 방법중 음성학적 지식에 기반을 둔 tree-based clustering 기법을 도입하였다. 음소모델 훈련에는 ETRI에서 구축한 POW (Phonetically Optimized Words) 음성 데이터베이스(DB)[1]를 사용하였고, 어휘독립인식실험에는 POW DB와 관련없는 22개의 부서명을 50명이 발음한 총 1.100개의 고립단어 부서 DB[2]를 사용하였다. 인식실험결과 문맥독립형 음소모델이 88.6%를 보인데 비해 문맥종속형 음소모델은 96.2%의 더 나은 성능을 보였다.

  • PDF