• 제목/요약/키워드: HMM(HMM)

검색결과 963건 처리시간 0.023초

PDA 환경에서 자동화자 확인의 계산량 개선을 위한 연구 (A Study for Complexity Improvement of Automatic Speaker Verification in PDA Environment)

  • 서창우;임영환;전성채;장남영
    • 융합신호처리학회논문지
    • /
    • 제10권3호
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 PDA 디바이스에서 개인정보를 보호하기 위한 자동화자확인 시스템을 제안한다. 최근 M-커머스와 같은 모바일 환경을 위한 PDA의 용량이 확장되고 사용이 증가되고 있다. 그러나 너무 많은 계산량 때문에 PDA 디바이스에서 자동화자확인의 실질적인 응용은 여전히 많은 어려움이 존재한다. 본 논문에서는 이러한 문제점을 해결하기 위해서 음성발성 동안 스펙트럼 차감법과 음성 검출과 같은 전처리를 수행함으로써 계산량을 줄일 수 있는 방법을 적용하였다. 또한 빠른 처리 결과를 얻기 위한 은닉마코프모델의 최적 상태 정합과 시퀀스 확률비 테스트를 적용하였다. 전체적인 시스템은 PDA디바이스의 제한된 메모리와 낮은 CPU 속도에 적합하도록 간결하게 구현하였다.

  • PDF

차량 항법용 음성인식 시스템의 구현 (Implementation of a Speech Recognition System for a Car Navigation System)

  • 이태한;양태영;박상택;이충용;윤대희;차일환
    • 전자공학회논문지S
    • /
    • 제36S권9호
    • /
    • pp.103-112
    • /
    • 1999
  • 본 논문에서는 차량 항법영 음성 인식을 위한 화자 독립 단독음 인식 시스템을 범용 DSP를 사용하여 구현하였으며, 잡음 처리 기술로 SNR 정규화와 RAS를 결합한 방법을 제안하여 인식 시스템의 성능을 개선시켰다. 인식 알고리즘으로서 반연속 HMM을 사용하였으며, TMS320C31을 이용하여 구현하였다. 실험에서 사용된 인식 단어는 차량 항법 시스템을 위한 명령어 69단어이며, 구현된 인식 시스템은 자동차 환경에서 녹음된 음성 데이터에 의한 인식 결과와 하드웨어 구현에 따르는 제약 조건을 동시에 고려하여 구현되었다. 주행 중에 녹음된 데이터에 대한 컴퓨터 시뮬레이션 상에서 특징 벡터 중 MFCC-CMS를 이용하고, 잡음 처리 방법으로 SNR 정규화와 스펙트럼 차감법을 결합하여 실험한 경우 최고 93.62%의 인식 성능을 보였으며, 89.93%의 인식률을 갖는 기존 방법보다 3.69%의 인식 성능 향상을 가져왔다. 제안된 잡음 처리 방법은 자동차 안에서의 SNR이 5dB이하에서 좋은 인식 성능을 보이는 것으로 나타났다.

  • PDF

개선된 Levenshtein Distance 알고리즘을 사용한 어휘 탐색 시스템 (Vocabulary Retrieve System using Improve Levenshtein Distance algorithm)

  • 이종섭;오상엽
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.367-372
    • /
    • 2013
  • 기존의 Levenshtein distance 알고리즘은 어휘들 간의 순서가 정해져 있지 않은 경우에 사용되므로 어휘 탐색 작업의 중요도를 구분할 수 없는 단점을 가진다. 본 연구에서 제안하는 개선된 Levenshtein 방법에서는 효율적으로 사용빈도에 따라 어휘들을 탐색하고, 어휘들 간의 순서를 가지는 가중치를 부여한다. 따라서 어휘의 수가 증가하는 경우에도 효율적으로 사용빈도에 따라 어휘를 탐색하여 인식율이 저하되는 단점을 해결하고, 인식 시간을 향상 및 탐색 공간의 효율적으로 관리할 수 있는 장점을 가진다. 제안한 시스템을 분석한 결과 실내 환경에서 어휘 종속 인식률은 97.81%, 어휘 독립 인식률은 96.91%의 인식률을 나타났다. 또한, 실외 환경에서 어휘 종속 인식률은 91.11%, 어휘 독립 인식률은 90.01%의 인식률을 나타났다.

페이스북 마케팅 활용 방안에 대한 연구: 페이스북 '좋아요' 기능과 인구통계학적 정보 추출 (The Study of Facebook Marketing Application Method: Facebook 'Likes' Feature and Predicting Demographic Information)

  • 유성종;안세은;이준기
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.61-66
    • /
    • 2016
  • 최근 기업들이 빅데이터를 활용하여 효과적인 마케팅 전략을 전개함에 있어서, 고객의 세부정보를 기반으로 하는 개인화된 마케팅 전략을 활용하고 있다. 하지만 프라이버시 및 개인정보 유출위협이 커짐에 따라 소셜 네트워크 사이트(Social Network Site, 이하 SNS)에서 계정의 개인정보 항목을 삭제하거나 정보공개수준을 통제하는 경향이 높아지고 있다. 이로인해 기업의 마케팅 담당자들은 고객의 세부정보를 파악하는 것에 어려움을 겪고 있다. 본 연구에서는 SNS 중에서 가장 많은 회원 수를 보유하고 있는 Facebook에서 제한된 정보를 바탕으로 성별을 예측하는 분석방법론을 도출하고자 하였다. 본 연구에는 측정도구로 Gaussian RBF, nFactors, randomForest, 그리고 5-fold cross-validation 사용하였다. 그 결과, 성별은 75%, 연령대는 97.85%로 '좋아요' 정보만을 가지고 성별과 연령을 예측할 수 있었다. 즉, 사용자들의 어떠한 세부정보 없이, Facebook의 '좋아요'의 정보를 가지고 인구통계학적인 정보를 추론할 수 있었다. 본 연구의 결과를 바탕으로 개인정보 수집에 어려움을 겪고 있는 기업 및 마케팅 담당자들에게 유용한 가이드 라인을 제시 할 수 있을 것으로 기대한다.

  • PDF

플라즈마 식각 공정에서 의사결정 알고리즘을 이용한 실시간 식각 종료점 검출 (Real Time Endpoint Detection in Plasma Etching Using Decision Making Algorithm)

  • 노호택;박영국;한승수
    • 전기전자학회논문지
    • /
    • 제20권1호
    • /
    • pp.9-15
    • /
    • 2016
  • 플라즈마 식각 공정에서 식각 종료점 검출은 중요한 요소이다. Optical Emission Spectroscopy (OES) 는 플라즈마 반응을 분석하는데 사용한다. 그리고 Plasma Impedance Monitoring (PIM) 은 플라즈마 공정 중에 RF power에 의한 voltage, current, power, impedance를 분석하는데 사용한다. 본 논문에서는 새로 제안하는 의사결정 알고리즘을 이용하여 single layer 산화막 플라즈마 식각에서 식각 종료점 검출의 성능을 향상시키는 것을 제안한다. 식각 종료점 검출의 정확도를 높이기 위해 OES 데이터와 PIM 데이터들을 의사결정 알고리즘에 모두 적용하여 사용한다. 제안된 방법은 SiOx 플라즈마 식각에서 식각 종료점을 정확하게 검출한다.

Hidden Markov Network를 이용한 음향학적 음소모델 작성에 관한 검토 (A Study on Construction of Acoustical Phoneme Models Using Hidden Markov Network)

  • 오세진;임영춘;황철준;김범국;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.29-32
    • /
    • 2000
  • 본 논문에서는 음성인식 시스템의 음향모델 개선을 위한 기초적 연구로서, 문맥적인 요소를 필요로 하는 SSS(Successive State Splitting)와 필요로 하지 않는 SSS-free 알고리즘을 이용한 HMnet(Hidden Markov Network) 음향모델 작성방법에 대해 검토하고 작성한 음향모델을 한국어에 적용하여 그 유효성을 확인하였다. HMnet을 이용한 음소모델의 작성방법은 전체 학습 데이터에 대해서 각각 2개의 상태를 가지는 초기 모델을 작성한 후, 이를 시간과 문맥방향으로의 최대 분포를 가지는 상태를 재분할한 후 임의의 상태수가 될 때까지 상태분할을 계속적으로 수행케 하여 각 음소모델을 작성하게 된다. 작성한 HMnet 음향모델의 유효성을 확인하기 위해 ETRI 445 단어의 3인에 대한 화자종속 음소인식 실험을 수행하였다. 인식실험 결과, SSS 알고리즘을 이용한 화자종속실험의 경우 상태수 520에서 평균 $62.8\%$의 인식률을, SSS-free 알고리즘의 경우 상태수 420에서 평균 $64.2\%$의 인식률을 얻었다. 이 결과는 HMM을 이용한 경우(약$43.4\%$)보다 $20\%$이상의 인식률 향상을 보여 이 알고리즘의 유효성을 확인할 수 있었다. SSS와 SSS-free를 비교한 경우, SSS-free가 SSS보다 낮은 상태수에서 평균 $1.4\% 향상된 인식률을 보였다.

  • PDF

퍼지양자화 은닉 마르코프 모델에서 코드워드 종속거리 정규화와 Instar 형태의 퍼지 기여도에 기반한 출력확률의 평활화 (Codeword-Dependent Distance Normalization and Smoothing of Output Probalities Based on the Instar-formed Fuzzy Contribution in the FVQ-DHMM)

  • 최환진;김연준;오영환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.71-79
    • /
    • 1997
  • 본 논문에서는 FVQ-DHMM(fuzzy vector quantization-discrete hidden Markov model)에서 강인한 출력확률의 추정을 위해서 코드워드 종속 거리 정규화와 출력확률에 대한 instar 형태의 퍼지 평활화 방법을 제안한다. FVQ-DHMM은 DHMM의 변형된 모델로, 상태별 출력확률이 입력패턴에 대한 각 코드워드와의 가중치와 출력확률의 곱에 대한 합의 형태로 추정된다. FVQ-DHMM의 성능이 가중치 요소와 상태별 출력분포에 영향을 받으므로, 가중치 요소와 상태별 출력분포를 강인하게 추정하는 방법이 필요하게 된다. 실험결과, 제안된 코드워드 종속 거리 정규화(CDDN : codeword dependent distance normalization)를 적용한 방법이 기존의 FVQ-DHMM에 비해 24%의 오인식률 감소가 있었으며, 상태별 출력분포에 대해서 평활화를 적용한 경우 79%의 오식율을 감소 시킴을 알 수 있었다. 이러한 결과는 제안된 CDDN과 퍼지 평활화의 사용이 향상된 인식율을 얻는데 주요하며, 결과적으로 제안된 방법이 FVQ-HMM을 위한 강인한 출력확률의 추정을 위한 대안으로 유용함을 보여준다고 할 수 있다.

  • PDF

음성 인식에서 음소 클러스터 수의 효과 (The Effect of the Number of Phoneme Clusters on Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제9권11호
    • /
    • pp.1221-1226
    • /
    • 2014
  • 본 논문에서는 음성 인식의 효율을 높이기 위하여 음소 클러스터 개수의 효과에 대해 연구하였다. 이를 위하여 음소 클러스터 개수를 바꾸어 가면서 수정된 k-평균 군집 알고리듬을 사용하여 코우드북을 작성하였다. 그런 다음, 퍼지 벡터 양자화와 은닉 마코브 모델을 사용하여 음성인식 테스트를 수행하였다. 실험 결과 두 개의 영역이 구분되어 나타났다. 음소 클러스터 개수가 클 때 인식 성능은 대체로 그와 무관하지만, 개수가 작을 때에는 그 감소와 더불어 인식 오류율이 비선형적으로 증가하는 것으로 나타났다. 수치 해석적 계산으로부터, 이 비선형 영역은 멱승함수에 의해 모델링 될 수 있었다. 또한 300개의 고립단어 인식의 경우에, 166개의 음소클러스터가 최적의 수임을 보일 수 있었다. 이는 음소당 3개 정도의 변화에 해당하는 값이다.

음소에 따른 화자특성을 이용한 화자적응방법에 관한 연구 (The Study on the Speaker Adaptation Using Speaker Characteristics of Phoneme)

  • 채나영;황영수
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.6-9
    • /
    • 2003
  • 본 연구는 화자 적응 시스템을 구축하기 위한 전과정으로서, 음성 인식 단위로, 음소를 이용할 경우 화자 적응 변화에 대한 연구이다. 음소 변화에 따른 가중치를 적응시켜 화자 적응을 하기 위하여, 본 연구에서는 인식 시스템으로 반연속 HMM, 화자 적응 방법으로는 최대사후확률추정법과 음성선형특성을, 인식 대상 단어로 10개의 격리 숫자음을 사용하였다. 상기의 화자 적응 방법들은 교사 없는 학습이 가능한 것으로서, 온라인 시스템에서 사용이 가능하다. 이 두 방법을 수행한 결과 두 번째 방법보다 첫 번째 방법의 결과가 더 나은 인식률을 보였으며, 두 방법 모두 결합하여 인식 실험을 한 결과가 각각의 화자 적응 방법을 독립적으로 수행한 결과보다 좋은 결과를 얻을 수 있었다. 또한 가중치에 따른 화자 적응 결과 음소에 따른 변동 가중치를 사용할 경우가 고정된 가중치를 이용한 것보다 우수한 결과를 보였다.

  • PDF

다중척도 모델의 결합을 이용한 효과적 인 침입탐지 ((Effective Intrusion Detection Integrating Multiple Measure Models))

  • 한상준;조성배
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권3호
    • /
    • pp.397-406
    • /
    • 2003
  • 정보통신기술이 발전함에 따라 내부자의 불법적인 시스템 사용이나 외부 침입자에 의한 중요 정보의 유출 및 조작을 알아내는 침입탐지시스템에 대한 연구가 활발히 이루어지고 있다. 이제까지는 네트워크 패킷, 시스템 호출 감사자료 등의 척도에 은닉 마르코프 모델, 인공 신경망, 통계적 방법 등의 모델링 방법을 적용하는 연구가 이루어졌다. 그러나 사용하는 척도와 모델링 방법에 따라 취약점이 있어 탐지하지 못하는 침입이 많은데 이는 침입의 형태에 따라 흔적을 남기는 척도가 다르기 때문이다. 본 논문에서는 이러한 단일척도 침입탐지시스템의 단점을 보완하기 위해 시스템 호출, 프로세스의 자원점유율, 파일 접근이벤트 등의 세 가지 척도에 대하여 은닉 마르코프 모델, 통계적 방법, 규칙기반 방법을 사용하여 모델링한 후, 그 결과를 규칙기반 방법으로 결합하는 침입탐지 방법을 제안한다. 실험결과 다양한 침입 패턴에 대하여 다중척도 결합방법이 매우 낮은 false-positive 오류율을 보여 그 가능성을 확인할 수 있었다.