• 제목/요약/키워드: 연속변이

검색결과 164건 처리시간 0.026초

대화체 연속음성인식을 위한 확장 다중발음 사전에 관한 연구 (A Study on the Multiple Pronunciation Dictionary for Spontaneous Speech Recognition)

  • 강병옥
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.65-68
    • /
    • 2003
  • 본 논문에서는 대화체 연속음성인식 과정에서 사용되는 다중발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 한 확장된 발음사전의 방법을 적용하여 대화체 연속음성인식에서 인식성능의 향상을 가져오게 됨을 실험을 통해 보여준다. 대화체 음성에서 빈번하게 나타나는 음운축약 및 음운탈락, 전형적인 오발화, 양성음의 음성음화 등의 발음변이는 언어모델의 효율성을 떨어뜨리고 어휘 수를 증가시켜 음성인식의 성능을 저하시키고, 또한 음성인식 결과로 나타나는 출력형태가 정형화되지 못하는 단점을 가지고 있다. 이에 이러한 발음변이들을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고, 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 한다. 그리고, 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 하여 결과적으로 인식성능을 향상시키고, 정형화된 출력패턴을 얻도록 한다. 본 연구에서는 어절단위 뿐 아니라 의사형태소[2] 단위의 발음사전에도 발음변이를 포용하도록 하여 실험을 하였다. 실험을 통해 어절단위의 다중발음사전 구성을 통해 ERR 10.9%, 의사형태소 단위의 다중발음 사전의 구성을 통해 ERR 4.3%의 성능향상을 보였다.

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

확률 발음사전을 이용한 대어휘 연속음성인식 (Large Vocabulary Continuous Speech Recognition using Stochastic Pronunciatioin Lexicon Modeling)

  • 윤성진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.315-319
    • /
    • 1998
  • 대어휘 연속음성인식을 위한 확률 발음사전 모델에 대해서 제안하였다. 제안된 확률 발음 사전은 연속음성과 같은 자연스런 발성에서 자주 발생되는 단어의 변이를 확률적인 subword-state로 이루어진 HMM으로 모델화 함으로써 단어의 발음 변이를 효과적으로 표현할 수 있으며, 단위 인식 시스템의 성능을 보다 높일 수 있도록 구성되었다. 확률 발음사전의 생성은 음성 자료와 음소 모델을 이용하여 단어 단위의 분할과 학습을 통해서 자동으로 생성되게 됨 음소와 같은 언어학적인 단위뿐만 아니라 PLU 이나 비언어학적인 인식 모델을 이용한 연속음성인식기에도 적용이 가능하다.연속음성인식실험결과 확률 발음사전을 사용함으로써 표준 발음 표기를 사용하는 인식 시스템에 비해 단어 오류율은 39.8%, 문장 오류율은 24.4%의 큰 폭으로 오류율을 감소시킬 수 있었다.

  • PDF

딸기 조직배양 시 BA (benzyladenine) 처리에 따른 변이 발생 및 변이 연속성 검정 (Occurrence and identification of genetic variation and variation continuity in strawberry tissue culture caused by benzyladenine treatment)

  • 김혜진;최미자;이종남;서종택;김기덕;김율호;홍수영;김수정;손황배;남정환
    • Journal of Plant Biotechnology
    • /
    • 제47권1호
    • /
    • pp.46-52
    • /
    • 2020
  • 본 실험은 딸기 조직배양 시 BA 처리에 따른 변이 발생 및 변이 연속성을 확인하고자 실시하였다. 본 실험에 사용된 공시 품종은 '고하'이며, 본 실험에 사용한 BA 농도는 0.0, 0.5, 1.0, 2.0 mg·L-1로 처리하였다. 변이는 형태적, 유전적 검정을 실시하였으며, 변이 연속성 검정은 3년간 실시하였다. BA 처리 시 형태적 변이는 10.5 ~ 20.0%로 매우 높게 나타났으나, 유전적 변이는 재배 1년차에 7.0 ~ 15.0%, 재배 2년차에는 1.8 ~ 10.0%, 재배 3년차에는 5.0%로 재배연수가 길어짐에 따라 유전적 변이 발생율이 낮아졌다. 뿐만 아니라 재배1년차와 2년차에는 BA 1.0 mg·L-1과 BA 2.0 mg·L-1에서 유전적 변이가 발생한 반면, 재배 3년차에는 BA 2.0 mg·L-1에서만 유전적 변이가 발생하였다. 따라서 딸기 조직배양묘의 증식을 위해서 BA는 1.0 mg·L-1미만으로 처리하고, 반드시 변이 검정 후 보급하는 것이 바람직하다고 판단되었다.

소성모델에 기초한 형상기억합금의 연속체 구성방정식 (Continuum constitutive equation of Shape Memory Alloy based on plasticity model)

  • 류정현;김상헌;조맹효
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.30-33
    • /
    • 2009
  • 본 논문에서는 형상기억합금의 특징적인 거동을 모사하기위한 구성방정식을 제안한다. 제안되는 구성방정식은 기존의 소성모델을 기초로 하는 현상학적인 모델로, 소성 경화이론에서 사용되는 항복곡면에 대응되는 상변이 곡면을 정의하여 형상기억합금의 비선형 거동을 모사한다. 단, 상변이 곡면이 1개만 존재하는 소성모델과는 다르게, 오스테나이트에서 마르텐사이트로의 정방향 상변이와 마르텐사이트에서 오스테나이트로의 역방향 상변이를 각각 해석하기위해 독립적인 2개의 상변이 곡면을 정의해주게 된다. 기계적 하중만이 아닌 열적 하중의 변화에도 비선형 거동을 보이는 형상기억합금의 특성을 반영하기위해 상변이 곡면은 응력과 온도의 함수로 정의되며, 이렇게 정의된 상변이 곡면을 바탕으로 리턴 매핑 알고리즘을 적용하여 열적하중과 기계적하중의 변화에 따른 형상기억합금의 거동을 모사하는 구성방정식을 제안하였다.

  • PDF

변이-움직임 벡터의 상관관계를 이용한 객체기반 스테레오 동영상 부호화 (Object-based Stereo Sequence Coding using Disparity and Motion Vector Relationship)

  • 박찬희;손광훈
    • 방송공학회논문지
    • /
    • 제7권3호
    • /
    • pp.238-247
    • /
    • 2002
  • 본 논문에서는 객체 단위 스테레오 동영상을 변이-움직임 벡터의 상관관계를 이용하여 부호화 방식을 제안한다. 시간적으로 연속되는 스테레오 동영상에서의 객체를 MPEG-4와 같이 VOP 단위로 구성하고, 이전 시간에서 한 쌍의 VOP에 대한 변이 벡터와 현재 시간에서 좌ㆍ우 VOP에 대한 움직임 벡터를 블록 정합 방식으로 구한다. 그리고 나머지 한 개의 변이 벡터는 위에서 구한 벡터들을 가지고 변이-움직임 벡터의 상관관계를 이용하여 별도의 추정과정 없이 구한다. 그리고 보다 신뢰성 있는 벡터를 구하기 위해 각각 구한 변이와 움직임 벡터에 평활화를 수행한다. 이러한 기법을 스테레오 동영상 부호화에서 대부분의 부호화 방식인 B-VOP 예측부호화에 적용하였고 B-YOP 변이 보상시 변이-움직임 벡터의 상관관계를 이용하여 3개의 참조 VOP를 가지고 보상함으로써 화질을 기존 방식에 비해 향상시킬 수 있었다.

SCHMM 기반 7연속 숫자음 인식에 관한 연구 (A Study on 7-Connected Digits Speech Recognition using SCHMM)

  • 김세용;정희석;강철호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.127-130
    • /
    • 2002
  • 본 연구에서는 우리말 연속 숫자음 인식에서 본래의 숫자음을 변이 시키는 주된 요인인 연음현상에 대한 인식을 높이기 위해 별도의 연음부분의 레퍼런스를 작성하여 매칭 시키는 방식을 제안한다 또한 단모음으로 이루어진 /2/와 /5/의 연속된 음에 대하여도 레퍼런스를 작성하였다. 제안한 방식에 의하여 전체적으로 $1.4\%$정도 인식률이 상승됨을 볼 수 있다. 특히 발성 목록중 /82/, /62/, /31/, /15/, /75/ 등의 연음과 /226/, /755/등과 같이 모음의 연속된 발성이 포함된 숫자 열에서 제안된 방식이 인식률에 영향을 미치는 것을 볼 수가 있었다. 이는 연음에서 발생하는 오류가 연속 숫자음에 많은 영향을 미치는 것을 알 수 있다. 그 외에 /22/, /55/등과 같이 단모음으로 이루어진 숫자음의 연속 발성 또한 인식률을 저하시키는데 한 요인으로 작용함으로서 이에 대한 레퍼런스도 작성하여 인식률이 상승되는 것을 볼 수 있었다.

  • PDF

착유우의 연속유량, 유량변이, 유성분, 체세포수, 비유지속시간, 비유속도에 대한 산차, 착유시간, 유기 및 착유간격의 효과 (The Effects of Various Factors on Milk Yield and Variation in Milk Yield Between Milking, Milk Components, Milking Duration, and Milking Flow Rate in Holstein Dairy Cattle)

  • 안병석;전병순;백광수;박성재;이현준;이왕식;김상범;박수봉;김현섭;주종철;아즈말 칸
    • Journal of Animal Science and Technology
    • /
    • 제47권6호
    • /
    • pp.919-924
    • /
    • 2005
  • 본 연구는 축산연구소에서 사육하고 있는 홀스타인 젖소 122두를 공시하여 2005.7.1부터 2005.8.8까지 연속유량, 유량변이, 유성분, 체세포수, 착유시간, 비유지속시간, 최고비유속도 및 비유속도에 영향을 미치는 산차, 착유시간, 착유간격, 유기가 미치는 효과에 대하여 조사 분석하였다. 공시축의 평균산차는 1.6산, 평균유기는 199.4일, 1회 착유시 평균유량은 12.25kg이었다. 연속유량, 유성분(지방율, 단백질율, 유당율, 무지고형분율), 체세포수, 비유지속시간, 최고비유속도, 평균비유속도는 산차 영향을 받았으며 연속유량, 유량변이, 지방율, 무지고형분율, 체세포수, 비유지속시간, 최고비유속도, 평균비유속도는 착유시간의 영향을 받았다. 비유일수는 연속유량, 지방율, 단백질율, 무지고형분율, 비유속도와 평균비유속도에 영향을 미쳤고, 착유간격은 연속유량, 유량변이, 평균비유속도에 영향을 미치는 것으로 나타났다. 그러나 MUN은 산차, 착유시간, 유기, 착유간격에 의한 영향은 없었다. 연속유량은 산차가 증가 할수록 감소하는 경향이었으며 오전 착유가 오후 착유보다 많이 생산되었고 유량변이에서는 산차간 차이가 없었으나 착유시간에서는 차이가 있었다. 유성분 중에서 지방율에서는 오후 착유가 오전 착유에 비하여 높은 결과를 보였다. 유성분인 유지방율, 유단백율, 유당율 및 무지고형분율과 체세포수, 비유지속시간과 분당 최고비유속도에 대하여 산차와 착유시간에 따라 달랐으나 MUN은 변화가 없었다. 본 연구 결과로 미루어 볼 때 유량변이, 비유속도, 비유시간 등도 중요한 형질로 취급되어야 하며 이들의 유전적 특성 구명을 위하여 더 많은 연구가 수행되어야 할 것으로 생각한다.

기능어용 음소 모델을 적용한 한국어 연속음성 인식 (Korean Continuous Speech Recognition using Phone Models for Function words)

  • 명주현;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.354-356
    • /
    • 2000
  • 의사형태소를 디코딩 단위로 한국어 연속 음성 인식에서의 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들은 한국어 기능어라 정의하고 실제 의사형태소 단위의 인식 실험을 통하여 기능어 집합 1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

  • PDF

확률 발음사전을 이용한 대어휘 연속음성인식 (Stochastic Pronunciation Lexicon Modeling for Large Vocabulary Continous Speech Recognition)

  • 윤성진;최환진;오영환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.49-57
    • /
    • 1997
  • 본 논문에서는 대어휘 연속음성인식을 위한 확률 발음사전 모델에 대해서 제안하였다. 확률 발음 사전은 HMM과 같이 단위음소 상태의 Markov chain으로 이루어져 있으며, 각 음소 상태들은 음소들에 대한 확률 분포 함수로 표현된다. 확률 발음 사전의 생성은 음성자료와 음소 모델을 이용하여 음소 단위의 분할과 인식을 통해서 자동으로 생성되게 된다. 제안된 확률 발음 사전은 단어내 변이와 단어간 변이를 모두 효과적으로 표현할 수 있었으며, 인식 모델과 인식기의 특성을 반영함으로써 전체 인식 시스템의 성능을 보다 높일 수 있었다. 3000 단어 연속음성인식 실험 결과 확률 발음 사전을 사용함으로써 표준 발음 표기를 사용하는 인식 시스템에 비해 단어 오류율은 23.6%, 문장 오류율은 10% 정도를 감소시킬 수 있었다.

  • PDF