• 제목/요약/키워드: 고립단어

검색결과 127건 처리시간 0.029초

한국어 어말어미 산출관련 대뇌 활성화 (Cerebral activation related with morphological priming effect in production of Korean Endings)

  • 황유미;신정무;임수미;류근택;강현수;이광오;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.273-277
    • /
    • 2005
  • 본 연구는 한국어 어말어미 산출시 나타나는 대뇌 활성화 영역을 살펴보기 위하여 실시되었다. 두 가지 실험이 실시되었다 실험 1은 어말어미의 기본형을 주고 이를 의문형, 명령형으로 산출하는 고립단어 실험을 실시하였다. 통제 조건으로 모음변환조건(C1)과 아라비아문자보기(C2)를 사용하였다. 실험 1의 결과 ‘어말어미-C1’ 조건에서 좌반구의 측두엽과 전두엽부분의 의 활성화 superior temporal gyrus와 inferior frontal gyrus의 활성화가 관찰되었다. ‘어말어미-C2’ 의 조건에서 우반구에서 후두엽의 활성화와 좌반구에서의 후두엽, 전두엽, lingual G, Cuneus, fusiform G, inferior occipital G에서의 활성화를 관찰할 수 있었다. 실험 2는 명령형과 의문형 어미의 형태점화효과와 관련된 대뇌 활성화 영역을 관찰하기 위하여 Er-fMRI 기법을 이용하여 실시되었다. 실험 조건은 어미동일조건, 어간반복조건, 무관련 조건으로 구성되었다. 피험자들은 점화자극이 제시된 후 신호가 제시되고 나오는 표적단어를 의문형 또는 명령으로 산출하도록 하는 과제를 실시하였다. 뇌 활성화 영역을 분석한 결과 의문형과 명령형을 산출할 때의 활성화 영역에서 $^{\ast}^{\ast}^{\ast}$를 볼 때의 영역을 빼기 (substraction)한 결과 공통적으로 좌반구 브로카 영역이 활성화되었고, 의문형과 명령형 안에서 어미동일조건에서 무관련 조건을 뺀 경우에는 좌반구의 superior temporal G 영역의 활성화가 관찰되었다. 이들 결과를 종합해 볼 때 어말어미 산출 그 자체와 직접 관련되는 영역으로는 좌반구의 측두엽과 전두엽 부분이 관찰되었다. 특히 한국어 어말어미 산출시 나타나는 형태점화 양상과 관련된 대뇌영역으로 발견된 브로카 영역에서의 활성화는 어미 변환과 관련된 영역이라기보다는 산출시 관련되는 articulation, motor coordinate관련 영역으로 추정되고, 측두엽의 활성화는 형태소, 의미 관련 지식의 data base로 추정된다. 또한 우반구 전두엽 부분에서 관찰된 활성화는 억제관련 영역으로 짐작된다.

  • PDF

웹에서의 저가 음성인식 시스템의 구현 (The Low Cost Implementation of Speech Recognition System for the Web)

  • 박용범;박종일
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1129-1135
    • /
    • 1999
  • DTW 알고리즘을 이용한 고립단어 인식은 화자종속이라는 상황에 있어서는 좋은 인식 율을 제공하여 준다. 그러나 DTW 알고리즘은 검색해야 할 단어가 많을 경우 검색시간이 상대적으로 높아지게 되므로 현실적으로 적용하기가 힘들다. 웹에서의 교육용 학습 지와 같이 상황 의존적 단답형 질의 응답을 요구하는 시스템의 경우에 있어서는 주어진 질문에 대한 응답이 비교적 제한되어 있어 검색대상을 줄일 수 있다. 본 논문에서는 이와 같은 상황에서 사용할 수 있는 저가형 음성 인식기를 DTW로 구현하였다. DTW의 단점을 보완하기 위해 검색할 대상을 상황에 따라 줄이는 방법을 이용하였다. 질문에 따라 관심대상을 선정하여 이들만을 검색대상으로 삼았다. 실제적인 구현을 통하여 검색대상을 줄인 결과 높은 인식 율을 얻을 수 있었고, 그룹을 설정한 만큼의 빠른 검색시간을 얻을 수 있었다.

  • PDF

인공 신경망을 이용한 한국어 문장단위 운율 발생에 관한 연구 (A study on the Prosody Generation of Korean Sentences using Artificial Neural networks)

  • 이일구;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.105-108
    • /
    • 1999
  • TTS(Text-To-Speech) 시스템 합성음성의 자연감을 개선하기 위해 하나의 언어에 대해 존재하는 운율 법칙을 정확히 구현해야 한다. 존재하는 운율 법칙을 추출하기 위해서는 방대한 분량의 언어 자료 구축이 필요하다. 그러나 이 방법은 존재하는 운율 현상이 포함된 언어자료에 대해 완벽한 운율을 파악할 수 없으므로 합성음성의 질을 좋게 할 수 없다. 본 논문은 한국어 음성의 운율을 학습하기 위해 2개의 인공 신경망을 제안한다. 하나의 신경망으로 문장의 각 음소에 대한 피치 변화를 학습시키는 것이며, 다른 하나는 에너지 변화를 학습하도록 하였다. 신경망은 BP 신경망을 이용하며 11개의 음소를 나타내기 위해 11개의 입력과, 중간 음소의 피치와 에너지 변화곡선을 근사하는 다항식 계수를 출력하도록 하였다. 신경망시스템의 학습과 평가에 앞서, 음성학적 균형잡힌 고립단어를 기반으로 의미있는 문장을 구성하였다. 문장을 남자 화자로 하여금 읽게 하고 녹음하여 음성 DB를 구축하였다. 음성 DB에 대해 각 음소의 운율 정보를 수집하여 신경망에 맞는 목표 패턴과 훈련 패턴을 작성하였다. 이 목표 패턴은 회귀분석을 통한 추세선을 이용해 피치와 에너지에 대한 2차 다항식계수로 구성하였다. 본 논문은 목표패턴에 맞는 신경망을 학습시켜 좋은 결과를 얻었다.

  • PDF

비선형 집단화와 완화기법을 이용한 VQ/HMM에 관한 연구 (A Study on VQ/HMM using Nonlinear Clustering and Smoothing Method)

  • 정희석;강철호
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.35-42
    • /
    • 1999
  • 본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 확률적으로 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두 가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.

  • PDF

음성인식 로봇을 위한 동시통화검출 기반의 강인한 음성 끝점 검출 (Robust End Point Detection for Robot Speech Recognition Using Double Talk Detection)

  • 문성규;박진수;고한석
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.161-169
    • /
    • 2012
  • 본 논문에서는 반향이 큰 로봇 환경에 강인한 음성 끝점 검출 방법을 제안한다. 양방향 대화 로봇과 같이 반향대 신호 비가 -5 dB 이하인 반향환경에서는, 반향제거기의 성능이 저하되어 사용자 음성 에너지와 비슷한 크기의 에너지를 갖는 잔여반향이 생긴다. 잡음에 강인한 기존의 음성 끝점검출 방법이라도, 사용자 음성과 비슷한 수준의 에너지를 갖는 잔여반향은 음성으로 오검출하기 때문에 정확한 음성 끝점검출이 어렵다. 반향 환경에 강인한 끝점검출을 위해, 본 논문에서는 음성/반향 구간 판별에 좋은 성능을 보이는 동시통화검출의 결과를 기존의 음성끝점검출 방법과 AND 연산하여 음성끝점검출기를 구성하였다. 제안하는 방법의 평가를 위해 반향이 큰 환경에서 고립단어 인식을 실험하였고, 다양한 실험환경에서 기존 음성 끝점검출 방법보다 평균 30 % 이상의 인식 성능 향상을 확인할 수 있었다.

합성단위 자동생성을 위한 자동 음소 분할기 후처리에 대한 연구 (The Postprocessor of Automatic Segmentation for Synthesis Unit Generation)

  • 박은영;김상훈;정재호
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.50-56
    • /
    • 1998
  • 본 논문은 자동 음소 분할기의 음소 경계 오류를 보상하기 위한 후처리 (Postprocessing)에 관한 연구이다. 이는 현재 음성 합성을 위한 음성/언어학적 연구, 운율 모델링, 합성단위 자동 생성 연구 등에 대량의 음소 단위 분절과 음소 레이블링된 데이터의 필요성에 따른 연구의 일환이다. 특히 수작업에 의한 분절 및 레이블링은 일관성의 유지가 어렵고 긴 시간이 소요되므로 자동 분절 기술이 더욱 중요시 되고 있다. 따라서, 본 논문은 자동 분절 경계의 오류 범위를 줄일 수 있는 후처리기를 제안하여 자동 분절 결과를 직접 합성 단위로 사용할 수 있고 대량의 합성용 운율 데이터 베이스 구축에 유용함을 기술한다. 제안된 후처리기는 수작업으로 조정된 데이터의 특징 벡터를 다층 신경회로망 (MLP:Multi-layer perceptron)을 통해 학습을 한 후, ETRI(Electronics and Telecommunication Research Institute)에서 개발된 음성 언어 번역 시스템을 이용한 자동 분절 결과와 후처리기인 MLP를 이용하여 새로운 음소 경계를 추출한다. 고립단어로 발성된 합성 데이터베이스에서 후처리기로 보정된 분절 결과는 음성 언어 번역 시스템의 분할율보 다 약 25%의 향상된 성능을 보였으며, 절대 오류(|Hand label position-Auto label position |)는 약 39%가 향상되었다. 이는 MLP를 이용한 후처리기로 자동 분절 오류의 범위를 줄 일 수 있고, 대량의 합성용 운율 데이터 베이스 구축 및 합성 단위의 자동생성에 이용될 수 있음을 보이는 것이다.

  • PDF

모바일 기기를 위한 음성인식의 사용자 적응형 후처리 (User Adaptive Post-Processing in Speech Recognition for Mobile Devices)

  • 김영진;김은주;김명원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권5호
    • /
    • pp.338-342
    • /
    • 2007
  • 본 논문에서는 모바일 환경에서 고립단어 음성인식을 할 경우 화자종속 방법을 이용하여 성능을 높이는 사용자 적응형 후처리 방법을 제안한다. 이 방법은 인식기의 정확한 인식 결과를 위한 추가적인 처리들로 구성된다. 즉 인식기의 출력과 정확한 최종 결과들 간의 관계를 학습하여 이를 잘못된 인식기의 출력을 수정하는 데에 사용한다. 학습에는 패턴인식에 강인한 다층 퍼셉트론을 사용하며 학습 시간을 고려하여 모델을 세분화하고 동적으로 동작할 수 있도록 구현한다. 이 결과 인식기의 오류에 대해 41%를 수정하는 성과(오류 수정률: 41%)를 보였다.

주행중인 자동차 환경에서의 고립단어 음성인식 연구 (A Study on Isolated Words Speech Recognition in a Running Automobile)

  • 유봉근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.381-384
    • /
    • 1998
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작없이 상시 음성의 입, 출력이 가능하도록 한다. 이때 잡음에 강인한 threshold 값을 구하기 위하여, 일정한 시간마다 기준 에너지와 영교차율(Zero Crossing Rate)을 변경하며, 밴드패스 필터(bandpass filter)를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점검출(End Point Detection)을 처리한다. 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)을 사용하며, 화자의 변별력을 높이기 위하여 2개의 모델사용을 제안한다. 또한 주행중인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누며 차량의 가변잡음 크기에 따라 자동으로 선택하도록 한다. 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 One-Stage Dynamic Programming (OSDP)를 이용한다. 실험결과, 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시속 80Km/h 이상)에서 화자독립 89.75%, 화자종속 90.08%의 인식율을 구하였으며, 경부 고속도로에서는 화자독립 92.29%, 화자종속 92.42%의 인식율을 구하였다. 그리고 저속 주행중인 자동차 환경(80km/h 이내, 시멘트, 아스팔트 등의 서울시내 및 시외독립)에서는 화자독립 92.89%, 화자종속 94.44% 인식율을 구하였다.

  • PDF

음성 신호의 음소 단위 구분화에 관한 연구 (A Study on the Segmentation of Speech Signal into Phonemic Units)

  • 이의천;이강성;김순협
    • 한국음향학회지
    • /
    • 제10권4호
    • /
    • pp.5-11
    • /
    • 1991
  • 본 연구에서는 음성신호의 음소 단위 구분화 방법을 제안한다. 제안된 구분화 시스템은 화자 독립적이고, 음성신호에 대한 사전 정보 없이도 음소 단위로 구분화를 수행할 수 있는 특징을 갖는다. 구분화 처리는 입력 음성신호를 먼저 순수 유성을 구간과 순수 유성음이 아닌 구간으로 분리 시킨 후, 각각의 구간에 대해 세분화된 음소 단위로 분리시키는 2단계 구분화 알고리즘을 적용하였고, 이때 사용된 파라미터는 유성을 검출 파라미터, 영차 LPC 캡스트럼 계수의 시간변호 파라미터, ZCR 파라미터이다. 본 연구에서 제안한 구분화 알고리즘의 유용성을 입증하기 위해 사용한 대상어는 고립단어와 연속음성으로 구성된 어휘로서 전체 어휘중에 포함된 507개 음소에 대한 구분화율은 91.7% 이다.

  • PDF

베이시안 신뢰도 융합을 이용한 신뢰도 측정 (Bayesian Fusion of Confidence Measures for Confidence Scoring)

  • 김태윤;고한석
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.410-419
    • /
    • 2004
  • 본 논문에서는 베이시안에 기반한 신뢰도 융합 기법을 제안한다. 음성인식에서 신뢰도는 인식 결과에 대한 신뢰의 정도를 말하며, 인식 결과가 맞는 지의 여부를 판단할 수 있다. 개별 신뢰도 기법의 신뢰도 값을 융합하여 최종 판단을 내리는 집중형 융합 방식과 개별 신뢰도 기법의 판단 결과들을 융합하는 분산형 융합의 두 가지 방식에 대해 최적의 베이시안 융합규칙이 제시되었다. 고립단어 인식에서의 미등록어 거절 실험 결과 집중형 베이시안 신뢰도 융합 기법은 개별 신뢰도 기법에 비해 13% 이상의 상대적인 에러 감소 효과를 보였으나, 분산형 베이시안 융합은 성능의 향상을 보이지 못했다.