• 제목/요약/키워드: 고립단어

검색결과 127건 처리시간 0.023초

다층 퍼셉트론에서의 빠른 화자 적응을 위한 선택적 주의 학습 (Selective Attentive Learning for Fast Speaker Adaptation in Multilayer Perceptron)

  • 김인철;진성일
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.48-53
    • /
    • 2001
  • 본 논문에서는 에러 역전파 알고리듬에 기반한 다층 퍼셉트론의 학습 속도를 개선하기 위해 선택적 주의 학습방식을 제안한다. 제안된 방식은 학습 과정에서 세 가지 선택적 주의 기준을 적용하여 학습 데이터베이스 내의 일부 데이터만을 입력 패턴으로 사용하거나 주어진 입력 패턴에 대해 신경회로망내의 특정 영역만 선택적으로 학습이 이루어지도록 한다. 이러한 선택적 주의 기준은 다층 퍼셉트론의 출력층에서 계산된 평균 자승 에러와 은닉층의 각 노드에서 획득된 클래스 의존적인 적합도(relevance)를 이용하여 설정된다. 학습 속도의 개선은 학습 반복 횟수 당 계산량을 줄임으로써 이루어진다. 본 논문에서는 고립 단어 인식시스템에서의 화자 적응 문제에 대해 제안한 선택적 주의 학습방법을 적용하여 그 유효성을 알아보았다. 실험 결과로부터 제안한 선택적 주의 기법이 학습 속도를 평균 60%이상 개선시킬 수 있음을 확인하였다

  • PDF

자동 교환 시스템을 위한 실시간 음성 인식 구현 (An Implementation of the Real Time Speech Recognition for the Automatic Switching System)

  • 박익현;이재성;김현아;함정표;유승균;강해익;박성현
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.31-36
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용한 자동 교환 시스템을 구현하고, 성능을 평가하였다. 이 시스템은 다수의 구성원과 조직 체계를 가지는 관공서나 일반 기업, 학교 등의 교환 서비스를 음성 인식을 통하여 자동으로 제공한다. 본 시스템에 사용된 음성 인식기는 SCHMM(Semi-Continuous Hidden Markov Model) 기반으로 한 전화망에서의 화자 독립 고립 단어 가변 어휘인식기(Speaker-Independent, Isolated-Word, Flexible-Vocabulary Recognizer)이며, 실시간 구현을 위해 사용한 DSP(Digital Signal Processor)는 Texas Instrument 사의 TMS320C32이다. 자동 교환 서비스를 위하여 음성 인식 기능 외에도 음성 인식 DSP 진단 기능과 인식 대상 어휘의 추가 및 변경을 위한 운용 단말을 구현하여 운용의 편의성을 추구하였다. 본 시스템의 인식 실험은 음성 인식 구내 자동 교환 시스템용 1300여 어휘(부서명, 인명 등)에 대해서 8명의 화자가 유선 전화망에서 수행하였으며 인식률은 91.5%이다.

  • PDF

HM-Net을 이용한 한국어 유사음소 단위의 재 정의와 평가 (Definition and Evaluation of Korean Phone-Like Units using Hidden Markov Network)

  • 임영춘;오세진;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.183-186
    • /
    • 2002
  • 최근 음성인식의 인식 단위로서 문맥의존 음향 모델이 널리 사용되고 있다. 이는 음소의 음향학적 특징, 즉 선행 및 후행음소에 의한 중심 음소의 변이음 모델이 문맥독립 모델보다 좀 더 정확하게 모델링 될 수 있기 때문이다. 하지만 강건한 문맥의존 음향 모델을 작성하기 위해서는 모델 파라미터의 병합(tying)과 미지의 문맥(unseen context)의 처리를 위한 좀더 정교한 해결 방법이 필요하다. 따라서 본 논문에서는 이점을 고려하여 음향학적 특징과 언어학적 특징을 결합하여 상태 분할을 수행할 수 있도록 SSS(Successive State Splitting) 알고리즘의 문맥 방향 상태 분할에 음소결정트리를 접목한 HM-Net(Hidden Markov Network) 구조 결정법을 도입하였다. 또한 HM-Net은 연속적인 상태 분할에 의해 한국어에서 많이 발생하는 변이음들을 효과적으로 모델링 할 수 있다는 점을 고려하여 본 연구실에서 기존에 사용하던 48 유사음소 단위에서 문맥의존 음향 모델 작성에 불필요한 변이음을 제거하여 39 유사음소 단위를 재 정의하였다. 도입한 방법과 새로 정의한 유사음소 단위의 유효성을 확인하기 위해 고립 단어, 4연속 숫자음, 연속 음성인식에 대해 인식 실험을 수행한 결과, 모든 실험에서 재 정의한 39 유사음소 단위가 문맥종속형 HM-Net 음향모델을 이용한 한국어 음성인식에 효과적임을 확인할 수 있었다. 특히 연속 음성인식 실험의 경우, 기존의 48 유사음소 단위보다 평균 $15.08\%$의 인식률 향상이 있었다.

  • PDF

에벤키족 씨족명 분포 현황 및 의미 분석: 바이(Baj), 킴(Kim), 샤마/사마(Shama/Sama)를 중심으로 (The Analysis of the Distribution and Meaning of the Evenki's Clan Name: Centering on Baj, Kim, and Shama/Sama)

  • 엄순천
    • 비교문화연구
    • /
    • 제41권
    • /
    • pp.443-475
    • /
    • 2015
  • 본 논문에서는 알타이어족, 예니세이어족, 고립어족에서 공통적으로 발견되는 에벤키족 씨족명 어근 바이, 킴, 사마를 중심으로 해당 씨족명의 기원과 의미, 분포현황, 이동경로, 해당 씨족명이 존재하는 시베리아 제 민족 사이의 친연 관계를 규명했다. 씨족명 '바이'의 기원에 대해 아직 명확하게 규명된 바는 없지만 그 의미를 둘러싸고 '북쪽', '흰색', '풍요로운' 혹은 '자연의'라는 세 가지 입장이 대립하고 있다. 씨족명 '바이~'는 시베리아 제민족 사이에 넓게 분포되어 있다. 먼저 알타이제어 만주-퉁구스어파에 속하는 에벤키, 에벤, 나나이, 울치, 오로크, 오로치, 만주족 그리고 몽고어파와 투르크어파에 분포되어 있으며 예니세이어족이나 고립어족에서도 발견된다. 하지만 이 어근의 씨족명이 에벤키족 사이에서 가장 많이 발견되는 점으로 미루어 이 씨족명은 프리바이칼리예의 에벤키족에서 기원하여 인근의 부랴트, 몽골, 야쿠트족 사이로 넓게 전파된 뒤 이후 동쪽으로는 아무르강의 닙흐족, 북쪽으로는 유카기르와 케트족 같은 예니세이 고아시아제어권 민족, 서쪽으로는 엔츠족과 셀쿠프족 같은 사모예드제어권 민족에게로 전파된 것으로 보인다. 씨족명 '킴~'은 먼 고대에 기원하며 만주-퉁구스어파에 존재하는 유사한 단어, 에벤키족 씨족명 어근 '킴~'과 음성학적으로 유사한 중국인의 성 '김', 에벤키족의 설화를 바탕으로 그 의미를 유추할 수 있었다. 그 결과 씨족명 '킴~'은 '사람'이라는 의미를 지니고 있지만 금, 쇠, 돌과도 일정정도 관련이 있다는 결론에 도달했다. 또 씨족명 '킴~'은 시베리아 소수민족 사이에 널리 분포되어 있지만 에벤키족 사이에 가장 많이 분포되어 있으며 중국 인근과 페르시아에도 분포되어 있었다. 씨족명 '킴~'의 기원은 명확하게 규명할 수 없지만 먼 고대 바이칼 인근의 에벤키족에 편입된 후 만주-퉁구스의 제민족 사이에 널리 전파되었고 더 나아가 투르크제민족 사이로 전파되었음을 알 수 있었다. 씨족명 '샤마/사마~'는 알타이어족의 만주-퉁구스제어권, 투르크제어권, 우랄어족의 사모예드어제어권 민족 등 시베리아의 전역에 널리 분포되어 있으며 음성적 형태도 무척 다양한데 에벤키족 사이에 가장 널리 분포되어 있다. 이 씨족명이 알타이어족과 우랄어족의 제민족 사이에서 발견된다는 점은 이 두 어족의 민족들이 아주 먼 과거에 관련이 있었다는 증거이다. 이 씨족명은 오로크족을 제외한 만주-퉁구스제어권의 모든 민족 사이에서 발견되는데 이에 대한 규명이 필요해 보인다.

한글 전용과 국한 혼용의 언어 심리학적 고찰(I): 읽기 시간, 이해, 기억에서의 차이 (Differences of Reading the Pure Hangul Text and the Hangul Plus Hanja Text in Reading Speed, Comprehension, and Memory)

  • 남기춘;김태훈;이경인;박영찬;서광준;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.469-476
    • /
    • 1997
  • 본 연구는 한글 전용과 한자 혼용이 글의 이해 속도, 이해 정도, 내용의 기억에 어떤 영향을 미치는 가를 조사하기 위해 실시되었다. 한글 전용론과 한자 혼용론은 각각 나름대로의 논리를 가지고 서로 논쟁을 펼쳐왔다. 먼저 한글전용론의 주장을 살펴보면, 한자는 배우기 어렵고 쓰기도 불편해 쉽게 익힐 수 있는 한글을 사용해야 하며, 한자를 사용함으로 인해서 순 우리말의 발전이 방해를 받고, 글자 생활의 기계화와 출판 문화의 발달에 있어 한자는 이것을 어렵게 한다는 것이다. 반면에, 한자혼용론의 주장에 따르면, 한자말은 한자로 적을 때 그 의미의 파악이 빠르고 정확하고, 우리말 어휘의 절반 이상을 한자어가 차지하고 있으므로 한자를 가르치는 것이 국어교육의 지름길이고, 우리말에는 동음이의어가 많아서 한글로만 적을 경우 그 뜻을 식별하기 어렵고, 한자는 각 글자가 모두 뜻을 가지고 있으므로, 각각을 조합하여 새로운 의미의 단어를 쉽게 만들 수 있음은 물론이고 한글로 쓸 경우 길게 쓰여져야만 하는 것을 짧게 쓸 수 있다는 장점을 가지고 있으며, 한자를 쓰지 않으면 우리의 전통 문화를 이어 받을 수 없으며 한자를 공통으로 쓰고 있는 동양문화권에서도 고립을 초래할 수 있다는 것이다. 이렇게 한글전용과 한자혼용에 대한 의견이 다양한 만큼 우리나라의 한자에 대한 정책도 그 갈피를 잡지 못하고 계속 바뀌어 왔다. 독립이후 정부에서는 법령과 훈령 등으로 모든 공문서에서의 한자사용을 금지하고 일반 사회의 문자 생활에도 한글을 전용할 것을 권고하지만 이 지침은 결국 공문서에만 한정되어 왔고 후에는 이것조차도 유명무실해졌다. 또한 중고등학교의 한자교육 정책도 수차례 변화되어 한글만을 배운 세대가 사회에 나와 여전히 한자가 사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.

  • PDF

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

  • 김회린;고진석
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.180-186
    • /
    • 2004
  • 음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.

중국인 학습자를 위한 한국어 교재의 어휘 분석 및 개선 방안 한국어 '상징부사+용언'을 중심으로 (A Vocabulary Analysis and Improvement Plan of Korean textbooks for Chinese learners: focusing on Korean "symbol adverb+predicate")

  • 종예
    • 한국교육논총
    • /
    • 제42권1호
    • /
    • pp.35-72
    • /
    • 2021
  • 본 연구는 중국인 한국어 학습자들이 세밀한 느낌과 다양한 감정을 표현할 때 보다 정확하게 말할 수 있도록 한국어 '상징부사+용언'형을 중심으로 효과적인 교재 개선안을 마련하는 데 목적이 있다. 다수 외국인 학습자들이 어휘를 습득할 때 개별 단어를 암기하고자 노력하고 있으며, 어휘간의 결합을 중시하지 않으므로 한국어 어휘를 정확하고 자연스럽게 사용하지 못하는 문제점이 있다. 상징부사는 고립되어 사용하지 않으며 특정 어휘와 자주 공기하기 때문에 개별 어휘가 아닌 '상징부사+용언' 형태로 가르치는 것이 더 효과적이다. 따라서 본고는 상징부사 뒤에 오는 특정 어휘 또는 공통적인 의미자질을 가진 어휘 군과 자주 공기할 수 있는 것을 중심으로 고찰하였다. 이에 상징부사 뒤에 서술어가 함께 사용되는 양상의 차이를 밝히기 위하여 국내·외 대학 기관에서 사용하고 있는 한국어 7종 교재를 중심으로 비교·분석하였다. 마지막으로 교재 분석 결과를 바탕으로 중국인 학습자를 위한 한국어 '상징부사+용언'형의 개선 방안을 제시하였다.

  • PDF