• 제목/요약/키워드: 음소

검색결과 529건 처리시간 0.027초

ETRI의 음성데이타베이스 구축현황 (Current Status of Speech Database at ETRI)

  • 이영직
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.265-271
    • /
    • 1995
  • 한국전자통신연구소의 음성 데이터베이스 구축 현황을 기술한다. 현재 한국전자통신연구소에서는 음성인식 연구를 위해 단어음성, 정형 문장 음성 등의 데이터베이스를 구축, 보유하고 있다. 음성인식용 데이터베이스는 정해진 단어, 분장을 20명 내지 100명이 발성한 것으로, 일부는 음소 단위까지 레이블링이 되어 있다. 또 음성합성 연구를 위해 합성단위 및 운율데이타베이스를 가지고 있는데 이는 한 명 혹은 남녀 각각 3명이 발성한 것으로, 일부는 피치 등이 수록되어 있다. 문장 데이터베이스는 언어 정보처리를 위해 교재, 문학, 경제, 과학 분야의 문장을 총 480만 어절 가지고 있으며, 이 중 일부에 품사 정보를 추가하였다. 한국전자통신연구소는 국내 음성 연구의 발전에 기여하고자 음성 연구의 기반 자료가 되는 음성 데이터베이스를 국내 대학 및 산업체에 배포하고 있다 음성 데이터베이스는 음성 연구의 기반이 되는 자료임에도 불구하고 많은 비용과 노력이 들어 일반 대학에서는 쉽게 만들 수 없었다. 이에 ETRI는 한국통신이 출연한 "자동통역 요소기술개발" 과제으 LQNTKSANF인 여러 종류의 음성 데이터베이스와 관련 프로그램을 공급하여 국내 음성 연구의 기반 확립에 기여하고자 한다. 기여하고자 한다.

  • PDF

오피니언 마이닝을 통한 학습자 상태 분류 및 활동 모니터링 시스템 (Classifying learner's states and Monitoring it by using opinion Mining)

  • 김동현;장두수;최용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.640-643
    • /
    • 2016
  • 오피니언 마이닝은 객관적인 정보를 필요로 하는 많은 분야에서 쓰이는 기법이다. 그러나 표현의 자유도가 높은 한글 Text를 분석하는 것은 상당히 어려운 일이다. 또한 한글 파괴 현상도 하나의 원인으로 대두되고 있다. 본 논문에서는 Text를 음소단위로 분할하는 Trigrarn-Signature 기법과 구문태그 패턴 기법을 통합한 새로운 상태 분류 기법을 제안했고, 만족, 불만, 낙담, 의문, 흥분 5가지 감정 분류를 시도했다. 이를 토대로 사용자의 정보를 그래프로 보여주는 시각화 시스템을 제안한다.

다국어 입력기에서 한글 입력의 최적화 방안 (An Optimization of Hangul Input in Multilingual Input Method)

  • 유정원;변정용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.677-680
    • /
    • 2005
  • 다국어 입력기에서 한글 입력의 최적화를 위하여 문자별 보편성과 개별성을 밝혀내어서 어떤 문자의 개별성이 다른 문자의 보편성을 헤치지 않도록 충돌 요인을 최대한 낮추어야 한다. 특히 한글은 표음 문자로서 음절 및 음소문자의 특성을 가지고 있고, 한글전용을 하고 있다. 반면에 일본어와 중국어는 음절문자에 해당하며 가나 또는 병음을 입력하여 마지막에는 한자로 바꾸어야 한다. 여기서 훈민정음창제원리를 기본으로 삼아 최적화에 적용하고자 한다.

  • PDF

강화학습을 이용한 구어 태거의 모델링과 구어 태거의 구현 (Modeling a Tagger for Korean Spoken Language)

  • 정홍;서명원;김용;박기윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.367-369
    • /
    • 2001
  • 본 논문에서는 기존의 문어를 다루는 태거와는 달리 구어를 처리할 수 있는 구어태거를 구현하였다. 구어태거는 크게 심층구조와 표층구조의 두 가지 부분으로 구성되어 있으며, 촘스키의 구조에 따라 설계하였다. 심층구조에서 예측된 문장은 표층구조에서 실제의 입력과 음소열수준으로 비교되고 그 결과 가 다시 심층구조로 되메김된다. 이를 통해 가장 적합한 후부가 선택되며 또한 강화학습을 통해 문법과 어휘가 학습된다. 실험을 통해서 여러 가지 잡음이 섞인 입력단어를 본 태거가 얼마나 정확한 예측을 할 수 있는가를 보았으며, 그 결과 잡음에 강한 특성을 나타내는 것을 확인하였다.

  • PDF

음소 특성 정규화를 통한 화자 변화 검출 (Speaker Change Detection by Normalization of Phonetic Characteristics)

  • 김형순;박혜영;박선영
    • 대한음성학회지:말소리
    • /
    • 제47호
    • /
    • pp.97-107
    • /
    • 2003
  • Speaker change detection is to detect automatically a point of time at which speaker was replaced. Since feature parameters used for speaker change detection depend not only on speaker characteristics but also on phonetic characteristics, spoken contents included in the feature parameters inevitably causes performance degradation of speaker change detection. In this paper, to alleviate this problem, a method to normalize phonetic variations in speech feature parameters is proposed for emphasizing changes due to speaker characteristics. Experimental results show that the proposed method improves the performance of speaker change detection.

  • PDF

연인두 폐쇄 부전 환자의 보상조음 특성

  • 이은경;손영익
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.146-146
    • /
    • 2003
  • 연인두 폐쇄 부전으로 보상조음이 있을 때, 말 명료도를 저하시킬 뿐 아니라 실제의 연인두 기능이 과소평가 될 수 있으므로 이에 대한 감별 및 언어치료가 필수적이다. 본 연구에서는 연인두 폐쇄 부전 환자들에서 보상조음의 출현율을 알아보고 어떤 음소들이 영향을 받는지 살펴보고자 하였다. 또한 연령과 과비성의 정도에 따른 차이도 살펴보았다. 1998년 3월부터 2003년 6월까지 삼성서울병원에서 연인두 폐쇄 부전으로 진단 받고 언어치료를 받지 않았거나 언어치료 경험은 있지만 일반화되지 않고 중단된 환자 105명의 조음 및 공명 평가 자료를 분석하였다. 연령은 평균 11.3세(2.1세부터 63세)였고 7세 이하의 아동집단이 65명, 성인집단이 40명이었다. 조음은 구강압력자음인 파열음, 마찰음, 파찰음에서의 보상조음의 유무 및 종류를 분석하였다. 과비성의 정도는 경도, 중도, 심도로 평가하였다. (중략)

  • PDF

한국어 양순 파열음 발음시 구강내압과 폐쇄기, VOT에 대한 연구 (The Study on Intraoral Pressure, Closure Duration, and VOT During Phonation of Korean Bilabial Stop Consonants)

  • 표화영;최홍식
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
    • /
    • pp.89-89
    • /
    • 1996
  • 정상인 20명을 대상으로 하여, 우리말의 양순 파열음인 /ㅂ, ㅃ, ㅍ/의 발음시, 각각의 음소에서의 구강내압의 크기와 폐쇄기 및 VOT의 길이를 측정하고, 목표 자음이 어두에 나올 때 및 음절 초에 나올 때, 그리고 어음을 보통 소리로 말했을 때와 큰 소리로 말했을 때, 그 세 측정치가 어떻게 변화하는지를 파악하기 위한 실험을 실시하였다 채취된 어음의 구강내압은 발음시 Pressure sensor를 사용함으로써 산출된 파형을 이용하여 측정하였고, 폐쇄기와 VOT는 컴퓨터에 입력된 음성신호를 Spectrogram으로 분석하여 측정하였다. 그 결과, 양순 파열음 중 구강내압은 /ㅍ/>/ㅃ/>/ㅂ/의 순이었고, 폐쇄기의 길이는 /ㅃ/>/ㅍ/>/ㅂ/, 그리고, VOT의 길이는 /ㅍ/>/ㅂ/>/ㅃ/의 순이었다. 양순 파열음이 어두에 올 패보다 음절 초에 올 때 더 큰 구강내압을 보였으며, 폐쇄기의 길이는 더 짧아지는 경향을 보였고, VOT의 길이도 폐쇄기와 마찬가지로 짧아지는 경향을 보였다 그리고, 양순 파열음을 큰 소리로 발음했을 때, 목표 자음의 위치에 상관없이, 구강내압의 크기는 의미 있게 커졌으며, 폐쇄기와 VOT는 짧아지는 경향을 보였다.

  • PDF

청지각적 음성장애평가에서의 객관적인 파라미터 추출 (Objective parameter extraction in perceptual dysphonia assessment)

  • 장승진;최예린;김은연;김원식
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2009년도 춘계학술대회
    • /
    • pp.181-182
    • /
    • 2009
  • GRBAS(G : grade, R : rough, B : breathy, S : strained, A : asthenic) 음성장애평가는 성대의 이상 또는 말마비장애 등의 환자들을 평가하는 척도로 널리 사용된다. 하지만 사람에 의해 주관적인 평가로 이루어지는 방식의 문제점이 많이 제기되어, 자동화 알고리즘에 의한 객관적인 청지각적 음성장애 평가도구를 개발하려는 시도가 많이 연구되어왔다. 이러한 개발에 있어 보편적으로 선행되어야 하는 음소 분류 및 일치성 판단을 위한 객관적인 파라미터를 구하고자 함이 본 연구의 목적이다.

  • PDF

초성파찰음의 음소분류에 관한 연구 (A Study on the Phonemic Segmentation of an Initial Affricate)

  • 김기운;이기영;배철수;최갑석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.33-36
    • /
    • 1988
  • In this paper, the starting point of affricate is detected from the first predictor coefficient of a 12-pole linear predictive coding (LPC) analysis and phonemic segmentation is done through measuring short time energy and zero crossing rate. By this segmentation method, the duration of an aspirate can be mearsured in order to detect an aspirate or not.

  • PDF

대역폭 변화에 따른 음성 인식률 비교연구 (A Comparative Study of Recognition Rate According to the Variance of Speech Bandwidth)

  • 손일현;도삼주;구명완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.193-199
    • /
    • 1992
  • 이 논문에서는 123개 단어의 한국어 음성에 대하여 음성의 대역폭 변화에 따른 인식률을 비교하였다. 인식률 비교실험을 위해 hidden Markov model과 음소와 유사한 131개의 한국어 subword 유니트를 사용한 화자독립 격리단어 인식 시스팀을 사용하였다. 이 실험은 대역폭이 각각 0 - 4.5kHz 및 0.3 - 3.3kHz인 두가지 종류의 음성 데이타베이스를 사용하였다. 훈련과정에서 corrective training의 반복회수를 2로 하고 state transition duration 정보를 사용하였을 때, 0 - 4.5kHz 와 0.3 - 3.3kHz 대역폭에 대해 각각 98.8 % 및 98.2 % 의 최고 인식률을 얻었다. 이로부터 전화대역폭에서도 음성인식률은 크게 저하되지 않음을 알 수 있다.

  • PDF