• Title/Summary/Keyword: 음소

검색결과 529건 처리시간 0.023초

어휘 대조 초점과 음소 대조 초점 실현에 관한 음성학적 연구 (A Study On the Realization of the Lexical Contrastive Focus and the Segmental Contrastive Focus)

  • 곽숙영;신지영
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.179-184
    • /
    • 2005
  • The aim of this paper is to analyze the phonetic features of the lexical contrastive focus and the segmental contrastive focus. In this paper, I made two variables to study the realization of the contrastive focus. One is the three phonation types of the Korean plosive, a lenis, a fortis and an aspirate. The other is the positions of the segmental contrastive focus syllable in a word. I examined pitch, duration, intensity, VOT, formant, and so on. The realization of focus is different by the phonation types and the positions of the focused syllable.

  • PDF

산업용 음성 DB 메타데이터 표준화 (Standardization of XML based Meta-data for Industrial Speech Databases)

  • 주영희;홍기형
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.211-214
    • /
    • 2005
  • 본고에서는 산업용 음성 DB를 위한 XML 기반 메타데이터의 표준화에 대한 현재 상황과 표준화 활동에 대하여 소개한다. 산업용 음성 DB는 구축에 많은 시간과 비용을 요구하며, 양질의 음성 처리 시스템 (인식/합성/인증)의 개발을 위해서는 가능한 많은 양의 음성 데이터가 필요하다. 산업용 음성 DB 메타데이터 표준화는 서로 다른 기관에서 구축한 음성 DB의 공유와 재사용을 원활히 하기 위하여, 2004년 9월부터 요구사항 분석을 시작하여, 2005년 3월 초안이 완성되었다. 본 표준안은 음성 DB 메타데이터의 구조를 XML 기반으로 정의한 것이며, 음성 파일 이름, 화자 식별자, 음소 기호와 같은 구조 외의 표준화 대상에 대해서는 다루지 않는다. 이미 ETRI와 SiTEC [5]에서 XML 기반의 메타데이터 구조와 내용 표준안을 제안한 바 있으나. [5]에서 제안한 구조는 평면 구조를 취하고 있어 내용의 중복성등의 단점이 있어, 이를 보완하여 음성 DB 데이터 모델을 객체지향 방식으로 설계하였다.

  • PDF

문자소 기반의 한국어 음성인식 (Korean speech recognition based on grapheme)

  • 이문학;장준혁
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.601-606
    • /
    • 2019
  • 본 논문에서는 한국어 음성인식기 음향모델의 출력단위로 문자소를 제안한다. 제안하는 음성인식 모델은 한글을 G2P(Grapheme to Phoneme)과정 없이 초성, 중성, 종성 단위의 문자소로 분해하여 음향모델의 출력단위로 사용하며, 특별한 발음 정보를 주지 않고도 딥러닝 기반의 음향모델이 한국어 발음규정을 충분히 학습해 낼 수 있음을 보인다. 또한 기존의 음소기반 음성인식 모델과의 성능을 비교 평가하여 DB가 충분한 상황에서 문자소 기반 모델이 상대적으로 뛰어난 성능을 가진다는 것을 보인다.

認知建枸主義教學說計 在漢語發音教育中的必要性

  • 이선희
    • 중국학논총
    • /
    • 제66호
    • /
    • pp.85-103
    • /
    • 2020
  • We use prototypes (also known as referent in semiotics) when we understand the outside world. Different language users use different prototypes to decode the same sound. When we learn Chinese language as a foreign language, during it's sound perceptual process, Korean learners' target language prototypes are different from Chinese native speakers'. The purpose of the paper is to examine the theory of speech perception and the theory of constructivism teaching, and to suggest to the Chinese language teachers to have Cunstructivist approach while they design there teaching course. For this, we concerned three things: First is to review speech perception theory and constructivism teaching theory. Second based on the preceding study, we review that learner's prototypes are different from Chinese native speaker and this cause the error of listening and pronunciation. Finally, we introduced two simple speech visualization programs developed to help us learn pronunciation.

딥러닝 기반 한글 전자 필기 연습 및 분석 앱 개발에 대한 연구 (A Study on Hangeul Mobile Handwriting Practice and Analyzing Application Development Based on Deep Learning)

  • 고주은;오지은;민경원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.322-325
    • /
    • 2022
  • 전 세계적으로 코로나바이러스가 유행함에 따라 비대면 활동을 비롯하여 전자 필기 이용 및 상품 소비가 증가하였다. 전자 필기에 대한 수요가 늘어남에 따라 전자 필기 글씨체 교정에 대한 관심 또한 증가하는 추세이다. 본 논문에서는 전자 필기 이미지에서 음절과 음소 영역을 추출하여 글씨를 분석하고, 이를 사용하여 사용자의 손글씨에서 개선점을 찾아낼 수 있는 딥러닝 알고리즘을 제안한다. 제안한 알고리즘을 통해 사용자가 원하는 전자 필기 글씨체를 효과적으로 습득할 수 있도록 사용자 글씨에 대해 구체적인 피드백을 제공하는 딥러닝 기반 태블릿 PC 용 한글 전자 필기 연습 및 분석 앱에 대한 연구를 소개하였다.

대규모 언어 모델 기반 한국어 휴지 예측 연구 (A Study on Korean Pause Prediction based Large Language Model)

  • 나정호;이정;나승훈;정정범;최맹식;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-18
    • /
    • 2023
  • 본 연구는 한국어 음성-텍스트 데이터에서 보편적으로 나타난 휴지의 실현 양상을 분석하고, 이를 토대로 데이터셋을 선별해 보편적이고 규격화된 한국어 휴지 예측을 위한 모델을 제안하였다. 이를 위해 전문적인 발성 훈련을 받은 성우 등의 발화가 녹음된 음성-텍스트 데이터셋을 수집하고 MFA와 같은 음소 정렬기를 사용해 휴지를 라벨링하는 등의 전처리를 하고, 다양한 화자의 발화에서 공통적으로 나타난 휴지를 선별해 학습데이터셋을 구축하였다. 구축된 데이터셋을 바탕으로 LLM 중 하나인 KULLM 모델을 미세 조정하고 제안한 모델의 휴지 예측 성능을 평가하였다.

  • PDF

상태레벨 공유를 이용한 MLLR 적응화의 회귀클래스 생성에 관한 연구 (A Study on Regression Class Generation of MLLR Adaptation Using State Level Sharing)

  • 오세진;성우창;김광동;노덕규;송민규;정현열
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.727-739
    • /
    • 2003
  • 본 논문에서는 HM-Net (Hidden Markov Network)을 다양한 태스크에의 적용과 화자의 특성을 효과적으로 나타내기 위해 HM-Net 음성인식 시스템에 MLLR (Maximum Likelihood Linear Regression) 적응방법을 도입하였으며, HM-Net 학습 알고리즘을 개량하여 회귀클래스 생성방법을 제안한다. 제안방법은 PDT-SSS (Phonetic Decision Tree-based Successive State Splitting)알고리즘의 문맥방향 상태분할에 의한 상태레벨 공유를 이용한 방법이다. 즉, 문맥방향의 각 상태에 적응화자 음성데이터에 포함된 문맥정보를 분할하여 적응화될 음소환경을 결정하는 것이다. 따라서 제안방법은 새로운 화자로부터 문맥정보와 적응화 데이터의 발성 양에 의존하여 결정된 많은 적응 파라미터들을 (평균, 분산) 자유롭게 제어할 수 있게 된다. 제안방법의 유효성을 확인하기 위해 국어공학센터 (KLE) 452 데이터와 항공편 예약관련 (YNU200) 연속음성을 대상으로 인식실험을 수행한 결과, 음소인식, 단어인식, 연속음성인식에 대해서, 평균 34∼37%, 평균 9%, 평균 20%의 성능 향상을 각각 보였다. 또한 적응화 데이터의 양에 따른 인식성능 비교에서 제안방법을 적용한 인식 시스템이 적응 데이터의 양이 적은 경우에도 향상된 인식률을 보여 MLLR 적응방법의 특성을 만족하였다. 따라서 MLLR 적응방법을 도입한 HM-Net 음성인식 시스템에 제안한 회귀클래스 생성방법이 유효함을 확인할 수 있었다.

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

단음절 단어의 사건 관련 전위 (Event-Related Potentials of a Monosyllabic Word)

  • 민병경;김명선;윤탁;김재진;권준수
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.211-215
    • /
    • 2002
  • 본 실험은 종합적 인지과정을 추론할 수 있는 결합 문제(binding problem)를 언어적인지 과정을 통해 알아 본 실험으로, 총 10 명(남:61여:4, 평균나이:24.40 $\pm$ 1.35)의 정상군을 대상으로, 4개의 음소로 이루어진 단음절 명사를 목표 자극(target stimulus)으로 하고, 4개 음소의 임의적인 조합으로서 글자를 이루지 못하는 비목표 자극(non-target stimulus)을, 각각 200 회와 800 회씩 시각적으로 0.5초씩 무작위로 제시하여 128 채널 고밀도 사건관련전위(ERP)를 측정하였다. 이번 실험 결과의 주요 특징은 글자가 아닌 비목표 자극보다 글자인 목표 자극에서 두드러지게 나타난 두정엽 부근의 P500 과 N900 이라고 할 수 있다. 자극 제시 비율의 차이에서 오는 oddball 효과로 인한 기존 P300 의 인지적 의미를 이번 결과의 P500 이 함축한다고 볼 수 있으며, 단음절 단어를 인지할 때, 글자임을 인식하는 순간은 의미적인지 과정이 진행되었다기보다 그 글자의 형태만으로 낯익은 글자인지를 분간하는 것으로 보인다 따라서, 이 경우 기존 언어 실험에 자주 등장하던 의미론적 peak 인 N400 은 보이지 않고, 곧바로 형태적이고, 통사적(syntactic)인 인지 처리 과정인 P500이 나타났다고 해석할 수 있다. 하지만, 이번 실험에서는 N400 대신에 N900 이 나타났다. 이 결과는 이번 ERP 실험과 병행된 프로토콜 분석을 통해, 피험자가 자극 제시 후, 약 900ms 정도에, 이미 제시되고 사라진 글자 자극을 다시 한번 떠올리는 인지 과정이 일어난다는 점과 관련 지어 해석하면, 기존에 의미적(semantic) 인지 과정으로만 해석했던 negative-peak 를 생각(thinking)과 같은 내재적인지 과정(internal cognitive process)으로 확장하여 일반화하는 추론도 생각해 볼 수 있다. 요컨대, 언어인지를 통한 이번 실험을 통해, 뇌파에서 검출되는 negative-peak 은 internal cognitive process로 추측되고, positive-peak 는 external cognitive process 라고 생각된다. 덧붙여, 유의해서 볼 점은 각 peak-topology 에서 Cz 의 진폭이 Fz 보다 크게 나온 점과, 일반적으로 언어 기능을 담당한다는 좌측 측두엽(T7)이 우측(T8)보다 통계적으로 더 유의미한 차이를 보였다는 점등이다.

  • PDF

문장 따라말하기 과제에서 3~7세 아동의 말소리발달 (Phonological development of children aged 3 to 7 under the condition of sentence repetition)

  • 김수진;박나래;장문수;김영태;신문자;하지완
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.85-95
    • /
    • 2020
  • 아동이 산출하는 말소리를 평가할 때 단어와 문장을 유도하여 산출한 말소리를 분석하고, 자발화를 이용하여 분석하기도 한다. 단어 검사와 자발화 검사의 한계를 보완할 수 있는 평가 방법으로 문장 따라말하기 과제가 있다. 문장 따라말하기 과제를 통한 아동의 말소리 평가는 자발화와 유사한 특성을 보이면서 단어와 같이 제한된 시간 안에 다양한 음소를 평가할 수 있다. 본 연구에서는 다양한 모음문맥에서 자음을 배치하고 모든 음소가 3회 이상의 출현 기회를 가질 수 있도록 계획된 11개의 문장 따라말하기를 통해 연령과 성별에 따라서 단어단위 음운지표와 개정자음정확도의 발달을 살펴보았다. 전국에 거주하는 3세부터 7세까지 아동 535명을 대상으로 UTAP2에 새롭게 포함된 11개 문장 따라말하기 과제를 실시하였다. 말소리발달을 평가할 수 있는 지표 PCC-R, PWC, PMLU, PWP을 구하였다. 아동은 연령별 6개월 단위로 10개의 집단을 구분하고 각 지표에 대해 연령집단과 성별에 따른 차이를 분석하였다. 연구 결과, 모든 지표에서 연령이 증가함에 따라 수치가 상승하였으며 연령집단 간 차이는 유의하였다. 성별에 따른 차이와 연령과 성별의 상호작용효과는 유의하지 않은 것으로 나타났다. 본 연구는 전국에서 자료를 수집하였고, 연령집단을 6개월로 나누어 보았으며, 집단별 데이터를 충분히 수집하였다는 점과 단어와 자발화 검사의 한계점을 보완할 수 있는 문장 따라말하기라는 새로운 말소리 평가 방법의 연령별 준거 자료를 제시하였다는 측면에서 의의가 있다.