• 제목/요약/키워드: 음소

검색결과 529건 처리시간 0.022초

Logatom을 사용한 문서음성변환 시스템 (Text-to-Speech System Using Logatom)

  • 조관선;이철희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.7-10
    • /
    • 1999
  • 본 논문에서는 logatom 기반 무제한 한국어 TTS 시스템 구현을 제안한다. 이를 위하여 한국어를 대표할 만한 문서코퍼스를 선택하여 분석하고 이를 바탕으로 합성에 필요한 logatom을 설계한다. 일반적으로 음성코퍼스를 통해 음성세그먼트를 추출하여 접속에 기반한 TTS 시스템에서는 음성세그먼트를 의미있는 단어 또 는 어절로부터 추출한다. 하지만 음성세그먼트 추출시 고려되는 사항은 합성단위에 기초한 음소간의 결합형태이므로 본 논문에서는 음성세그먼트 추출을 위하여 무의미한 음소열인 logatom을 설계한다. Logatom은 문장 세그먼트의 어절내 위치와 문서코퍼스 분석 결과 얻어진 음소간의 결합형태를 기반으로 설계된다. 제안된 시스템의 합성음질을 평가하기 위하여 CVC 기반 logatom을 사용하여 임의의 문장을 합성해 본 결과 대부분의 음성세그먼트 접속이 자음에서 이루어지고 어절의 위치를 고려한 logatom 설계로 인하여 어절 내에서는 비교적 자연스러운 합성음을 얻을 수 있었다.

  • PDF

LSP를 이용한 음소단위 PSOLA 음성합성에 관한 연구 (A Study on Phoneme-Based PSOLA Speech Synthesis Using LSP)

  • 권혁제;조순계;김종교
    • 한국음향학회지
    • /
    • 제17권2호
    • /
    • pp.3-10
    • /
    • 1998
  • 본 논문에서는 음소단위 PSOLA 한국어 합성을 LSP line의 조절과 자모음 분석을 통해서 실시하였다. 음성합성에서 많이 사용하는 triphone, diphone, demisyllable등과 같은 합성단위들은 자연스러운 합성음을 위해 다양한 음운환경에서 수집된다. 그러나, 이런 방법 은 많은 시간과 메모리가 요구된다. 본 논문에서는 합성단위로서 자음17개, 모음 16개로 총 33개의 음소를 이용하였다. 자음은 후위모음/이/인 CV에서 segment되고, 모음은 단음절의 단모음과 이중모음을 1인의 화자로부터 합성데이터를 수집하였다. 또한, 10명의 화자가 발성 한 CV에서 각 모음에 따라 변하는 자음의 주파수를 분석하였고, CV+VC 또는 CV+CV에서 각 자음에 따라 변하는 모음의 포먼트변화를 분석하였다. 분석결과를 토대로 모음은 LSP line을 조절해서 PSOLA합성을 하고, 자음은 합성하려는 모음과 결합하였다. 그 결과 6개의 합성단어에 대한 청취율은 65%를 보였다.

  • PDF

한글 문자의 음소 및 음절 문자 특성의 구현 방안 (An Implementation Method for The Phonemic and Syllabic Character Attributes of Hangul Character)

  • 변정용;강진곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.288-294
    • /
    • 1994
  • 훈민정음 해례에 따르면 한글문자는 음소 및 음절 문자 특성을 가지고 있다. 이러한 특성들을 컴퓨터 시스템에서 구현함에 있어서 야기되어 왔던 각종 문제를 분석한 다음 이들 문제들에 대하여 한글문자의 특성을 제약함이 없이 컴퓨터에 대한 기술을 개발함으로써 해결책을 모색한다. 본 논문은 훈민정음 해례에서 밝힌 한글 문자의 음소 및 음절 문자 특성에 따라서 기존의 코드 체계를 평가하며, 그리고 이들에 대한 구현 방안을 제시하고자 한다. 또한 이러한 특성을 반영한 한글 입출력들인 '셔블'을 개발하고 이에 대한 검증을 시도하였다.

  • PDF

음소 단위 임베딩 기반 한국어 모델 (Phoneme-level Embedding based Korean Language Model)

  • 최우성;현경석;정재화;정순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1026-1029
    • /
    • 2019
  • 최근 제안되고 있는 Bert 등의 딥러닝 언어 모델 기반 pre-training 기법은 다양한 NLP 분야에서 활용되고 있다. 텍스트로 작성된 데이터 셋을 딥러닝 언어 모델이 학습하기 위해서는 토크나이징(tokenizing) 기술이 필요하다. 그러나 기존 토크나이징 방식은 한국어 및 한글이 가지는 고유한 특성(교착어적 특성과 모아쓰기 반영)을 반영하기 어렵다는 한계를 가지고 있다. 본 논문에서는 한국어와 한글이 가지는 고유한 특성을 고려하기 위하여 음소 단위의 임베딩 기법을 제안하며, 이를 기반으로 언어 모델을 설계 및 구현한다. 또한 음소 단위 임베딩 기반 한국어 모델이 실제 데이터 집합(구약성서)에서 나타나는 언어적 패턴을 학습할 수 있다는 것을 실험을 통하여 밝힌다.

음소 단위 임베딩 모형을 이용한 감성 분석 (Sentimental Analysis using the Phoneme-level Embedding Model)

  • 현경석;최우성;정순영;정재화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1030-1032
    • /
    • 2019
  • 형태소 분석을 통하여 한국어 문장을 형태소 단위의 임베딩 및 학습 관련 연구가 되었으나 최근 비정형적인 텍스트 데이터의 증가에 따라 음소 단위의 임베딩을 통한 신경망 학습에 대한 요구가 높아지고 있다. 본 논문은 비정형적인 텍스트 감성 분석 성능 향상을 위해 음소 단위의 토큰을 생성하고 이를 CNN 모형을 기반으로 다차원 임베딩을 수행하고 감성분석을 위하여 양방향 순환신경망 모델을 사용하여 유튜브의 비정형 텍스트를 학습시켰다. 그 결과 텍스트의 긍정 부정 판별에 있어 90%의 정확도를 보였다.

한국어 음소 최소대립쌍의 계량언어학적 연구: 초성 자음을 중심으로 (A quantitative study on the minimal pair of Korean phonemes: Focused on syllable-initial consonants)

  • 정지은
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 이 연구의 목적은 한국어 음소의 최소대립쌍 출현 양상에 대해 계량언어학적으로 알아보는 것이다. 최소대립쌍은 한 언어에서 음소의 체계를 세우는 데 중요한 역할을 하고, 기능부담량의 측정에도 중요한 척도가 됨에도 불구하고 아직까지 한국어 음소의 최소대립쌍에 대한 전면적인 연구가 이루어지지 않았다. 이를 위해 "우리말샘"의 표제어 325,715개의 발음을 대상으로 초성 위치에서의 자음 최소대립쌍의 개수를 절대수치와 상대수치로 산출하고, 최소대립쌍을 이루는 두 단어의 품사 관계에 대해서 분석했다. "우리말샘"을 연구의 대상으로 삼은 이유는 최소대립쌍 분석은 기본적으로 사전을 통해서 이루어져야 한다고 판단했고, 한국어 사전 중 규모가 가장 크기 때문이다. 연구 결과는 다음과 같다. 첫째, 최소대립쌍은 총 153가지, 337,135개였다. 개수가 많은 음소 쌍(/ㅅ-ㅈ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/, /ㄱ-ㅂ/, /ㄱ-ㅎ/)은 평음의 비중이 높고, 개수가 적은 음소 쌍(/ㅃ-ㅋ/, /ㄹ-ㅃ/, /ㅉ-ㅋ/, /ㄸ-ㅋ/, /ㅆ-ㅋ/)은 경음의 비중이 높았다. 최소대립쌍 형성에 많은 역할을 담당하는 음소를 개별 음소 단위에서 살펴보면 /ㄱ, ㅅ, ㅈ, ㅂ, ㅊ/ 순으로 높게 나타났는데, 경구개음의 비율이 높게 나타난 것이 특징적이었다. 삼지적 상관속을 이루는 장애음의 최소 대립쌍 관계에도 조음 위치와 조음 방법에 따라 차이가 나타났다. 최소대립쌍의 절대수치와 상대수치의 상관계수는 0.937로 높은 상관관계를 보였다. 둘째, 최소대립쌍을 이루는 두 단어의 품사는 '명사-명사'의 최소대립쌍이 70.25%로 가장 많았고, 그다음으로 '동사-동사' 쌍이 14.77%로 나타나 이 두 유형이 전체 85% 이상을 차지했다. 초성 최소대립쌍의 품사 일치율은 87.91%로 나타나 최소대립쌍은 의미 형태적으로도 비슷한 범주로 묶일 수 있음을 확인할 수 있었다. 이 연구의 결과는 한국어 음소와 관련된 기초 자료로서 국어학, 언어 병리학, 언어 교육, 언어 습득, 음성 공학 등의 다양한 응용 분야에서 유용하게 활용될 수 있을 것이다.

한국인 학습자의 영어 모음 인지: 새로운 L2 모음 범주와 비슷한 L2 모음 범주의 비교 (Perception of English Vowels By Korean Learners: Comparisons between New and Similar L2 Vowel Categories)

  • 이계윤;초미희
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.579-587
    • /
    • 2015
  • 본 연구의 목적은 한국인 학습자들이 어떻게 영어모음을 인지하는지를 알아보고, 언어학습모델(SLM)의 예측처럼 한국어에 없는 새로운 영어모음이 한국어와 비슷한 영어모음보다 습득에 용이한지 살펴보는 것이다. 20명의 한국인 실험참여자들은 6개의 영어모음 /i, ɪ, u, ʊ, ɛ, æ/을 사료로 한 영어-한국어 대응 테스트와 영어 모음 판별 테스트에 참여하였다. 영어-한국어 대응 테스트의 결과 대부분의 학생들이 음향적으로 구분되어있는 영어모음 /i/-/ɪ/, /u/-/ʊ/를 각각 하나의 한국어모음인 /이/와 /우/로 대응하여 인지하는 것을 보여주었다. 또한 영어모음 /ɛ/를 한국어모음 /에/와 /애/로 대응하여 인지하였고, 영어모음 /æ/도 마찬가지로 한국어모음 /에/와 /애/로 혼용하여 대응하는 패턴을 보여줌으로써 한국인 영어학습자들이 영어 모음쌍 /i-ɪ/, /u-ʊ/, /ɛ-æ/을 인지하기 어려울 것으로 예측되었다. 영어모음 판별테스트에서는 새로운 음소로 분류된 영어모음 /ɪ, ʊ, æ/의 판별 정확도(ɪ: 81.3%, ʊ: 62.5%, æ: 60.0%)가 비슷한 음소로 분류된 영어모음 /i, u, ɛ/의 판별 정확도(i: 28,8%, u: 28.8%, ɛ: 32.4%)보다 유의하게 높아서 SLM의 예측대로 새로운 음소가 습득하기 쉽다는 것을 확인할 수 있었다. 또한 비슷한 음소로 분류된 영어모음들의 판별 정확도가 새로운 음소에서의 판별 정확도보다도 현저히 낮은 수치를 보여준 것을 과일반화로 설명하였는데, L2 학습자가 새로운 모음 범주를 습득하는 과정에서 비슷한 L2 소리를 새로운 L2 소리로 과도하게 대치한 현상이다. 본 연구결과를 바탕으로 교육적인 함의점도 제시되었다.

후기 한국어-영어 이중언어화자의 자소-음소 변환 규칙에 따른 영어 규칙성 효과 (Grapheme-to-Phoneme Conversion Regularity Effects among Late Korean-English Bilinguals)

  • 김다희;백연지;류재희;남기춘
    • 인지과학
    • /
    • 제26권3호
    • /
    • pp.323-355
    • /
    • 2015
  • 후기 한국어-영어 이중언어화자의 자소-음소 변환규칙(grapheme to phoneme conversion rule, GPC 규칙)에 따른 영어 규칙성 효과(regularity effect)가 단어수준과 하위단어수준에서 나타나는지 알아보기 위해 단어명명과제, 각운판단과제, 음소제거과제를 진행하였다. 전체 단어수준(whole word level)에서의 규칙 양상을 살펴보기 위해, [1] 영어단어명명과제(English word naming task)를 사용하였고, 단어 단위보다 하위 단계에서의 규칙성 효과를 알아보기 위해 [2] 라임판단 과제(rhyme judgement task)와 음소수준(phoneme level)에서의 과제인 [3] 음소탈락과제(phoneme deletion task)를 사용하였다. 실험 참가자들은 세 종류의 과제를 모두 수행하였고, 총 43명의 후기 이중언어화자가 실험에 참가하였다. 실험결과, 세 과제 모두에서 규칙성 효과가 나타나 한국어-영어 이중언어화자가 영어(L2) 단어 처리 시 GPC 규칙을 적극적으로 활용하고 있다는 사실을 확인하였다. 사후분석으로써 세 과제 사이의 상관분석을 진행한 결과, 단어명명과제와 라임판단과제 간 상관이 가장 높게 나타났다. 비록 영어 모국어 화자의 이전 연구결과와는 달리 라임판단과제와 단어읽기과제 간 상관이 높게 나타났지만, 이는 실험 참가자의 L2 능숙도가 모국어화자만큼 높지 않았기 때문인 것으로 보인다. 본 연구는 후기 한국어-영어 이중언어화자가 영어 GPC 규칙을 사용하여 영어단어읽기 처리를 하고 있음을 확인하였다.

분산 메모리 다중 프로세서 상에서의 병렬 음성인식 (Parallel Speech Recognition on Distributed Memory Multiprocessors)

  • 윤지현;홍성태;정상화;김형순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.747-749
    • /
    • 1998
  • 본 논문에서는 음성과 자연언어의 통합처리를 위한 효과적인 병렬 계산 모델을 제안한다. 음소모델은 continuous HMM에 기반을 둔 문맥종속형 음소를 사용하며, 언어모델은 knowledge-based approach를 사용한다. 또한 계층구조의 지식베이스상에서 다수의 가설을 처리하기 위해 memory-based parsing기술을 사용하였다. 본 연구의 병렬 음성인식 알고리즘은 분산메모리 MIMD 구조의 다중 Transputer 시스템을 이용하여 구현되었다. 실험을 통하여 음성인식 과정에서 발생하는 speech-specific problem의 해를 제공하고 음성인식 시스템의 병렬화를 통하여 실시간 음성인식의 가능성을 보여준다.

  • PDF

표준어 규정에 따른 한국어 음소열 자동생성기 (Automatic Phoneme Generator based on Standard Korean Pronunciation)

  • 이도관;강미영;윤근수;이교운;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.528-530
    • /
    • 2003
  • 우리말에서 띄어쓰기와 버금갈 정도로 어려운 것이 우리말의 발음이다. 이에 실생활에서 혼란스럽게 사용되는 발음법과 그로 인해 올바른 발음의 선택에 대한 어려움을 덜어낼 수 있도록 표준어 규정의 표준 발음법에 따른 한국어 음소열 자동 생성기를 구현하여 교육용으로 쓸 수 있도록 하는 것이 이 논문의 목적이다.

  • PDF