• 제목/요약/키워드: 음절 표현

검색결과 69건 처리시간 0.024초

문맥 표현과 음절 표현 기반 포인터 네트워크를 이용한 한국어 상호참조해결 (Contextualized Embedding- and Character Embedding-based Pointer Network for Korean Coreference Resolution)

  • 박천음;이창기;류지희;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-242
    • /
    • 2018
  • 문맥 표현은 Recurrent neural network (RNN)에 기반한 언어 모델을 학습하여 얻은 여러 층의 히든 스테이트(hidden state)를 가중치 합(weighted sum)을 하여 얻어낸 벡터이다. Convolution neural network (CNN)를 이용하여 음절 표현을 학습하는 경우, 데이터 내에서 발생하는 미등록어를 처리할 수 있다. 본 논문에서는 음절 표현 CNN 기반의 포인터 네트워크와 문맥 표현을 함께 이용하는 방법을 제안하고, 이를 상호참조해결에 적용한다. 실험 결과, 질의응답 데이터셋에서 CoNLL F1 57.88%로 규칙기반에 비하여 11.09% 더 좋은 성능을 보였다.

  • PDF

훈민정음 표현을 위한 최적 폰트 설계 (An Optimized Font Design for Hunminjeongeum Representation)

  • 김경욱;변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-57
    • /
    • 2008
  • 1987년 정보교환용 부호가 완성음절형 부호계로 개정되면서 한글 음절 표현은 극히 제한되어 컴퓨터상에서 한글의 표현은 제약을 받게 되었다. 1446년 훈민정음이 공포된 후로 목판, 활자시대를 지나서 타자기를 만나면서 한자와 다른 길을 걸어왔다. 특히 컴퓨터시대가 되면서 한글은 타자 이상의 적합성을 가지고 있지만 훈민정음 창제원리에 대한 이해부족으로 음절문자로 분류하여 완성음절형 부호를 지원하게 됨에 따라서 많은 문제를 야기하고 있다. 국제표준인 유니코드에는 세가지 종류의 부호가 반영되어 있는데 음절문자 중심의 부호화이므로 훈민정음의 특성을 해치는 일이며 또한 한글의 과학성을 부정하는 일이기도 하다. 본 논문은 훈민정음 창제원리에 입각하지 않음으로 생긴 문제에 대한 근본적인 해결책으로 훈민정음을 표현하는 최적 폰트 설계 방안을 검토하고 현행의 한글부코드표준의 개선 방향을 제시하고자 한다.

  • PDF

훈민정음 원리에 기반한 자소형 코드와 최적 폰트 코드의 일치성에 관한 연구 (A study on the Conformity of Jaso-Type Code and Optimum Font Code Based On Hunminjeongeum Principle)

  • 김경욱;변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-80
    • /
    • 2009
  • 훈민정음 창제당시의 모든 한글 음절인 약 399억 음절을 표현하기 위해서 자소형 코드만을 입력하여 이를 조합 음절 형태로 구성하고, 최적 폰트 코드를 출력함으로써 모든 한글을 표현할 수 있었다. 하지만, 이러한 최적 폰트 코드는 모든 한글을 표현하는 데에만 치중하였지만, 키보드로부터 입력되는 자소형 코드와 화면에 음절을 구성하며 출력되는 폰트 코드의 일치하지 않는 문제점이 발생하였다. 이를 해결하기 위해서 본 연구에서는 실험을 통하여 입력된 자소형 코드를 파일입출력을 이용하여 파일로 저장 후 이를 본 연구에서의 옛한글 입력기의 폰트 변환 모듈을 사용하여 음절을 표현하여, 자소형 코드와 폰트 코드와의 일치함을 보이고자 한다.

  • PDF

훈민정음 원리에 기반한 자소형 최적 폰트 개발 (A Development of Optimized Jaso-Type Font based on Hunminjeongeum Principle)

  • 변정용;김경욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.690-693
    • /
    • 2007
  • 훈민정음 창제당시의 모든 한글 음절을 모두 표현함에 있어서 현재의 컴퓨터 환경은 표현방법과 폰트의 부족으로 입력 및 출력을 완전하게 할 수 없다. 본 연구에서는 훈민정음해례에서 정의한 약 399억 음절을 컴퓨터 위에서 표현할 수 있는 폰트를 제작함에 있어서 글꼴 설계의 경제적이고 효율적인 방법을 개발하는 데 초점을 둔다. 그렇게 하려면 완성형이 아닌 조합형 글꼴 설계가 요구되며, 자소들을 복자모를 뺀 오직 낱자소만으로 제작함으로써, 음절구성 형태에 따른 낱자소 8개 형식과 세 가지 타입으로 설계한다. 즉, 컴퓨터상에서는 모든 한글이 낱자소만 이용하여 풀어쓰기 형태로 입력되며, 화면에 출력할 때는 풀어쓰기 형태의 자소들을 모아쓰기로 표현하여 낱자소를 초성, 중성, 종성만으로 둘 또는 세 글자 복자모로 확장하여 표현한다. 그러므로 최소한의 폰트모양을 이용하여 훈민정음 창제 당시의 모든 한글 399억 음절을 컴퓨터에 표현할 수 있도록 한다.

  • PDF

보컬즉흥연주 가창분석을 통한 스캣음절(Scat Syllables) 표현에 관한 연구 (The Study on Expressive Methods for Scat Syllables by Analyzing Vocal Improvisation)

  • 방현승
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 추계학술논문집 1부
    • /
    • pp.85-88
    • /
    • 2011
  • 본 논문에서는 3명의 재즈보컬리스트에 의해 가창된 보컬즉흥연주를 분석하여 스캣음절의 사용실례를 살펴보고 그 결과를 통하여 스캣음절의 사용 및 표현방식에 대한 이해를 돕고자 하는데 그 목적이 있다.

  • PDF

한글에 의한 외국어 표기법에서 음절표현 방법 제안 (Suggestion of syllable representation methods for foreign languages in Hangul)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2015
  • 우리 모두 소리의 표현력이 뛰어난 한글의 우수성은 너무나 잘 알고 있으며, 한글의 세계화를 외치고 있다. 그러나 그런 일을 해야할 국립국어원 등 국가기관은 외국어 표기법을 만들지 않고 있다. 외래어표기법으로 충분하다고 생각하고 있는 것이다. 외래어표기법은 현재의 한글을 유지하면서 외국어를 한글 단어로 만들 때 어떻게 만드느냐를 규정한 것이다. 한글세계화에 필요한 외국어 표기법은 한글로 외국어를 잘 표현함으로써 한글을 외국에 퍼트리는 것이 목표이다. 따라서 외국인이 쓰기에 편리해야하고 외국어 발음 왜곡을 최소화 하면서 잘 표현해 내기엔 현재 한글로는 부족한 면이 있음으로 표현력이 확장된 한글을 만들어야한다. 물론 확장된 한글이 현재의 한글과 동떨어지면 안될 것이다. 많은 분들이 여러 아이디어로 제안을 해 왔지만 대부분 자음을 추가하는 데에 집중되어 있다. 확장한글에서 다루어야할 것은 1) 추가되는 자음과 모음 2) 한글에 없는 성조나 강약 및 장단 등에 관한 규정 추가 등이면 된다고 생각하고 있다. 그러나 한글의 큰 특성인 음절이 외국어 표현 때에 왜곡되는 현상이 있는데, 어떻게 외국어와 한글의 음절개념을 일치시킬 수 있을지에 대해 관심을 가지고 방안을 제안하고자 한다. 그 방안으로는 1) 합용병서와 2) 풀어쓰기 활용법이 가능하나, 필자는 중간선으로 3) 촉진자 표기법을 제안한다. 또한, 크기조절법에 대응해 음절인 글자 위에 점을 표기하는 음절점표기법도 제안한다.

  • PDF

감정표현 음성합성 시스템을 위한 감정 분석 (An Analysis on the Emotional Speech for the Speech Synthesis System with Emotion)

  • 천희진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.350-355
    • /
    • 1998
  • 감정을 표현하는 음성 합성 시스템을 구현하기 위해서는 감정음성에 대한 분석이 필요하다. 본 논문에선,s 평상, 화남, 기쁨, 슬픔의 네 가지 감정에 대한 음성 데이터에 대해 음절 세그먼트, 라벨링을 행한 감정 음성 데이터베이스를 구축하였고, 감정표현이 음성에 영향을 미치는 요인에대하여, 운율, 음운적인 요소로 나누어 분석하였다. 또한 기본 주파수, 에너지, 음절지속시간에 대한 분석과 감정 음성의기본 주파수, 에너지, 음절지속시간, 스펙트럼 포락의 인지 정도를 측정하기 위하여 평상 음성에 감정 음성의 운율 요소를 적용하는 음성을 합성하여 ABX 방법으로 평가하였다. 그 결과, 기본 주파수의변화가 73.3%, 음절지속시간은 43.3% 로 올바른 감정으로 인지되었으며, 특히 슬픈 감정에서 음절지속시간은 76.6%가 올바르게 감정을 나타내는 것으로 인지되었다.

  • PDF

음절 임베딩과 양방향 LSTM-CRF를 이용한 한국어 문장 자동 띄어쓰기 (Bi-LSTM-CRF and Syllable Embedding for Automatic Spacing of Korean Sentences)

  • 이현영;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.605-607
    • /
    • 2018
  • 본 논문에서는 음절 임베딩과 양방향 LSTM-CRF 모델을 이용한 한국어 문장 자동 띄어쓰기 시스템을 제안한다. 문장에 대한 자질 벡터 표현을 위해 문장을 구성하는 음절을 Unigram 및 Bigram으로 나누어 각 음절을 연속적인 벡터 공간에 표현하고, 양방향 LSTM을 이용하여 현재 자질에 양방향 자질들과 의존성을 부여한 새로운 자질 벡터를 생성한다. 이 새로운 자질 벡터는 전방향 신경망과 선형체인(Linear-Chain) CRF를 이용하여 최적의 띄어쓰기 태그 열을 예측하고, 생성된 띄어쓰기 태그를 기반으로 문장 자동 띄어쓰기를 수행하였다. 문장 13,500개와 277,718개 어절로 이루어진 학습 데이터 집합과 문장 1,500개와 31,107개 어절로 이루어진 테스트 집합의 학습 및 평가 결과는 97.337%의 음절 띄어쓰기 태그 분류 정확도를 보였다.

  • PDF

은닉 마르코프 모델을 이용한 음차표기된 외래어의 자동인식 및 추출 기법 (Automatic Detection and Extraction of Transliterated Foreign Words Using Hidden Markov Model)

  • 오종훈;최기선
    • 인지과학
    • /
    • 제12권3호
    • /
    • pp.19-28
    • /
    • 2001
  • 본 논문에서는 한국어문서에서 음차표기된 외래어를 자동적으로 인식 및 추출하는 알고리즘을 제안한다. 제안된 방법에서는 음차표기된 외래어 인식 및 추출 문제를 음절태깅문제로 변환한다. 음절태깅문제는 주어진 단어 내의 음절들에 대하여 순수 한국어를 구성하는 음절인지 또는 음차표기된 외래어를 구성하는 음절인지를 태깅하는 작업으로 정의된다. 이를 위하여. 주어진 어절 내의 음절의 나열을 순수 한국어 음절을 표현하는 상태와 외래어 음절을 표현하는 상태의 이진 상태(binary state)로 모델링한 은닉 마르코프 모델을 이용한다. 제안된 방법은 기존 연구에 비하여 높은 재현율과 정확률로 음차표기된 외래어를 인식 및 추출하였다.

  • PDF

4~6세 일반아동 및 언어발달지연 아동의 음운인식 및 음운처리 능력이 언어 능력에 미치는 영향 (Effects of phonological awareness and phonological processing on language skills in 4- to 6-year old children with and without language delay)

  • 김신영;손진경;임동선
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.51-63
    • /
    • 2020
  • 음운인식은 음운론 영역의 상위언어인식 능력으로, 읽기 및 어휘력 등의 언어능력을 예측하는 것으로 알려져 있다. 본 연구는 음운인식 능력과 기타 음운처리 능력, 그리고 언어능력 간의 관계를 일반아동 집단과 언어발달지연 아동 집단 간 비교를 통해 살펴보고자 하였다. 4~6세의 언어발달지연 아동(n=15)과 일반아동(n=18)을 대상으로 음운인식 능력을 평가하기 위하여 음절수세기, 음절탈락, 음절변별 과제를 실시하였다. 또한 비단어 따라말하기, 숫자 거꾸로 회상하기의 두 가지 음운처리 과제와 수용 및 표현어휘력, 문법성판단 과제와의 상관관계를 분석하고, 언어능력을 예측하는 음운인식 하위과제가 무엇인지 검토하였다. 음운인식 하위과제 중 음절수세기를 제외한 음절탈락, 음절변별 과제 수행력의 집단 간 차이가 유의하였다. 또한 일반아동 집단은 음절탈락과 숫자 거꾸로 회상하기, 음절변별과 수용어휘력 과제 수행력 간 상관관계가 유의하였으며, 언어발달지연 아동 집단은 음절수세기 과제와 숫자 거꾸로 회상하기, 수용어휘력, 표현어휘력, 문법성판단 과제의 수행력 간 상관관계가 유의하였다. 그리고 단계적 중다회귀분석 결과 일반아동 집단은 음절변별 과제가 수용어휘력 및 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났으며, 언어발달지연 아동 집단은 음절수세기 과제가 수용어휘력, 표현어휘력, 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났다. 언어발달지연 아동 집단은 일반아동 집단에 비해 음절수세기를 제외한 나머지 음절 수준의 음운인식 과제의 수행력이 저조하였으며, 이러한 특징이 상관관계 분석 및 회귀분석 결과에도 반영되었다. 또한 각 집단에서 음운인식 과제 수행력이 언어능력을 유의하게 예측하는 것으로 나타난 결과는 음운론 영역의 상위언어인식 능력의 중요성을 시사한다.