• 제목/요약/키워드: 음절

검색결과 571건 처리시간 0.023초

한글 단어재인에 있어서 글자처리와 낱자의 지각 (II) (Syllabic Processing and Latter Perception in Korean Word Recognition (II))

  • 김정오;김재갑
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.423-433
    • /
    • 1992
  • 낱자 또는 음절들을 매우 짧게 제시하고 차폐로 지운 후 두 낱자 중하나를 선택하는 과제 (Reicher, 1969)를 사용하여 음절 맥락에서 낱자 지각에 영향을 주는 변수들과 그 배후 지각과정들을 검토하였다. 자모 조합유형이 음절 내 낱자의 정체 파악에 체계적으로 영향을 주고 있었고, 예상과는 달리 음절 내의 낱자들이 단독으로 제시되는 낱자 보다 잘 파악되지 않는 음절열등효과가 일관되게 관찰되었다. 본 연구의 세 실험 결과들을 상호작용활성화 모형과 초보지각자-기억자 모형에 비추어 논의하였다.

  • PDF

훈민정음 표현을 위한 최적 폰트 설계 (An Optimized Font Design for Hunminjeongeum Representation)

  • 김경욱;변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-57
    • /
    • 2008
  • 1987년 정보교환용 부호가 완성음절형 부호계로 개정되면서 한글 음절 표현은 극히 제한되어 컴퓨터상에서 한글의 표현은 제약을 받게 되었다. 1446년 훈민정음이 공포된 후로 목판, 활자시대를 지나서 타자기를 만나면서 한자와 다른 길을 걸어왔다. 특히 컴퓨터시대가 되면서 한글은 타자 이상의 적합성을 가지고 있지만 훈민정음 창제원리에 대한 이해부족으로 음절문자로 분류하여 완성음절형 부호를 지원하게 됨에 따라서 많은 문제를 야기하고 있다. 국제표준인 유니코드에는 세가지 종류의 부호가 반영되어 있는데 음절문자 중심의 부호화이므로 훈민정음의 특성을 해치는 일이며 또한 한글의 과학성을 부정하는 일이기도 하다. 본 논문은 훈민정음 창제원리에 입각하지 않음으로 생긴 문제에 대한 근본적인 해결책으로 훈민정음을 표현하는 최적 폰트 설계 방안을 검토하고 현행의 한글부코드표준의 개선 방향을 제시하고자 한다.

  • PDF

훈민정음 원리에 기반한 자소형 코드와 최적 폰트 코드의 일치성에 관한 연구 (A study on the Conformity of Jaso-Type Code and Optimum Font Code Based On Hunminjeongeum Principle)

  • 김경욱;변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-80
    • /
    • 2009
  • 훈민정음 창제당시의 모든 한글 음절인 약 399억 음절을 표현하기 위해서 자소형 코드만을 입력하여 이를 조합 음절 형태로 구성하고, 최적 폰트 코드를 출력함으로써 모든 한글을 표현할 수 있었다. 하지만, 이러한 최적 폰트 코드는 모든 한글을 표현하는 데에만 치중하였지만, 키보드로부터 입력되는 자소형 코드와 화면에 음절을 구성하며 출력되는 폰트 코드의 일치하지 않는 문제점이 발생하였다. 이를 해결하기 위해서 본 연구에서는 실험을 통하여 입력된 자소형 코드를 파일입출력을 이용하여 파일로 저장 후 이를 본 연구에서의 옛한글 입력기의 폰트 변환 모듈을 사용하여 음절을 표현하여, 자소형 코드와 폰트 코드와의 일치함을 보이고자 한다.

  • PDF

음절 n-gram 기반의 미등록 어휘 추정기 구현 (Out of Vocabulary Word Extractor based on a Syllable n-gram)

  • 신준수;홍초희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-141
    • /
    • 2013
  • 다양한 콘텐츠가 생성됨에 따라 신조어 및 미등록어도 다양한 형태로 나타나고 있다. 이러한 신조어 및 미등록어는 텍스트 처리 단계에서 오분석 되어 성능 저하의 원인이 된다. 본 논문은 이러한 문제를 해결하기 위해서 대량의 문서로부터 신조어 및 미등록 어휘를 추정하는 방법에 대해서 제안한다. 제안 방법은 대량의 문서로부터 음절 n-gram을 추출한 뒤, 각 n-gram에서 n을 한음절 축소 및 확장 시켜, (n+1)gram, (n-1)gram을 추가적으로 추출한다. 추출된 음절 n-gram을 기준으로 (n+1)gram, (n-1)gram과의 빈도 차이를 계산하여 빈도차가 급격하게 발생하는 구간을 신조어 및 미등록 어휘로 추정한다. 실험결과 신조어 뿐만 아니라 트위터, 미투데이 등과 같은 도메인에 종속적인 미등록 어휘도 추출되는 것을 확인할 수 있었다.

  • PDF

한국어의 운율리듬에 관한 연구 - 길이리듬을 중심으로- (The Study of Korean Prosodic Rhythm - with respect to its durational rhythm)

  • 이현복;성철재;정일진;이승미;진남택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.111-117
    • /
    • 1993
  • 강세간 음절이 증가되는데 따른 시간의 증가비율을 알아보기 위해 남녀 및 연령으로 구분되는 4그룹을 선정하여, 증가되는 음절의 마지막 낱말이 각각 '이(V)', '도(CV)', '썽(CVC)'으로 구분되는 자료를 이용하였다. 결과적으로 나온 한국어의 강세간 음절증가에 따른 시간의 증가비율의 모습은 젊은층에서는 음절시간언어에 가까운 모습을 나타내며 이에 반해 장년층은 강세시간언어의 모습을 보여준다. 두 그룹을 하나로 통합한 결과는 음절시간언어와 강세시간 언어의 중간적 양상 즉 그리이스어와 가까운 모습으로 나타난다.

  • PDF

자연발화상에 나타난 단음절 단일간투사의 길이특성 분석 (Analysis of the durational characteristics of monosyllabic interjections in Natural spoken language)

  • 김기호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.95-98
    • /
    • 1994
  • 자연발화상에 포함되어, 음성언어 인식에 장애를 초래하는 간투사의 음성적 특성 중 가장 뚜렷이 구별되는 길이특성얼 분석하여 음성언어 인식에 도움을 주는 것을 목적으로 한다. 이 연구에서는 간투사의 대부분을 차지하는 단음절 단일 간투사에 한정하여, 실제 대화의 녹음자료에서 나타나는 간투사의 빈도수와, 그 길이특성을 신분별, 성별, 간투사 유형별로 분석하였다. 또 간투사를 위치에 따라, 음운구초 간투사, 음운구말 간투사로 나누고, 그 길이를 음절 평균, 음운 구초 음절이나 음운구말 음절의 길이와 비교하여 간투사의 증가율을 측정하였다. 분석결과 가장 높은 빈도수를 보이는 단음절 단일 간투사는 어 이며, 간투사 길이 증가율은, 음절평균에 대해서는 그가, 음운구초 평균에 대해서는 응이 가장 큰 증가율을 나타낸다. 전체적을 음운구초 음절길이에 대한 간투사 길이 증가율이 음절평균 길이에 대한 간투사 길이 증가율보다 더 크게 나타났다. 이러한 분석결과를 통해 하위레벨에서 제거할 수 있는 간투사와, 통사적 또는 의미론적 분석이 필요한 상위레벨에서 처리해야할 간투사를 구별할 수 있다. 이와 같은 길이 특성외에 간투사에 대한 다양한 음성적 특성과, 다음절 단일 간투사와, 이중 간투사에 대한 연구가 진척된다면 음성언어 인식에 장애가 되는 간투사의 효과적 배제가 가능할 것으로 보인다.

  • PDF

한글에 의한 외국어 표기법에서 음절표현 방법 제안 (Suggestion of syllable representation methods for foreign languages in Hangul)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2015
  • 우리 모두 소리의 표현력이 뛰어난 한글의 우수성은 너무나 잘 알고 있으며, 한글의 세계화를 외치고 있다. 그러나 그런 일을 해야할 국립국어원 등 국가기관은 외국어 표기법을 만들지 않고 있다. 외래어표기법으로 충분하다고 생각하고 있는 것이다. 외래어표기법은 현재의 한글을 유지하면서 외국어를 한글 단어로 만들 때 어떻게 만드느냐를 규정한 것이다. 한글세계화에 필요한 외국어 표기법은 한글로 외국어를 잘 표현함으로써 한글을 외국에 퍼트리는 것이 목표이다. 따라서 외국인이 쓰기에 편리해야하고 외국어 발음 왜곡을 최소화 하면서 잘 표현해 내기엔 현재 한글로는 부족한 면이 있음으로 표현력이 확장된 한글을 만들어야한다. 물론 확장된 한글이 현재의 한글과 동떨어지면 안될 것이다. 많은 분들이 여러 아이디어로 제안을 해 왔지만 대부분 자음을 추가하는 데에 집중되어 있다. 확장한글에서 다루어야할 것은 1) 추가되는 자음과 모음 2) 한글에 없는 성조나 강약 및 장단 등에 관한 규정 추가 등이면 된다고 생각하고 있다. 그러나 한글의 큰 특성인 음절이 외국어 표현 때에 왜곡되는 현상이 있는데, 어떻게 외국어와 한글의 음절개념을 일치시킬 수 있을지에 대해 관심을 가지고 방안을 제안하고자 한다. 그 방안으로는 1) 합용병서와 2) 풀어쓰기 활용법이 가능하나, 필자는 중간선으로 3) 촉진자 표기법을 제안한다. 또한, 크기조절법에 대응해 음절인 글자 위에 점을 표기하는 음절점표기법도 제안한다.

  • PDF

ELECTRA 모델을 이용한 음절 기반 한국어 개체명 인식과 슬롯 필링 (Syllable-based Korean Named Entity Recognition and Slot Filling with ELECTRA)

  • 도수종;박천음;이청재;한규열;이미례
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-342
    • /
    • 2020
  • 음절 기반 모델은 음절 하나가 모델의 입력이 되며, 형태소 분석을 기반으로 하는 모델에서 발생하는 에러 전파(error propagation)와 미등록어 문제를 회피할 수 있다. 개체명 인식은 주어진 문장에서 고유한 의미를 갖는 단어를 찾아 개체 범주로 분류하는 자연어처리 태스크이며, 슬롯 필링(slot filling)은 문장 안에서 의미 정보를 추출하는 자연어이해 태스크이다. 본 논문에서는 자동차 도메인 슬롯 필링 데이터셋을 구축하며, 음절 단위로 한국어 개체명 인식과 슬롯 필링을 수행하고, 성능 향상을 위하여 한국어 대용량 코퍼스를 음절 단위로 사전학습한 ELECTRA 모델 기반 학습방법을 제안한다. 실험 결과, 국립국어원 문어체 개체명 데이터셋에서 F1 88.93%, ETRI 데이터셋에서는 F1 94.85%, 자동차 도메인 슬롯 필링에서는 F1 94.74%로 우수한 성능을 보였다. 이에 따라, 본 논문에서 제안한 방법이 의미있음을 알 수 있다.

  • PDF

한국어 원거리 음성의 운율적 특성 (Prosodic Characteristics of Korean Distant Speech)

  • 김선희;김종진;이숙향
    • 한국음향학회지
    • /
    • 제25권3호
    • /
    • pp.137-143
    • /
    • 2006
  • 본 논문의 목적은 한국어 원거리 음성의 운율적 특성을 규명하는 것으로, 36개의 2음절어를 4명의 화자 (여성 화자 2명, 남성 화자 2명)가 원거리 환경과 일반환경에서 발화한 총 288개의 2음절어를 분석대상으로 하였다. 실험 결과 지속시간과 에너지의 경우는 일반 음성에 비하여 원거리 음성의 첫음절에 대한 둘째음절의 비율이 유의미하게 큰 것으로 나타났다. F0 대역폭의 경우에도 원거리 음성에서의 대역폭이 평이 음성에 비해 큰 값을 보였다. 억양 패턴에 있어서는 원거리 음성의 경우에 둘째음절에 'HL%'의 복합 경계성조가 실현되거나 첫음절에 'L+H' 성조가 실현되기도 하였으며 이 두 가지가 한 단어에 모두 실현되는 경우도 있었다.

운율 정보를 이용한 한국어 위치 정보 데이타의 발음 모델링 (Pronunciation Variation Modeling for Korean Point-of-Interest Data Using Prosodic Information)

  • 김선희;박전규;나민수;전재훈;정민화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.104-111
    • /
    • 2007
  • 본 논문은 두 가지의 구조적 운율 정보, 즉 운율어와 음절수를 이용하여 한국어 위치 정보 데이타의 발음모델링을 수행할 경우에 음성인식기의 성능을 평가하는 것을 목표로 하는 이다. 먼저, 위치 정보 데이타가 운율어로 구성되어 있다는 전제 하에 운율어를 이용하여 위치 정보 데이타의 가능한 모든 발음을 생성하고, 다시 음절수를 기준으로 발음변이 수를 조절하는 방법을 제시하였다. 제안한 방법에 의하여 9개의 테스트 세트와 9개의 학습 세트로 총 81개의 실험을 통하여 음성인식의 성능을 평가하였다. 실험 결과 운율어를 이용하여 발음 사전을 제작한 모든 경우에 베이스라인과 비교하여 성능이 향상되었다. 음절수에 따라서 발음 변이의 수를 조절한 결과도 전체적으로는 3음절로 그 수를 제한한 경우에 가장 좋은 인식 성능을 얻을 수 있어서, 음절수에 따른 발음 변이 수의 조절이 효과적임을 알 수 있었다. 제안한 방법과 같이 운율어와 음절수를 이용한 경우에 베이스라인의 WER 4.63%에서 최대 8.4%의 WER가 감소하였다.