• Title/Summary/Keyword: 기능어

Search Result 644, Processing Time 0.029 seconds

Korean Continuous Speech Recognition using Phone Models for Function words (기능어용 음소 모델을 적용한 한국어 연속음성 인식)

  • 명주현;정민화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.354-356
    • /
    • 2000
  • 의사형태소를 디코딩 단위로 한국어 연속 음성 인식에서의 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들은 한국어 기능어라 정의하고 실제 의사형태소 단위의 인식 실험을 통하여 기능어 집합 1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

  • PDF

Probabilistic Dependency Grammar Induction (한국어 확률 의존문법 학습)

  • 최선화;박혁로
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

Generation of Auxiliary Verbs in a Korean Generation System of English-Korean Machine Translation (영한 기계번역의 한국어 생성 시스템에서 조동사의 생성)

  • An, Dong-Un;Cho, Jeong-Mi;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.533-544
    • /
    • 1993
  • 기계번역에서 기능어의 번역은 각 언어가 고유의 문법적 특성과 표현방법을 가지고 있기 때문에 기능어가 가지는 의미와 문법적 기능을 자질로 표현하고 이를 통하여 해석과 생성을 한다. 한국어는 첨가어로 기능어가 매우 발달되어 있으며, 특히 조동사가 많은 문법적 기능을 담당하고 화자의 양태적 관계를 나타낸다. 따라서, 기계번역의 한국어 생성에서 조동사가 번역의 질에 상당한 영향을 미친다. 본 논문에서는 중간언어방식을 이용한 기계번역시스템의 한국어 생성에서 문법적 기능이나 양태적 관계를 나타낸 중간언어로부터 어떠한 조동사가 생성이 되어야 하고, 또한 조동사들간의 결합순서는 어떠한지를 살펴본다. 이를 위하여 Corpus를 분석하여 각 조동사 분류에 대한 대표 표층어를 선정하고 조동사간의 결합순서를 밝힌다. 조동사 생성을 위해 필요한 처리 과정과 언어적 지식베이스를 제안하고 시스템을 구현한다.

  • PDF

Restoring Functional Word and Noun-Verb Syntactic Relations for Korean Compound Noun Analysis (단위 명사간 보-술 관계를 이용한 한국어 복합 명사의 문장 복원)

  • Yang, Seong-Il;Kim, Young-Kil;Seo, Young-Ae;Park, Eun-Jin;Ra, Dong-Yul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.694-695
    • /
    • 2007
  • 한국어 문장의 구성은 명사, 동사와 같은 내용어와 조사, 어미와 같은 기능어로 크게 나눌 수있다. 문장의 핵심적인 의미 전달은 내용어에 의해 이루어지며, 한국어 명사구의 경우 잦은 기능어의 생략으로 명사 나열에 의한 복합 명사가 발생된다. 이렇게 발생되는 복합 명사를 구성하는 단위 명사들은 일부 문장 성분을 생략시켜 발생된 것으로, 생략 성분의 복원에 의해 본래의 문장 형태를 추정할 수 있다. 한국어 복합 명사의 경우, 생략되는 문장 성분은 대부분 접사, 조사와 같은 기능어로 국한되며, 기능어의 복원은 단위 명사 간의 격 관계와 의미 관계를 분석하여 이루어질 수 있다. 본 논문에서는 단위 명사간의 보-술 관계를 이용하여 복합 명사를 구성하는 단위 명사 간의 의존 관계를 추정하고, 추정된 의존 관계에 의해 생략된 격조사와 용언화 접사를 복원하는 방법을 제안한다. 구조 분석에서 사용되는 의미 격틀에 의해 결정되는 격 관계는 격조사와 용언화 접사의 복원을 결정하며, 올바른 본래의 문장 표현 복원을 위해 관형격 조사와 관형격 어미를 비롯한 특별한 형태의 복원은 통계 정보와 휴리스틱 규칙으로 결정한다.

  • PDF

Flow Analysis in the Baffled Fishway using FLOW-3D (FLOW-3D를 이용한 도류벽식 어도내의 흐름해석)

  • Choi, Soo-Hyoung;Kim, Seo-Jun;Lim, Yoon-Sung;Yoon, Byung-Man
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1837-1840
    • /
    • 2009
  • 최근 자연형하천 조성사업과 하천복원 등을 목적으로 하천의 치수, 이수적인 기능뿐만 아니라 생태적인 기능을 고려한 하천설계를 위하여 많은 노력들을 하고 있다. 이와 같은 목적으로 하천의 생태적 통로가 단절되는 것을 막기 위해 하천 횡단 구조물인 보와 낙차공에 어도를 설치하고 있다. 하지만 현재 어도 설계는 어도 내의 흐름특성을 정확히 고려하지 못하고 설계되어 어도 본래의 기능을 수행하지 못하는 경우가 많았다. 그 이유는 현장 상황에 따라 어도의 종류와 형태가 다양하게 설계되고 있는 것에 반해 이를 검토할 수 있는 방법이 수리실험으로 한정되어 있어서 어도내 흐름특성을 결정하기 어렵기 때문이다. 어도 설계를 위한 수리실험은 시간적, 공간적 및 경제적인 제약으로 인해 다양한 형태의 어도 조건과 수리조건을 검토하기에는 현실적으로 어려움이 있는 반면에 수치모의는 매개변수 결정에 어려움이 있지만 수리실험에 비해 다양한 형태와 수리조건에 대해 간편하게 흐름특성을 예측할 수 있는 장점이 있다. 따라서 본 연구에서는 어도 설계시 간편하게 어도내 흐름특성을 예측할 수 있도록 기존에 사용되고 있는 수리실험 결과와 수치모의 기법을 이용한 흐름해석 결과를 비교하여 보았다. 수치모의는 3차원 흐름모형인 FLOW-3D를 이용하였고, 어도 형태는 도류벽식 어도를 대상으로 수행하였다. 수행 결과 수리실험과 비교하여 수심별로 최대 13% 정도의 오차를 보이고 있으며, 최대유속 발생 지점을 비교한 결과 하폭의 6% 정도 오차를 보였다. 따라서 최종 설계 이전에 어도의 흐름특성을 예측하기 위한 방법으로 FLOW-3D를 사용한다면 충분히 활용 가능할 것으로 판단된다.

  • PDF

Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency (한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교)

  • Park, Woojim;Mo, Ranm;Rhee, Seok-Chae
    • Phonetics and Speech Sciences
    • /
    • v.12 no.3
    • /
    • pp.33-40
    • /
    • 2020
  • The purpose of this research was to find out the relation between Korean learners' English proficiency and the ratio of the length of the stressed vowel in a monosyllabic noun to that of the unstressed vowel in an article of the noun phrases (e.g., "a cup", "the bus", etcs.). Generally, the vowels in monosyllabic content words are phonetically more prominent than the ones in monosyllabic function words as the former have phrasal stress, making the vowels in content words longer in length, higher in pitch, and louder in amplitude. This study, based on the speech samples from Korean-Spoken English Corpus (K-SEC) and Rated Korean-Spoken English Corpus (Rated K-SEC), examined 879 English noun phrases, which are composed of an article and a monosyllabic noun, from sentences which are rated on 4 levels of proficiency. The lengths of the vowels in these 879 target NPs were measured and the ratio of the vowel lengths in nouns to those in articles was calculated. It turned out that the higher the proficiency level, the greater the mean ratio of the vowels in nouns to the vowels in articles, confirming the research's hypothesis. This research thus concluded that for the Korean English learners, the higher the English proficiency level, the better they could produce the stressed and unstressed vowels with more conspicuous length differences between them.

Subject Based Classification: Conceptualization and the Development Plan as a Classificatory System (주제어기반 분류의 분류론적 개념 정립 및 발전 방안 - 발전과정 및 기능 분석을 통하여 -)

  • Baek, Ji-Won
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.23 no.4
    • /
    • pp.5-24
    • /
    • 2012
  • The aim of this study is 1) to analyse the historical development and current condition of the subject based classification(SBC), 2) to clarify the function and to categorize the specific kind of SBC, for its conceptualization and the development plan. For this purpose, almost 30 cases, for the period 1937 through now, were analyzed concerning their terms used in the names and the specific kinds as SBC. In addition, the analysis was made regarding how the SBC fulfill the selected main functions as a classificatory scheme and how SBC is inter-related with the other knowledge organization systems(KOS) such as classification and subject heading. Based on the above analysis, the conclusion addressed that SBC could be defined in consideration of the detailed function, type, information environment, and interconnection among the KOS, and suggested the future development plan of SBC as a classification scheme.

Design for the Semaphore Interface Function of the Dual Core Embedded Linux System (듀얼코어 임베디드 리눅스 시스템에서 코어간 세마포어 인터페이스 기능 설계)

  • Jung, Ji-Sung;Lee, Jae-Gi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.97-100
    • /
    • 2018
  • 세마포어 처리문제는 프로세스간 메시지를 전송하거나 공유메모리를 통해 특정 데이터를 공유할 때 발생되는 문제로 공유된 자원에 여러 개의 프로세스가 동시에 접근하면 안되며, 단지 한번에 하나의 프로세서만 접근 가능하도록 하여야 한다. 세마포어 기본정책은 호출되는 코어에 생성되며, 다른 코어에서는 IPI를 통해 존재 여부를 확인한다. 동일 코어에서 접근 시 기존방식으로 사용한다. 본 논문에서는 서로 다른 코어 및 운영체제에서 다른 코어에서 접근할 때에는 IPI를 통해 존재 여부를 확인한 후 더미 세마포어 구조체를 생성하여 관련 정보를 유지하고 해당 요청을 처리해 주는 세마포어 인터페이스 기능 설계 방법을 제안한다. 제안하는 세마포어 인터페이스 기능 설계 방안은 멀티 태스킹 기술 구현으로 기존 코어가 가지고 있는 성능상의 문제를 해결해 준다.

Discourse Deixis and Anaphora in Slavic Languages (슬라브어 담화 직시와 대용)

  • Chung, Jung Won
    • Cross-Cultural Studies
    • /
    • v.45
    • /
    • pp.381-431
    • /
    • 2016
  • This paper deals with Slavic discourse deixis comparing Russian, Polish, Czech and Bulgarian demonstrative and personal pronouns. In general, the Slavic proximal pronouns have precedence over the distal ones. Proximal pronouns, such as Russian eto, Polish to, and Bulgarian tova, are employed more frequently and widely than their distal counterparts to, tamto and onova. The distance-neutral pronoun to in Modern Czech was also a proximal pronoun in the past. These Slavic proximal and former-proximal pronouns function as a discourse deixis marker, whereas, in most other languages, the discourse deixis is mainly a function of distal or non-proximal demonstrative pronouns. However, the Russian, Polish, Czech, and Bulgarian discourse deixis differs in distal demonstrative and personal pronouns. In general, the Polish and Czech discourse deixis does not employ the distal demonstrative pronoun tamto or the personal pronoun ono. The Russian distal demonstrative pronoun to is actively used as a discourse deixis marker, and the personal pronoun ono can also be used to refer to the preceding discourse, though it is not frequent. In Bulgarian the distal demonstrative pronoun onova is rarely used to refer to a discourse, but the personal pronoun to frequently indicates a discourse that is repeatedly referred to in a text. The discourse deixis, which is a peripheral deixis and can be both deixis and anaphora, reveals different characteristics in different Slavic languages. In Russian, where all of the proximal, distal, and personal pronouns function as a discourse deixis marker, the deixis itself plays a crucial role in distinguishing these three pronouns from each other, revealing the speaker's psychological, emotional, temporal, and cognitive proximity to or distance from a given discourse. In Bulgarian, the most analytic Slavic language, the personal pronoun is used more as a discourse deixis marker to reveal the highest givenness of a discourse, and it seems that Bulgarian discourse deixis is more anaphoric than the other Slavic discourse deixis is.

Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation (구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델)

  • Kim, Hae-Gyung;Chae, Young-Soog;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF