Search | Korea Science

Interpretation of Noun Sequence using Semantic Information Extracted from Machine Readable Dictionary and Corpus (기계가독형사전과 코퍼스에서 추출한 의미정보를 이용한 명사열의 의미해석)

이경순;김도완;김길창;최기선
- Korean Journal of Cognitive Science
- /
- v.12 no.1_2
- /
- pp.11-24
- /
- 2001
The interpretation of noun sequence is to find semantic relation between the nouns in noun sequence. To interpret noun sequence, semantic knowledge about words and relation between words is required. In this thesis, we propose a method to interpret a semantic relation between nouns in noun sequence. We extract semantic information from an machine readable dictionary (MRD) and corpus using regular expressions. Based on the extracted information, semantic relation of noun sequence is interpreted. And. we use verb subcategorization information together with the semantic information from an MRD and corpus. Previous researches use semantic knowledge extracted only from an MRD but our method uses an MRD. corpus. and subcategorizaton information to interpret noun sequences. Experimental result shows that our method improves the accuracy rate by +40.30% and the coverage rate by + 12.73% better than previous researches.
PDF

Lexical Disambiguation for Intonation Synthesis : A CCG Approach (억양 합성을 위한 어휘 중의성 해소 : 결합범주문법을 통한 접근)

Lee, Ho-Joon;Park, Jong-Chul
- Proceedings of the Korean Society for Language and Information Conference
- /
- 2005.06a
- /
- pp.103-118
- /
- 2005
IT의 급격한 발전과 함께 새로운 형태의 정보 전달 방법이 지속적으로 나타나면서 우리말의 정확한 발음에 대한 인식이 점점 약화되고 있는 추세이다. 특히 장단음의 발음은 발화에 대한 전문인들도 정확하게 구분하지 못하고 있는 심각한 상황이다. 본 논문에서는 한국어 명사에서 나타나는 장단음화 현상을 주변 어휘와의 관계를 바탕으로 살펴보고 동음이의어 중 다르게 발음되는 명사의 장단음 구분을 명사와 명사의 수식어, 명사의 서술어와의 관계를 중심으로 논의한다. 분석된 결과는 결합범주문법을 이용하여 표현하고 어휘적 중의성이 해소된 음성 합성 과정을 표준화된 SSML(Speech Synthesis Markup Language)으로 기술한다.
PDF

An Analysis of Noun-modifying Adverbs for Structural Disambiguation (구조적 중의성 해결을 위한 명사 수식 부사 연구)

황선영;이공주
- Korean Journal of Cognitive Science
- /
- v.13 no.4
- /
- pp.43-53
- /
- 2002
An adverb has been generally defined as what modifies verbs or adjectives in Korean, but we can find that some adverbs can modify nouns. These kinds of adverbs lead a structural analysis complicated; therefore, they should be exceptionally processed by a syntactic parser. In this paper, we categorize a noun-modifying adverb and characterize that from a syntactic analysis standpoint. And also, we propose a method to handle noun-modifying adverbs for improving the accuracy of syntactic analysis. By using this proposed method, we can show that the parser increases it's accuracy from 81.9 to 83.6％ on testing corpus.
PDF

An Analysis of Noun-modifying Adverbs for Structural Disambiguation (구조적 중의성 해결을 위한 명사 수식 부사 연구)

Hwang, Seon Yeong;Lee, Gong Ju
- Korean Journal of Cognitive Science
- /
- v.13 no.4
- /
- pp.42-42
- /
- 2002
An adverb has been generally defined as what modifies verbs or adjectives in Korean, but we can find that some adverbs can modify nouns. These kinds of adverbs lead a structural analysis complicated; therefore, they should be exceptionally processed by a syntactic parser. In this paper, we categorize a noun-modifying adverb and characterize that from a syntactic analysis standpoint. And also, we propose a method to handle noun-modifying adverbs for improving the accuracy of syntactic analysis. By using this proposed method, we can show that the parser increases it′s accuracy from 81.9 to 83.6% on testing corpus.

Korean Syntax Analysis Using Sentence Pattern Information (문형 정보를 이용한 한국어 구문 분석)

Han, Yong-Gi;Hwang, Yi-Gyu;Lee, Yong-Seok
- Annual Conference on Human and Language Technology
- /
- 1995.10a
- /
- pp.23-29
- /
- 1995
대부분의 한국어 구문 분석은 용언과 명사구 사이의 하위범주화 정보를 이용하여 용언에 대한 명사구의 문법적 역할을 밝히는 방향으로 구문 분석을 시도하였다. 여기에 이용된 용언의 하위 범주화 정보가 단지 자릿수 서술어나 형용사, 자동사, 타동사 등으로 분류하는 수준이었기 때문에 구문 모호성이 많이 발생하고 틀린 문장이 구문적으로 옳기 때문에 옳은 문장으로 인식되는 경우가 발생하였다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어의 용언에 따른 문장 형태(문형)를 세분류하고 문장에 필수적으로 나타나는 명사구(NP[case])와 수의적으로 나타나는 명사구(NP[case])를 분류하여 분석을 시도하였다. 확장된 PATR II로 문법을 기술하여 동적인 파싱을 쉽게 제어할 수 있도록 하였다. 문형 정보는 한국어의 기본 구조를 자연스럽게 표현할 수 있기 때문에 그 자체를 기계번역을 위한 한국어 문법으로 설정하는 것이 타당하다고 생각된다.
PDF

Korean Verb Senses Disambiguation Using Distributional Information from Corpora (분포 정보를 이용한 의미 중의성을 지닌 한국어 동사의 의미 분별)

Cho, Jeong-Mi;Kim, Gil-Chang
- Annual Conference on Human and Language Technology
- /
- 1995.10a
- /
- pp.56-61
- /
- 1995
본 논문에서는 말뭉치로부터의 분포 정보를 이용하여, 의미 중의성을 지닌 한국어 동사의 의미를 분별하고자 한다. 분포 정보란 말뭉치내에서 목적어-서술어 관계에 있는 명사와 동사의 분포를 의미한다. 이 분포 정보는 명사 분포와 동사 분포로 나누어 생각할 수 있는데, 본 논문에서는 이 두가지 분포 정보를 사용함으로써 명사 분포만을 이용하였을 때 나타나는 자료 부족 현상을 등사 분포 정보를 이용하여 보완하였다. 분포 정보간의 유사도 계산은 정보 이론에서 사용하는 상대 엔트로피를 이용한다. 품사가 태깅된 50만 단어의 한국어 말뭉치로부터 분포 정보들을 추출하여 한국어 동사 10개에 대해 실험하였다.
PDF

Exactly reading vs. at least reading of NPs with a numeral determiner

Wee, Hae-Kyung
- Proceedings of the Korean Society for Language and Information Conference
- /
- 2002.06a
- /
- pp.162-172
- /
- 2002
서수 한정사의 수식을 받는 명사구는 "정확히"의 의미와 "적어도"의 의미를 둘 다 가질 수 있다. Horn(1972)과 Kadmon(1985, 1987, 2001)은 "적어도"의 의미를 의미론적 의미로, "정확히"의 의미를 화용적 의미로 분석하고, Kamp는 그 반대 입장을 취한다. 그러나 서수 한정사의 의미를 그 의미 구조와 무관하게 일률적으로 분석하는 이런 접근 방식은 양쪽 중 어떤 입장을 취하든 다음의 두 사실을 설명할 수 없다 (i) 서술구에 쓰인 서수 한정사는 항상 "정확히"의 의미만을 갖는다. (ii) 초점을 받는 서수 한정사도 항상 "정확히"의 의미만을 갖는다. 이 연구는 초점 구문에 대한 논리-의미적 분석 방법에 근거하여 서수 한정사의 중의성의 의미를 설명한다. 구체적으로, 서수 한정사는 통사적 논항에 나타나든 통사적 서술구에 나타나든 상관없이 의미적으로 동일성의 서술구에 나타나면 항상 "정확히"의 의미만을 갖게 되고 의미적 주부에 나타나면 "적어도"의 의미를 갖게 된다는 사실을 보인다.
PDF

Using Lexical Co-occurrence Information in Syntactic Analysis (구문 분석에서의 어휘간 공기 정보의 활용)

Yoon, Jun-Tae;Choi, Key-Sun;Kim, Seon-Ho;Song, Man-Suk
- Annual Conference on Human and Language Technology
- /
- 1998.10c
- /
- pp.276-280
- /
- 1998
구문 분석에 있어서 어휘 정보는 구문적 중의성을 해결하는 데 매우 중요한 역할을 한다. 본 논문에서는 대량의 말뭉치로부터 추출된 공기 정보가 구문 분석에서 효과적으로 이용될 수 있음을 보인다. 첫째, 공기 정보로부터 보다 의미있는 연어를 추출하고 이를 구문 분석에 이용함으로써 보다 효율적인 파서의 구축이 가능함을 밝힌다. 둘째로는 대량의 말뭉치로부터 추출한 공기 정보가 구문 분석시 보조사나 조사 생략에 의한 격 중의성 혹은 관계 관형절에서 발생하는 명사구 이동에 따른 격 중의성의 해결에 적용될 수 있음을 보인다. 이를 위해 본 연구에서는 연세대학교 한국어 사전 편찬실의 연세 말뭉치 3,000만 어절과 KAIST 말뭉치 중 1,000만 어절로부터 <서술어, 명사, 격관계> 공기 정보를 추출하였다.
PDF

Bootstrapping for Semantic Role Assignment of Korean Case Marker (부트스트래핑 알고리즘을 이용한 한국어 격조사의 의미역 결정)

Kim Byoung-Soo;Lee Yong-Hun;Na Seung-Hoon;Kim Jun-Gi;Lee Jong-Hyeok
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.06b
- /
- pp.4-6
- /
- 2006
본 논문은 자연언어처리에서 문장의 서술어와 그 서술어가 가지는 명사 논항들 사이의 문법관계를 의미 관계로 사상하는 즉 논항이 서술어에 대해 가지는 역할을 정하는 문제를 다루고 있다. 의미역 결정은 단어의 의미 중의성 해소와 함께 자연언어의 의미 분석의 핵심 문제 중 하나이며 반드시 해결해야 하는 매우 중요한 문제 중 하나이다. 본 연구에서는 언어학적으로 유용한 자원인 세종전자사전을 이용하여 용언격틀사전을 구축하고 격틀 선택 방법으로 의미역을 결정한 후. 결정된 의미역들에 대한 확률 정보를 확률 모델에 적용하여 반복적으로 학습하는 부트스트래핑(Bootstrapping) 알고리즘을 사용하였다. 실험 결과, 기본 모델에 대해 10% 정도의 성능 향상을 보였다.
PDF

A study on semantic ambiguity in the Korean Named Entity Recognition (한국어 개체명 인식 과제에서의 의미 모호성 연구)

Kim, Seonghyun;Song, Youngsook;Song, Chisung;Han, Jiyoon
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.203-208
- /
- 2021
본 논문에서는 맥락에 따라 개체명의 범주가 달라지는 어휘를 중심으로 교차 태깅된 개체명의 성능을 레이블과 스팬 정답률, 문장 성분과 문장 위치에 따른 정답률로 나누어 살펴 보았다. 레이블의 정확도는 KoGPT2, mBERT, KLUE-RoBERTa 순으로 정답률이 높아지는 양상을 보였다. 스팬 정답률에서는 mBERT가 KLUE-RoBERTa보다 근소하게 성능이 높았고 KoGPT2는 매우 낮은 정확도를 보였다. 다만, KoGPT2는 개체명이 문장의 끝에 위치할 때는 다른 모델과 비슷한 정도로 성능이 개선되는 결과를 보였다. 문장 종결 위치에서 인식기의 성능이 좋은 것은 실험에 사용된 말뭉치의 문장 성분이 서술어일 때 명사의 중첩이 적고 구문이 패턴화되어 있다는 특징과 KoGPT2가 decoder기반의 모델이기 때문으로 여겨지나 이에 대해서는 후속 연구가 필요하다.
PDF

Search Result 25, Processing Time 0.023 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)