Search | Korea Science

Noun Sense Disambiguation Based-on Corpus and Conceptual Information (말뭉치와 개념정보를 이용한 명사 중의성 해소 방법)

이휘봉;허남원;문경희;이종혁
- Korean Journal of Cognitive Science
- /
- v.10 no.2
- /
- pp.1-10
- /
- 1999
This paper proposes a noun sense disambiguation method based-on corpus and conceptual information. Previous research has restricted the use of linguistic knowledge to the lexical level. Since knowledge extracted from corpus is stored in words themselves, the methods requires a large amount of space for the knowledge with low recall rate. On the contrary, we resolve noun sense ambiguity by using concept co-occurrence information extracted from an automatically sense-tagged corpus. In one experimental evaluation it achieved, on average, a precision of 82.4%, which is an improvement of the baseline by 14.6%. considering that the test corpus is completely irrelevant to the learning corpus, this is a promising result.
PDF

Korean Lexical Disambiguation Based on Statistical Information (통계정보에 기반을 둔 한국어 어휘중의성해소)

박하규;김영택
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.19 no.2
- /
- pp.265-275
- /
- 1994
Lexical disambiguation is one of the most basic areas in natural language processing such as speech recognition/synthesis, information retrieval, corpus tagging/ etc. This paper describes a Korean lexical disambiguation mechanism where the disambigution is perfoemed on the basis of the statistical information collected from corpora. In this mechanism, the token tags corresponding to the results of the morphological analysis are used instead of part of speech tags for the purpose of detail disambiguation. The lexical selection function proposed shows considerably high accuracy, since the lexical characteristics of Korean such as concordance of endings or postpositions are well reflected in it. Two disambiguation methods, a unique selection method and a multiple selection method, are provided so that they can be properly according to the application areas.
PDF

Evaluation of Supply Alternatives of Water Shortage based on Multi-criteria Decision Analysis (다기준의사결정을 통한 물부족 해소방안 제시)

Choi, Si-Jung;Kim, Joong-Hoon;Lee, Dong-Ryul
- Proceedings of the Korea Water Resources Association Conference
- /
- 2008.05a
- /
- pp.1510-1514
- /
- 2008
많은 지역이 수자원 관리와 계획에 있어 많은 문제점을 가지고 있으며 우리나라의 경우 장래에 물 부족이 전망되고, 하천 수질과 생태환경의 개선은 국민이 바라는 만큼 기대 수준에 미치고 있지 못하고 있어 우리 삶의 질을 저해하고 있다. 따라서 수자원 계획이나 개발에 있어서 기존의 공급 차원만을 고려하기보다는 수질과 생태환경, 수요적 측면을 함께 고려하는 통합적인 접근 방법들이 시도되고 있다. 점점 증가하는 물수요 때문에 장래에 물 부족이 발생할 것으로 예상되며 이를 해소시킬 수 있는 대안들이 제시되어야 할 것으로 판단된다. 하지만 미래에 발생할 수 있는 다양한 상황들을 예측하고 분석하기는 쉽지 않으며, 물 부족을 해소시킬 수 있는 다양한 대안 중에 최적대안을 찾는 것 또한 쉬운 일이 아니다. 본 연구에서는 한국건설기술연구원과 SEI-US(Stockholm Environment Institute-US Center)가 공동으로 개발한 통합수자원평가계획모형인 K-WEAPq(Korea-Water Evaluation And Planning System Linked QUAL2K) 모형을 이용하여 미래에 발생할 수 있는 다양한 물 수급 전망을 분석하였으며, 물 부족을 해소시킬 수 있는 여러 대안에 따른 물 수급 변화를 분석하였다. 또한 수자원 계획 및 개발 분야에서 여러 상반된 기준들에 대해 최적의 대안들을 찾고 이를 결정하기 위해 다기준의사결정 분석(MCDA: Multicriteria Decision Analysis)을 이용하였다. 낙동강 권역에 대해 2011년 물 수급 전망을 분석한 후 물 부족이 예상되는 지역에 대한 물 부족 해소 정책으로 7가지 대안을 제시하였으며, 사회 경제 환경적 기준에 대해 각각의 대안을 분석하여 최적의 대안을 제시하였다.
PDF

A Disambiguation and Weighting Method using Mutual Information for Query Translation in Korean-to-English Cross-Language IR (한-영 교차언어 정보검색에서 상호정보를 이용한 질의 변환 모호성 해소 및 가중치 부여 방법)

Jang, Myung-Gil;Myaeng, Sung-Hyon;Park, Se-Young
- Annual Conference on Human and Language Technology
- /
- 1999.10e
- /
- pp.55-62
- /
- 1999
교차언어 문서검색에서는 단일언어 문서 상황을 만들기 위하여 질의나 문서를 다른 언어로 변환하게 되는데, 일반적으로 간단하면서도 실용적인 질의 변환의 방법을 주로 사용하고 있다. 하지만 단순한 대역 사전을 사용한 질의 변환의 경우에 변환 모호성 때문에 40% 이상의 검색 효과의 감소를 가져온다. 본 논문에서는 이러한 변환 모호성을 해결하기 위하여 대역 코퍼스로부터 추출한 상호 정보를 이용하는 단순하지만 효과적인 사전 기반 질의 변환 방법을 제안한다. 본 연구에서는 변환 모호성으로 발생한 다수의 후보들에서 가장 좋은 후보를 선택하는 모호성 해소 뿐 아니라 후보 단어들에 적절히 가중치를 부여하는 방법을 사용한다. 본 질의 변환 방법은 단순히 가장 큰 상호 정보의 단어를 선택하여 모호성 해소만을 적용하는 방법과 Krushall의 최소 스패닝 트리 구성과 유사한 방법으로 상호 정보가 큰 순서대로 간선들을 연결하여 모호성 해소와 가중치 부여를 적용하는 방법들과 질의 변환의 검색 효과를 비교한다. 본 질의 변환 방법은 TREC-6 교차언어 문서검색 환경의 실험에서 단일 언어 문서검색의 경우의 85%, 수작업 모호성 해소의 경우의 96%에 도달하는 성능을 얻었다.
PDF

Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word (어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상)

Park, Hee-Geun;Seo, Young-Hoon
- Annual Conference on Human and Language Technology
- /
- 2007.10a
- /
- pp.134-139
- /
- 2007
품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.
PDF

Word Sense Disambiguation using Korean Word Space Model (한국어 단어 공간 모델을 이용한 단어 의미 중의성 해소)

Park, Yong-Min;Lee, Jae-Sung
- The Journal of the Korea Contents Association
- /
- v.12 no.6
- /
- pp.41-47
- /
- 2012
Various Korean word sense disambiguation methods have been proposed using small scale of sense-tagged corpra and dictionary definitions to calculate entropy information, conditional probability, mutual information and etc. for each method. This paper proposes a method using Korean Word Space model which builds word vectors from a large scale of sense-tagged corpus and disambiguates word senses with the similarity calculation between the word vectors. Experiment with Sejong morph sense-tagged corpus showed 94% precision for 200 sentences(583 word types), which is much superior to the other known methods.
https://doi.org/10.5392/JKCA.2012.12.06.041 인용 PDF KSCI

Korean Entity Linking based on KorBERT and Popularity (KorBERT와 Popularity 정보에 기반한 한국어 개체연결 )

Jeong Heo;Kyung-Man Bae;Soo-Jong Lim
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.502-506
- /
- 2022
본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.
PDF

Analysis on an Algorithm of Sensitivity and Switching for Alleviating Overloads in Transmission Lines (송전선로 과부하 해소를 위한 민감도와 스위칭 알고리즘에 관한 연구)

Lee, Byung-Ha;Baek, Jung-Myoung
- Proceedings of the KIEE Conference
- /
- 2009.07a
- /
- pp.252_253
- /
- 2009
각 송전선로의 임피던스 변화에 대한 과부하 선로 조류의 민감도를 통하여 과부하 선로를 해소하기 위한 여유 송전선로의 투입과 운전 중인 선로의 차단을 한꺼번에 체계적으로 수행하는 민감도와 스위치 상태변경을 최소화하는 스위칭의 알고리즘이 제시된다. 이를 통해 수많은 케이스의 스위칭 경우의 수를 대폭적으로 줄임으로써 효율적으로 선로 스위칭을 수행하여 효과적인 과부하 해소 대책을 세우는 기법을 제시한다. 이 기법을 IEEE 39 모선 시스템에 적용하여 제시된 알고리즘의 효과를 보여준다.
PDF

Word Ambiguity Resolution for Concept-based Text Classification (개념 기반 문서 분류를 위한 단어 애매성 해소)

강원석;황도삼
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.167-169
- /
- 2000
문서 분류 시스템은 문서에 나타난 용어나 개념의 출현 정보를 이용한다. 개념 기반문서분류는 용어를 사용하지 않고 문서의 단어에 나타난 의미를 이용한다. 단어가 중의성을 가지는 경우 그 뜻을 정확히 가리지 않으면 문서에 출현하지 않은 의미를 이용하게 되므로 문서 분류 시스템의 성능이 저하된다. 본 논문은 개념 기반 문서분류를 위하여 단어 애매성 해소를 시도하였다. 문서에 출현된 의미 정보를 이용하여 의미들간의 공기정보를 구하고 이를 이용하여 단어의 애매성을 해소하였다. 단어의 의미정보는 시소러스 도구를 통해 획득하고 의미들간의 공기정보는 의미들간의 동시 출현 정보를 획득하여 구축하였다. 본 시스템은 문서 분류 등 자연어처리 분야에 이용할 수 있어 효용가치가 높다.
PDF

Korean Word Sense Disambiguation Using BERT (BERT를 이용한 한국어 단어 의미 모호성 해소)

Youn, Jun Young;Shin, Hyeong Jin;Park, Jeong Yeon;Lee, Jae Sung
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.485-487
- /
- 2019
단어의 의미 모호성을 해결하기 위한 연구는 오랫동안 지속되어 왔으며, 특히 최근에는 단어 벡터를 이용한 연구가 활발하게 이루어져왔다. 본 논문에서는 문맥 기반 단어 벡터인 BERT를 이용하여 한국어 단어 의미 모호성을 해소하기 위한 방법을 제안하고, 그 실험 결과를 기존의 한국어 단어 의미 모호성 연구 결과와 비교한다.
PDF

Search Result 4,491, Processing Time 0.035 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)