Search | Korea Science

A Study on Resolving Word Sense Ambiguity Using Mutual Information (상호 정보를 이용한 어의 모호성 해소에 관한 연구)

Jeon, Mee-Sun;Park, Se-Young
- Annual Conference on Human and Language Technology
- /
- 1994.11a
- /
- pp.369-373
- /
- 1994
정보 검색 시스템의 정확성은 색인어의 정확성과 질의 해석의 정확성에 의존한다. 한국어 정보 검색분야에서는 한국어의 특성을 고려하는 것이 무엇보다 중요하다. 한국어의 문서 색인과 질의 해석시 야기되는 어의 모호성(word sense ambiguity)을 가지는 단어에 대해서는 어의 모호성을 해소한 정확한 색인과 질의 해석이 전제되어야 정확한 문서를 검색해낼 수 있다. 본 논문은 한국어 문서 색인시 동음이의어(homonym)에 의해 발생하는 어의 모호성을 해소하기 위한 방안에 대해 다루고 있으며 의미적 관련 정보를 이용할 것을 제안하고 타당성을 보이는 실험 결과를 제시한다.
PDF

A Naive Bayes Classifier for Category Disambiguation of Features (자질의 범주 모호성 해소를 위한 Naive Bayes 분류기 설계)

유현숙;정영미
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.04b
- /
- pp.364-366
- /
- 2001
문서 범주화는 전자 정보환경에서 매우 유용한 정보처리 도구로서, 다양한 문서 범주화 기법 및 성능향상을 위한 연구들이 지속적으로 이루어지고 있다. 그러나, 대부분의 연구들은 문서 범주화의 대상이 되는 단어 자질 공간의 차원축소 문제에만 집중되었을 뿐, 학습단계에 큰 영향을 미치는 다범주 단어 자질의 범주 모호성은 고려하지 않았다. 본 연구에서는, 다범주 자질의 범주 모호성을 해소함으로써 문서 범주화의 성능향상을 유도하는 범주 모호성 해소 가중치 W를 제시하고 이를 실험을 통해 증명하였다. 실험에서는 Naive Bayes 분류기와 가중치 W를 적용한 Naive Bayes-W 분류기를 직접 구축하여 문서 범주화의 성능향상 여부를 비교하는데 사용하였다. 도출된 실험결과를 통해, 가중치 W는 현재의 분류기가 가지고 있는 자질 표현의 범주 모호성이라는 단점을 보완하고 분류기의 성능향상을 유도함으로써 정보검색시스템의 검색효율을 높이는 데 활용될 수 있음일 증명되었다.
PDF

Word Sense Disambiguation From Unlabelled Data (의미 부착이 없는 데이터로부터의 학습을 통한 의미 중의성 해소)

박성배;장병탁;김영택
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.04b
- /
- pp.330-332
- /
- 2000
의미 모호성 해소는 문맥상의 한 단어의 올바른 의미를 밝히는 것으로, 대부분의 자연언어처리 응용에서 가장 중요한 문제 중 하나이다. 말뭉치로부터 얻어진 예제로부터 의미 모호성 해소 방법을 학습하기 위해서는 답이 알려져 있는 대량의 학습 예제가 필요하지만, 답이 알려져 있는 예제를 구하는 일은 사람의 간섭을 필요로 하므로 매우 비싼 작업이다. 본 논문에서는 답이 알려져 있는 학습 예제로 어느 정도 학습한 수, 답이 알려져 있지 않은 예제로 학습을 보충하는 방법을 통해 사람의 간섭을 최소화하였다. 결정트리 학습을 통한 한국어 명사에 대한 의미 결정 실험 결과, 본 논문에서 제안한 방법은 가장 많은 분포를 보이는 의미를 선택하는 경우보다 평균적으로 33.6%의 성능 향상을 보이며, 이는 전체 학습 예제의 답이 모두 알려져 있는 경우와 거의 비슷한 결과이다. 따라서, 한국어와 같이 신뢰할 만한 의미 부착 말뭉치가 없는 경우에 본 논문에서 제시된 방법은 매우 효율적이다.
PDF

Automated Pronoun Resolution Using CRF (CRF를 이용한 대명사 참조해소 시스템)

Kim, Hyung-Chul;Seo, Hyung-Won;Kim, Jae-Hoon;Choi, Yun-Soo
- Annual Conference on Human and Language Technology
- /
- 2009.10a
- /
- pp.197-201
- /
- 2009
이 논문은 영어 문장에서 대명사의 참조해소 시스템을 구현한다. 대명사는 문장에서 반복되는 말 대신에 사용하는 단어이다. 반복되는 말을 선행어라고 하며 대명사는 선행어보다 간결한 형식으로 사용된다. 정보검색이나 정보추출에서 대명사를 그대로 색인하여 검색하면 정확한 정보를 추출할 수 없다. 따라서 대용어가 가리키는 개체를 정확히 파악해서 이 정보를 색인하고 검색하면 정보검색, 정보추출, 질의응답의 성능을 크게 개선할 수 있다. 이 논문에서는 CRF모델을 이용해서 이용하여 영어 문서에서 대명사 참조해결 방법을 제안하고 이를 구현한다.
PDF

Automatic WordNet mapping using word sense disambiguation (의미 애매성 해소를 이용한 WordNet 자동 매핑)

Lee, Chang-Ki;Lee, Geun-Bae
- Annual Conference on Human and Language Technology
- /
- 2000.10d
- /
- pp.262-268
- /
- 2000
본 논문에서는 어휘 의미 애매성 해소와 영어 대역어 사전 그리고 외국언어에 존재하는 개념체계를 이용하여 한국어 개념체계를 자동으로 구축하는 방법을 기술한다. 본 논문에서 사용하는 방법은 기존의 개념체계 구축 방법들에 비해 적은 노력과 시간을 필요로 한다. 또한 상기한 자동 구축 방법에서 사용하는 어휘 의미 애매성 해소를 위한 6가지 feature도 함께 설명한다.
PDF

Comparative Analysis of Drought Characteristics Considering Various Drought Definitions (다양한 가뭄정의에 따른 가뭄 특성 비교분석)

Yoo, Ji-Young;Park, Jong-Yong;Kim, Tae-Woong
- Proceedings of the Korea Water Resources Association Conference
- /
- 2010.05a
- /
- pp.367-371
- /
- 2010
가뭄 발생원인은 기후학적인 인자(온도, 바람, 상대습도 등)들과 밀접한 관계를 갖고 있으나, 가장 큰 원인은 강수부족이라고 말할 수 있다. 따라서 가뭄은 정상수준 이하의 강수 상황이 연속적으로 발생하여 나타나며, 설정된 절단수준에 대해 가뭄의 지속기간, 심도, 발생간격 등을 정의한 후 이에 대한 시계열 분석을 수행하여 가뭄의 특성을 분석한다. 본 연구에서는 가뭄 절단수준의 변화에 따른 한반도 내 가뭄의 특성분석을 위하여 하나의 절단수준으로 고정된 경우의 가뭄특성과 각 년도 월별 특성을 고려하여 절단수준이 지속적으로 변화하는 경우로 구분하여, 가뭄특성의 변화를 분석하였다. 또한 위 두 가지 경우에 대해 각각 가뭄해소 여부를 판단하여 총 4가지 경우에 따른 가뭄 특성을 분석하였다. 가뭄 절단수준의 변화 및 가뭄 해소여부에 따른 한반도 내 가뭄 특성을 분석하기 위해, 가뭄의 지속기간, 심도의 기초통계량 등을 산정하여 비교 분석하였다. 본 연구는 한반도 내의 가뭄특성을 보다 정확하게 해석하기 위해서는 다양한 가뭄정의에 따라 가뭄 해석결과가 나타내는 상대적 차이를 비교할 필요성이 있음을 증명하였다.
PDF

A study on the prediction method and system for human resource demand by technology fields (기술분야별 인력수요 예측 방법 및 시스템에 대한 연구)

Park, sang wook;Kim, sang heon;Ham, eun sik;Lee, min kyoung
- Proceedings of the Korea Contents Association Conference
- /
- 2018.05a
- /
- pp.91-92
- /
- 2018
사업체, 연구소 등이 적극적인 구인에도 불구하고 인력수요를 충원하지 못하면 정상적인 운영이 어렵게 되는바, 부족한 인력규모를 조사하여 해소할 수 있도록 국가적인 정책지원이 필요하다. 그런데 인력수요를 해소하기 위하여 기존의 유휴 인력만으로는 충원이 어려워 인력양성을 해야 하는 경우에는 시간과 비용이 필요하므로 현재의 부족한 인력규모를 해소하지 못한다는 문제점이 있다. 본 논문은 기술분야별 인력양성을 위한 인력수요 예측 방법 및 시스템에 관한 것으로 인력 수요를 충족하기 위한 인력 양성에 시간과 비용이 필요하므로 인력 수요를 예측하여 미리 양성할 수 있도록 하기 위한 방법을 제안하였다.
PDF

Derived Nouns of Suffixes Disambiguation using User-Word Intelligent Network (UWIN을 이용한 접미파생명사 중의성 해소)

Bae, Young-Jun;Ock, Cheol-Young
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.04a
- /
- pp.432-435
- /
- 2012
지식정보화 사회로의 진입으로 언어처리의 필요성은 점차 확대되고 있으나, 현재의 언어처리 기술은 의미분석에 기반하지 않음으로써 많은 한계를 가지고 있다. 본 논문에서는 의미분석의 일환으로 접미사의 중의성 해소를 위해 한국어 사용자 어휘지능망(U-WIN)을 이용한 접미파생명사 분석 방법을 제시한다. 세종 말뭉치에서 중의성 접미사를 포함한 32,647개의 문장을 대상으로 접미사 앞의 어근을 추출하여 U-WIN과 매핑되는 노드에 가중치를 부여한 뒤 이를 접미사 중의성 해소에 사용한다. 동형이의 접미사 49종 중 세종말뭉치에 나타난 25개의 동형이의접미사만을 대상으로 실험한 결과 91.83%의 정확률을 보였다.
https://doi.org/10.3745/PKIPS.y2012m04a.432 인용 PDF

A Study on the Computer Use Policy for the Digital Divide of Marriage Immigrants (결혼이민자들의 정보격차 해소를 위한 컴퓨터 활용 정책방안 연구)

Bang, Sung A
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2019.01a
- /
- pp.181-184
- /
- 2019
본 연구는 결혼이민자들의 성공적인 정착을 위해서는 그 수단 중의 하나로서 정보격차 수준의 완화를 통하여 정보불평등에 따른 사회불평등을 해소시켜 주기 위한 정보화교육 활성화의 정책적 시사점을 제시하고자 하였다. 결혼이민자의 정보격차해소를 위한 정책적 시사점은 첫째, 결혼이민자를 위한 공공기관과 그들이 자주 이용하는 기관의 정보화 교육프로그램의 다양화에 따른 정보 접근권의 확대, 둘째, 인터넷을 통한 사회참여 활동 기회제공을 위한 시스템 구축마련, 셋째, 디지털기기를 이용한 이체, 송금, 계좌조회, 공인인증서, 세금납부, 각종 민원서류발급, 공과금, 고지서 확인, 각종 복지 및 보조금 신청, 공공서비스 관련 정보검색 등의 업무 능력 향상을 위한 '찾아가는 맞춤형 서비스 프로그램' 확대, 넷째, 인터넷 비이용자들을 위한 교재개발과 체계적인 커리큘럼 개발을 위한 교육기관 지원정책 확대, 다섯째, 결혼이민자를 위한 컴퓨터 자격증반의 운영을 활성화를 통한 취업 및 창업의 기반을 지원해주어야 함을 제시하였다.
PDF

Improving Clustered Sense Labels for Word Sense Disambiguation (단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상)

Jeongyeon Park;Hyeong Jin Shin;Jae Sung Lee
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.268-271
- /
- 2022
단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.
PDF

Search Result 4,491, Processing Time 0.033 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)