통합 검색 | Korea Science

말뭉치와 개념정보를 이용한 명사 중의성 해소 방법 (Noun Sense Disambiguation Based-on Corpus and Conceptual Information)

이휘봉;허남원;문경희;이종혁
- 인지과학
- /
- 제10권2호
- /
- pp.1-10
- /
- 1999
본 노문에서는 말뭉치와 개념정보에 기반한 명사 중의성 해소 방법을 제안하다. 지곤의 연구에서는 대부분 어휘의 공기 정보을 이용하고있으나, 이러한 방법은 많은 저장공간이 필요하고, 적용률이 크지 않다는 단점이 있다. 본 논무에서는 자동으로 의미 태깅된 한국어 말뭉치에서 추출된 공기 개념정보를 이용하여 명사 중의성을 해소하는 방법을 제안한다. 제안한 방법의 평가 실험에서 기본의미를 정하는 것보다 1.6% 높은 평균 82.4%의 정확률을 보였다. 실험 문장들이 학습문장과 다른 것을 고려하면, 제안된 방법이 어휘 중의성 해소에 유용함을 보여주는 결과라고 할 수 있다.
PDF

통계정보에 기반을 둔 한국어 어휘중의성해소 (Korean Lexical Disambiguation Based on Statistical Information)

박하규;김영택
- 한국통신학회논문지
- /
- 제19권2호
- /
- pp.265-275
- /
- 1994
어휘중의성 해소는 음성 인식/생성, 정보 검색, 발뭉치 태킹 등 자연언어 처리에서 가장 기초가 되는 분야 중의 하나이다. 본 논문은 말뭉치로부터 추출된 통계정보를 이용하는 한국어 어휘중의성해소 기법에 대해 기술한다. 이 기법에서는 좀더 정밀한 중의성해소를 위해 품사태그 대신 형태소분석 결과에 해당하는 토큰태그를 사용하고 있다. 본 논문에서 제안한 어휘선택함수는 어미나 조사의 호응 관계등 한국어의 어휘적 특성을 잘 반영하기 때문에 상당히 높은 정확성을 보여준다. 그리고 활용분야에 적합하게 사용될 수 있도록 유일선택 방식과 다중선택 방식이라는 두가지 중의성해소 방식을 지원하고 있다.
PDF

다기준의사결정을 통한 물부족 해소방안 제시 (Evaluation of Supply Alternatives of Water Shortage based on Multi-criteria Decision Analysis)

최시중;김중훈;이동률
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2008년도 학술발표회 논문집
- /
- pp.1510-1514
- /
- 2008
많은 지역이 수자원 관리와 계획에 있어 많은 문제점을 가지고 있으며 우리나라의 경우 장래에 물 부족이 전망되고, 하천 수질과 생태환경의 개선은 국민이 바라는 만큼 기대 수준에 미치고 있지 못하고 있어 우리 삶의 질을 저해하고 있다. 따라서 수자원 계획이나 개발에 있어서 기존의 공급 차원만을 고려하기보다는 수질과 생태환경, 수요적 측면을 함께 고려하는 통합적인 접근 방법들이 시도되고 있다. 점점 증가하는 물수요 때문에 장래에 물 부족이 발생할 것으로 예상되며 이를 해소시킬 수 있는 대안들이 제시되어야 할 것으로 판단된다. 하지만 미래에 발생할 수 있는 다양한 상황들을 예측하고 분석하기는 쉽지 않으며, 물 부족을 해소시킬 수 있는 다양한 대안 중에 최적대안을 찾는 것 또한 쉬운 일이 아니다. 본 연구에서는 한국건설기술연구원과 SEI-US(Stockholm Environment Institute-US Center)가 공동으로 개발한 통합수자원평가계획모형인 K-WEAPq(Korea-Water Evaluation And Planning System Linked QUAL2K) 모형을 이용하여 미래에 발생할 수 있는 다양한 물 수급 전망을 분석하였으며, 물 부족을 해소시킬 수 있는 여러 대안에 따른 물 수급 변화를 분석하였다. 또한 수자원 계획 및 개발 분야에서 여러 상반된 기준들에 대해 최적의 대안들을 찾고 이를 결정하기 위해 다기준의사결정 분석(MCDA: Multicriteria Decision Analysis)을 이용하였다. 낙동강 권역에 대해 2011년 물 수급 전망을 분석한 후 물 부족이 예상되는 지역에 대한 물 부족 해소 정책으로 7가지 대안을 제시하였으며, 사회 경제 환경적 기준에 대해 각각의 대안을 분석하여 최적의 대안을 제시하였다.
PDF

한-영 교차언어 정보검색에서 상호정보를 이용한 질의 변환 모호성 해소 및 가중치 부여 방법 (A Disambiguation and Weighting Method using Mutual Information for Query Translation in Korean-to-English Cross-Language IR)

장명길;맹성현;박세영
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
- /
- pp.55-62
- /
- 1999
교차언어 문서검색에서는 단일언어 문서 상황을 만들기 위하여 질의나 문서를 다른 언어로 변환하게 되는데, 일반적으로 간단하면서도 실용적인 질의 변환의 방법을 주로 사용하고 있다. 하지만 단순한 대역 사전을 사용한 질의 변환의 경우에 변환 모호성 때문에 40% 이상의 검색 효과의 감소를 가져온다. 본 논문에서는 이러한 변환 모호성을 해결하기 위하여 대역 코퍼스로부터 추출한 상호 정보를 이용하는 단순하지만 효과적인 사전 기반 질의 변환 방법을 제안한다. 본 연구에서는 변환 모호성으로 발생한 다수의 후보들에서 가장 좋은 후보를 선택하는 모호성 해소 뿐 아니라 후보 단어들에 적절히 가중치를 부여하는 방법을 사용한다. 본 질의 변환 방법은 단순히 가장 큰 상호 정보의 단어를 선택하여 모호성 해소만을 적용하는 방법과 Krushall의 최소 스패닝 트리 구성과 유사한 방법으로 상호 정보가 큰 순서대로 간선들을 연결하여 모호성 해소와 가중치 부여를 적용하는 방법들과 질의 변환의 검색 효과를 비교한다. 본 질의 변환 방법은 TREC-6 교차언어 문서검색 환경의 실험에서 단일 언어 문서검색의 경우의 85%, 수작업 모호성 해소의 경우의 96%에 도달하는 성능을 얻었다.
PDF

어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상 (Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word)

박희근;서영훈
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
- /
- pp.134-139
- /
- 2007
품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.
PDF

한국어 단어 공간 모델을 이용한 단어 의미 중의성 해소 (Word Sense Disambiguation using Korean Word Space Model)

박용민;이재성
- 한국콘텐츠학회논문지
- /
- 제12권6호
- /
- pp.41-47
- /
- 2012
한국어 단어의 의미 중의성 해소 방법들은 주로 소규모의 의미 태그 부착 말뭉치나 사전 정보 등을 이용하여 엔트로피 정보, 조건부 확률, 상호정보 등을 각각 계산하고 이를 중의성 해소에 이용하는 방법 등으로 다양하게 제안되었다. 본 논문에서는 대규모로 구축된 의미 태그 부착 말뭉치를 이용하여 한국어 단어 벡터를 추출하고 이 벡터들 사이의 유사도를 계산하여 단어 의미 중의성을 해소하는 단어 공간 모델 방법을 제안한다. 세종 형태의미분석 말뭉치를 사용하여 학습하고 임의의 200문장(583 단어 종류)에 대해 평가한 결과, 정확도가 94%로 기존의 방법에 비해 매우 우수했다.
https://doi.org/10.5392/JKCA.2012.12.06.041 인용 PDF KSCI

KorBERT와 Popularity 정보에 기반한 한국어 개체연결 (Korean Entity Linking based on KorBERT and Popularity )

허정;배경만;임수종
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
- /
- pp.502-506
- /
- 2022
본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.
PDF

송전선로 과부하 해소를 위한 민감도와 스위칭 알고리즘에 관한 연구 (Analysis on an Algorithm of Sensitivity and Switching for Alleviating Overloads in Transmission Lines)

이병하;백정명
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2009년도 제40회 하계학술대회
- /
- pp.252_253
- /
- 2009
각 송전선로의 임피던스 변화에 대한 과부하 선로 조류의 민감도를 통하여 과부하 선로를 해소하기 위한 여유 송전선로의 투입과 운전 중인 선로의 차단을 한꺼번에 체계적으로 수행하는 민감도와 스위치 상태변경을 최소화하는 스위칭의 알고리즘이 제시된다. 이를 통해 수많은 케이스의 스위칭 경우의 수를 대폭적으로 줄임으로써 효율적으로 선로 스위칭을 수행하여 효과적인 과부하 해소 대책을 세우는 기법을 제시한다. 이 기법을 IEEE 39 모선 시스템에 적용하여 제시된 알고리즘의 효과를 보여준다.
PDF

개념 기반 문서 분류를 위한 단어 애매성 해소 (Word Ambiguity Resolution for Concept-based Text Classification)

강원석;황도삼
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
- /
- pp.167-169
- /
- 2000
문서 분류 시스템은 문서에 나타난 용어나 개념의 출현 정보를 이용한다. 개념 기반문서분류는 용어를 사용하지 않고 문서의 단어에 나타난 의미를 이용한다. 단어가 중의성을 가지는 경우 그 뜻을 정확히 가리지 않으면 문서에 출현하지 않은 의미를 이용하게 되므로 문서 분류 시스템의 성능이 저하된다. 본 논문은 개념 기반 문서분류를 위하여 단어 애매성 해소를 시도하였다. 문서에 출현된 의미 정보를 이용하여 의미들간의 공기정보를 구하고 이를 이용하여 단어의 애매성을 해소하였다. 단어의 의미정보는 시소러스 도구를 통해 획득하고 의미들간의 공기정보는 의미들간의 동시 출현 정보를 획득하여 구축하였다. 본 시스템은 문서 분류 등 자연어처리 분야에 이용할 수 있어 효용가치가 높다.
PDF

BERT를 이용한 한국어 단어 의미 모호성 해소 (Korean Word Sense Disambiguation Using BERT)

윤준영;신형진;박정연;이재성
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
- /
- pp.485-487
- /
- 2019
단어의 의미 모호성을 해결하기 위한 연구는 오랫동안 지속되어 왔으며, 특히 최근에는 단어 벡터를 이용한 연구가 활발하게 이루어져왔다. 본 논문에서는 문맥 기반 단어 벡터인 BERT를 이용하여 한국어 단어 의미 모호성을 해소하기 위한 방법을 제안하고, 그 실험 결과를 기존의 한국어 단어 의미 모호성 연구 결과와 비교한다.
PDF

검색결과 4,491건 처리시간 0.034초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)