Search | Korea Science

Word Sense Disambiguation Using Knowledge Embedding (지식 임베딩 심층학습을 이용한 단어 의미 중의성 해소)

Oh, Dongsuk;Yang, Kisu;Kim, Kuekyeng;Whang, Taesun;Lim, Heuiseok
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.272-275
- /
- 2019
단어 중의성 해소 방법은 지식 정보를 활용하여 문제를 해결하는 지식 기반 방법과 각종 기계학습 모델을 이용하여 문제를 해결하는 지도학습 방법이 있다. 지도학습 방법은 높은 성능을 보이지만 대량의 정제된 학습 데이터가 필요하다. 반대로 지식 기반 방법은 대량의 정제된 학습데이터는 필요없지만 높은 성능을 기대할수 없다. 최근에는 이러한 문제를 보완하기 위해 지식내에 있는 정보와 정제된 학습데이터를 기계학습 모델에 학습하여 단어 중의성 해소 방법을 해결하고 있다. 가장 많이 활용하고 있는 지식 정보는 상위어(Hypernym)와 하위어(Hyponym), 동의어(Synonym)가 가지는 의미설명(Gloss)정보이다. 이 정보의 표상을 기존의 문장의 표상과 같이 활용하여 중의성 단어가 가지는 의미를 파악한다. 하지만 정확한 문장의 표상을 얻기 위해서는 단어의 표상을 잘 만들어줘야 하는데 기존의 방법론들은 모두 문장내의 문맥정보만을 파악하여 표현하였기 때문에 정확한 의미를 반영하는데 한계가 있었다. 본 논문에서는 의미정보와 문맥정보를 담은 단어의 표상정보를 만들기 위해 구문정보, 의미관계 그래프정보를 GCN(Graph Convolutional Network)를 활용하여 임베딩을 표현하였고, 기존의 모델에 반영하여 문맥정보만을 활용한 단어 표상보다 높은 성능을 보였다.
PDF

기계공학 교육과정 소고

이종원
- Journal of the KSME
- /
- v.28 no.2
- /
- pp.146-149
- /
- 1988
19세기의 기술시대 이후, 20세기 전반은 과학의 시대, 20세기 후반은 과학과 공학이 연합한 세 련된 기술의 창조시대였으며, 21세기는 정교한 공학과 과학의 지식이 요구되는 시대라고 한다. 이러한 논리는 현대공학이 기술주도와 과학주도 공학분야의 결합체로서, 공학적 수련(engineering practice)을 위해서는 과학이 원리에 기본을 둔 지시과 수련과 기술에 의하여 주도된 경험적 지 식을 모두 요구하고 있기 때문이다. 공학은 응용과학과는 다르며 과학적인 원리와 경험적 지 식을 사용하여 기술적인 해를 추구하는 방법임에도 불구하고 오늘날의 세계적인 공학교육의 추 세는 아직까지도 과학적 원리에 중점을 두어왔으며, 따라서 공학의 요체라 할 수 있는 수련과 기술에 의한 경험적 지식은 대학교육에서 도외시 되어온 반면, 많은 부분이 산업체에 축적, 존 재하게 되었다. 특히 현대의 고도기술 경쟁사회에 있어서 창의적 기술개발은 상대적 기술우위를 점하기 위해 필수적인 요소가 되고 있으며 '기술에는 과거가 있어도 기술자에게는 과거가 없고 오직 미래만이 있다'는 아이러니가 통용되고 있는 실정이다.
PDF

A Study on Lexical Knowledge Representation for Interlingua Machine Translation (중간언어 기계번역방식을 위한 어휘지식 표현체계에 관한 연구)

Li, Hui-Feng;Song, Seong-Dae;Lee, Jong-Hyeok;Lee, Geun-Bae
- Annual Conference on Human and Language Technology
- /
- 1995.10a
- /
- pp.105-111
- /
- 1995
본 논문에서는 중간언어 설계의 일부분으로, 중간의미 표현을 위한 어휘지식 표현 방안에 관하여 논한다. 기존 중간언어들은 단어의 의미 구별법이 단순한 선택적 제한을 기반으로 하고 있으며, 시소러스체계도 단일하게 유지하고 있다. 따라서, 단어의 의미간 중첩성이 반영되지 못하고 단어의 창조적 사용(creative use)에 대한 대처능력도 떨어진다. 또한 단일 시소러스체계를 통해서는 단어들의 명확한 분류기준을 파악할 수가 없다. 이러한 어휘지식 표현체계의 문제점들을 극복하기 위한 해결책으로서 생성사전(Generative Lexicon)을 도입하고, 중간표현의 관계기호를 효과적으로 파악하기 위한 관점에서의 시소러스 분류체계를 제안한다. 또한 이 같은 어휘지식 표현체계를 이용하여 문장의 구문구조로부터 중간표현을 나타내는 과정을 제시한다.
PDF

Collaborative Hangul Editor (한글 공동 편집기)

Kim, Sang-Wook;Cha, Kyung-Ae;Kim, Woo-Nyun
- Annual Conference on Human and Language Technology
- /
- 1997.10a
- /
- pp.454-460
- /
- 1997
여러 응용 분야에 따라 많은 공동작업 시스템이 있다. 이러한 시스템들은 각 응용 영역에 따라 요구되는 문제가 다르다. 이 논문에서는 공동작업객체의 개념을 제시한다. 이 개념은 어떠한 멀티미디어 공동작업 시스템에도 적용할 수 있는 시스템 소프트웨어의 구조적인 모델이다. 이 모델은 지식베이스에서 이벤트를 자동으로 공유하고 각 이벤트에 대한 동작을 비동기적 동기적으로 수행한다. 이 논문에서의 공동작업객체는 멀티미디어 객체의 집합인데, 개념 그래프와 지식 쉘로 표현된다. 이 공동작업객체에서 수행되는 한글 공동텍스트 편집기는 한글 편집 지식에 의하여 공동으로 편집할 수 있다. 또한 한글 공동텍스트 편집기는 공동작업을 위하여 공동작업 객체를 관리, 유지하는 기능을 제공한다. 앞으로는 일반적인 공동작업 객체의 이론적 모델을 연구한다.
PDF

Implementation of Question-Answering System using Wikipedia (위키백과를 이용한 질의응답 시스템의 구현)

Park, Young-Min;Seo, Jung-Yun
- Annual Conference on Human and Language Technology
- /
- 2012.10a
- /
- pp.206-208
- /
- 2012
본 논문에서는 위키백과를 이용한 지식DB구축의 예로서 연예인 관련 정보들을 자동으로 추출한다. 우리는 위키백과의 연예인 문서로부터 생년월일, 학력, 본명 등 총 9가지 정보들을 추출하고 이를 지식DB로 구축한다. 또한 추출된 지식 DB를 이용하여 질의응답 시스템을 구현하여 유용함을 입증하였다. 질의응답 시스템은 어휘의미패턴 방법으로 질의를 분석하고, 템플릿 기반의 문장생성 방법으로 정답을 자연어문장으로 생성한다. 성능 평가결과 총 6471명의 연예인 정보들을 추출하였고 95%에 해당하는 질의분석 성능을 제공하였다.
PDF

Automatic Thesaurus Construction using Inference Networks (추론망을 이용한 시소러스의 자동구축)

Park, Youn-Chan;Han, Young-Seok;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 1994.11a
- /
- pp.395-399
- /
- 1994
정보 검색의 효율은 정보검색 시스템에서 사용되는 지식의 질에 상당한 영향을 받는다. 이러한 지식 표현의 한 가지로 널리 사용되고 있는 것이 시소러스이다. 이러한 시소러스의 구축은 지식을 얼마만큼 잘 구성하는가에 있다. 따라서 시소러스의 자동 구축은 상당한 효용을 지니게 된다. 시소러스의 자동구축시에 대량의 말뭉치로부터 지식을 추출하는 방법론이 많이 연구되어 오고 있다. 그러나 이러한 방법은 단어의 통계적인 행태에 크게 의존하고 있기때문에 자료 회귀(data sparseness)의 문제가 큰 장에 요인이 되고 있다. 본 연구에서는 이러한 자료회귀문제를 해결하기 위해 추론망을 사용하고자 하는 모험을 제시하고자 한다.
PDF

Construction of Korean WordNet (한국어 워드넷의 구축)

Lim, Sung-Shin;Lee, Eun-Ryoung;Kwon, Hyuk-Chul
- Annual Conference on Human and Language Technology
- /
- 2004.10d
- /
- pp.106-111
- /
- 2004
사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.
PDF

Triplet Extraction using Korean Dependency Parsing Result (한국어 의존 파싱을 이용한 트리플 관계 추출)

Kwak, Sujeong;Kim, Bogyum;Lee, Jae Sung
- Annual Conference on Human and Language Technology
- /
- 2013.10a
- /
- pp.86-89
- /
- 2013
자연언어 문서에서 지식 추출은 QA 시스템을 비롯한 여러 분야에서 필수적이다. 트리플은 가장 일반적인 지식 추출 형식으로 문장 내부의 지식 정보를 주어, 서술어, 목적어의 관계로 표현한다. 본 논문에서는 한국어 의존 파서로 문장을 분석하고, 그 결과에서 트리플을 추출하는 방법을 제안했다. 제안된 트리플 추출기는 21개 문장에서 추출된 78개의 트리플 정답 집합과, 64개의 준정답 집합에 대해서 각각 60.75%와 66.67%의 F-measure 성능을 보였다.
PDF

Y-HisOnto: A History Ontology Model for Q&A System (Y-HisOnto: Q&A 시스템에서의 활용을 위한 역사 온톨로지 모형)

Lee, In Keun;Jung, Jason J.;Hwang, Dosam
- Annual Conference on Human and Language Technology
- /
- 2013.10a
- /
- pp.156-159
- /
- 2013
본 논문에서는 시간 개념이 포함된 역사적 지식을 표현할 수 있는 사건 온톨로지(event ontology) 기반의 역사 온톨로지 모형인 Y-HisOnto 를 제안한다. 제안한 역사 온톨로지 모형은 기존의 온톨로지에서 사용되는 이진 관계(binary-relationship)로 표현된 단편적 지식들을 조합하여 다진 관계(n-ary relationship)를 이용하여 역사적 사건 관련 지식을 표현한다. 제안한 온톨로지 모형에 기반하여 사건 중심의 지식을 온톨로지로 구축하고, 사건 관련 질의에 대해 온톨로지 논리 검색 실험을 수행함으로써 제안한 온톨로지 모형이 Q&A 시스템에서 효과적으로 활용될 수 있음을 확인한다.
PDF

Automatic Dictionary Construction of Indonesian Field-Associated Terms by Using Korean Associated Knowledge (한국어의 분야 연상 지식의 추출 방법에 관한 연구)

Lee, Sang-Gon
- Annual Conference on Human and Language Technology
- /
- 2016.10a
- /
- pp.205-210
- /
- 2016
인간은 문서전체를 읽지 않고 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체는 물론 부분 텍스트(단락)에 출현하는 소수의 단어 정보에서 문서의 분야를 정확히 결정하기 위한 분야연상어의 구축은 중요한 연구과제이다. 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집 문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준을 정하였다. 인도네시아어의 분야연상어 사전을 자동으로 구축하기 위해 먼저 한국어로 구축한 분야 연상 지식을 추출하는 방법을 제안한다.
PDF

Search Result 1,320, Processing Time 0.03 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)