• Title/Summary/Keyword: 다의어

Search Result 61, Processing Time 0.029 seconds

어의의 기술 -중간언어의 관점에서

  • 장석진
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2001.06a
    • /
    • pp.113-139
    • /
    • 2001
  • 중간언어 (interlingua, IL) 구축을 지향하는 시각에서 단어의 다의성 (polysemy) 문제를 각종 워드넷의 기술 방식과 용례를 대비하여 논의하고, 센스(어의) 번호를 부착한 세계 워드넷 (Would Wordnet) 데이터베이스를 구상하고, 이 연장 선상에서 (Pustejvsky 식) 생성 어휘 부와 TMR(텍스트의미표상)이론을 가미한 제약기반 통합문법(CUG)으로 IL구축에 다리를 놓고, 이로부터 개별언어 기술로 변환한다.

  • PDF

A Study on the Entry Description Format of Glossaries (전문용어사전 표제어 기술형식에 대한 연구)

  • 강정미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.39-42
    • /
    • 1999
  • 우리나라에서 학문분야별로 출판된 전문용어사전의 표제어 기술형식은 매우 상이하다. 이러한 특징은 여러 분야의 전문용어사전을 참조해야 하는 이용자에게 많은 불편을 초래할 뿐만 아니라 표준화된 전자사전에 대한 요구를 충족시키지도 어렵다. 본 연구에서는 전자사전 표준화의 일환인 전문용어사전의 표제어 기술형식 표준화를 위한 기초작업의 일부로서 현재까지 우리나라기서 출판된 전문 용어사전을 대상으로 표제어의 기술형식에 대하여 기술요소, 기술요소의 순서, 띄어쓰기, 다의성을 갖는 용어의 구분, 배열 등에 대하여 조사 분석하였다.

  • PDF

인용문헌을 이용한 검색 성능 향상에 관한 실험적 연구

  • 국민상;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.235-240
    • /
    • 2002
  • 정보검색시 전문(full-text)의 사용이 늘어남에 따라 다의어나 철자오류와 같은 문제점으로 인해 내부적인 정보원의 사용에 한계를 보이면서 외부적인 정보원, 즉 문헌간의 관계와 같은 링크 또는 인용정보에 대한 관심이 높아지게 되었다. 본 논문에서는 인용링크나 피인용링크, 서지결합링크, 동시인용링크 둥과 같은 인용정보와 적합성 피드백 검색을 이용하여 검색 성능을 향상시키는 방안에 대하여 연구하였다.

  • PDF

The Korean Dictionary and the Buddhist Language: Description of Popularity of Buddhism Terminologies (국어사전과 불교 언어: '불교' 영역의 전문용어 기술을 중심으로)

  • Kim, Han-saem
    • Cross-Cultural Studies
    • /
    • v.45
    • /
    • pp.195-218
    • /
    • 2016
  • This paper focuses on the terminology of the dictionary as an encyclopedic element in the Buddhist language. The previous study on Buddhist language can be divided into a philosophical approach to the language itself, a review of the linguistic perspective of a specific monk, and a linguistic examination of the Buddhist language. The linguistic examination of the Buddhist language is further divided into analysis of certain Buddhist scriptures, and a study of vocabulary used throughout the Buddhist sphere. The Buddhist vocabulary in the existing Korean dictionary is found in specialized areas such as name, place name, history, and Buddhism. By advancing the generalized words of the terminologies, the meanings of the terminologies and the general words are described as polysemy. It is possible to identify the degree of transition from terminology to general word depending on the distribution of senses. In the case of Buddhist vocabulary, the usage as a general language and as a Buddhist term was given priority, and vocabulary was also derived from a Buddhist term, although it was described as a general language. If a dictionary is changed according to the language unit it contains, the difference in a Buddhist terminology for each dictionary, and a conflict between the existing academic research result and the prior description, will need to be resolved through the collaboration of religious experts, linguists, and lexicographers.

Korean-to-English Query Translation based on Multilingual Ontology in Cross-Language Text Retrieval (교차언어 문서검색에서 다국어 온톨로지에 기반한 한영 질의어 변환)

  • Chun, Jung-Hoon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.43-49
    • /
    • 1999
  • 본 논문에서는 교차언어 문서검색(CLTR: Cross-Language Text Retrieval)에서의 한-영 질의어 변환을 다룬다. 질의어 변환시 영어 대역어 획득과정에서는 다음 두 가지를 고려한다. 첫째, 한국어 질의어를 구성하는 단어가 한가지 개념을 기호화하지만 이에 대응되는 영어 대역어들이 하나 이상인 경우이다. 둘째, 질의어 구성 단어가 둘 이상의 개념들을 기호화하는 다의성을 지닌 경우이다. 전자의 경우는 영어 대역어들이 모두 동일한 개념, 또는 유사한 개념을 나타내므로 그대로 검색에 이용한다 해도 검색 성능을 크게 좌우하지 않지만, 후자의 경우는 모든 개념을 다 검색에 이용하게 되면 정확률(precision)이 크게 떨어지게 된다. 이에 본 연구에서는 개념 선택단계와 선택된 개념의 영어 대역어들에 가중치를 주는 가중치 부가단계로 나누어 질의어 변환을 수행한다. 본 논문의 질의어 변환에서 영어 대역어는 대역사전 대신 다국어 온톨로지인 KAIST 분류어휘표와 한영 음차복원 모듈을 통해 얻어진다.

  • PDF

Using Semantic Annotation and Ontology Content- Based Image Retrieve (시맨틱 주석과 도메인 온톨로지를 이용한 내용 기반 이미지 검색)

  • Kim, Su-Gyeong;An, Gi-Hong
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.11a
    • /
    • pp.331-337
    • /
    • 2005
  • 현재 인터넷과 멀티미디어 데이터배이스 상에서 부딪치는 검색 문제의 해결 방안으로서 명시적 배경지식의 사용을 지향하는 시맨틱 웹과 새로운 표준 기술 등은 이미지 데이터에 대한 배경 지식을 규정하는 구문론 등을 지원한다. 따라서 본 연구에서는 이미지의 주제(양)에 대한 배경지식을 표현한 도메인 온톨로지를 이용하여 사용자에게 검색어의 정확한 선택이 이루어지도록 제공하고 이미지의 내용과 기술 특정에 대한 시맨틱 주석을 이용하여 검색 용어의 일반화와 다의어, 이미지 대상물의 행위와 같은 고수준의 메타데이터 스키마를 제공함으로써 이미지의 검색에 있어 내용에 기반한 시맨틱 주석과 도메인 온톨로지의 구현과 검색 방법을 제안하고자 한다.

  • PDF

Latent Semantic Indexing Using Semantic Diffusion (의미 확산을 이용한 잠재 의미 색인 방법)

  • Kim, Jin-Hwa;Kim, Yong-Hyuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.16-21
    • /
    • 2010
  • 잠재 의미를 색인하는 것은 문서 색인에 있어서 그 색인 품질에 주요한 요인을 차지한다. 본 논문에서 살펴보는 의미 확산 방법은 문서 집합에 나타나는 단어들의 의미적 연관성을 바탕으로 활성화 작용 모델(spreading activation model)을 구축하고 색인 대상 문서의 단어 분포를 출발점으로 삼아, 그 모델 안에서 의미적으로 수렴할 수 있도록 랜덤 워크 방법(random walk method)1)을 수정한 변형 방법을 이용해 확률을 확산시킨다. 이 방법은 단어 사이의 연관성을 따라 탐색하며 동의어와 다의어 등 단순 단어 일치로는 알 수 없는 의미적 유사 단어들이 의미 있는 확률 분포를 갖게 한다. 이는 단어들의 의미 분포를 가중치 그래프를 통해 보다 합리적으로 다루게 된다. 실험에서는 문서 분류를 시행하여 평균 정확도 및 정확도-재현율 곡선을 산출하였고, 비교 실험을 통해서 전반적인 우수성을 관찰할 수 있었다.

  • PDF

A Semantic Hierarchy of Korean Nouns using the Definitions of Words in a Dictionary (사전 뜻 풀이말에서 구축한 한국어 명사 의미 계층구조)

  • 조평옥;안미정;옥철영;이수동
    • Korean Journal of Cognitive Science
    • /
    • v.10 no.4
    • /
    • pp.1-10
    • /
    • 1999
  • A Semantic Hierarchy of Korean Nouns(SHKN) where Korean nouns are semantically and hierarchically classified is one of the most important things that can provide semantic information concerned with processing the Korean sentences. In this paper. SHKN is constructed in bottom-up method by making use of the definition of a noun in the Korean dictionary. SHKN constructed in this paper is a forest which consist of 43 trees and 2.443 non-terminal nodes and 10.347 terminal nodes. depth of which is 17. The classes of level 1. 2 of SHKN is quite different from the existing structure classified in top-down method. 2 b but the lower classes than level 2 is very objective.

  • PDF

A Semantic Hierarchy of Korean Nouns using the Definitions of Words in a Dictionary (사전 뜻 풀이말에서 구축한 한국어 명사 의미 계층구조)

  • 조평옥;안미정;옥철영;이수동
    • Korean Journal of Cognitive Science
    • /
    • v.10 no.3
    • /
    • pp.1.1-10
    • /
    • 1999
  • A Semantic Hierarchy of Korean Nouns(SHKN) where Korean nouns are semantically and hierarchically classified is one of the most important things that can provide semantic information concerned with processing the Korean sentences. In this paper. SHKN is constructed in bottom-up method by making use of the definition of a noun in the Korean dictionary. SHKN constructed in this paper is a forest which consist of 43 trees and 2.443 non-terminal nodes and 10.347 terminal nodes. depth of which is 17. The classes of level 1. 2 of SHKN is quite different from the existing structure classified in top-down method. 2 b but the lower classes than level 2 is very objective.

A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules (확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기)

  • Lee, Su-Gwang;Ok, Cheol-Yeong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.5
    • /
    • pp.48-460
    • /
    • 2001
  • 국어사전의 뜻풀이말은 표제어의 의미를 기술할 뿐만 아니라, 상위/하위개념, 부분-전체개념, 다의어, 동형이의어, 동의어, 반의어, 의미속성 등의 많은 의미정보를 내재하고 있다. 본 연구는 뜻풀이말에서 다양한 의미정보를 획득을 위한 기본적인 도구로서 국어사전의 뜻풀이말 구문분석기를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어사전의 뜻풀이말을 대상으로 일정한 수준의 품사 및 구문 부착 말 뭉치를 구축하고, 이 말뭉치들로부터 품사 태그 중의성 어절의 빈도 정보와 통계적 방법에 기반한 문법규칙과 확률정보를 자동으로 추출한다. 본 연구의 뜻풀이말 구문분석기는 이를 이용한 확률적 차트파서이다. 품사 태그 중의성 어절의 빈도 정보와 문법규칙 및 확률정보는 파싱 과정의 명사구 중의성을 해소한다. 또한, 파싱 과정에서 생성되는 노드의 수를 줄이고 수행 속도를 높이기 위한 방법으로 문법 Factoring, Best-First 탐색 그리고 Viterbi 탐색의 방법을 이용한다. 문법규칙의 확률과 왼쪽 우선 파싱 그리고 왼쪽 우선 탐색 방법을 사용하여 실험한 결과, 왼쪽 우선 탐색 방식과 문법확률을 혼용하는 방식이 가장 정확한 결과를 보였으며 비학습 문장에 대해 51.74%의 재현률과 87.47%의 정확률을 보였다.

  • PDF