• Title/Summary/Keyword: 의미 처리

Search Result 3,549, Processing Time 0.03 seconds

A recognition algorithm of Korean verb and noun idiomatic phrases (한국어 동사와 명사 관용구 인식 알고리즘)

  • Lee, Ho Suk
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

Semantic Information Modeling for Image Annotation System (이미지 주석 시스템을 위한 의미 정보 모델링)

  • Choi, Jun-Ho;Kwak, Hyo-Seung;Kim, Won-Pil;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.787-790
    • /
    • 2002
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주서 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 이에 본 논문에서는 시각 데이터에 존재하는 객체들과 그 객체 사이의 개념관계를 Ontology의 한 형태인 WordNet을 이용하여 의미 정보로 표현할 수 있도록 한다. 이를 활용하면 영상 데이터의 자동 주석 시스템이나 검색 시스템에서 인간이 인식하는 개념적인 사고방식에 더욱 접근할 수 있는 결과물을 얻을 수 있을 것이다.

  • PDF

Standards on Semantic Annotation (의미주석 표준)

  • Lee, Kiyong
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.3-8
    • /
    • 2015
  • 최근에 ISO/TC 37/SC 4 산하의 Working Group 2 Semantic annotation에서 자연언어의 의미주석에 관한 4 개의 국제표준을 완성하여 출판하였다. 그 중에서 2 개의 국제표준 ISO 24617-1 SemAF-Time(ISO-TimeML)[1]과 24617-7 ISOspace[2]를 간략히 소개하는 것이 이 발표의 목적이다. 자연언어 텍스트에서 전자는 사건과 관련된 시간 정보를 주석처리하고, 후자는 사건(event), 특히 운동(motion)과 관련된 공간 정보를 주석 처리하는 주석체계(annotation scheme)들을 구축, 기술하는 명세언어(specification language)이다. 이 표준들은 또한 ISO 24612:2012 LAF (Linguistic annotation framework)[3]의 제약조건들을 준수하며 언어 주석체계를 구축하였다. 오늘의 발표는 이들 두 개의 국제표준에 준한 주석체계들 ASisoTime과 ASisoSpace가 LAF를 따라 어떻게 구축되었는지 그 추상통사구조(abstract syntax)를 명시하고, 의미주석체계로서의 이들 주석체계의 타당성을 보이기 위하여 주석기반의 의미형식(semantic form)들을 체계적으로 도출하는 과정을 또한 보이도록 한다.

  • PDF

Document Summarization using Semantic Feature and Hadoop (하둡과 의미특징을 이용한 문서요약)

  • Kim, Chul-Won
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.18 no.9
    • /
    • pp.2155-2160
    • /
    • 2014
  • In this paper, we proposes a new document summarization method using the extracted semantic feature which the semantic feature is extracted by distributed parallel processing based Hadoop. The proposed method can well represent the inherent structure of documents using the semantic feature by the non-negative matrix factorization (NMF). In addition, it can summarize the big data document using Hadoop. The experimental results demonstrate that the proposed method can summarize the big data document which a single computer can not summarize those.

A Multimedia Data Search System using Indexing Agent (인덱싱 에이전트를 이용한 멀티미디어 데이터 검색시스템)

  • Ko, Jae-Woon
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05a
    • /
    • pp.487-490
    • /
    • 2010
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF

Frame Structure Modeling of OWL (OWL의 프레임 구조 모델링)

  • 시대근;오지훈;장영진;전양승;한성국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.97-99
    • /
    • 2004
  • 현재의 웹 환경에서의 정보는 점점 대량화되고 있으며, 정보에 대한 의미처리가 지원되지 않는 까닭에 많은 양의 정보가 무분별하게 검색되고 필요한 정보를 찾는데 많은 노력이 필요하다. 이를 해결하고자 XML의 의미태그를 중심으로 한 메타데이터 정보 모델링 등이 출현하였고, 이를 개념 수준의 의미처리로 추상화한 온톨로지(ontology) 기술이 개발되게 되었다. 온톨로지는 컴퓨터가 처리할 수 있는 명시적인 개념 표현을 상호 공유할 수 있도록 하여 줌으로써, 컴퓨터가 의미를 이해하고 추론할 수 있는 기반을 제공한다. 최근에는 여러 온톨로지 언어는 기술 논리(Description Logic)의 의미 모델에 기반을 두고 있는 OWL언어로 표준화되고 있다. 그러나, 온톨로지 언어를 사용한 직접적인 온톨로지 구축은 거의 불가능하다. 본 논문에서는 지식 표현의 기초가 되고 OWL의 이론적 기반이 되고 있는 프레임 구조로 개념 모델링 하는 방법을 통해 OWL기반의 온톨로지 구축을 보다 편리하고 효과적으로 수행할 수 있는 방법을 제공하며, 효율적인 OWL 문서의 생성과 편집 방안을 도출한다.

  • PDF

A Concept Language Model combining Word Sense Information and BERT (의미 정보와 BERT를 결합한 개념 언어 모델)

  • Lee, Ju-Sang;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.3-7
    • /
    • 2019
  • 자연어 표상은 자연어가 가진 정보를 컴퓨터에게 전달하기 위해 표현하는 방법이다. 현재 자연어 표상은 학습을 통해 고정된 벡터로 표현하는 것이 아닌 문맥적 정보에 의해 벡터가 변화한다. 그 중 BERT의 경우 Transformer 모델의 encoder를 사용하여 자연어를 표상하는 기술이다. 하지만 BERT의 경우 학습시간이 많이 걸리며, 대용량의 데이터를 필요로 한다. 본 논문에서는 빠른 자연어 표상 학습을 위해 의미 정보와 BERT를 결합한 개념 언어 모델을 제안한다. 의미 정보로 단어의 품사 정보와, 명사의 의미 계층 정보를 추상적으로 표현했다. 실험을 위해 ETRI에서 공개한 한국어 BERT 모델을 비교 대상으로 하며, 개체명 인식을 학습하여 비교했다. 두 모델의 개체명 인식 결과가 비슷하게 나타났다. 의미 정보가 자연어 표상을 하는데 중요한 정보가 될 수 있음을 확인했다.

  • PDF

A Study on Semantic Processing Methods for Smart Mobile Services (스마트 모바일 서비스를 위한 의미 처리 방법에 관한 연구)

  • Jeong, Dong-Won;Lee, Suk-Hoon;Kim, Jang-Won;Baik, Doo-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.84-87
    • /
    • 2011
  • 스마트폰을 중심으로 한 모바일 기기를 위한 스마트 서비스 개발에 대한 연구가 다양한 분야에서 지속적으로 진행되어 왔다. 스마트 모바일 서비스를 제공하기 위해서는 다양한 문제에 대한 다각적인 접근이 요구된다. 특히 스마트 모바일 서비스 제공을 위해서는 정보에 대한 의미를 해석하고 지능적으로 처리할 수 있는 연구가 필수적으로 요구된다. 이 논문에서는 스마트 모바일 서비스 제공을 위하여 그 기반이 되는 의미 처리 방법들을 제안하고 각각의 장 단점을 분석한다. 특히 이러한 방법들 중에서 정확성을 담보할 수 있는 의미 처리 방법을 위한 시스템 구조를 제안한다. 이 논문은 다양한 환경을 고려하여 보다 지능적이고 사용자에게 편리한 스마트 모바일 서비스 개발을 위한 기초 자료 및 기반 기술로서 활용될 수 있으며, 스마트 서비스 개발에 기여할 수 있을 것으로 기대된다.

Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network (한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식)

  • Park, Seo-Yeon;Ock, Cheol-Young;Shin, Joon-Choul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

A Development of the Automatic Predicate-Argument Analyzer for Construction of Semantically Tagged Korean Corpus (한국어 의미 표지 부착 말뭉치 구축을 위한 자동 술어-논항 분석기 개발)

  • Cho, Jung-Hyun;Jung, Hyun-Ki;Kim, Yu-Seop
    • The KIPS Transactions:PartB
    • /
    • v.19B no.1
    • /
    • pp.43-52
    • /
    • 2012
  • Semantic role labeling is the research area analyzing the semantic relationship between elements in a sentence and it is considered as one of the most important semantic analysis research areas in natural language processing, such as word sense disambiguation. However, due to the lack of the relative linguistic resources, Korean semantic role labeling research has not been sufficiently developed. We, in this paper, propose an automatic predicate-argument analyzer to begin constructing the Korean PropBank which has been widely utilized in the semantic role labeling. The analyzer has mainly two components: the semantic lexical dictionary and the automatic predicate-argument extractor. The dictionary has the case frame information of verbs and the extractor is a module to decide the semantic class of the argument for a specific predicate existing in the syntactically annotated corpus. The analyzer developed in this research will help the construction of Korean PropBank and will finally play a big role in Korean semantic role labeling.