• 제목/요약/키워드: 의미처리

검색결과 3,545건 처리시간 0.025초

한국어 보조동사의 개념그래프적 기술 방안 (A Description Method of Korean Auxiliary Verbs)

  • 이병희;권오석
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.373-380
    • /
    • 2001
  • 본 논문은 한국어 보조동사의 의미를 Sowa에 의해 제안되고 국제표준이 되고있는 개념그래프를 이용하여 형식적으로 기술하는 방법을 제안한다. 이를 위해 영어의 양상과 상에 관한 개념그래프를 알아보고 한국어 보조동사를 통사/의미론적으로 고찰한다. 한국어 보조동사의 개념그래프적 기술을 위해, 각종 논문과 국어사전에서 한국어 보조동사 40개의 여러 예문들을 수집하여 완료, 진행, 봉사, 시도, 강세, 원망, 지속, 추정의 8가지 의미로 분류하고 이들을 개념그래프로 기술한다. 실험에서는 이들 8가지 의미들을 인공지능언어의 일종인 LIPS과 유사한 KIF로 작성하고 C++를 이용하여 한국어 보조동사가 포함된 문장을 입력받아 개념그래프로 변환하는 프로그램을 구현한다. 문장 내의 모든 범주들의 개념과 개념 관계가 자연어의 모든 의미관계를 표시할 수 있는 개념그래프는 한국어 보조동사의 다양한 의미를 기술하는데 적합함을 알 수 있었다.

  • PDF

비정형 XML 문서에서의 의미정보 검색을 위한 이동에이전트 시스템 (A Mobile Agent System for Meaningful Information Filtering for XML Documents)

  • 공용해;최인석;이경수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1021-1024
    • /
    • 2002
  • 본 연구에서는 인터넷에 존재하는 다양한 XML 문서에서 의미정보를 검색하기 위한 의미정보수집 이동에이전트 시스템을 개발하였다. 이동에이전트는 실행 프로그램이 이기종 분산 환경의 네트웍에서 자율적으로 이동 및 반응하며 실제로 데이터가 존재하고 있는 장소로 이동하여 목적을 수행한다. 의미 정보수집 이동에이전트 시스템의 연구를 위하여, 정보를 개념화하고 포괄적 DTD를 자동으로 생성할 수 있는 DTD생성기를 개발하였으며 의미정보를 추론할 수 있는 추론알고리즘을 연구하였다. 개발된 의미정보수집 이동에이전트 시스템은 정보가 존재하는 원격지 사이트에 파견되어 비정형 XML 문서를 대상으로 포괄적 DTD와 추론엔진을 이용하여, 의미정보를 추출하고 전송하는 임무를 수행한다. 따라서, 의미정보수집 이동에이전트 시스템을 이용한 정보수집은 정보의 질을 향상시키고 네트워크의 부하를 감소시킨다.

  • PDF

한국어 동사와 명사 관용구 인식 알고리즘 (A recognition algorithm of Korean verb and noun idiomatic phrases)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

이미지 주석 시스템을 위한 의미 정보 모델링 (Semantic Information Modeling for Image Annotation System)

  • 최준호;곽효승;김원필;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.787-790
    • /
    • 2002
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주서 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 이에 본 논문에서는 시각 데이터에 존재하는 객체들과 그 객체 사이의 개념관계를 Ontology의 한 형태인 WordNet을 이용하여 의미 정보로 표현할 수 있도록 한다. 이를 활용하면 영상 데이터의 자동 주석 시스템이나 검색 시스템에서 인간이 인식하는 개념적인 사고방식에 더욱 접근할 수 있는 결과물을 얻을 수 있을 것이다.

  • PDF

의미주석 표준 (Standards on Semantic Annotation)

  • 이기용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2015
  • 최근에 ISO/TC 37/SC 4 산하의 Working Group 2 Semantic annotation에서 자연언어의 의미주석에 관한 4 개의 국제표준을 완성하여 출판하였다. 그 중에서 2 개의 국제표준 ISO 24617-1 SemAF-Time(ISO-TimeML)[1]과 24617-7 ISOspace[2]를 간략히 소개하는 것이 이 발표의 목적이다. 자연언어 텍스트에서 전자는 사건과 관련된 시간 정보를 주석처리하고, 후자는 사건(event), 특히 운동(motion)과 관련된 공간 정보를 주석 처리하는 주석체계(annotation scheme)들을 구축, 기술하는 명세언어(specification language)이다. 이 표준들은 또한 ISO 24612:2012 LAF (Linguistic annotation framework)[3]의 제약조건들을 준수하며 언어 주석체계를 구축하였다. 오늘의 발표는 이들 두 개의 국제표준에 준한 주석체계들 ASisoTime과 ASisoSpace가 LAF를 따라 어떻게 구축되었는지 그 추상통사구조(abstract syntax)를 명시하고, 의미주석체계로서의 이들 주석체계의 타당성을 보이기 위하여 주석기반의 의미형식(semantic form)들을 체계적으로 도출하는 과정을 또한 보이도록 한다.

  • PDF

하둡과 의미특징을 이용한 문서요약 (Document Summarization using Semantic Feature and Hadoop)

  • 김철원
    • 한국정보통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.2155-2160
    • /
    • 2014
  • 본 논문은 하둡 기반의 분산병렬처리에 의한 문서의 의미특징을 추출하고, 추출된 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 문서요약에 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 또한 하둡을 이용하여 빅데이터의 문서를 요약할 수 있다. 실험결과 제안방법이 단일 컴퓨터 환경에서 처리할 수 없는 대용량의 문서를 요약할 수 있음을 보인다.

인덱싱 에이전트를 이용한 멀티미디어 데이터 검색시스템 (A Multimedia Data Search System using Indexing Agent)

  • 고재운
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.487-490
    • /
    • 2010
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF

의미 정보와 BERT를 결합한 개념 언어 모델 (A Concept Language Model combining Word Sense Information and BERT)

  • 이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2019
  • 자연어 표상은 자연어가 가진 정보를 컴퓨터에게 전달하기 위해 표현하는 방법이다. 현재 자연어 표상은 학습을 통해 고정된 벡터로 표현하는 것이 아닌 문맥적 정보에 의해 벡터가 변화한다. 그 중 BERT의 경우 Transformer 모델의 encoder를 사용하여 자연어를 표상하는 기술이다. 하지만 BERT의 경우 학습시간이 많이 걸리며, 대용량의 데이터를 필요로 한다. 본 논문에서는 빠른 자연어 표상 학습을 위해 의미 정보와 BERT를 결합한 개념 언어 모델을 제안한다. 의미 정보로 단어의 품사 정보와, 명사의 의미 계층 정보를 추상적으로 표현했다. 실험을 위해 ETRI에서 공개한 한국어 BERT 모델을 비교 대상으로 하며, 개체명 인식을 학습하여 비교했다. 두 모델의 개체명 인식 결과가 비슷하게 나타났다. 의미 정보가 자연어 표상을 하는데 중요한 정보가 될 수 있음을 확인했다.

  • PDF

UTagger의 속도 향상을 위한 선택적 기능제한 (Optional features for speeding up UTagger)

  • 신준철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.113-116
    • /
    • 2012
  • UTagger는 한국어 의미 처리를 위해 개발된 형태소분석기이며 의미 분열 기능도 가지고 있다. 정확률이 매우 높고 다앙한 기능을 갖추고 있으나 이전에 개발된 다른 형태소 분석기에 비하여 속도가 느리다는 단점을 가지고 있었다. 형태소 분석기의 빠른 속도는 많은 분야에서 요구되고 있기 때문에 본 논문에서는 UTagger의 정확률을 유지하면서 속도를 향상시키는 캐시(Cache) 방법과, 정확률을 조금 낮추면서 향상시키는 다앙한 방법들을 제시한다. 또한 상황에 따라 적합한 방법을 선택할 때 참조가 되도록 하기 위해 각 방법들 실험 결과를 정리한다.

  • PDF

스마트 모바일 서비스를 위한 의미 처리 방법에 관한 연구 (A Study on Semantic Processing Methods for Smart Mobile Services)

  • 정동원;이석훈;김장원;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.84-87
    • /
    • 2011
  • 스마트폰을 중심으로 한 모바일 기기를 위한 스마트 서비스 개발에 대한 연구가 다양한 분야에서 지속적으로 진행되어 왔다. 스마트 모바일 서비스를 제공하기 위해서는 다양한 문제에 대한 다각적인 접근이 요구된다. 특히 스마트 모바일 서비스 제공을 위해서는 정보에 대한 의미를 해석하고 지능적으로 처리할 수 있는 연구가 필수적으로 요구된다. 이 논문에서는 스마트 모바일 서비스 제공을 위하여 그 기반이 되는 의미 처리 방법들을 제안하고 각각의 장 단점을 분석한다. 특히 이러한 방법들 중에서 정확성을 담보할 수 있는 의미 처리 방법을 위한 시스템 구조를 제안한다. 이 논문은 다양한 환경을 고려하여 보다 지능적이고 사용자에게 편리한 스마트 모바일 서비스 개발을 위한 기초 자료 및 기반 기술로서 활용될 수 있으며, 스마트 서비스 개발에 기여할 수 있을 것으로 기대된다.