• Title/Summary/Keyword: 개체 기반

Search Result 912, Processing Time 0.034 seconds

Answer Extraction based on Named Entity in Korean Question Answering System (한국어 질의응답시스템에서 개체인식에 기반하여 대답 추출)

  • 이경순;김재호;최기선
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.184-189
    • /
    • 2000
  • 본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대한 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다. 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위 5위까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는 48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

  • PDF

ABox Reasoning with Relational Databases (관계형 데이터베이스 기반 ABox Reasoning)

  • Khandelwal, Ankesh;Bisai, Summit;Kim, Ju-Ri;Lee, Hyun-Chang;Han, Sung-Kook
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.353-356
    • /
    • 2009
  • OWL 온톨로지의 확장 가능한(scalable) 추론(reasoning)에 대한 접근 방법으로 SQL로 구축된 논리 규칙을 관계형 데이터베이스에 저장되어있는 개체(individual)에 대한 사실(facts)과 공리(axioms)들에 적용하는 것이다. 예로서 미네르바(Minerva)는 서술 논리 프로그램(Description Logic Program, DLP)을 적용함으로써 ABox 추론을 수행한다. 본 연구에서는 관계형 데이터베이스를 기반으로 추론을 시도하며, 대규모 논리 규칙 집합을 사용한 추론을 시도한다. 뿐만 아니라, 특정 클래스에 속한 익명(anonymous)의 개체들과 개체들의 묵시적(implicit)인 관계성 추론을 시도하며, 필요한 경우 새로운 개체를 생성함으로써 명시화하여 추론을 시도한다. 더욱이, 추론의 논리 패러다임(paradigm)에서부터 데이터베이스 패러다임에 이르기까지 변화 시켜가면서 카디널리티(cardinality) 제약을 만족하는 개체들에 대한 제약적인 추정 추론을 시도하며, 벤치마크 테스트 결과 향상된 추론 능력을 얻을 수 있음을 보인다.

  • PDF

Developing Responsive Web Application for Location Based DBpedia Retrieval (위치기반 DBpedia 검색을 위한 반응형 웹 애플리케이션 개발)

  • Lee, Su-hyoung;Lee, Yong-ju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.975-977
    • /
    • 2017
  • 본 논문은 링크드 오픈 데이터(Linked Open Data)의 일종인 DBpedia 개체를 위치기반으로 검색하여 지도상에 표시해주고, 표시된 개체중 하나를 선택하게 되면 개체에 관한 RDF 형태의 데이터를 파싱하여 개체에 관한 기본적인 정보와 사진과 외부로의 링크 등을 제공한다. 또한 개체가 가지는 특성을 지정하여 지도에 선택적으로 표시하는 필터링 기능을 제공한다. 이러한 웹 애플리케이션을 개발하기 위해 오픈소스 웹 프레임워크인 루비 온 레일즈(Ruby on Rails)를 사용하였고, HTML5와 Google Map API를 활용한 반응형 웹 애플리케이션으로 구현하였다.

Lexicon Feature Infused Character-Based LSTM CRFs for Korean Named Entity Recognition (문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용)

  • Min, Jin-Woo;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.99-101
    • /
    • 2016
  • 문자 기반 LSTM CRF는 개체명 인식에서 높은 인식을 보여주고 있는 LSTM-CRF 방식에서 미등록어 문제를 해결하기 위해 단어 단위의 임베딩 뿐만 아니라 단어를 구성하는 문자로부터 단어 임베딩을 합성해 내는 방식으로 기존의 LSTM CRF에서의 성능 향상을 가져왔다. 한편, 개체명 인식에서 어휘 사전은 성능 향상을 위한 외부 리소스원으로 활용하고 있는데 다양한 사전 매칭 방법이 파생될 수 있음에도 이들 자질들에 대한 비교 연구가 이루어지지 않았다. 본 논문에서는 개체명 인식을 위해 다양한 사전 매칭 자질들을 정의하고 이들을 LSTM-CRF의 입력 자질로 활용했을 때의 성능 비교 결과를 제시한다. 실험 결과 사전 자질이 추가된 LSTM-CRF는 ETRI 개체명 말뭉치의 학습데이터에서 F1 measure 기준 최대 89.34%의 성능까지 달성할 수 있었다.

  • PDF

Named Entity Linking Based on Deep Learning Model (딥러닝 모형 기반 한국어 개체명 연결)

  • Sohn, Dae-Neung;Lee, Dongju;Lee, Yong-Hun;Chung, Youjin;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.90-95
    • /
    • 2016
  • 개체명 연결이란 문장 내 어떤 단어를 특정 사물이나 사람, 장소, 개념 등으로 연결하는 작업이다. 과거에는 주로 연결 대상 단어 주변 문맥에서 자질 공학을 거쳐 입력을 만들고, 이를 이용해 SVM이나 Logistic Regression 혹은 유사도 계산, 그래프 기반 방법론 등으로 지도/비지도 학습하여 문제를 풀어왔다. 보통 개체명 연결 문제의 출력 부류(class)가 사물이나 사람 수만큼이나 매우 커서, 자질 희소성 문제를 겪을 수 있다. 본 논문에서는 이 문제에 구조적으로 더 적합하며 모형화 능력이 더 뛰어나다 여겨지는 딥러닝 기법을 적용하고자 한다. 다양한 딥러닝 모형을 이용한 실험 결과 LSTM과 Attention기법을 같이 사용했을 때 가장 좋은 품질을 보였다.

  • PDF

Answer Extraction based on Named Entity in Korean Question Answering System (한국어 질의응답시스템에서 개체인식에 기반한 대답 추출)

  • Lee, Kyung-Soon;Kim, Jae-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.184-189
    • /
    • 2000
  • 본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대해 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위5까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

  • PDF

Representation of Spatio-Temporal Relations for Understanding Object Motion in Video (비디오의 객체 움직임 이해를 위한 시공간 관계 표현)

  • Choi, Jun-Ho;Cho, Mi-Young;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.883-885
    • /
    • 2005
  • 비디오 데이터에서 의미적 인식을 위해 활용되는 요소 중 하나가 객체에 대한 움직임 정보로 이는 비디오 데이터에 대한 색인과 내용 기반 검색을 수행하는데 중요한 역할을 한다. 본 논문에서는 효율적인 객체기반 비디오 검색과 비디오의 움직임 해석을 위한 시공간 관계 표현 방법을 제시한다. 비디오의 객체표현 방법은 Polygon-based Bounding Volume의 3차원 Mesh 모델을 생성한 후 이를 이용하여 비디오 내 개체의 구조적 내용을 저차원적 속성과 움직임에 대한 기본 구조로 활용하였다. 또한, 움직임 객체에 대해 시공간적 특성과 시각적 특성을 동시에 고려하여 표현되도록 하였다. 각 Vertex는 시각적 특징 중 일부분이고, 비디오 내 개체의 공간적 특성과 개체의 움직임은 Volume Trajectory로 모델링되고, 개체와 개체간의 시공간적 관계를 표현하기 위한 Operation을 정의한다.

  • PDF

Genetic Algorithm Applying Modified Mutation Operator Based on Hamming Distance for Solving Multi-dimensional Knapsack Problem (개체간 해밍 거리 기반의 변이연산을 적용한 유전알고리즘을 이용한 다차원 배낭 문제 탐색)

  • Jeong, Jae-Hun;Lee, Jong-Hyun;Ahn, Chang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1728-1731
    • /
    • 2012
  • 본 논문에서는 부모 개체의 해밍 거리에 기반하여 선택적 변이연산을 적용한 유전알고리즘을 제안한다. 유전자 형이 매우 유사한 개체들 간의 유전연산은 알고리즘의 탐색성능을 저하시키고 조기 수렴의 가능성을 증가시킨다. 본 논문에서는 이러한 현상을 극복하기 위하여, 교차연산 시 선택된 두 부모 개체간의 해밍 거리에 따라 그 값이 낮으면 교차연산 후 생성된 두 자식 개체 중 한쪽에게 높은 변이확률을 적용하고 다른 한쪽 자식은 부모와 비슷한 유전자 형으로 탐색을 계속하게 하여 조기 수렴을 방지하면서 해집단의 다양성 유지 기능을 향상 시켰다. 제안한 유전 알고리즘을 다차원 배낭 문제에 적용한 결과, 같은 조건에서 단순 유전 알고리즘(SGA) 보다 향상된 탐색 성능을 보여주었다.

Korean Named Entity Recognition based on ELECTRA with CRFs (ELECTRA-CRFs 기반 한국어 개체명 인식기)

  • Hong, Jiyeon;Kim, Hyunwoo J
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.473-476
    • /
    • 2020
  • 개체명 인식에 적용된 대부분의 신경망 모델들에서 CRFs와 결합을 통해 성능 향상을 하였다. 그러나 최근 대용량 데이터로 사전 학습한 모델을 활용하는 경우, 기 학습된 많은 유의미한 파라미터들로 인해 CRFs의 영향력이 비교적 작아졌다. 따라서 본 논문에서는 한국어 대용량 말뭉치로 사전 학습한 ELECTRA 모델에서의 CRFs 가 개체명 인식에 미치는 영향을 확인해보고자 한다. 모델의 입력 단위로 음절 단위와 Wordpiece 단위로 사전 학습된 두 가지의 모델을 사용하여 미세 조정을 통해 개체명 인식을 학습하였다. 실험을 통해서 두 모델에 대하여 각각 CRFs 층의 유무에 따른 성능을 비교해 보았다. 그 결과로 ELECTRA 기반으로 사전 학습된 모델에서 CRFs를 통한 F1-점수 향상을 보였다.

  • PDF

A New N-ary Entities Relation Approach for User Query Mean Desicion (사용자 질의 의미 결정을 위한 새로운 N-ary 개체 관계 디자인 패턴)

  • Su-Kyoung Kim;Kee-Hong Ahn
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.635-638
    • /
    • 2008
  • 본 연구는 웹이나 정보 검색 환경에서 사용자로부터 입력되는 단순한 키워드 형태의 질의가 아닌 문장형태의 질의에 있어 문장이 내포하는 질의의 의미를 결정하여 더 정확한 검색 결과를 제공하기 위해 온톨로지 내 개념들 간의 속성간 연결을 위해 A-Box 기반의 관계 선언과 새로운 N-ary 개체 관계 방법을 제안한다. 특히 개념 개체들 간의 의미를 더 정확히 결정하기 위해 기존의 N-ary 개체 관계 방법이 갖고 있는 속성에 가중치를 포함하는 것이 아니라 가중치에 관련된 새로운 개체를 생성 패턴을 제시하여 특정 개념에 연관된 개념들의 관련성 결정의 성능을 높이도록 하였다. 본 연구의 실험에 있어 사용자가 입력한 병증의 문장을 결정하기 위해, A-Box 기반의 관계 선언과 N-ary 디자인 패턴에 결합하는 지식 도메인 온톨로지 등을 구축하였으며, 이를 통한 실험 결과 문장의 의미에 따른 더 정확한 결과를 보여주었다.