• Title/Summary/Keyword: 구조 추출

Search Result 4,060, Processing Time 0.047 seconds

Relation Extraction based on Composite Kernel using Pattern Similarity of Predicate-Argument Structure (술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출)

  • Jeong, Chang-Hoo;Chun, Hong-Woo;Choi, Yun-Soo;Song, Sa-Kwang;Choi, Sung-Pil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.276-279
    • /
    • 2011
  • 문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

Design and Optimization of Extractive Thermally Coupled Distillation System (추출 열 통합 증류계의 설계 및 최적화)

  • Cho, Hoon;Woo, Daesik;Choi, Yumi;Han, Myungwan
    • Korean Chemical Engineering Research
    • /
    • v.50 no.2
    • /
    • pp.270-276
    • /
    • 2012
  • In this study, thermally coupled distillation system and conventional two-column process were investigated for extractive distillation. The two processes were simulated and optimized using Aspen plus. Objective function for the optimization was energy consumption and optimization results to reduce energy consumption were used to get guidelines for design and operation for the two extractive distillation processes. Comparison of these two processes showed that thermally coupled distillation system provided better energy efficiency and lower capital cost than conventional distillation system.

Implementation of a Content-Based Image Retrieval System Based on Color Feature Extraction Using Quadtree Structure (Quadtree 구조를 사용한 색상 특징 추출 기반 영상 검색 시스템의 구현)

  • 최창규;정성일;최병걸;이시영;김승호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.362-364
    • /
    • 1999
  • 본 논문에서는 Quadtree 구조를 기반으로 한 효율적인 색상 정보 추출과 영상 검색을 수행하는 시스템을 구현한다. 제시한 시스템은 원 영상으로부터 DC영상을 추출하고, DC 영상의 화소들을 RGB에서 HSV의 색상 좌표계로 변환한다. 변환된 영상에서 색상의 분포에 따라 Quadtree 형태로 영역을 분할하고 대표 색상을 추출한다. 마지막으로 추출한 색상과 그 색상의 분포에 따라 Quadtree 형태로 영역을 분할하고 대표 색상을 추출한다. 마지막으로 추출한 색상과 그 색상의 분포값을 영역의 위치에 따라 Quadtree의 단말 노드에 저장한다. 그리고, 사용자가 질의 영상을 주었을 때 Quadtree에 저장된 정보를 이용하여 본 논문에서 제안한 유사도 측정을 통하여 결과 영상을 보여준다. 본 논문에서 제안한 방법으로 실험한 결과 64개의 영역으로 나눈 방법에 비해 비교하는 평균 영역의 개수는 28.9개였고, 검색시간은 2~6초 정도 감소하였다. 또한, 전체 영상의 색상 정보 저장량도 25% 정도 줄어들었지만 질의에 대한 두 방법의 검색 결과는 유사하게 나타났다.

  • PDF

Relation Extraction Using Self-attention with Multi Grained Information (다중 정보와 Self-Attention을 이용한 관계 추출)

  • Kim, Jeong-Moo;Lee, Seung-Woo;Char, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.175-180
    • /
    • 2019
  • 관계 추출은 문서에서 존재하는 트리플(주어, 관계어, 목적어)형식에 해당하는 단어를 추출하는 작업을 뜻한다. 본 논문에서는 멀티헤드 셀프 어텐션을 이용하여 트리플 중 주어나 목적어를 찾는 구조를 제안한다. 한국어 위키피디아와 DBpedia의 관계어를 단어 임베딩을 통해 벡터를 생성하고 입력한다. 초록과 관계어의 어텐션 이후 멀티 헤드 셀프 어텐선 구조를 통해 초록 중 관계어와 관련 있는 단어들의 가중치가 높아 진다. 멀티헤드 셀프 어텐션 과정을 반복하여 주요 단어들의 가중치가 계속해서 높아진다. 이를 입력으로 하여 정답이 될 단어의 시작과 끝을 선택한다. 제안 방법으로 직접 구축한 한국어 관계 추출 데이터셋을 대상으로 F1 0.7981의 성능을 보였다. 제안 방법은 관계어와 같이 단순한 정보만을 이용하고도 초록에서 적절한 정답 단어를 추출할 수 있음을 확인하였다. 관계어의 범위를 확장함으로서 나아가 육하원칙(5W1H)과 같은 이벤트의 추출에도 활용할 수 있을 것이다.

  • PDF

Effect of an emitting-layer height on a photon extraction efficiency in LED (LED에서 발광층의 높이가 광추출 효율에 미치는 영향)

  • Kwon, Keeyoung
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.1
    • /
    • pp.564-569
    • /
    • 2021
  • In this paper, for the typical LED and the tilted LED, when there is no electrode, when 20% absorption (80% reflection) occurs at the electrode, and when 60% absorption (40% reflection) occurs at the electrode, the effect of the absorption at the electrode and the height of the active region on the photon extraction efficiency and the mean photon path length was investigated, and an appropriate height of the active region was proposed. In a typical LED, as the absorption of the electrode increases, the photon extraction efficiency decreases from 18% to 15% and 13%, and the photon extraction efficiency is highest when the height of the active area is located in the center between the two electrodes. In the tilted LED, as the absorption of the electrode increases, the photon extraction efficiency decreases from 38% to 33% and 25%, and the photon extraction efficiency is highest when the height of the active area is located in the center between the two electrodes. The tilted LED can increase the photon extraction efficiency more than twice than that of a typical LED, where photons are trapped inside the chip due to total reflection.

An Approach to Structuralizing Business Information for Internet Shopping Malls (인터넷쇼핑몰의 사업자신원정보 구조화 방안)

  • 장용식
    • Journal of Intelligence and Information Systems
    • /
    • v.10 no.1
    • /
    • pp.27-45
    • /
    • 2004
  • While on-line shopping is increasing, the "Consumer Protection Law in Electronic Commerce" obliges each internet shopping mall to provide its business information. Although most internet shopping malls provide their business information in the semi-structured format on the bottom of their homepages, the attributes and expression forms of business information are different each other. It makes consumers difficult to identify their business information and lowers public confidence. Hence this study proposes three approaches - HTML-based structure, XML-based structure, and XML data island-based structure - to structuralizing business information for correct expression. The experiment results showed that the business information extraction time by XML data island-based structure is independent of the size of the web document, while the time by HTML-based structure is dependent on the size. By comparing the business information extraction times, we show that XML data island-based structure is more efficient and effective than HTML-based structure.structure.

  • PDF

A Study on Korean Dependency Parser Using Case Relation and Mutual Information (격 관계와 상호정보를 이용한 한국어 의존 파서)

  • Jung, Seok-Won;Park, Eui-Kyu;Ra, Dong-Yul;Yoon, Jun-Tae
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.450-456
    • /
    • 2001
  • 본 논문은 의존 문법에 기반만 한국어의 구문 분석 시스템을 제안한다. 일반적으로 올바른 구둔 구조를 얻기 위해서 많은 가능한 구문 구조를 생성하고 이 중에서 가장 좋은 것을 선택하는 방법을 사용한다. 이를 위하여 가능한 모든 구문 분석 구조를 생성하는 기법을 제안하였다. 이것은 모든 가능한 구문 구조에 관한 정보를 응축한 자료 구조를 구축한 다음 여기에서 구문 트리를 하나씩 추출하도록 하였다. 이 과정에서 의존 문법이 만족하여야 하는 모든 기본적인 제약 조건을 만족하는 트리 만이 효과적으로 추출되는 기법을 제안하였다. 그 결과 생성되는 트리의 수를 줄이게 되어 효율적인 구문 분석을 달성할 수 있게 되었다. 추출된 많은 트리 중에서 하나를 선택하는 작업에서 상호 정보가 이용되었다. 본 논문에서는 이러한 상호 정보를 구문 분석 중의성 해소에 효과적으로 사용하는 기법을 제시하였다. 제안된 기법의 타당성을 입증하기 위하여 구문 분석 시스템을 개발하고 여러 문장에 대한 분석을 실험하였다.

  • PDF

An Efficient Method for Logical Structure Analysis of HTML Tables (HTML 테이블의 논리적 구조분석을 위한 효율적인 방법)

  • Kim Yeon-Seok;Lee Kyong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.334-336
    • /
    • 2006
  • 본 논문에서는 웹 문서로부터 정보를 추출찰기 위한 목적의 일환으로 HTML 테이블의 논리적인 구조를 추출하여 XML 문서로 변환하는 효율적인 방법을 제안한다. 제안된 방법은 영역구문과 구조분석의 두 단계로 구성된다. 영역구분 단계에서는 테이블의 잡음영역을 제거하고 정규화한 후 시각적 및 의미적 일관성 검사를 통하여 테이블에 존재하는 속성 및 값 영역을 구분한다. 또한 구조분석 단계에서는 구분된 영역에 제안된 테이블 모델을 적용하여 계층구조를 추출하며, 이로부터 XML 문서를 생성한다. 제안된 영역구분 방법의 성능을 평가하기 위하여 1,180개의 테이블을 대상으로 실험한 결과, 평균적으로 86.7%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

Weighted Negative Tree Pattern Discovery (가중치 부여 부정 트리 패턴 추출)

  • Paik, Juryon;Kim, Jinyoung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.23-26
    • /
    • 2019
  • 사물인터넷(IoT)은 지금의 우리가 살고 일하는 모든 방식을 변화시키고 있다. IoT를 통해 데이터를 생성하고 저장하고 연결된 장치와 상호작용하여 비즈니스는 물론 우리의 일상 생활을 개선하고 있는 것이다. 무수히 많은 센서들이 연결된 세상은 센서들에 의해 그 어느 때보다 거대한 양의 데이터들을 생산하고 있다. JSON, XML 같은 트리 구조의 데이터 타입은 대량 데이터 저장 전송 교환 등에 주요하게 사용되는데 이는 트리 구조가 이형 데이터 간의 유연한 정보 전송과 교환을 가능하게 하기 때문이다. 반면에, 효용성 높은 정보나 감추어져 있는 정보들을 트리 구조의 대량 데이터들로부터 추출하는 것은 일반 데이터 구조에 비해 훨씬 어려우며 더 난해한 문제들을 발생시킨다. 본 논문에서는 트리 구조의 대량 스트리밍 데이터로부터 가중치가 부여된 주요한 부정 패턴들을 추출하기 위한 방법을 공식화한다.

  • PDF

Automatic Acquisition of Ranked IS-A Relation from Unstructured Text (텍스트에서 IS-A 관계의 자동 추출 및 순위화)

  • Ryu, Pum-Mo;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.150-157
    • /
    • 2007
  • 본 논문에서는 의존 구조 매칭과 약한 지도식 학습 방법을 적용하여 텍스트에서 IS-A 관계를 자동으로 추출하고 순위화하는 방법을 제안한다. 텍스트에서 잠재적인 IS-A 관계를 표현하는 [관계 표현, 하위어, 상위어]의 삼진관계 리스트를 추출하고, 관계 표현과 IS-A 관계 인스턴스, IS-A 관계 후보, 사이의 상호 관련성을 이용하여 각각의 점수를 반복적으로 정제한다. 제안한 방법의 대표적인 특징은 다음과 같다. 1) 의존 구조에 기반한 패턴 매칭 방법을 적용하여 정규 표현에 기반한 방법보다 다양한 형태의 삼진관계를 추출할 수 있고, 2) 도메인 코퍼스에서 통계적으로 추출한 어휘 사이의 관련성 정보를 이용하여 도메인에 적합한 IS-A 관계 인스턴스의 순위를 높일 수 있으며, 3) 관계 표현과 관계 인스턴스의 점수를 상호 관련성에 기반한 방법으로 반복적으로 점수화하여 IS-A 관계 인스턴스 사이의 변별력을 높일 수 있다. 실험에서 순위화된 관계 인스턴스는 전문가의 판단과 66%이상 일치함을 보였고, 의존 구조를 이용한 유연한 패턴 매칭 방법은 정규표현을 이용한 방법보다 43.6%의 추가적인 삼진관계를 추출하였다.

  • PDF