• Title/Summary/Keyword: 관계 추출

Search Result 4,389, Processing Time 0.033 seconds

Automatic Extraction of Semantic Relationships from Images Using Ontologies and SVM Classifiers (SVM과 온톨로지를 이용한 이미지 의미 관계 자동 추출 기법)

  • Jeong, Jin-Woo;Joo, Young-Do;Lee, Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.13-18
    • /
    • 2007
  • 효과적인 이미지 검색을 위하여, 이미지의 저수준 시각 정보로부터 고수준 의미 정보를 추출하는 기술에 관한 많은 연구가 이루어지고 있다. 특히 최근에는 Support Vector Machine과 같은 기계 학습 기법을 이용한 이미지 어노테이션 시스템의 개발이 활발히 진행중이이다. 그러나 기존의 연구들은 단편적인 이미지 정보만을 추출함에도 불구하고, 그 성능이 여전히 만족스럽지 못하다. 본 논문에서는 Support Vector Machine과 온톨로지를 이용하여 이미지의 다양한 정보를 효과적으로 추출 및 기술할 수 있는 시스템을 제안한다. 특히 온톨로지는 특정 도메인의 상세한 지식 표현과 추론을 위한 지식베이스로서, 본 논문에서는 Support Vector Machine을 이용하여 이미지 안에 존재하는 객체들의 컨셉을 판별하고 이미지 어노테이션 온톨로지와 생태계 온톨로지를 이용하여 공간 관계, 천적 관계와 같은 객체간 의미 관계를 자동적 자동적으로 추출하는 방법을 제안한다.

  • PDF

Extraction Association Rule between Attribute Values Using Hash Table (해시테이블을 이용한 속성값 간의 연관관계 추출)

  • Yang, Jong-Won;Lee, Sang-Hee;Lee, Dong-Joo;Yang, Jung-Yun;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.220-222
    • /
    • 2005
  • 전자상거래의 발전은 필연적으로 상품 데이터베이스화를 수반하게 되었다. 이 상품 데이터베이스에 존재하는 각 상품들의 속성값들의 연관관계 추출은 검색- 유의어 추출 혹은 클러스터링등에 활용될 수 있다. 본 논문에서는 상품 속성값들의 연관관계 추출을 위하여 해쉬 테이블에 기반한 트리 형태 자료구조을 제안한다. 그리고 이 자료구조를 이용하여 상품 데이터에이스의 각 속성값 간의 연관관계를 threshold를 이용하여 선형 시간에 추출하는 알고리즘을 제시한다. 마지막으로, Support를 이용하여 트리의 탐색 공간을 줄이는 방식으로 최적화를 시키는 기법을 제시한다.

  • PDF

Definition and Extraction of Causal Relations for Question-Answering on Fault-Diagnosis of Electronic Devices (전자장비 고장진단 질의응답을 위한 인과관계 정의 및 추출)

  • Lee, Sheen-Mok;Shin, Ji-Ae
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.5
    • /
    • pp.335-346
    • /
    • 2008
  • Causal relations in ontology should be defined based on the inference types necessary to solve problems specific to application as well as domain. In this paper, we present a model to define and extract causal relations for application ontology for Question-Answering (QA) on fault-diagnosis of electronic devices. Causal categories are defined by analyzing generic patterns of QA application; the relations between concepts in the corpus belonging to the causal categories are defined as causal relations. Instances of casual relations are extracted using lexical patterns in the concept definitions of domain, and extended incrementally with information from thesaurus. On the evaluation by domain specialists, our model shows precision of 92.3% in classification of relations and precision of 80.7% in identifying causal relations at the extraction phase.

System Optimization Technique using Crosscutting Concern (크로스커팅 개념을 이용한 시스템 최적화 기법)

  • Lee, Seunghyung;Yoo, Hyun
    • Journal of Digital Convergence
    • /
    • v.15 no.3
    • /
    • pp.181-186
    • /
    • 2017
  • The system optimization is a technique that changes the structure of the program in order to extract the duplicated modules without changing the source code, reuse of the extracted module. Structure-oriented development and object-oriented development are efficient at crosscutting concern modular, however can't be modular of crosscutting concept. To apply the crosscutting concept in an existing system, there is a need to a extracting technique for distributed system optimization module within the system. This paper proposes a method for extracting the redundant modules in the completed system. The proposed method extracts elements that overlap over a source code analysis to analyze the data dependency and control dependency. The extracted redundant element is used to program dependency analysis for the system optimization. Duplicated dependency analysis result is converted into a control flow graph, it is possible to produce a minimum crosscutting module. The element extracted by dependency analysis proposes a system optimization method which minimizes the duplicated code within system by setting the crosscutting concern module.

Domain-specific Korean Relation Extraction system using Prompt with Meta-Information (메타 정보를 활용한 프롬프트 기반 도메인 특화 한국어 관계 추출)

  • Jinsung Kim;Gyeongmin Kim;Junyoung Son;Aram So;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.369-373
    • /
    • 2022
  • 기존의 관계 추출 태스크에서의 많은 연구들은 사전학습 언어모델을 파인튜닝하여 뛰어난 성능을 달성해왔다. 하지만, 파인튜닝은 사전학습 시의 학습 기법과의 간극으로 인해 일반화 능력을 저해한다. 본 연구는 다운스트림 태스크를 사전학습의 Masked Language Modeling (MLM) 기법을 통해 해결하는 프롬프트 기반의 학습 기법을 활용하여, 특정 한국어 도메인에서의 관계 추출을 위한 프롬프트 기반 파인튜닝 방법론을 제안한다. 실험의 경우, 도메인의 특성이 뚜렷한 전통문화유산 말뭉치를 대상으로 실험을 진행하여 본 방법론의 도메인 적응력을 보이며, 메타 정보 즉, 개체 유형 및 관계 유형의 의미론적 정보를 일종의 지식 정보로 활용하여 프롬프트 기반 지식 주입의 효과성을 검증한다. 프롬프트에의 메타 정보의 주입과 함께 프롬프트 기반으로 파인튜닝된 모델은 오직 MLM 기법만을 이용하여 태스크를 수행하여 기존 파인튜닝 방법론 대비 파라미터 수가 적음에도, 성능 면에서 대부분 소폭 상승하는 경향을 보여줌으로써 그 효과성 및 효율성을 보인다.

  • PDF

Implementation and Model to Automatically Generate an Ontology for Korean (한국어에 적합한 자동 온톨로지 생성을 위한 모델 제안 및 구현)

  • Jung, Young-Giu;Park, Mi-Sung;Choi, Jae-Hyuk;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.173-176
    • /
    • 2003
  • 본 논문은 언어학적 데이터로부터 자동으로 온톨로지를 생성하기 위한 모델을 제안하고 이를 구현한다. 모델 제안을 위해 온톨로지의 기본 구성 요소인 개념과 관계를 정의하고 이러한 개념과 관계 객체를 자동으로 추출하는 알고리즘을 제안한다. WordNet을 이용하여 개념을 자동으로 추출하고, 추출된 개념들간의 관계는 한국어의 구문적 특성을 이용하여 관계의 기본 형태를 정의하고 이를 기반으로 관계를 추출한다. 본 논문은 특허문서에서 전기통신기술문서를 대상으로 구현했으며, 제안된 알고리즘을 다른 영역으로 확장하여 이를 검증할 것이다.

  • PDF

MRSPAKE : A Web-Scale Spatial Knowledge Extractor Using Hadoop MapReduce (MRSPAKE : Hadoop MapReduce를 이용한 웹 규모의 공간 지식 추출기)

  • Lee, Seok-Jun;Kim, In-Cheol
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.569-584
    • /
    • 2016
  • In this paper, we present a spatial knowledge extractor implemented in Hadoop MapReduce parallel, distributed computing environment. From a large spatial dataset, this knowledge extractor automatically derives a qualitative spatial knowledge base, which consists of both topological and directional relations on pairs of two spatial objects. By using R-tree index and range queries over a distributed spatial data file on HDFS, the MapReduce-enabled spatial knowledge extractor, MRSPAKE, can produce a web-scale spatial knowledge base in highly efficient way. In experiments with the well-known open spatial dataset, Open Street Map (OSM), the proposed web-scale spatial knowledge extractor, MRSPAKE, showed high performance and scalability.

A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models (심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 -)

  • Sung-Pil Choi
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.57 no.1
    • /
    • pp.93-114
    • /
    • 2023
  • Information extraction can facilitate the intensive analysis of documents by providing semantic triples which consist of named entities and their relations recognized in the texts. However, most of the research so far has been carried out separately for named entity recognition and relation extraction as individual studies, and as a result, the effective performance evaluation of the entire information extraction systems was not performed properly. This paper introduces two models of end-to-end information extraction that can extract various entity names in clinical records and their relationships in the form of semantic triples, namely pipeline and joint models and compares their performances in depth. The pipeline model consists of an entity recognition sub-system based on bidirectional GRU-CRFs and a relation extraction module using multiple encoding scheme, whereas the joint model was implemented with a single bidirectional GRU-CRFs equipped with multi-head labeling method. In the experiments using i2b2/VA 2010, the performance of the pipeline model was 5.5% (F-measure) higher. In addition, through a comparative experiment with existing state-of-the-art systems using large-scale neural language models and manually constructed features, the objective performance level of the end-to-end models implemented in this paper could be identified properly.

Relation Extraction based on Extended Composite Kernel using Flat Lexical Features (평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출)

  • Chai, Sung-Pil;Jeong, Chang-Hoo;Chai, Yun-Soo;Myaeng, Sung-Hyon
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.8
    • /
    • pp.642-652
    • /
    • 2009
  • In order to improve the performance of the existing relation extraction approaches, we propose a method for combining two pivotal concepts which play an important role in classifying semantic relationships between entities in text. Having built a composite kernel-based relation extraction system, which incorporates both entity features and syntactic structured information of relation instances, we define nine classes of lexical features and synthetically apply them to the system. Evaluation on the ACE RDC corpus shows that our approach boosts the effectiveness of the existing composite kernels in relation extraction. It also confirms that by integrating the three important features (entity features, syntactic structures and contextual lexical features), we can improve the performance of a relation extraction process.

An Experimental Study on the Relation Extraction from Biomedical Abstracts using Machine Learning (기계 학습을 이용한 바이오 분야 학술 문헌에서의 관계 추출에 대한 실험적 연구)

  • Choi, Sung-Pil
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.50 no.2
    • /
    • pp.309-336
    • /
    • 2016
  • This paper introduces a relation extraction system that can be used in identifying and classifying semantic relations between biomedical entities in scientific texts using machine learning methods such as Support Vector Machines (SVM). The suggested system includes many useful functions capable of extracting various linguistic features from sentences having a pair of biomedical entities and applying them into training relation extraction models for maximizing their performance. Three globally representative collections in biomedical domains were used in the experiments which demonstrate its superiority in various biomedical domains. As a result, it is most likely that the intensive experimental study conducted in this paper will provide meaningful foundations for research on bio-text analysis based on machine learning.