• 제목/요약/키워드: Semantic Classification

검색결과 329건 처리시간 0.107초

시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구 (A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel)

  • 최성필;정창후;전홍우;조현양
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.251-275
    • /
    • 2011
  • 본 논문에서는 단백질 간 상호작용 자동 추출을 위해서 기존에 연구되어 높은 성능을 나타낸 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존 구문 트리 커널의 문제점은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대한 단순 외형적 비교로 인해, 실제 의미적으로는 유사한 두 구문 트리의 커널 값이 상대적으로 낮아지는 현상이며 결국 상호작용 자동 추출의 전체 성능에 악영향을 줄 수 있다는 점이다. 본 논문에서는 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 어휘 의미적 유사도 계산을 위해서 문맥 및 워드넷 기반의 어휘 중의성 해소 시스템과 이 시스템의 출력으로 도출되는 어휘 개념(WordNet synset)의 추상화를 통한 기존 커널의 확장을 시도하였다. 실험에서는 단백질 간 상호작용 추출(PPII, PPIC) 성능의 심층적 최적화를 위해서 기존의 SVM에서 지원되던 정규화 매개변수 외에 구문 트리 커널의 소멸인자와 시맨틱 구문 트리 커널의 어휘 추상화 인자를 새롭게 도입하였다. 이를 통해 구문 트리 커널을 적용함에 있어서 소멸인자 역할의 중요성을 확인할 수 있었고, 시맨틱 구문 트리 커널이 기존 시스템의 성능향상에 도움을 줄 수 있음을 실험적으로 보여주었다. 특히 단백질 간 상호작용식별 문제보다도 비교적 난이도가 높은 상호작용 분류에 더욱 효과적임을 알 수 있었다.

온톨로지 통합 분류와 온톨로지 기반의 PLM Object 의미적 통합 (Classification of Ontology Integration and Ontology-based Semantic Integration of PLM Object)

  • 곽정애;용환승;최상수
    • 한국CDE학회논문집
    • /
    • 제13권3호
    • /
    • pp.163-174
    • /
    • 2008
  • In this paper, for integrating of data on car parts we model information of parts that PDM system manages. Ontology of car parts applies existing ontology mapping research to integrate into car ontology. We propose a method for semantic integration of PLM object of MEMPHIS based on the integrated ontology. Through our method, we introduce C# ontology model to apply existing C# applications with ontology. We also classify ontology integration into three through examples and explain them. While semantically integrating PLM objects based on the integrated ontology, we explain the need for change of PLM object type and describe the process of change for PLM object type by examples.

파일명의 의미 클러스터링에 의한 윈도우 시소러스 WTPM 설계와 구현 (Design and Implementation of The Windows Thesaurus WTPM using Filename of Semantics Clustering)

  • 김만필;차홍준
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.73-79
    • /
    • 2009
  • 객체지향 프로그래밍 언어를 기반으로 윈도우 사용자의 컴퓨터 파일시스템에 기록된 파일의 의미를 분석한 후, 이를 사용자 편의를 위해 파일명의 의미를 시소러스로 클러스터링 하는 설계를 하고, 파일로 기록된 문자의 의미와 파일확장자를 기반으로, 데이터베이스를 구성하고 참조하여 사용자 작성 파일들을 시소러스의 의미 체계와 통제어로 클러스터링 하여, 윈도우시스템의 화면표시 되는 Icon 파일들을 자동으로 분리하고, 설정하여, Mashup 시각구조로 나타내어 주는 프로세스(WTPM)를 설계하고 구현을 하였다.

  • PDF

시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성 (Automatic Generation of RDF Metadata for Semantic Search in Semantic Web)

  • 강상구;양재영;양승섭;최원종;최중민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

회의공지에서 회의장소를 나타내는 문자열의 지도상 실제 위치 추정 시스템 (A system for finding actual location on the map from the meeting location text in the meeting announcement)

  • 김경렬;최동현;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.255-257
    • /
    • 2011
  • 본 연구에서는 각종 웹사이트와 이메일을 통해 전달되는 회의공지에 포함된 회의장소를 나타내는 문자열로부터 실제 위치를 추정하는 시스템을 설계 및 구현하였다. 직접 구현한 NER과 Relation-type Classification 모듈을 사용하였으며, 장소에 대한 모델은 기존의 지리정보시스템들과의 상호 운용성을 위하여 OpenStreetMap[6]과 Geonames[7]의 데이터 구조를 참조하여 설계되었고, 실제 위치를 구하기 위하여 내부자원 외에도, 각종 오픈API들을 외부자원으로 활용하였다.

의미분석 지식베이스를 위한 SENKOV 시스템의 구현 (Implementation of SENKOV System: A Knowledge Base for Semantic Analysis)

  • 문유진
    • 경영정보학연구
    • /
    • 제2권2호
    • /
    • pp.245-253
    • /
    • 2000
  • The paper presents methodology and techniques for design and implementation of the SENKOV System based on the validation of set membership and dictionaries. And it performs verb concept classification available for establishing the selectional restriction relationships among adverbs and verbs. The paper is important in that it has made the first attempt at classifying Korean verb concepts for the semantic analysis. We select about 600 Korean verbs which are commonly used in the daily life, and implements the SENKOV System. According to results of the experiments, SENKOV has 44 top nodes and depth of average 2.35, and that it can be utilized to classify Korean verb concept for the selectional restrictions among adverbs and verbs.

  • PDF

Semantic-based Mashup Platform for Contents Convergence

  • Yongju Lee;Hongzhou Duan;Yuxiang Sun
    • International journal of advanced smart convergence
    • /
    • 제12권2호
    • /
    • pp.34-46
    • /
    • 2023
  • A growing number of large scale knowledge graphs raises several issues how knowledge graph data can be organized, discovered, and integrated efficiently. We present a novel semantic-based mashup platform for contents convergence which consists of acquisition, RDF storage, ontology learning, and mashup subsystems. This platform servers a basis for developing other more sophisticated applications required in the area of knowledge big data. Moreover, this paper proposes an entity matching method using graph convolutional network techniques as a preliminary work for automatic classification and discovery on knowledge big data. Using real DBP15K and SRPRS datasets, the performance of our method is compared with some existing entity matching methods. The experimental results show that the proposed method outperforms existing methods due to its ability to increase accuracy and reduce training time.

A Study on the Land Cover Classification and Cross Validation of AI-based Aerial Photograph

  • Lee, Seong-Hyeok;Myeong, Soojeong;Yoon, Donghyeon;Lee, Moung-Jin
    • 대한원격탐사학회지
    • /
    • 제38권4호
    • /
    • pp.395-409
    • /
    • 2022
  • The purpose of this study is to evaluate the classification performance and applicability when land cover datasets constructed for AI training are cross validation to other areas. For study areas, Gyeongsang-do and Jeolla-do in South Korea were selected as cross validation areas, and training datasets were obtained from AI-Hub. The obtained datasets were applied to the U-Net algorithm, a semantic segmentation algorithm, for each region, and the accuracy was evaluated by applying them to the same and other test areas. There was a difference of about 13-15% in overall classification accuracy between the same and other areas. For rice field, fields and buildings, higher accuracy was shown in the Jeolla-do test areas. For roads, higher accuracy was shown in the Gyeongsang-do test areas. In terms of the difference in accuracy by weight, the result of applying the weights of Gyeongsang-do showed high accuracy for forests, while that of applying the weights of Jeolla-do showed high accuracy for dry fields. The result of land cover classification, it was found that there is a difference in classification performance of existing datasets depending on area. When constructing land cover map for AI training, it is expected that higher quality datasets can be constructed by reflecting the characteristics of various areas. This study is highly scalable from two perspectives. First, it is to apply satellite images to AI study and to the field of land cover. Second, it is expanded based on satellite images and it is possible to use a large scale area and difficult to access.

A Semantic Classification Model for e-Catalogs

  • Kim, Dong-Kyu;Lee, Sang-Goo;Chun, Jong-Hoon
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2004년도 e-Biz World Conference
    • /
    • pp.302-309
    • /
    • 2004
  • ·Catalogs -information about products and services -Contents + Classification Schema + Operational Issues ·What do we do with them? -[Schulten, et a;, 2001] ‥Narrow down search for complete set of applicable products ‥Comprehend individual description to the precision needed -Support other applications that use product information ‥SCM, ERP, e-Procurement, etc. ·Catalog Management System -Design, storage, navigation & retrieval, transformation, communication, publication(omitted)

  • PDF

A Muti-Resolution Approach to Restaurant Named Entity Recognition in Korean Web

  • Kang, Bo-Yeong;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권4호
    • /
    • pp.277-284
    • /
    • 2012
  • Named entity recognition (NER) technique can play a crucial role in extracting information from the web. While NER systems with relatively high performances have been developed based on careful manipulation of terms with a statistical model, term mismatches often degrade the performance of such systems because the strings of all the candidate entities are not known a priori. Despite the importance of lexical-level term mismatches for NER systems, however, most NER approaches developed to date utilize only the term string itself and simple term-level features, and do not exploit the semantic features of terms which can handle the variations of terms effectively. As a solution to this problem, here we propose to match the semantic concepts of term units in restaurant named entities (NEs), where these units are automatically generated from multiple resolutions of a semantic tree. As a test experiment, we applied our restaurant NER scheme to 49,153 nouns in Korean restaurant web pages. Our scheme achieved an average accuracy of 87.89% when applied to test data, which was considerably better than the 78.70% accuracy obtained using the baseline system.