• 제목/요약/키워드: Semantic Mapping

검색결과 129건 처리시간 0.019초

관계형 데이터베이스 뷰 정의로부터 온톨로지 클래스와 계층 관계 생성 기법 (Generating Ontology Classes and Hierarchical Relationships from Relational Database View Definitions)

  • 양준석;김기성;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권6호
    • /
    • pp.333-342
    • /
    • 2010
  • 온톨로지는 시맨틱 웹을 구현하기 위해 중요한 역할을 하지만 이를 구축하는 작업은 많은 시간을 필요로 한다. 그러므로 기존 웹의 데이터 중 많은 양을 차지하고 있는 관계형 데이터베이스로부터 온톨로지를 자동으로 생성하는 연구들이 진행되고 있다. 기존의 연구들은 데이터베이스 스키마와 저장된 데이터 분석을 통한 온톨로지 생성에 대한 연구들이 주를 이룬다. 이러한 연구들은 데이터베이스 스키마 중 테이블과 제약조건만을 분석하여 온톨로지 스키마를 생성하며, 뷰 정의를 고려하지 않는다. 그러나 뷰는 데이터베이스 설계자가 데이터베이스를 사용하는 도메인을 고려하여 정의하므로, 뷰 정의를 고려할 경우 추가적인 클래스와 상하위 관계를 생성할 수 있다. 그리고 이렇게 생성된 클래스는 온툴로지에 대한 질의 처리와 통합에 유용하게 사용될 수 있다. 본 논문에서는 기존의 방법들을 분석하여 클래스와 상하위 관계 생성을 정형화하였으며, 뷰 정의를 분석하여 기존의 방법을 통해 생성된 온톨로지에 추가적인 클래스와 상하위 관계를 생성하는 방법을 제안한다. 또한 제안하는 방법을 이용해 예제 데이터베이스 스키마로부터 생성된 온톨로지의 결과 분석을 수행하고, 이를 통해 뷰 정의로부터 의미 있는 클래스와 상하위 관계가 추가적으로 생성되었음을 보인다.

시멘틱 웹 기반의 비교구매 에이전트를 위한 동적 웹 온톨로지에 대한 연구 (A Study of Dynamic Web Ontology for Comparison-shopping Agent based on Semantic Web)

  • 김수경;안기홍
    • 지능정보연구
    • /
    • 제11권2호
    • /
    • pp.31-45
    • /
    • 2005
  • 본 논문에서는 전자상거래 상점별로 상이하게 정의되고 표현되어 있는 디지털 캠코더에 대한 HTML 페이지의 상품 정보를 래퍼(Wrapper)기술을 이용하여 획득하고 이를 RDF 문서 변환기를 통해 RDF 트리플(triple)과 RDF 문서로 변환하여 디지털 캠코더에 대한 메타데이터 스키마를 설계한다. 설계된 메타데이터 스키마를 기반으로 OWL 웹 온톨로지로 변환하고 이를 관계형 데이터베이스로 구현된 디지털 캠코더(DC: Digital Camcoder) 도메인 온톨로지 저장소(Domain Ontology Repository)에 DCC 지식 베이스 온톨로지 (DCCKBO: DCC Knowledge Based Ontology)로 저장한다. 다음 각 상점의 RDF 트리플과 문서를 DCCKBO와 비교, 매핑 그리고 추론 과정을 통해 최적의 상품 구매 정보를 가진 상점의 DCC 정보를 구매자에게 제공하고, DCCKBO에 저장되어 있는 도메인 온톨로지를 최적의 상품 구매 정보의 내용으로 재 정의하는 동적 웹 온톨로지를 제안하고자 한다.

  • PDF

Small Sample Face Recognition Algorithm Based on Novel Siamese Network

  • Zhang, Jianming;Jin, Xiaokang;Liu, Yukai;Sangaiah, Arun Kumar;Wang, Jin
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1464-1479
    • /
    • 2018
  • In face recognition, sometimes the number of available training samples for single category is insufficient. Therefore, the performances of models trained by convolutional neural network are not ideal. The small sample face recognition algorithm based on novel Siamese network is proposed in this paper, which doesn't need rich samples for training. The algorithm designs and realizes a new Siamese network model, SiameseFacel, which uses pairs of face images as inputs and maps them to target space so that the $L_2$ norm distance in target space can represent the semantic distance in input space. The mapping is represented by the neural network in supervised learning. Moreover, a more lightweight Siamese network model, SiameseFace2, is designed to reduce the network parameters without losing accuracy. We also present a new method to generate training data and expand the number of training samples for single category in AR and labeled faces in the wild (LFW) datasets, which improves the recognition accuracy of the models. Four loss functions are adopted to carry out experiments on AR and LFW datasets. The results show that the contrastive loss function combined with new Siamese network model in this paper can effectively improve the accuracy of face recognition.

AANet: Adjacency auxiliary network for salient object detection

  • Li, Xialu;Cui, Ziguan;Gan, Zongliang;Tang, Guijin;Liu, Feng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3729-3749
    • /
    • 2021
  • At present, deep convolution network-based salient object detection (SOD) has achieved impressive performance. However, it is still a challenging problem to make full use of the multi-scale information of the extracted features and which appropriate feature fusion method is adopted to process feature mapping. In this paper, we propose a new adjacency auxiliary network (AANet) based on multi-scale feature fusion for SOD. Firstly, we design the parallel connection feature enhancement module (PFEM) for each layer of feature extraction, which improves the feature density by connecting different dilated convolution branches in parallel, and add channel attention flow to fully extract the context information of features. Then the adjacent layer features with close degree of abstraction but different characteristic properties are fused through the adjacent auxiliary module (AAM) to eliminate the ambiguity and noise of the features. Besides, in order to refine the features effectively to get more accurate object boundaries, we design adjacency decoder (AAM_D) based on adjacency auxiliary module (AAM), which concatenates the features of adjacent layers, extracts their spatial attention, and then combines them with the output of AAM. The outputs of AAM_D features with semantic information and spatial detail obtained from each feature are used as salient prediction maps for multi-level feature joint supervising. Experiment results on six benchmark SOD datasets demonstrate that the proposed method outperforms similar previous methods.

Generating Radiology Reports via Multi-feature Optimization Transformer

  • Rui Wang;Rong Hua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2768-2787
    • /
    • 2023
  • As an important research direction of the application of computer science in the medical field, the automatic generation technology of radiology report has attracted wide attention in the academic community. Because the proportion of normal regions in radiology images is much larger than that of abnormal regions, words describing diseases are often masked by other words, resulting in significant feature loss during the calculation process, which affects the quality of generated reports. In addition, the huge difference between visual features and semantic features causes traditional multi-modal fusion method to fail to generate long narrative structures consisting of multiple sentences, which are required for medical reports. To address these challenges, we propose a multi-feature optimization Transformer (MFOT) for generating radiology reports. In detail, a multi-dimensional mapping attention (MDMA) module is designed to encode the visual grid features from different dimensions to reduce the loss of primary features in the encoding process; a feature pre-fusion (FP) module is constructed to enhance the interaction ability between multi-modal features, so as to generate a reasonably structured radiology report; a detail enhanced attention (DEA) module is proposed to enhance the extraction and utilization of key features and reduce the loss of key features. In conclusion, we evaluate the performance of our proposed model against prevailing mainstream models by utilizing widely-recognized radiology report datasets, namely IU X-Ray and MIMIC-CXR. The experimental outcomes demonstrate that our model achieves SOTA performance on both datasets, compared with the base model, the average improvement of six key indicators is 19.9% and 18.0% respectively. These findings substantiate the efficacy of our model in the domain of automated radiology report generation.

메타데이터 상호운용성을 위한 기록관리 메타데이터 표준 분석 5W1H와 태스크 모델의 관점에서 (Analysis of Metadata Standards of Record Management for Metadata Interoperability From the viewpoint of the Task model and 5W1H)

  • 백재은;스기모토 시게오
    • 기록학연구
    • /
    • 제32호
    • /
    • pp.127-176
    • /
    • 2012
  • 메타데이터 표준규격(이하 메타데이터 표준으로 기재)은 디지털 자원(Digital resource)의 장기보존 및 디지털 아카이브를 위해 필요한 기본 요소 중 하나로, 이는 현대 정보사회에서 중요한 요소로 잘 알려져 있다. 자원(Resource)의 기록관리와 아카이브, 장기보존을 위한 메타데이터 표준은 다양하며, AGRkMS, EAD, ISAD(G), OAIS, PREMIS5) 등이 이용되고 있다. 우리는 아카이브 시스템의 메타데이터 표준을 디자인하기 위해 목적에 따른 메타데이터 표준을 선택하고 맞춤화(Customization)하지 않으면 안 된다. 한편으로, 다른 시스템의 메타데이터 스키마와의 상호운용성(Interoperability)에 대한 고찰도 실시하지 않으면 안 된다. 이전 연구에서, 우리는 기록 생애 주기(Records lifecycle)라는 관점으로부터 메타데이터 표준의 특성에 대해 분석을 실시하였다. 이로 인해, 각 메타데이터 표준 요소가 해당하는 기록 생애 주기의 처음 단계를 확인할 수 있었고, 아카이브 혹은 보존을 위해서는 하나의 메타데이터 표준만으로 기록 생애 주기 전체를 포괄할 수 없다는 것을 보여 주었다. 우리는 이 분석을 통해서 기록 생애 주기의 단계와 메타데이터 표준간의 관계, 기록 생애 주기 전체에서의 메타데이터 특성은 볼 수 있었으나, 보다 상세한 분석을 실시하는 것은 앞으로의 과제로 남겨두었다. 지금까지의 연구에 근거하여, 본 논문은 기록 생애 주기의 관점에서 디지털 아카이브와 보존, 기록관리를 위한 메타데이터 표준의 특징 분석을 위해, 기록 생애 주기 안에서 실행되는 업무의 관점으로부터 메타데이터 스키마를 재 파악하고 분석하였다. 지금까지 메타데이터 스키마는 기술대상이 되는 자원을 중심으로 정의되었기 때문에 기록 생애 주기 전체와 생애 주기 안의 각 단계에서 이용되는 메타데이터 표준간의 매핑을 위한 적절한 방법이 없었다. 이에 본 논문에서는 각기 다른 메타데이터 표준의 기술 요소를, 기록 생애 주기에 포함시키는 업무와 연결시키는 것으로 메타데이터 표준간의 매핑 방법을 제안한다. 본 연구에서는 메타데이터 표준 분석을 위한 프레임워크(Framework)로, 기록 생애 주기를 이용하여 작성한 자원의 업무중심 모델, 즉 태스크 모델(Task Model)을 제안한다. 태스크 모델을 이용함에 있어서 업무를 실행하는 '이벤트(Event)'의 관점을 보다 명확하게 할 수 있다. 한편, 업무를 중심으로 기술 요소간의 매핑을 보다 효율적으로 실시하기 위해서는 요소를 카테고리 화하여 매핑의 대상 범위를 좁히는 것이 중요하다. 이를 위해 우리는 범용성을 가진 5W1H모델(Who, What, Why, When, Where, How)을 이용하여, 기술 요소를 카테고리 화 하는 것을 제안한다. 그리고 태스크 모델과 5W1H 모델을 이용하여 메타데이터 표준 요소에 특징을 부여하고, 요소 간의 매핑을 실시하여 표준 간 관계를 확인하였다. 태스크 모델은 기록 생애 주기 전체에 업무의 관점을 반영한 것으로, 이 모델을 이용함으로써 기록 생애 주기와 그 안의 각 업무에 대한 메타데이터 표준의 사용, 그리고 특징 분석을 위해 실시되는 기술 요소간의 매핑이 가능할 수 있었다. 또한, 5W1H 카테고리를 이용하여 업무와 자원에 관련되는 기술 요소간의 관계를 살펴보는 것으로, 관계가 명확해지는 것과 함께 조사대상을 좁히는 것이 가능하게 되었다. 이 프레임워크의 제안과 이용으로 우리는 특징 분석을 위해 실시되는 매핑 혹은 분류가 단순한 일반적인 매핑이 아닌 의미적인 분류를 할 수 있었다. 본 연구에서는 이 모델들을 이용하여, 메타데이터 표준간의 크로스워크를 정의하였다. 그리고 태스크 모델의 각 단계의 문맥 내에서 메타데이터 기술 요소의 특성을 매핑 예로 확인하고, 이를 바탕으로 하여 프레임워크에 대해 고찰하였다.

온톨로지 기반의 수강지도 시스템 (Ontology-based Course Mentoring System)

  • 오경진;윤의녕;조근식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.149-162
    • /
    • 2014
  • 수강지도는 학생의 졸업인증이나 공학교육인증 이수를 위해 수강 신청 이전에 수행되는 과정을 지칭한다. 수강지도는 학생의 수강이력 점검과 향후 수강 과목의 안내 등을 포함하여 학생들의 졸업 및 교과과정 인증과 관련된 중요한 역할을 하고 있다. 현재 대부분 대학에서는 수강지도를 위한 전산시스템의 부재로 인해 지도교수가 직접 수동적으로 수강지도를 진행하고 있다. 하지만 이러한 수동적인 방식의 수강지도는 지도교수가 각 학생에 대한 정보를 분석해야 하고, 때때로 휴먼에러를 일으키게 된다. 수강신청이 학기 단위로 이루어지기 때문에 휴먼에러로부터 발생된 피해는 원상태로 되돌리는 것이 거의 불가능하다. 따라서 수강지도를 진행함에 있어 자동화된 시스템은 필수적인 요소로 판단된다. 관계 데이터 모델을 이용한 수강지도 시스템의 도입은 수동적인 수강지도의 문제점을 해결할 수 있게 해준다. 하지만 교육과정 및 인증제도의 변화에 따라 기존 시스템의 스키마 변경이 요구되고, 수강 과목 사이에 존재하는 관계 및 의미적인 검색을 제공하는 것이 어렵다는 한계가 존재한다. 본 논문에서는 수강지도 시스템을 위한 수강지도 온톨로지를 모델링하고, 온톨로지 기반의 수강지도 시스템을 설계한다. 온톨로지 인스턴스 생성을 위해 JENA 프레임워크를 이용하여 온톨로지 생성 모듈을 개발하였고, 실험에 참가한 학생의 수강 이력 데이터를 기반으로 온톨로지 인스턴스를 생성하고 추론과정을 통해 트리플 저장소에 저장하였다. 실험은 제안하는 시스템이 학생들이 향후 수강할 수 있는 과목을 모두 제공하는지 여부와 제공되는 과목에 대한 정보 및 학점 계산들이 정확한 지를 측정하였다. 실제 학생의 수강내역을 이용한 실험의 결과는 온톨로지 기반의 수강지도 시스템이 현 수강지도 시스템의 수동적 방법을 해결하고, 사람이 지도한 내용과 같은 내용을 도출하는 것을 확인함으로써 제안하는 시스템의 유효성을 보여준다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

단순 RDF 메시지의 온톨로지 상호 운용성을 위한 변환 규칙들의 연쇄 조합 (Cascade Composition of Translation Rules for the Ontology Interoperability of Simple RDF Message)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.528-545
    • /
    • 2007
  • 최근 모바일과 유비쿼터스 컴퓨팅에서 보다 지능적인 다양한 서비스를 제공하고자 하는 비즈니스 전략과 함께 온톨로지 기술이 큰 관심이 되고 있다. 온톨로지를 이용하는 응용 도메인에서의 본질적 문제점은 모든 영역 구성원, 에이전트, 응용 프로그램이 온톨로지에서 정의된 동일 개념을 공유해야 하는 것이다. 하지만, 다양한 제조업자에 의해서 만들어지는 다양한 모바일 디바이스, 센싱 디바이스, 네트워크 구성요소, 다양한 통신 사업자, 다양한 서비스 제공업자 들이 모여 이루어지는 모바일과 유비쿼터스 컴퓨팅 환경에서는 서로 상이한 온톨로지가 공존할 가능성이 높다. 이러한 의미적 상호 운용성의 문제를 해결하고자 했던 다수의 연구가 있다. 이를 크게 분류하면, 맵핑, 합병, 변환에 의한 방법들이다. 본 연구에서는 이러한 방법들 중 OntoMorph와 같이 상이한 온톨로지 데이타들 간에 변환 규칙을 직접 작성하여 사용하는 방법에 초점을 맞춘다. 하지만 이러한 변환 규칙을 수작업으로 직접 작성하는 방법은, 그 자체도 어려울뿐더러 N개의 온톨로지가 존재할 경우 최악의 경우 $O(N^2)$의 변환 규칙 작성 복잡도를 갖는다. 따라서 본 논문에서는 이러한 복잡도를 개선하기 위한, 웹의 개방성에 근거한 연쇄 조합 변환 규칙 생성의 개념을 소개한다. 연구 성과는 변환 규칙의 변환의 신속성, 변환의 적합성, 변환 규칙 작성의 용이성 등의 중요한 평가 요소를 도출할 수 있었으며, 몇 가지 실험 및 기존 연구와의 비교 분석을 통하여 제안된 방법이 신속성과 정확성을 보장하면서 보다 높은 용이성을 가짐을 확인할 수 있었다.

UML 및 OCL을 이용한 서비스 온톨로지 설계 방안에 관한 연구 (Study Service Ontology Design Scheme Using UML and OCL)

  • 이윤수;정인정
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.627-636
    • /
    • 2005
  • 지능형 웹 서비스는 시맨틱 웹과 에이전트 기술을 통하여 자동적인 서비스의 발견, 호출, 조합 및 상호운영, 실행 감시 및 복구를 수행하기 위한 목적으로 제안되었다. 이러한 지능형 웹 서비스의 목적을 실현하기 위해서는 컴퓨터가 지식을 추론하고 처리할 수 있게 하기 위한 온톨로지가 필수적으로 요구된다. 그러나 현재 지능형 웹 서비스를 위한 서비스 온톨로지의 생성은 서비스 개발자의 휴리스틱에 의존하여 많은 시간과 비용을 소모할 뿐만 아니라 서비스와 서비스 온톨로지간의 완벽한 매핑이 어렵다는 문제점을 가지고 있다. 또한 서비스 온톨로지를 기술하기 위한 마크업 언어를 서비스 개발자가 단기간 내에 학습하기에 많은 어려움이 있는 실정이다. 본 논문에서는 이러한 문제점들을 해결하기 위해 MDA 방법론을 사용하여 서비스 온톨로지를 효율적으로 설계 및 생성하기 위한 방안을 제안한다. 우리가 제안하는 방안은 MDA를 기반으로 UML을 사용하여 웹 서비스 모델을 설계하고 구축하는 과정에서 생성되는 모델을 재사용 한다. 즉, 플랫폼 독립적인 웹 서비스 모델을 서비스 온톨로지 기술 언어인 OWL-S에 종속적인 모델로 변환한 후 XMI를 통해 OWL-S 서비스 온톨로지로 변환한다. 본 논문에서 제안하는 방안은 이미 널리 사용되는 UML과 같은 소프트웨어 공학적 방법을 사용하기 때문에 서비스 개발자들이 쉽게 서비스 온톨로지를 구축할 수 있으며 하나의 모델로부터 서비스와 서비스 온톨로지 모델을 동시에 이끌어 낼 수 있는 장점을 가진다. 또한 모델로부터 자동적으로 서비스 온톨로지를 생성함으로써 시간과 비용을 절감할 수 있는 효과를 얻을 수 있다. 그리고 플랫폼 변화와 같은 외부 환경 변화에 유연하게 대처할 수 있다. 끝으로 본 논문에서는 제안된 방안의 타당성을 검증하기 위해 실제로 웹 서비스 모델을 설계하고 서비스 온톨로지를 생성하는 예를 보인다. 또한 생성된 서비스 온톨로지가 올바르게 생성되었는지를 유효성 검사를 통해 검증한다.