• 제목/요약/키워드: Semantic Constraints

검색결과 83건 처리시간 0.03초

DTD의 의미 구조 분석을 이용한 XML 문서의 변환 (A Transformation of XML Documents With Semantic Constraints)

  • 곽동규;최종명;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.589.2-861
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서를 다른 XML 어플리케이션에서 재 사용하여 사용자에게 동일한 정보를 제공하는데 있다 XML 문서는 어플리케이션 특성에 따라 한 문서에서 전달할 수 있는 정보의 량이 다르다. 따라서 문서를 변환하기 전에 어플리케이션의 특성에 따라 문서를 분할하거나 병합하여야 한다[1]. 또한, XML 문서의 정보는 속성에 따라 문법적인 특성을 가진다. 본 논문은 문벌적인 특성을 의미 속성이라 하고 의미 속성을 파악하기 위해 XML 문서의 의미 구조와 의미 구조 관계를 정의한다. 그리고 정의된 의미 구조와 의에 구조 관계를 이용하여 문서 정보의 속성을 분류하는 방법을 제안한다. 변환 규칙은 의ロP 구조 관계가 유사한 엘리먼트간의 대응으로 정의하고, 변환 규칙을 이용하여 문서 변환을 실행하여 변환 XML과 의미 관계 구조가 유사한 피 변환 XML 문서를 생성한다. 의미구조 분석을 이용한 변환은 기존의 사용 패턴을 분석한 변환에서 벗어나 DTD의 분석을 통한 자동화된 문서 변환 방법을 제공한다.

  • PDF

효율적인 릴레이션 생성과 제약조건 보존을 위한 새로운 Inlining 기법 (New Inlining Method for Effective Creation of Relations and Preservation of Constraints)

  • 안성철;김영웅
    • 한국멀티미디어학회논문지
    • /
    • 제9권7호
    • /
    • pp.773-781
    • /
    • 2006
  • XML (eXtensible Markup Language)은 웹 상의 데이터를 표현하고, 교환하기 위한 표준 언어로써, XML로 표현된 문서를 관계형 데이터베이스 관리시스템(RDBMS)에 저장하고 관리하는 기법에 대한 연구가 활발히 진행되어 왔다. 이러한 연구들은 입력으로 DTD(Document Type Definition) 문서를 받는 기법을 사용하고, 그것으로부터 관계형 스키마를 추론하는 기법을 사용한다. 하지만, 기존의 연구들은 DTD 간소화 절차 때문에 semantic 보존을 고려하지 않는다. 더 나아가서, 기존의 연구들은 XML 데이터의 내용(content)와 구조(structure) 정보만을 저장하는데 초점이 맞춰져 있기 때문에, XML문서 저장 시 데이터의 무결성을 보장하기 위해 저장 프로시져나 트리거를 사용해야 하는 번로움이 생긴다. 본 논문에서는 [1]의 연구에서 제시한 Inlining 기법을 기반으로 기존의 Inlining 기법의 문제점인 DTD에서 추론할 수 있는 의미적인 정보의 손실을 관계형 스키마로 보존하는 방법과 효율적인 릴레이션 생성을 위해 개선된 Inlining 기법을 제시한다.

  • PDF

헬스케어 서비스를 위한 푸드 온톨로지 모델 (Food Ontology Model for a Healthcare Service)

  • 이병문
    • 한국산업정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.31-40
    • /
    • 2012
  • 유비쿼터스 정보기술이 의료서비스와 융합되면서 자가 건강관리에 필요한 다양한 형태의 콘텐츠에도 영향을 주고 있다. 특히 웹과 모바일 환경의 빠른 변화로 다량의 헬스케어 콘텐츠가 예상되기 때문에 검색의 효율성이 중요하다. 더구나 콘텐츠의 개인 맞춤형은 더 세밀하고 필요하며 단순한 키워드 중심의 검색방식에서도 환자 또는 사용자 요구와 특성에 맞도록 효율적인 검색방식이 필요하다. 따라서 콘텐츠의 의미를 시스템이 빠르게 이해할 수 있도록 정확한 시맨틱 검색이 필요하며 이를 위한 헬스케어 온톨로지를 모델링은 매우 의미 있다. 따라서 본 연구에서는 Protege 툴을 활용하여 헬스케어 콘텐츠 중 음식(Food) 클래스와 하위 클래스를 설계하고 각 클래스에 대한 제약조건 및 관계를 정의하여 실제 시스템에서 활용할 수 있는 시스템도 모델링하였다. 이렇게 모델링된 헬스케어 콘텐츠 온톨로지는 환자나 사용자들에게 원하는 정보를 신속하고 정확하게 검색할 수 있는 기반을 제공해준다.

개인화 된 웹 네비게이션을 위한 온톨로지 기반 추천 에이전트 (An Ontology-based Recommendation Agent for Personalized Web Navigation)

  • 정현섭;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.40-50
    • /
    • 2003
  • 온톨로지(ontology)란 객체(object)들과 이들 사이의 관계의 정의에 의하여 어떤 사실이나 상태를 표하는 지식 표현 방법이다. 본 논문에서는 온톨로지를 이용한 웹 문서 분류와 이를 바탕으로 사용자의 정보 요구에 대한 개인화 된 정보를 제공하는 에이전트를 제안한다. 에이전트는 웹 문서들이 가지는 의미 구조를 계층적 형태로 표현한 온톨로지를 바탕으로 웹 문서를 분류하게 된다. 본 논문에서 온톨로지는 개념(concept)과 개념에 대한 특징(feature), 개념간의 관계(relation) 그리고 문서 분류를 위한 제약조건(constraint)으로 이루어진다. 에이전트는 사용자 프로파일과 문서 식별의 결과를 이용하여 사용자의 정보 요구를 효율적으로 파악하고 사용자의 브라우징을 돕게된다. 또한 에이전트는 선행탐색(look-ahead)방법을 통해 문서를 획득 문서를 개념으로 표현함으로써 사용자가 좀더 이해하기 쉬운 상위 단계의 윈 문서를 추천하게 된다.

Issues and Challenges in the Extraction and Mapping of Linked Open Data Resources with Recommender Systems Datasets

  • Nawi, Rosmamalmi Mat;Noah, Shahrul Azman Mohd;Zakaria, Lailatul Qadri
    • Journal of Information Science Theory and Practice
    • /
    • 제9권2호
    • /
    • pp.66-82
    • /
    • 2021
  • Recommender Systems have gained immense popularity due to their capability of dealing with a massive amount of information in various domains. They are considered information filtering systems that make predictions or recommendations to users based on their interests and preferences. The more recent technology, Linked Open Data (LOD), has been introduced, and a vast amount of Resource Description Framework data have been published in freely accessible datasets. These datasets are connected to form the so-called LOD cloud. The need for semantic data representation has been identified as one of the next challenges in Recommender Systems. In a LOD-enabled recommendation framework where domain awareness plays a key role, the semantic information provided in the LOD can be exploited. However, dealing with a big chunk of the data from the LOD cloud and its integration with any domain datasets remains a challenge due to various issues, such as resource constraints and broken links. This paper presents the challenges of interconnecting and extracting the DBpedia data with the MovieLens 1 Million dataset. This study demonstrates how LOD can be a vital yet rich source of content knowledge that helps recommender systems address the issues of data sparsity and insufficient content analysis. Based on the challenges, we proposed a few alternatives and solutions to some of the challenges.

상품 데이터베이스의 동적 특성을 지원하는 분류 모형 (A Classification Model Supporting Dynamic Features of Product Databases)

  • 김동규;이상구;최동훈
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.165-178
    • /
    • 2005
  • 상품 분류체계는 상품 데이터베이스를 설계하는 토대이며 전자상거래에서 상품 정보의 관리 및 활용에 관한 거의 모든 면에서 중심적 역할을 한다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eCl@ss와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 상품 정보는 재료, 시간, 장소 통의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 이 논문에서는 상품 데이터베이스의 동적 특성 및 이에 대한 기존 코드 기반 분류 체계의 한계점을 분석하고, [1]에서 제안된 의미적 분류 모형이 상품 데이터베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스 간의 관계를 그래프로 구성한다.

XML 스키마의 의미 구조 분석을 이용한 XML문서의 변환 (A Transformation of XML Documents with Semantic Constraints using XML Schema)

  • 곽동규;박호병;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.592-594
    • /
    • 2005
  • XML은 현재 어플리케이션에서 데이터를 저장하는 W3C 표준으로 많은 응용 분야에서 사용되고 있다. 어떤 응용 프로그램에서 사용하던 기존의 XML문서를 다른 응용 프로그램에서 재사용하기 위해서는 변환 XML 문서가 가지고 있는 정보와 구조의 손실 없이 피 변환 XML의 구조에 합당하게 변환해야 한다. XML 문서 정보의 의미는 엘리먼트를 통해 표현되는데 자동으로 분석하여 변환에 적용하기 어렵다. 그러나 XML 문서는 DTD나 XML 스키마와 같은 구조적 정보를 가지고 있고 XML의 구조 정보는 엘리먼트에 속성을 표현한다. 이에 착안하여 DTD의 의미정보를 분석하여 XML 문서의 변환에 적용하는 방법이 제안되었다. 하지만 DTD는 지원하는 데이터 형식이 한정되어 있고 엘리먼트의 반복 속성도 제안되어 있다. 본 논문은 XML의 엘리먼트 정보를 분석하기 위해서 XML 스키마를 사용한다. XML 스키마는 기존에 DTD보다 다수의 데이터 타일과 엘리먼트의 반복적 속성을 다양하게 제공하고 있다. 그러므로 기존 방법보다 더 많은 정보를 변환에 적용할 수 있는 장점을 가지고 있다. 제안하는 시스템은 한번 작성한 XML 문서를 다른 XML 어플리케이션에서 재사용함으로써 XML 문서 제작성에 따른 비용을 절감할 것으로 기대된다.

  • PDF

Icefex: Protocol Format Extraction from IL-based Concolic Execution

  • Pan, Fan;Wu, Li-Fa;Hong, Zheng;Li, Hua-Bo;Lai, Hai-Guang;Zheng, Chen-Hui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권3호
    • /
    • pp.576-599
    • /
    • 2013
  • Protocol reverse engineering is useful for many security applications, including intelligent fuzzing, intrusion detection and fingerprint generation. Since manual reverse engineering is a time-consuming and tedious process, a number of automatic techniques have been proposed. However, the accuracy of these techniques is limited due to the complexity of binary instructions, and the derived formats have missed constraints that are critical for security applications. In this paper, we propose a new approach for protocol format extraction. Our approach reasons about only the evaluation behavior of a program on the input message from concolic execution, and enables field identification and constraint inference with high accuracy. Moreover, it performs binary analysis with low complexity by reducing modern instruction sets to BIL, a small, well-specified and architecture-independent language. We have implemented our approach into a system called Icefex and evaluated it over real-world implementations of DNS, eDonkey, FTP, HTTP and McAfee ePO protocols. Experimental results show that our approach is more accurate and effective at extracting protocol formats than other approaches.

토픽 분할에 의한 토픽맵 매칭 및 통합 기법 (Topic maps Matching and Merging Techniques based on Partitioning of Topics)

  • 김정민;정현숙
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.819-828
    • /
    • 2007
  • 본 논문에서는 토픽맵의 모델 특성을 고려한 토픽맵 매칭 및 통합 기법을 제안한다. 이전까지의 대부분의 스키마 매칭 연구들은 계산 시간의 효율성을 고려하지 않고 매칭 기법의 범용성 및 정확성을 높이기 위한 목적으로 개발되어 왔다. 그러나 현재 표준적인 온톨로지 언어로 RDF/OWL과 토픽맵이 사용되고 있으며 앞으로 많은 온톨로지들이 이들 언어로 구현될 것이다. 따라서 본 논문에서는 토픽맵 데이터 모델의 구조적 특성 및 제약조건을 고려하여 토픽 분할, 토픽명기반 매칭연산, 속성기반 매칭연산, 계층구조기반 매칭연산, 연관관계기반 매칭연산 및 통합 알고리즘을 개발함으로써 효과적이면서 효율적인 토픽맵 매칭 및 통합이 가능함을 보인다.

전자 카탈로그를 위한 의미적 분류 모형 (A Semantic Classification Model for e-Catalogs)

  • 김동규;이상구;전종훈;최동훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.102-116
    • /
    • 2006
  • 전자 카탈로그는 시장 참여자들이 제공하는 상품과 서비스에 대한 정보를 가지고 있으며 결과적으로 전자 상거래의 근간을 형성하고 있다. 카탈로그의 관리는 여러 가지 요소에 의해 복잡해지는데, 상품 분류는 이들의 핵심 요소이다. 분류 계층 구조는 지출 분석, 관세 규제의 실행, 상품의 식별 등을 위해 활용된다. 이와 같이 상품 분류 체계는 상품 데이타베이스의 설계에 토대가 되고, 상품 정보의 활용 및 관리의 거의 모든 면에서 중심적 역할을 한다. 그러나, 데이타 모형, 연산, 의미론 등의 측면에서 상품 분류에 대한 형식적인 연구는 거의 없었다. 분류에 관한 논리적 모형의 부재는 분류에 대해서뿐만 아니라 일반적인 상품 데이타베이스에 대해서도 비일관성 및 비융통성 등 많은 문제를 야기시킨다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eClass와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 이 논문에서 우리는 상품 분류 체계의 의미를 이해하고, 기존의 분류 체계의 이면에 있는 의미를 포획하여 표현할 수 있는 방법으로 의미적 분류 모형을 제시하고자 한다. 상품 정의는 재료, 시간, 장소 등의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 상품 데이타베이스의 동적 특성 및 이에 대한 기존코드 기반 분류 체계의 한계점을 분석하고, 제안된 의미적 분류 모형이 상품 데이타베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스간의 관계를 그래프로 구성한다. 이 모형은 분류 체계의 매핑을 용이하게 하며, 선행 연구에 의해 제기된 요구 사항 및 문제를 해결한다고 믿는다.