• 제목/요약/키워드: 반구조

검색결과 68건 처리시간 0.025초

빈발 패턴 탐사 기법을 이용한 반구조적 데이터로부터의 공통구조 추출 (Extracting Common Structure of Semistructured data Using mining frequent patterns)

  • 이영언;문봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.302-304
    • /
    • 2000
  • 인터넷의 발달로 웹에는 엄청난 데이터가 존재하나, 불규칙적인 구조를 이루고 있는 반구조적 데이터가 대부분이다. 이러한 반구조적 데이터는 데이터들간의 어떤 정확하게 정해진 구조를 갖고 있진 않지만 불완전하고 불규칙한 구조 정보를 포함하고 있는 것으로, 데이터들 간의 관계를 규명할 수 있는 공통 구조 정보를 추출하여 효과적으로 구조화시킴으로써 정보로서의 가치를 높일 필요성이 대두되게 되었다. 또, 데이터 처리 과정에서 기존의 잘 정의된 구조를 가진 데이터베이스의 장점을 수용하기 위해서는 반구조적 데이터 집합의 불완전한 구조 정보로부터 공통 구조를 추출하는 것이 요구된다. 본 연구에서는 후보 항목 집합의 생성이 없는 빈발 패턴 탐사 기법을 사용하여 반구조적 데이터 집합으로부터 공통구조를 추출하고자 한다.

  • PDF

메타데이타 인터페이스를 이용한 분산된 반구조적 문서 검색을 위한 질의처리 알고리즘 설계 및 구현 (Design and frnplernentation of a Query Processing Algorithm for Dtstributed Semistructlred Documents Retrieval with Metadata hterface)

  • 최귀자;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.554-569
    • /
    • 2005
  • 반구조적 분산 문서에서는 구조 정보가 제공되지 않고, 자료 구조에 대한 엄격한 형식이 없기 때문에 질의 처리 시스템을 정형화하고 구현하기 어렴다. 이질적이고 이구조적인 반구조적 문서의 요소를 정확하게 검색하기 위해서는 한 요소가 1:1, 1:N, W:1과 같이 서로 다른 매핑 형태를 취하면서 동시에 여러 요소에 매핑되는 다중 매핑을 처리할 수 있어야 하며, 지역문서의 태그를 파싱하여 구조적인 정보를 얻고 경로 트리를 생성해야 한다. 본 논문에서는 분산된 시스템에 존재하는 이질적인 반구조적 자료나 문서에 대한 동시 다중 매핑을 완벽히 지원하고, 문서 자체를 파싱하여 구조적 정보를 얻을 수 있도록 통합 질의와 검색을 수행하기 위한 추상적인 질의 처리 알고리즘을 설계하고 메타데이타 인터페이스를 이용하여 구현하였다. 이 알고리즘은 전역질의를 기반으로 지역질의를 생성하기 위해서 메타데이타 정보를 이용하여 노드들 사이의 매핑, 매핑 종류에 따른 데이타의 변환, 경로교체 및 노드 사이의 이질성을 해결하기 위한 알고리즘으로 제시하였다. 전역스키마와 지역스키마에 대한 매핑과 함수에 의한 데이타의 변환 및 경로교체는 사용자에 의해 구축된 메타데이타 인터페이스인 DDXMI(for Distributed Documents XML Metadata Interface)를 기반으로 하여 구현되었으며, 같은 이름을 갖지만 다른 의미를 갖는 자료나 노드에 대한 검색은 노드를 구분할수 있는 노드가 가지고 있는 자식정보를 이용하여 노드 구분 조건절을 생성하여 구현하였다. XML 질의언어로 Quilt를 사용하였으며, OEM 모델로 제시한 세 개의 서로 다른 반구조적 레스토랑 안내 문서에서구현한 결과를 보였다. 프로토타입 시스템은 윈도우즈 환경에서 Java와 JavaCC 컴파일러를 이용하여 개발하였다.

반구조적 데이터의 효율적인 최소경계 스키마 추출 기법 (An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data)

  • 박경현;김록원;양은주;최은선;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.27-29
    • /
    • 2000
  • 반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

  • PDF

XML 데이터의 효율적인 DTD 추출 (An Efficient Technique for Extracting DTD from XML Data)

  • 양은주;박경현;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.97-100
    • /
    • 2000
  • 기존의 데이터를 인터넷상에서 XML 데이터 형태로 전송 시 부하를 줄이기 위해 DTD가 없는 형태로 전송하지만, 전송 받은 XML 데이터에 대한 저장 및 질의처리를 최적화하기 위해서는 DTD 추출이 필요하다. 따라서 이 논문에서는 반구조적 데이터의 특징을 갖는 XML 데이터에 대한 DTD를 추출하기 위해 기존의 데이터로그(DataLog)를 이용하여 반구조적 데이터의 최소 경계 스키마를 추출하는 방법보다 향상된 방법인 시뮬레이션을 이용한 최소 경계 스키마 추출 방법을 제시함으로써 보다 효율적인 DTD 추출을 가능하게 하는 방범을 제시한다.

  • PDF

DTD가 없는 XML 데이터의 효율적인 저장 기법 (An Efficient Technique for Storing XML Data Without DTD)

  • 박경현;이경휴;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.495-506
    • /
    • 2001
  • XML이 인터넷상의 데이터 교환의 표준으로 대두되면서 데이터 모델이나 플랫폼에 관계없이 데이터의 전송이 가능하게 되었다. 특히 데이터 중심의 XML문서의 경우 전송시의 부하를 줄이기 위해 DTD 없이 전송되는 경우가 일반적이다. 그러한 이유로 전송받은 XML 데이터를 효율적으로 저장하고 질의를 최적화하며 또한 관계형 데이터베이스에 저장된 기존의 데이터를 XML 형태로 출력하기 위해서는 DTD가 없는 XML 문서로부터 관계형 스키마의 추출이 필수적으로 요구된다. 따라서 이 논문에서는 반구조적 데이터의 스키마 추출기법인 최대/최소 경계 스키마 추출 기법을 이용하여 DTD가 없는 XML문서로부터 관계형 스키마를 생성하고 이를 바탕으로 XML 데이터를 저장하는 방법으로 제시한다. 특히, 반구조적 데이터 최소 경계 스키마를 추출하는데 있어서 기존의 데이터로그보다 효율적인 방법인 시뮬레이션을 제안함으로써 관계형 스키마를 생성하는데 있어서 보다 향상된 방법을 보여준다.

  • PDF

Oracle8i XDK를 이용한 XML 문서의 저장 (Storing XML Documents using Oracle8i XDK)

  • 하상호;이강석;백인천
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.324-327
    • /
    • 2000
  • XML은 웹 상에서 데이터의 원활한 교환을 위해서 HTML을 보완하여 설계된 차세대 인터넷문서작성용언어이다. XML 문서와 같은 반구조(semistructured) 의 특성을 갖는 데이터를 효과적으로 다루기 위한 새로운 데이터모델과 질의어가 제안되어 오고 있지만, 여기서는 관계형 데이터베이스에 XML 문서를 효과적으로 저장하는 방법에 관해서 논의한다. 먼저, 도서를 표현하는 XML 문서를 위한 DTD를 제시하고, 이 DTD를 관계 테이블로 변환하는 방법을 논의한다. 다음에는 Oracle서 지원하는 XDK를 이용하여 XML문서를 Oracle8i DB에 저장하는 방법에 대해서 논의한다.

  • PDF

DTD를 이용한 XML문서의 효율적인 스키마 추출 기법 (An Efficient Schema Extracting Technique Using DTD in XML Documents)

  • 안성은;최황규
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.141-146
    • /
    • 2001
  • XML is fast emerging as the dominant standard to represent and exchange data in the Web. As the amount of data available in the Web has increased dramatically in recent years, the data resides in different forms ranging from semi-structured data to highly structured data in relational database. As semi-structured data will be represented by XML, XML will increase the ability of semi-structured data. In this paper, we propose an idea for extracting schema in XML document using DTD.

  • PDF

Track&Trace 시스템의 서버와 XML 데이터베이스의 구현 (Implementation of Server and XML Database for the Track&Trace System)

  • 유정순;하수철;박주상;황재각
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.703-707
    • /
    • 2003
  • 본 논문은 물류 Tracking 시스템[1]의 서버와 XML 데이터베이스 구현에 관한 사항이다. 서버는 XML(데이터), XSL(표현방법), JSP(로직)의 3가지 형태로 분리함으로써 관리 및 개발 생산성을 향상시키도록 한다. 공간 낭비와 비효율성을 해결하기 위하여 반구조적인 데이터 모델이며, 트리 구조 형식인 XML을 XML 전용 데이터베이스인 오라클에 사상하여 저장한다. 그 결과 매핑 정보를 알기 때문에 XML 문서 전체를 파싱할 필요가 없어 보다 효율적으로 질의가 가능하다.

  • PDF

SW-IQS : 의미론적 데이터 통합을 위한 시맨틱 웹 기반의 통합 정보 검색 시스템 (SW-IQS : Semantic Web based Information Query System for the integration of semantic data)

  • 최옥경;한상용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.895-898
    • /
    • 2003
  • 본 연구에서는 온톨로지를 이용한 SW-IQS(Semantic Web based Information Query System)를 제안한다. 제안한 시스템은 자동 분류 기술과 정보 검색 기법들을 이용하여 반구조(semi-structured) 문서뿐만 아니라 비구조(unstructured) 문서의 처리를 극대화시키고자 한다. 또한 상호 운용성 및 데이터 통합을 위해 RDF(S) 방식의 문서 저장 서버를 지원하며 웹 페이지들간에 검색 순위를 두어 보다 신속하고 정확한 정보 검색이 가능하도록 하고자 한다. 마지막으로 새로운 순위 측정 알고리즘을 제안하고 이를 이용한 성능 평가를 실시하여 그 효율성과 정확성을 검증해 보이고자 한다.

  • PDF