• 제목/요약/키워드: XML 데이타베이스

검색결과 147건 처리시간 0.021초

경로 매칭 알고리즘을 이용한 구조화된 문서의 변화 탐지 (Change Detection of Structured Documents using Path-Matching Algorithm)

  • 이경호;변창원;최윤철;고견
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.606-619
    • /
    • 2001
  • 본 논문에서는 SGML/XML 문서의 구 버전과 신 버전간의 타이를 계산할 수 있는 효율적인 알고리즘을 제안한다. 타이는 구 버전의 문서를 신 버전으로 변환하는데 소요되는 편집 스크립트로 간주할 수 있다. 제안된 알고리즘은 상향식과 하향식의 복합적인 접근 방식을 적용한다. 먼저 두 버전을 구성하는 노드간의 대응관계를 상향식으로 생성하며 하향시 너비 우선 탐색을 적용하여 편집 스크립트를 계산한다. 제안된 알고리즘은 모든 노드간의 대응 여부를 모두 조사할 필요가 없기 때문에 대응관계를 보다 빠르게 생성할 수 있다. 또한 삽입, 삭제, 그리고 갱신의 단순한 변화는 물론이고 부트리 이동과 복사의 구조적으로 보다 의미 있는 변화를 탐지할 수 있다.

  • PDF

최소 공간관계를 이용한 효율적인 이미지 검색 (Efficient Image Retrieval using Minimal Spatial Relationships)

  • 이수철;황인준;변광준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.383-393
    • /
    • 2005
  • 멀티미디어 데이타베이스에서 이미지를 검색하기 위해 공간관계를 이용하는 것은 비주얼한 인터페이스 시스템을 통해서 효율적으로 수행할 수 있다. 시스템에서 이미지의 객체들은 2D 스트링으로 표현되고, 이것은 이미지 내의 객체를 추상화 하는 방법으로 객체의 심볼릭 프로젝션을 통해서 생성된다. 그러나 2D 스트링 표현기법을 이용한 이미지 객체간의 공간관계는 정확하지 않기 때문에 3D 이미지를 검색할 때 정확도가 떨어진다. 이러한 문제점을 해결하기위해 본 논문에서는 3D 이미지를 위한 공간 연산자를 이용한 공간관계를 제안하고, 이미지의 공간관계에서 중복되는 부분을 제거하기 위해 여러 가지 추론규칙을 이용한다. 이러한 규칙을 기반으로 하는 추론기법은 내용을 이용해 이미지를 검색할 때 질의 처리 시스템에서 사용되고, 기존의 방법보다 정확도와 융통성이 높다.

정보 검색 기술을 이용한 대규모 이질적인 XML 문서에 대한 효율적인 선형 경로 질의 처리 (Efficient Linear Path Query Processing using Information Retrieval Techniques for Large-Scale Heterogeneous XML Documents)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.540-552
    • /
    • 2004
  • 본 논문에서는 대규모 이질 XML 문서들에 대한 부분 매치 질의를 효과적으로 처리하는 새로운 방법 XIR-Linear를 제안한다. XPath 질의는 XML 문서를 표현하는 트리 구조에 대한 경로 표현식 (path expression)으로 쓰여진다. 주요한 형태의 XPath 질의는 부분 매치 질의(partial match query)이다. XIR-Linear의 목적은 이질적인 스키마들을 가진 대규모 문서들에 대한 부분 매치 질의를 효과적으로 지원하는 것이다. XIR-Linear는 관계형 테이블을 이용한 스키마-레벨 방법에 기반을 두고, 역 인덱스 (inverted index) 기술을 사용하여 XPath 질의 처리의 효율성을 획기적으로 향상시킨다. 본 방법은 레이블 경로(label path)를 덱스트로 간주하고 레이블 경로 내의 레이블(label)들을 텍스트 내에 있는 키워드(keyword)로 간주한 후, 레이블들을 정보 검색 기술을 이용하여 인덱스 함으로써 전통적인 방법들에서 사용된 스트링 매치(string match) 보다 효율적인 방법으로 질의와 매치되는 레이블 경로들을 찾을 수 있도록 하였다. 성능 평가에서는 인터넷에서 수집한 XML 문서들을 사용하여 기존의 관계형 테이블을 이용하는 XRel, XParent와 비교 실험함으로써, 제안한 방법의 효율성을 입증한다. 실험을 통해 XIR-Linear가 실험 범위 내에서 XRel 이나 XParent에 비해 수십 배 이상 좋은 성능을 보이며, XML 문서 수의 증가함에 따라 더욱 우수하다는 것을 보인다.

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

XML 기반 교수-학생 학습지도 시스템의 설계 및 구현 (Design and Implementation of Lesson Plan System for teacher-student based on XML)

  • 최문경;김행곤
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1055-1062
    • /
    • 2002
  • 현재 교육현장에서 사용되고 있는 학습지도안 문서는 교육 정보의 체계적인 제공이 미흡하고 교수 개인이 모든 교수 활동에 필요한 지도안을 작성하는데는 어려움이 있으므로 많은 추가적인 시간과 노력이 필요하다. 네트워크가 확산되어 사용되고 있는 현 시점에서는 웹을 기반으로 한 학습지도안 작성이 더욱 요구되어 진다. 따라서, 웹에서 표준화된 XML을 이용하여 문서의 생성과 검색, 그리고 재사용이 가능하도록 제공함으로써, 교수자의 다양한 요구사항을 융통성 있게 수용할 수 있다. 본 논문에서는 학습지도안을 분석하여 공통 DTD(Document Type Definition)를 생성하고 공통 DTD를 통해 표준화된 XML(eXtensible markup Language) 문서를 제공한다. 시스템에서는 학습지도안을 쉽게 작성할 수 있는 에디터를 제공하고. 이미 작성된 학습지도안의 재사용성을 높이기 위해 검색 기능을 제공하고 있다. 검색으로는 구조기반, 패싯, 키워드 검색 방법을 제시하고 있으며, 작성된 학습지도안은 데이타베이스와 연동되어 구현되어진다. 따라서, XML을 이용하여 학습지도안을 작성함으로써 웹 상에서의 정보를 공유할 수 있고, 웹에서 학습지도안을 바로 작성함으로써 시간과 비용이 절약될 수 있으며. 또한 보다 향상된 학습 환경을 제공할 수 있다

HL7 표준임상문서구조를 사용한 전자퇴원요약의 생성, 저장, 관리 시스템 (Generation, Storing and Management System for Electronic Discharge Summaries Using HL7 Clinical Document Architecture)

  • 김화선;김일곤;조훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.239-249
    • /
    • 2006
  • 병원정보시스템(Hospital Information System)은 다른 병원정보시스템과 서로 독립적으로 운영되므로 상호운영성(Interoperability)이 배제되어 왔다. 이 연구는 HL7 표준임상문서구조(Health Level 7, Clinical Document Architecture)와 XML 스키마의 분석과 설계를 통하여 새로운 패러다임의 병원정보시스템을 제안한다. 퇴원요약지로부터 필수 항목을 규정하여 템플릿을 정의한 후 임상문서구조를 설계하여 자동적으로 임상문서를 생성되도록 하였다. XML 스키마는 HL7에서 정의한 참조정보모델(Reference Information Model)을 기반으로 분석하였고, 전송 프로토콜은 HL7 V2.4를 사용하였다. 본 연구가 가지는 의의는 첫째, 국제 표준인 HL7 표준임상문서구조를 사용하기 위한 확장과 정제과정의 연구를 했으며, 둘째, 표준임상문서구조를 사용할 수 있는 웹 기반의 차세대 병원정보시스템의 구조를 제안하였다. 결론적으로, 한국의 퇴원요약 표준임상문서구조에 대한 본 연구로 말미암아 평생전자의무기록(Electronic Health Record)과 임상데이타저장소(Clinical Data Repository)를 포함하여 다양한 보건의료기관 간 의료정보 공유의 기반이 될 것이다.

프리픽스 매취 조인을 이용한 XML 문서에 대한 분기 경로 질의 처리 (Branching Path Query Processing for XML Documents using the Prefix Match Join)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.452-472
    • /
    • 2005
  • 본 논문에서는 정보 검색(Information Retrieval, IR) 기술과 새로운 인스턴스 조인 기술을 이용하여 방대하고도 이질적인 XML 문서들에 대한 부분 매취 질의(Partial Match Query)를 처리하는 새로운 방법으로, XIR-Branching을 제안한다. 부분 매취 질의는 경로 표현식에 조상-후손 관계성(descendent-or-self axis) "//"를 가지는 질의로 정의되며, 선형 경로 표현식(Linear Path Expression, LPE)과 분기 경로 표현식(Branching Path Expression, BPE)으로 구분된다 일반적 형식의 부분 매취 질의는 분기하는 경로들을 만드는 분기 조건들을 가진다. XIR-Branching의 목적은 이질적인 스키마들을 가진 방대한 문서들에 주어지는 부분 매취 질의를 효과적으로 지원하는 것이다. XIR-Branching은 관계형 테이블을 사용하는 전통적인 스키마-레벨 방법들(XRel, XParent, XIR-Linear[21])에 그 기초를 두고, 역 인덱스(inverted index) 기술과 새롭게 소개하는 인스턴스-레벨 조인 기술인 프리픽스 매취 조인(Prefix Match Join)을 사용하여 질의 처리 효율성과 확장성을 향상시킨다. 전자는 LPE를 처리하기 위한 기술로 XIR-Linear[21]에서 사용한 방법이다. 후자는 BPE를 처리하기 위한 기술로 본 논문에서 새롭게 제안하는 기술이며, 전통적인 방법에서 사용하는 포함 관계 조인(containment join) 보다 효과적인 방법으로 결과 노드(result node)를 찾는다. 기존 연구인 XR-Linear는 역 인덱스를 사용하여 LPE 처리에 우수한 성능을 보이고 있지만, BPE 처리 방법을 다루지 않았다. 그러나. 더욱 구체적이고 일반적인 질의를 위해서는 BPE도 처리할 수 있어야 한다. 본 논문에서는 BPE까지 다룰 수 있는 새로운 방법으로 기존의 XIR-Linear를 확장한 XIR-Branching을 제안한다. 제안하는 방법은 스키마-레벨 방법으로 질의 대상 후보 집합을 크게 줄인 후, 인스턴스-레벨 조인 방법인 프리픽스 매취 조인으로 최종 결과 집합을 효과적으로 구하는 방법이다. XIR-Branching의 우수성을 보이기 위해 기존 BP포 처리 방법인 XRei, XParent와 비교 분석을 수행한다. 마지막으로, 성능 평가를 통하여 XIR-Branching이 기존 방법들에 비해 수십에서 수백배 효과적이고 확장성 또한 뛰어남을 보인다.