• 제목/요약/키워드: Document Store

검색결과 125건 처리시간 0.031초

경로정보의 중복을 제거한 XML 문서의 저장 및 질의처리 기법 (Storage and Retrieval of XML Documents Without Redundant Path Information)

  • 이혜자;정병수;김대호;이영구
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.663-672
    • /
    • 2005
  • 본 논문에서는 대용량 XML 문서를 저장하고 그로부터 원하는 정보를 효율적으로 찾기 위한 방법으로, 경로정보의 중복을 제거하면서 역 인덱스를 함께 이용한 방법을 제안한다. XML 문서는 트리구조에 기반한 노드로 분해되어, 노드 타입에 따라, 루트에서 각 노드까지의 경로정보와 함께 관계형 테이블에 저장된다. 경로정보를 이용한 기존의 U 질의 기법들에서는 모든 엘리먼트 노드들에 대해 경로정보를 저장함에 따라 정보의 양이 증가하여 질의 처리의 성능을 저하시키는 요인이 되고 있다. 제안 방법에서는 경로정보 중 가장 긴 단말 엘리먼트 노드까지의 경로인 단말 엘리먼트 경로(leaf element path)만 저장하고 내부 엘리먼트 노드까지의 경로인 내부 엘리먼트 경로들(internal element paths)은 저장하지 않는다. 단말 엘리먼트 경로만을 대상으로 하여 역 인덱스를 구성함에 따라, 기존의 역 인덱스 이용 기법에 비해 키워드별 포스팅 리스트(posting lists)의 수를 줄이게 된다. 제안 방법에서는 U 문서의 저장과 질의를 위하여 XML 문서에 대한 스키마 정보가 없어도 되며, 관계형 데이터베이스의 어떤 확장도 요구하지 않는다. 실험을 통해 제안 방법은 실험 범위 내에서 기존 기법들에 비해 좋은 성능을 보인다.

YCSB를 사용한 PostgreSQL과 MongoDB 성능 비교 분석 (Performance Comparison of PostgreSQL and MongoDB using YCSB)

  • 김기성
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1385-1395
    • /
    • 2016
  • 빅데이터와 함께 등장한 NoSQL은 기존 관계형 데이터베이스로는 해결하기 힘든 문제를 새로운 아키텍처와 데이터 모델로 해결하고자 한다. 관계형 데이터베이스와는 달리 NoSQL 데이터베이스는 기능과 아키텍처 그리고 한계점이 제품마다 다르기 때문에 NoSQL 데이터베이스를 선택하기 위해서는 많은 고려사항이 필요하다. 이렇게 데이터베이스의 선택의 폭이 넓어진 만큼 선택의 어려움은 더욱 증가했다고 볼 수 있다. 또한 NoSQL 데이터베이스의 발전은 기존의 관계형 데이터베이스의 기능을 확장하는 데도 기여했다. 본 논문에서는 NoSQL 데이터베이스를 보다 정확히 이해하기 위해 관계형 데이터베이스와 비교 분석하고 오픈 소스 관계형 데이터베이스인 PostgreSQL의 최신 NoSQL 관련 기능에 대해 알아본다. 또한 NoSQL 데이터베이스 벤치마크(YCSB)를 사용해 NoSQL과 PostgreSQL의 성능을 비교하고 앞으로의 발전 방향에 대해서 논한다.

택시 데이터에 대한 효율적인 Top-K 빈도 검색 (Finding Frequent Route of Taxi Trip Events Based on MapReduce and MongoDB)

  • ;안성아;;정한유;권준호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.347-356
    • /
    • 2015
  • IoT(사물인터넷) 기술의 빠른 개발로 인하여 기존의 택시들은 디스패처와 위치 시스템을 통해 서로 연결되고 있다. 일반적으로 현대의 택시들은 경로 정보를 획득하기 위한 목적으로 GPS(Global Positioning System)를 탑재하고 있다. 택시 운행 데이터들의 경로 빈도를 분석하여, 주어진 질의 시간에 해당하는 빈번한 경로를 찾을 수 있다. 그러나 위치 데이터의 용량이 매우 크고 복잡하기 때문에 택시의 운행 이벤트의 위치 데이터를 분석된 빈도 정보로 변환할 때에 확장성 문제가 발생한다. 이 문제를 해결하기 위하여, NoSQL 데이터베이스에 기반한 택시 운행 데이터에 대한 Top-K 질의 시스템을 제안한다. 첫째, 원시 택시 운행 이벤트를 분석하고 모든 경로들의 빈도 정보를 추출한다. 추출한 경로 정보는 NoSQL 문서-지향 데이터베이스인 MongoDB에 해시 기반의 인덱스 구조로 저장한다. 주로 발생하는 경로에 대한 효율적인 Top-K 질의 처리는 몽고DB의 상에서 이루어진다. 미국 뉴욕시의 실제 택시 운행 데이터를 이용한 실험을 통하여 알고리즘의 효율성을 검증하였다.

19세기 영남지역 중기(重記)를 통해 본 지방관아의 조직과 기록물 연구 (Organizations and Records of Local Government Office in the 19th Century Through an Analysis on the Transition Documents in Yeongnam Region)

  • 손계영
    • 한국도서관정보학회지
    • /
    • 제48권2호
    • /
    • pp.237-262
    • /
    • 2017
  • 조선시대 지방관아는 지역을 다스리기 위한 행정 업무를 수행하기 위해서 공간과 조직 사람이 필수적으로 존재하였고, 행정 업무의 결과를 통해 지방관아의 기록물이 생산되고 관리 보관되었다. 지방관아의 건물과 공간은 첫째, 수령의 통치와 생활공간, 둘째, 관속들의 행정업무 공간, 셋째, 창고 공간으로 구분할 수 있고, 관속의 규모 측면에서도 대규모 기관이었기 때문에 조직구조도 복잡한 형태를 띠고 있었다. 관아의 조직은 크게 육방임과 기타 색임으로 구분하여 호장(戶長) 이방(吏房) 호방(戶房) 형방(刑房) 병방(兵房) 예방(禮房) 공방(工房)의 육방임 업무와 생산 기록물을 살펴보았고, 기타 색임의 업무를 살펴보았다. 또한 세기 영남지역 중기(重記)에 기재되어 있는 물목명 가운데 기록물류를 추출하여 지방관아에서 조직별로 관리하였던 기록물류를 크게 절목(節目), 안(案), 대장(大帳), 완문(完文), 등록(謄錄) 등의 유형으로 구분하여 살펴보았다.

공통 문서 구조 추출을 통한 XML DTD의 관계형 데이터 베이스 스키마 변환 기법 (A Transformation Technique of XML DTD to Relational Database Schema Based On Extracting Common Structure in XML Documents)

  • 안성은;최황규
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.999-1008
    • /
    • 2002
  • XML은 W3C에 제안된 마크업 언어고 HTML의 단순함과 SGML의 복잡함을 극복하여, 웹 상에서 데이터를 표현하고 교환하기 위한 표준으로 등장하고 있다. XML 문서를 질의 처리하기 위한 방법으로 XML 문서 전용 질의 언어가 개발되고 있지만, 데이터의 양이 증가한다면 결국 막대한 양의 데이터를 처리 할 데이터베이스 시스템을 필요하게 된다. 본 논문에서는 XML DTD를 관계형 데이터베이스 시스템 스키마로 변환하는 기법을 제안한다. 제안된 기법은 XML 데이터의 스키마 역할을 하는 DTD의 트리 구조를 생성하여, XML 데이터들의 공통구조와 비공통구조를 추출한 후 관계형 데이터베이스 스키마를 추출하는 기법이다. 추출된 관계형 데이터베이스 스키마는 기존의 방법들에 비해 생성 테이블 수가 적으며, 널(NULL)값의 출현을 감소시킨다. 또한, 제안기법은 XML 데이터를 보다 적은 테이블로 맵핑(mapping)시킴으로써 데이터 검색 시 참조 테이블 수를 감소시킬 수 있으며 질의 처리 시에도 성능 면에서 우수함을 보인다.

전통 가구의 서랍장 비교 - 한국, 일본, 서구 중심으로 - (Differentiation of Chest of Drawers in Traditional Furniture - Focusing on Korea, Japan, and the West -)

  • 문선옥
    • 한국가구학회지
    • /
    • 제22권2호
    • /
    • pp.101-111
    • /
    • 2011
  • The intention is to explore the differentiation or evolution of the chest of drawers in traditional Korean, Western, and Japanese furniture in order to know how the drawers currently becoming popular in Korea were developed historically. The Korean furniture centered in $Jang$, $Nong$, and $Bandazi$ used in the tradition generally, the Western furniture involved in drawers, and the Japanese furniture called $Tansu$ in Japanese called the chest of drawers were focused on the study because the Western and Japanese drawers affected the development of the chest of drawers in Korean furniture during the late 19th century and the Japanese Ruling Era, respectively. As a result, the Korean furniture was not shown the chest of drawers but only small drawers that store small items located in the upper part of $Jang$, $Nong$, and $Bandazi$ mostly used as wardrobe, while the traditional Japanese furniture developed from Edo period (1607-1868) had showed a wide variety of chest of drawers like $Isho-dansu$, $Mizuya-dansu$, $Kusuri-dansu$, $Cho-dansu$, $Funa-dansu$, $Kaidan-dansu$, $Nagamochi-dansu$, $Kuruma-dansu$, and so on, for specialized storage. And in the traditional Western furniture were presented the chest like a large-box form, mule chest, chest of drawers, cabinet, commode, highboy, tallboy, wardrobe, secretary drawer and bureau with document drawer invented and evolved throughout the 15th-18th century. Therefore, the chest of drawers in contemporary Korean furniture is supposed to adopt the Japanese and Western drawer form and to ensure the continual production from the obvious utility of the design with decoration for our current everyday lives.

  • PDF

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

웹기록물 보존을 위한 전자기록물 장기보존포맷 확장 설계 (Extension of the Long-term Archival Information Package for Electronic Records to Accommodate Web Records)

  • 박병주;차승준;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.33-47
    • /
    • 2010
  • 웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다. 웹기록물은 전자기록물의 일종이기 때문에 전자기록물 장기보존포맷에 보존할 수 있어야 한다. 하지만 현재 표준으로 제시된 포맷은 웹기록물의 특성을 고려하지 않고 정의되었기 때문에 웹기록물을 보존할 수 없다. 본 논문에서는 표면/심층 웹기록물 문서보존포맷으로 연구된 KoDeWeb/KoSurWeb과 전자기록물 장기보존포맷을 분석하고, 이를 바탕으로 웹기록물을 보존할 수 있는 확장된 전자기록물 장기보존포맷을 정의하였다. 정의된 포맷을 활용하면 웹기록물도 전자기록물들과 같이 보존되어 활용될 수 있고, 전자 상거래에 관련된 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 법적 증거로서 활용될 수 있다.

TMN 시험 시스템 구조 (A Study on TMN Test System Architecture)

  • 최영한;김장경;진병문;이준원
    • 한국정보통신학회논문지
    • /
    • 제2권3호
    • /
    • pp.409-416
    • /
    • 1998
  • TMN(Telecommunication Management Network)은 전기통신망 및 서비스 관리에 필요한 관리정보의 전달, 저장 및 처리를 위한 하부구조를 제공하며 아날로그 통신망, 디지털 통신망, 공중 통신망, 사설 통신망, 교환시스템, 전송 시스템, 전기통신 관련 s/w, 논리적 인 통신망 자원의 관리 등 그 적용분야는 매우 다양하고 광범위하다. 본 논문은 TMN 시스템을 하나의 SUT(System Under Test)로 보고 이를 simulation 하여 시험하는 기존의 방법과는 달리 표준화된 프로토콜 시험방법과 시험절차에 따른 시험이 가능할 수 있도록 하는 시험구조를 제안함에 그 목적이 있다. 프로토콜의 여러가지 시험 중에서 프로토콜의 적합성시험과 관련된 표준화된 시험방법론과 체계는 ISO/IEC JTC1 SC2l에서 작성된 ISO/IEC IS 9646 문서에 나타나 있고 이에 대한 ITU의 twin문서가 Recommendation X.290 series로 제시되어 있다. TMN 시험에 이들 시험방법을 적용할 수 있게 하기 위하여는 TMN 시험에 적용할 새로운 시험구조를 고안하고 이에 관한 시험절차를 구축하여야 한다.

  • PDF

XML 데이타 관리시스템과 유전체 데이타베이스에의 응용 (An XML Data Management System and Its Application to Genome Databases)

  • 이경희;김태경;김선신;이충세;조완섭
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.432-443
    • /
    • 2004
  • 최근 들어 XML의 급속한 확산으로 인해 DBMS를 이용한 XML 데이타 관리의 필요성이 높아지고 있다. 기존의 DBMS를 이용한 XML 저장 및 검색에 관한 연구들은 편의성 측면이나 성능 측면에서 아직 해결할 문제점을 가지고 있다. 특히, 관계 DBMS를 이용하는 경우 복잡한 XML 문서를 간단한 테이블 형태로 변환하는 데이타 모델 변환과 그에 따른 질의 변환의 복잡성이 문제점으로 지적되고 있다. 본 논문에서는 UniSQL ORDBMS를 이용한 DTD 의존적 데이타 관리 시스템인 Xing을 제안한다. Xing 시스템에서는 ORDBMS의 객체 참조와 다중값 속성을 이용하므로 XML 데이타를 객체 모델로 매핑하는 것이 간단하다. 또한, DTD 의존적인 객체 스키마를 생성하므로 XML 저장 알고리즘이 간단하고, 검색을 위한 질의 변환도 용이하다. 특히, Xing에서는 SAX 파서를 이용하여 메모리 부하가 적은 고유의 Xing 트리를 생성하므로 대량의 XML 데이타를 빠르게 저장할 수 있다. 그리고, 질의결과를 XML 형태로 반환함으로써 완전한 XML 데이타 관리시스템으로 사용할 수 있다. GenBank의 유전체 XML 데이타에 대하여 Xing을 이용한 저장과 관계 데이터베이스로 저장한 경우에 검색성능을 비교한 결과 제안한 시스템이 최고 10배까지 좋은 성능을 보였다.