• 제목/요약/키워드: 트리구조데이터

검색결과 38건 처리시간 0.03초

프랙탈을 이용한 시공간 데이터웨어하우스 (Spatio-Temporal Data Warehouses Using Fractals)

  • 최원익;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.46-48
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 적응적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

  • PDF

카운팅 블룸필터를 이용한 SSD 기반의 디렉토리 탐색 기법 (An SSD-Based Directory Parsing with the Counting Bloom Filter)

  • 김만윤;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.347-349
    • /
    • 2014
  • 데이터의 폭발적인 증가로 우리는 빅데이터 시대를 맞이하게 되었다. 빅데이터의 파일 시스템 내에는 아주 큰 트리구조로 이루어진 디렉토리와 파일이 무수히 존재한다. 이 커다란 트리구조에서 사용자가 요청하는 디렉토리와 파일을 탐색하는 것은 매우 어려운 작업이다. 이에 우리는 카운팅 블룸필터를 이용한 디렉토리 탐색 기법을 제시한다. SDP(SSD-based Directory Parsing)는 최근 또는 자주 액세스한 디렉토리와 파일의 메타데이터를 보관하는 SSD 기반의 캐시이다. 대규모 파일 시스템에서 사용자가 파일을 요청했을 때 파일 시스템은 저장 장치에 메타데이터를 검색하기 위해 여러 번 액세스한다. 이러한 비효율적인 SSD에 대한 액세스를 방지하기 위해 카운팅 블룸필터를 이용하여 메타데이터를 빠르고 효율적으로 검색하는 기법을 제시한다.

  • PDF

트리형 데이터베이스 및 언어 MUMPS 활용 (Study on Tree-Structured Database and Language MUMPS)

  • 임지현;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.108-110
    • /
    • 2019
  • 데이터베이스(Database)란 중복이 없는 데이터의 집합을 유지하는 것을 말하며, 정보의 양이 증가하고 있는 정보화 사회에서 정보를 쉽게 이용하고 공유하기 위해서 필수적이다. 데이터베이스의 대표적인 구조는 관계형 데이터베이스와 트리구조 데이터베이스가 존재하며, 본 연구에서는 트리구조 데이터베이스이자 프로그래밍 언어인 MUMPS에 대해 연구하고자 한다. 이 언어는 동적 또는 B-Tree 형식으로 배열을 저장하여 데이터베이스를 구성한다. Java나 C#과 같은 언어와 함께 사용하여야 하는 SQL과 달리, MUMPS는 자체적으로 언어와 데이터베이스를 지원하여 데이터를 관리할 수 있다는 차이점이 있으며, 데이터 이식률이 높아 실제 미국 병원에서는 MUMPS 기반의 플랫폼이 높은 시장 점유율을 차지하고 있다.

  • PDF

지능형 지식서비스를 위한 의미기반 XML 마이닝 시스템 연구 (Development of Semantic-Based XML Mining for Intelligent Knowledge Services)

  • 백주련;김진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.59-62
    • /
    • 2018
  • XML을 대상으로 하는 연구가 최근 5~6년 사이에 꾸준한 증가를 보이며 이루어지고 있지만 대다수의 연구들은 XML을 구성하고 있는 엘리먼트 자체에 대한 통계적인 모델을 기반으로 이루어졌다. 이는 XML의 고유 속성인 트리 구조에서의 텍스트, 문장, 문장 구성 성분이 가지고 있는 의미(semantics)가 명시적으로 분석, 표현되어 사용되기 보다는 통계적인 방법으로만 데이터의 발생을 계산하여 사용자가 요구한 질의에 대한 결과, 즉 해당하는 정보 및 지식을 제공하는 형식이다. 지능형 지식서비스 제공을 위한 환경에 부합하기 위한 정보 추출은, 텍스트 및 문장의 구성 요소를 분석하여 문서의 내용을 단순한 단어 집합보다는 풍부한 의미를 내포하는 형식으로 표현함으로써 보다 정교한 지식과 정보의 추출이 수행될 수 있도록 하여야 한다. 본 연구는 범람하는 XML 데이터로부터 사용자 요구의 의미까지 파악하여 정확하고 다양한 지식을 추출할 수 있는 방법을 연구하고자 한다. 레코드 구조가 아닌 트리 구조 데이터로부터 의미 추출이 가능한 효율적인 마이닝 기법을 진일보시킴으로써 다양한 사용자 중심의 서비스 제공을 최종 목적으로 한다.

  • PDF

무선 센서 네트워크에서 주기적인 트래픽의 효율적인 모니터링을 위한 MAC 프로토콜 (PM-MAC : An Efficient MAC Protocol for Periodic Traffic Monitoring In Wireless Sensor Networks)

  • 김동민;김성철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1328-1331
    • /
    • 2008
  • 본 논문에서는 트리구조의 네트워크 환경에서 주기적인 트래픽의 효율적인 모니터링을 위한 TDMA(Time Division Multiple Access)기반의 스케줄링 알고리즘을 제안한다. 주기적인 모니터링 환경을 위해 제안된 기존의 연구[1]는 트리구조가 깊어지고, 자식 노드들이 많은 환경에서 에너지 소모가 증가하고, 데이터 처리율이 떨어지는 문제점을 갖는다. 이를 해결하기 위해 유휴 타임 슬롯(Time Slot)을 활용하고, 데이터를 중복되지 않게 보내는 알고리즘을 제안한다. 제안된 알고리즘은 기존연구와의 비교를 통해 더 높은 데이터 처리율과, 에너지를 적게 소모함을 보였다.

트리구조 프로파일을 이용한 개인화 검색 (Tree structured user profile for web personalized search)

  • 전병훈;이정훈;전서현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.309-310
    • /
    • 2009
  • 이 논문에서는 테스크 프로파일과 쿼리 확장을 이용한 개인화 검색에서 프로파일의 효율적인 관리를 위해 트리구조 프로파일을 제안한다. 쿼리 확장은 설정된 기준 값이 문서의 질과 양에 따라 결과 값이 다르고 테스크 프로파일은 과거 사용자가 주제와 관련없는 문서를 방문 하였을 경우 데이터의 오염이 발생된다. 이 논문은 테스크 프로파일 수의 축소 및 쿼리확장을 효율적으로 분류할 수 있는 트리구조 프로파일을 제안한다.

Edge Computing 환경에서 트리 구조를 이용한 인덱스 관리 (Index Management Using Tree Structure in Edge Computing Environment)

  • 유승언;김세준;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.143-144
    • /
    • 2018
  • Edge Computing은 분담을 통해 네트워크의 부담을 줄일 수 있는 IoT 네트워크에 적합한 방법으로, 데이터를 전송하고 받는 과정에서 네트워크의 대역폭을 사용하는 대신 서로 연결된 노드들이 협력해서 데이터를 처리하고, 네트워크 말단에서의 데이터 처리가 허용되어 데이터 센터의 부담을 줄일 수 있다. 트리구조는 데이터 구조의 하나로, 데이터 항목의 한 묶음인 세그먼트를 나뭇가지처럼 연결한 것을 의미하여 분산된 데이터를 군집할 수 있다. 본 논문에서는 Edge Computing 환경에서 트리 구조를 이용하여 인덱스를 관리하는 모델을 알아보기 위해 이진 탐색 트리 중 AVL tree와 Paged Binary tree에 대해 서술하였다.

  • PDF

불균등 데이터 분포에 적합한 트리구조 (Efficient Tree structure for Ununiformed Data)

  • 김수현;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.225-227
    • /
    • 1999
  • 공간 데이터를 표현하는 색인 구조에 관하여 여러 연구가 진행되어 왔다. 그 중 R-트리 계열의 트리들은 최소 겹침과 최소 영역 증가를 기준으로 최소한계영역(Minimum Bounding Rectangle)을 생성하여 공간을 할당한다. 그러나 R-트리 기반의 트리들은 데이터 분포가 균등한 경우에서는 공간 할당이 적합하게 이루어지는 데 반하여 데이터 분포가 어느 특정 영역에 밀집되어 있는 도메인의 경우에는 공간영역을 비효율적으로 할당하는 문제점이 있다. 본 논문에서는 불균등하고 비대칭적인 데이터 분포에 적합한 트리 구조를 제안하였다. 제안된 트리 구조는 R*-트리를 기반으로 하였으며, 불균등하고 비대칭적인 데이터의 특징을 반영하여 단말 노드 구조를 설계하고 밀집영역에 대한 클러스터링을 반영하도록 삽입 및 삭제 루틴을 변형하였다.

  • PDF

긴 메뉴항목 리스트의 시각화 기법 비교에 관한 실험적 연구 (An Experimental Comparison on Visualization Techniques of Long Menu-Lists)

  • 서은경;성혜은
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.71-87
    • /
    • 2007
  • 인터넷 환경과 디지털자원의 활용환경이 빠르게 변화됨에 따라 탐색과 브라우징을 제공해주는 정보시스템의 인터페이스 또한 새롭게 변해가고 있다. 특히 최근에 검색 인터페이스에서 많이 사용되고 있는 긴 리스트의 메뉴항목을 이용자가 보다 쉽게 브라우징하고 선택할 수 있도록 하기 위하여 시각화기법을 이용하여 디스플레이하고 있다. 본 연구는 이용자와 데이터 특성에 맞는 긴 메뉴항목 시각화 기법을 제안하기 위하여 긴 리스트의 메뉴항목을 시각화하기 위하여 많이 사용되고 있는 기법 즉 트리구조 메뉴, 목차방식 메뉴, 롤-오버방식 메뉴, 클릭방식 메뉴, 어안렌즈 방식 메뉴를 비교하였다. 그 결과 계층구조 메뉴 중에서는 전문가는 목차방식 메뉴를, 초보자는 트리구조 메뉴를 선호하고, 또 순차적 구조 메뉴 중에서는 전문가와 초보자 모두 롤오버방식 메뉴를 선호하고 있음을 알 수 있었다.

멀티채널 환경에서 데이터 브로드 캐스트를 위한 효율적인 인덱싱 방법 (An Efficient Indexing Technique for Wireless Data Broadcast in Multiple Channels)

  • 이병규;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.586-588
    • /
    • 2002
  • 본 논문에서는 높은 대역폭(Bandwidth)을 가지는 싱글채널(Single Channel)로 결합될 수 없는 낮은 대역폭의 멀티채널(Multi Channel) 환경에서의 브로드캐스트(Broadcast)를 위한 효과적인 인덱스 방법을 제안한다. 최근에 들어 멀티채널에서 데이터 브로드캐스트의 인덱스 방법에 대한 많은 연구가 행하여 졌는데, 트리구조의 사용 여부에 따라 두 가지 방법으로 구분해 볼 수 있다. 트리 구조를 이용한 방법은 서버의 부담을 증가시키지만 트리 구조를 이용하지 않은 방법보다 모바일 유저에게 낮은 대기시간을 제공할 수 있다. 이 논문에서는 기존의 방법들이 가지는 채널의 수나 데이터의 크기에 제한을 두는 단점을 해결하고 접근 빈도가 높은 데이터에 대한 인덱스들의 반복 정도를 높여서 모든 인덱스에 대한 대기시간(Latency)의 평균값을 현저하게 줄일 수 있는 효과적인 인덱스 스케줄 생성 방법을 제시한다.

  • PDF