• 제목/요약/키워드: 데이터큐브

검색결과 130건 처리시간 0.027초

PdR-트리 : 고차원 데이터의 검색 성능 향상을 위한 효율적인 인덱스 기법 (PdR-Tree : An Efficient Indexing Technique for the improvement of search performance in High-Dimensional Data)

  • 조범석;박영배
    • 정보처리학회논문지D
    • /
    • 제8D권2호
    • /
    • pp.145-153
    • /
    • 2001
  • 피라미드 기법은 n-차원 공간 데이터를 1차원 데이터로 변환하여 $B^+$-트리로 표현하고, n-차원 데이터 공간에서 하이퍼큐브 영역질의 처리로 발생하는 "차원의 저주현상"에 영향을 받지 않게 검색 시간 문제를 해결하고 있다. 구형 피라미드 기법은 피라미드 기법의 공간 분할 전략을 응용하여 유사도 검색에 적합하도록 구 영역질의 방법을 사용하고 검색 성능을 개선하고 있다. 그러나 두 방법은 데이터 크기와 차원 변화에 따른 검색 성능이 100만건 이상과 16차원 이상일 때 현저하게 저하하는 현상을 보이고 있다. 이 논문에서는 멀티미디어 데이터와 같은 고차원 데이터의 검색 성능을 향상시키기 위한 새로운 인덱스 구조로 PdR-트리를 제안한다. 모의 데이터와 실제 데이터를 이용하여 실험한 결과, PdR-트리가 피라미드 기법과 구형 피라미드 기법보다 검색 성능이 향상되었음을 보이고 있다.

  • PDF

고차원 데이터의 효율적인 최근접 객체 검색 기법 (Efficient Searching Technique for Nearest Neighbor Object in High-Dimensional Data)

  • 김진호;박영배
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.269-280
    • /
    • 2004
  • 피라미드 기법은 n-차원 공간 데이터를 1차원 데이터로 변환하여 B+-트리로 표현하며, n-차원 데이터 공간에서 하이퍼큐브 영역질의 처리로 발생하는 “차원의 저주현상”에 영향을 받지 않게 검색 시간 문제를 해결하고 있다. 또 구형 피라미드 기법(SPY-TEC)은 피라미드 기법의 공간 분할 전략을 응용하여 유사도 검색에 적합한 구 영역질의 방법을 사용하고 검색 성능을 개선하고 있다. 하지만 유사도 검색의 응용에서 영역질의는 범위를 지정하는데 어려움이 있어 최근접 질의가 더 효율적이며, 기존의 제안된 인덱스 기법들은 특정 분포의 데이터에 대해서만 우수한 성능을 보이는 단점이 있다. 따라서 이 논문에서는 멀티미디어 데이터와 같은 고차원 데이터의 검색 성능을 향상시키기 위해 제안되었던 PdR-트리를 이용하여 최근접 객체 검색 기법을 제안한다. 다양한 분포의 모의 데이터와 실제 데이터를 이용하여 실험한 결과, PdR-트리가 피라미드 기법과 구형 피라미드 기법보다 검색 성능이 향상되었음을 보이고 있다.

맵리듀스에서 Grouping Sets 질의의 효율적인 계산 기법 (Efficient Computation of Grouping Sets Queries Using MapReduce)

  • 박소정;박은주;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.783-786
    • /
    • 2014
  • 맵리듀스(MapReduce)는 대용량의 데이터를 여러 컴퓨터에서 분산, 병렬 처리하는 프레임워크이다. Grouping sets 질의는 사용자가 지정한 여러 개의 group-by들을 모두 구하는 질의로서, 롤업(rollup)과 큐브(cube)가 너무 많은 결과를 반환하는 단점을 보완하여 원하는 group-by들에 대한 결과만 얻을 수 있도록 한다. 본 논문은 맵리듀스 환경에서 grouping sets 질의를 효율적으로 계산하는 방법을 제안한다. 제안 방법은 grouping sets 질의를 2개의 맵리듀스 잡(job)을 통해 단계적으로 계산한다. 첫 번째 맵리듀스 잡은 grouping sets 질의에 포함된 group-by들이 모두 계산될 수 있는 '부모' group-by를 먼저 계산한다. 두 번째 맵리듀스 잡은 부모 group-by를 입력으로 하여 grouping sets 질의에 포함된 group-by들을 각각 계산한다. 부모 group-by의 크기가 입력 데이터의 크기에 비해 매우 작은 경우, 제안 방법은 입력 데이터로부터 각 group-by를 독립적으로 구하는 단순 방법보다 좋은 성능을 보인다. 실험을 통해 제안 방법이 각 group-by를 독립적으로 구하는 단순 방법보다 좋은 성능을 가짐을 보인다.

OLAP을 위한 객체-관계 DBMS 기반 다차원 데이터 모델의 설계 및 구현 (Design and Implementation of Multidimensional Data Model for OLAP Based on Object-Relational DBMS)

  • 김은영;용환승
    • 한국통신학회논문지
    • /
    • 제25권6A호
    • /
    • pp.870-884
    • /
    • 2000
  • OLAT(On-Line Analytical Processing) 기법에서 스타 또는 눈송이(snowflake) 스키마에 기반한 ROLAP(Relational OLAP)은 성능 저하라는 문제가 있고, 다차원 데이터베이스에 기반한 MOLAP(Multidinmensional OLAP)은 데이터 크기 증가에 따른 공간 문제가 있다. 본 논문에서는 기존의 OLAP 시스템이 이러한 문제점을 해결하기 위해서 객체-관계 DBMS에 기반한 다차원 데이터 모델을 제안하였다. 객체-관계 DBMS가 가지는 확장성 특징을 사용하여 다차원 데이터 모델에 최적화된 다차원 개념과 함수를 정의할 수 있었다. 또한 객체-관계 DBMS의 객체간 계승 기능을 통하여 상위 테이블을 계승받는 요약 다차원 데이터 큐브의 다차원 데이터 모델을 설계하였다. 이와 같은 OLAP을 위한 데이터 타입과 함수가 정의되면, 새로운 객체-관계 DBMS 엔진과 같이 내장된 기능처럼 동작되어 성능향상이 가능하다. 또한 객체 관계 DBMS의 하나인 Informix Universal Server와 클라이언트 개발 도구를 이용하여 제안된 다차원 데이터 모델을 구현하였다.

  • PDF

사면체 기반의 볼륨 모델링에서 점근선 판정기를 이용한 영역의 선택 (Domain Selection Using Asymptotic Decider Criterion in Volume Modeling Based on Tetrahedrization)

  • 이건;권오봉
    • 정보처리학회논문지A
    • /
    • 제10A권1호
    • /
    • pp.59-68
    • /
    • 2003
  • 3 차원 산포 볼륨 데이터의 모델링(3-D Scattered Data Modeling)은 지질구조 조사, 환경가시화, 초음파 검사 등의 분야에 사용된다. 이러한 분야에 사용되는 데이터는 마칭큐브 알고리즘에서 사용하는 규칙적인 데이터와는 다르게 일반적으로 불규칙적으로 흩어진 데이터이다. 이 논문에서는 우선 불규칙적으로 흩어진 데이터에 적합한 사면체를 영역(domain)으로 하는 볼륨 모델링 기법에 대하여 고찰한다. 다음에 사면체 영역 결정에 애매성이 발생하였을 때 점근선 판정기(asymptotic decider critrion)로 애매성을 해결하는 방법을 제안하고 수식을 구한다. 마지막으로 제안한 방법을 이용하여 간단한 가시화 시스템을 구현하여 구 판정기(sphere criterion)와 비교한다. 사면체의 영역을 결정하는데 있어서 구 판 정기는 점의 좌표만을 이용하나 점근선 판정기는 점의 좌표와 그 점이 가지고 있는 함수 값을 이용하므로 보다 정확한 영역 분할이 가능하다.

고속도로 교통정보 취득을 위한 프루브 차량 비율 산정 연구 (Rate of Probe Vehicles for the Collection of Traffic Information on Expressways)

  • 김지원;정하림;강성관;윤일수
    • 한국ITS학회 논문지
    • /
    • 제18권6호
    • /
    • pp.262-274
    • /
    • 2019
  • 본 연구에서는 영동 고속도로 용인IC ~ 양지IC 구간을 대상으로 미시교통시뮬레이션 모형인 VISSIM을 이용하여 고속도로 교통정보 취득을 위한 프루브 차량 최소 비율을 추정하고자 한다. 실험을 위하여 일반상황과 유고상황을 고려한 7,200 가지의 시나리오를 생성하였다. 하지만, 모든 시나리오를 실험을 통해 수행하기에는 어려움이 있어 라틴 하이퍼큐브 샘플링(Latin Hypercube sampling) 방법을 사용하여 40 가지의 시나리오를 채택하였다. 이를 통해 얻은 개별차량의 1초당 데이터를 얻어 프루브 차량 비율을 세분화하여 평균통행시간 분포를 통계적으로 비교 분석 해본 결과 일반 상황에서는 고속도로 교통정보 취득을 위한 프루브 차량의 최소 비율이 1%였고 유고상황에서는 45%로 산정되었다. 또한 시나리오 분석 결과 25%의 프루브 차량 정보를 가지고 유고상황 시나리오 교통상황 중 70%를 충족시킬 수 있는 것으로 확인되었다.

기관지질환 진단을 위한 가상내시경 (Virtual Bronchoscopy for Diagnosis of Tracheo-Bronchial Disease)

  • 김도연;박종원
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.509-514
    • /
    • 2003
  • 본 논문은 흉부를 촬영한 CT(Computed Tomography) 영상을 이용하여 기관지 내부를 시각화(visualization)하기 위해 가상기관지경(virtual bronchoscopy)을 구현하였다. 실제 광학내시경은 침습(invasive)검사로 환자가 불편함을 감수해야하며 검사 전에 사전 준비 작업이 필요하고 절개, 감염, 출혈 등의 부작용을 수반하는데 비해 가상내시경은 CT 나 MRI 등과 같은 스캐너의 단면 영상을 사용하여 구현한다. 가상기관지경의 항해경로 결정을 위해 CT 단면 원천영상에서 기관지(trachea wall)만을 분리하였고, 분리된 기관지 영상을 이용하여 중앙축 변환(MAT : .Medial Axis Transformation)을 통해 구해진 좌표값을 가상 카메라의 운행 경로로 사용하였다. 원근투영(perspective projection) 및 볼륨 데이터의 표면을 렌더링하기 위해 마칭큐브(marching cube) 알고리즘을 사용하였다. 기관지질환은 기관지 내부의 염증(inflammation) 이나 폐암(lung cancer)으로 기인하여 기관지 통로가 좁아지는 기관지 협착증, 기관지 확장증 및 기관지암으로 분류된다. 가상기관지경은 기관지 내부의 질환 위치와 질환 정도를 정성적으로 파악 할 수 있으며 기관지질환의 진단과 교육에 사용될 수 있다.

System Development of Cubsat SIGMA(KHUSAT-3)

  • Shin, Jehyuck;Lee, Seongwhan;Lee, Jung-Kyu;Lee, Hyojeong;Lee, Jeongho;Seo, Junwon;Shin, Youra;Jeong, Seonyeong;Cheon, Junghoon;Kim, Hanjun;Lim, Jeonghyun;Lee, Junmin;Jin, Ho;Nam, Uk-Won;Kim, Sunghwan;Lee, Regina;Kim, Hyomin;Lessard, Marc R.
    • 천문학회보
    • /
    • 제39권2호
    • /
    • pp.106-106
    • /
    • 2014
  • SIGMA (Scientific cubesat with Instrument for Global Magnetic field and rAdiation)는 근 지구공간에서 우주방사선량 측정과 자기장 변화 검출의 과학적 목적과 교육적 목적을 가지고 개발하고 있는 초소형 큐브위성이다. $100mm{\times}100mm{\times}340.5mm$의 크기로 약 3.6 kg의 무게를 가지며, 탑재체는 방사선에 대하여 인체와 동일한 산란 흡수 특성을 가진 Tissue Equivalent Proportional Counter (TEPC)와 자기장 측정을 위한 Magnetometer (Mag)이다. 위성체는 구조계, 자세제어계, 전력계, 명령 및 데이터처리계, 통신계로 구성되어있다. 구조계는 위성의 뼈대인 Chassis와 Mag deployer로 이루어져있고, 위성의 안정적인 자세유지를 목적으로 Attitude Control System (ACS) Board와 Torque Coil이 자세제어계로 구성된다. 전력의 생산과 공급 및 충전은 태양전지판과 Electrical Power System (EPS), 리튬 배터리로 구성된 전력계에서 이뤄지며, 명령 및 데이터처리계는 On Board Computer (OBC)와 Instrument Interface board (IIB)를 중심으로 서브시스템의 명령체계와 데이터처리를 다룬다. 통신계는 Uplink인 VHF 안테나와 Downlink인 UHF, S-band 안테나로 구성되며 지상과 명령을 송수신한다. SIGMA는 타임인터럽트 기능을 활용한 Flight Software (FSW)로 운용되며 임무에 따른 6가지 모드의 시나리오로 위성을 운용한다. 이에 SIGMA의 개발과 테스트 결과를 소개한다. 본 큐브위성 개발기술을 바탕으로 향후 천문관측용 위성에도 활용할 예정이다.

  • PDF

GIS-AMR 시스템에서 시공간 데이터마이닝 기법을 이용한 전력 소비 패턴의 분석 및 예측 (Analysis and Prediction of Power Consumption Pattern Using Spatiotemporal Data Mining Techniques in GIS-AMR System)

  • 박진형;이헌규;신진호;류근호
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.307-316
    • /
    • 2009
  • 이 논문에서는 자동 원격 검침(AMR) 시스템에서 수집되는 전력 사용량 데이터의 분석 결과를 실세계에 적용하기 위하여 시간과 공간의 변화에 따른 전력 소비 패턴의 주기성 탐사를 위한 시공간 데이터마이닝 기법을 제안하였다. 첫째, 고객의 전력 사용 목적에 따른 군집 분석을 위하여 분할 군집화 기법을 적용하였다. 둘째, 3차원 큐브 마이닝 기법을 적용하여 고객의 전력 소비 데이터가 갖는 시간 속성과 공간 속성에 대한 패턴을 탐색하였다. 셋째, 다양한 시간 도메인에서의 주기 패턴 발견을 위한 캘린더 패턴 마이닝 기법을 이용하여 탐사된 패턴들이 갖고 있는 시간 속성의 의미와 관계를 분석 및 예측하였다. 제안된 시공간 데이터마이닝 기법을 평가하기 위해 한국 전력 연구원에서 구축된 GIS-AMR 시스템에 의해 제공되는 고압 전력 소비 고객 3,256명의 2007년 1월부터 4월까지 총 266,426건의 데이터로부터 시간의 주기성 및 공간적 특성을 포함한 전력 소비 패턴을 분석하였다. 제안한 분석 기법을 통하여 특정 그룹에 속한 각각의 대표 프로파일이 시간과 공간상에서 갖는 주기성을 발견하였다.

Cloud P2P OLAP: 클라우드 컴퓨팅 환경에서의 Peer-to-Peer OLAP 질의처리기법 및 인덱스 구조 (Cloud P2P OLAP: Query Processing Method and Index structure for Peer-to-Peer OLAP on Cloud Computing)

  • 주길홍;김훈동;이원석
    • 인터넷정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.157-172
    • /
    • 2011
  • 최근 분산 OLAP은 분산 환경에 적용하기 위하여 DHT기반의 P2P OLAP과 그리드 OLAP연구가 활발하게 진행되고 있다. 그러나 클라우드 컴퓨팅 환경에 적용하기 위하여 P2P OLAP은 structured P2P 특성 때문에 다차원 범위 질의에 문제점이 있고, Grid OLAP은 인접성 및 시계열 고려가 없기 때문에 쿼리 자체의 서브 �V 조회 알고리즘 연구에 치중되어 있다. 따라서 본 논문은 클라우드 컴퓨팅에 적합한 환경 제공을 위해 사용자의 조회 결과가 시계열적 특성으로 여러 사용자에 의해 재사용이 가능하고, 서버상의 휘발성 조회 큐브가 사용자 로컬 메모리에서 직접 분석 질의 시 효율이 좋다는 것에 초점을 두어 중앙관리 P2P방식을 제안하였다. 또한 빠른 질의 결과 및 다차원 범위질의를 위한 다단계 Hybrid P2P방식에 인덱스 부하 분산 및 성능 향상을 위한 클라우드 시스템을 접목하여 Cloud P2P OLAP을 제안하였다. 이를 위한 인덱스 구조로는 큐브 위상관계 트리와 인접성 2차원 Quadtree에, 시계열 Interval-트리를 접목하였으며, 이는 조회나 갱신 시에 일반 OLAP에 비해 큰 효율성을 보였다.