• 제목/요약/키워드: Tree data

검색결과 3,320건 처리시간 0.027초

자기 조직화 맵 기반 유사 검색 시스템 (SOM-Based $R^{*}-Tree$ for Similarity Retrieval)

  • 오창윤;임동주;오군석;배상현
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.507-512
    • /
    • 2001
  • 특징 기반 유사성은 멀티미디어 데이터베이스 시스템에서 중요한 연구 쟁점이 되고 있다. 멀티미디어 데이터의 특징이 멀티미디어 객체들을 구별하는데 유용하다지만 특징 벡터의 차원의 수가 증가함에 따라 종래의 다차원 데이터 구조의 성능은 떨어지는 경향이 있다. $R^{*}-Tree$는 R-Tree의 가장 성공적인 병형으로 본 논문에서 고차원 특징 벡터를 위한 새로운 인덱싱 방법으로서 자기 조직화 맵 기반 $R^{*}-Tree$를 제안한다. 자기 조직화 맵 기잔 $R^{*}-Tree$는 고차원 데이터를 좀더 스칼라화해서 탐색할 수 있도록 SOM과 $R^{*}-Tree$를 결합하여 구축한 인덱싱 기법이다. 자기 조직 맵은 고차원 특징 벡터들로부터 2차원 공간으로의 맵핑을 제공한다. 그러나 맵을 위상 특징 맵이라 하고 인접 노느에서 서로 유사한 특징 벡터들을 모아서 입력데이터의 특징 공간들 속에 유사성을 보존하는데 위상 특징 맵의 각 노드는 코드북 벡터를 가지고 있다. 실험적으로 4만개의 이미지로부터 추출된 색깔 특징 벡터들을 이용하여 자기 조직화 맵 기반 $R^{*}-Tree$의 검색시간 비용과 자기 조직화 맵과 $R^{*}-Tree$의 검색 시간 비용을 비교한다. 그 결과 $R^{*}-Tree$를 구축하는데 필요한 노드 수와 검색 시간 비용이 감소됨으로써 자기 조직화 맵 기반 $R^{*}-Tree$는 자기 조직화 맵과 $R^{*}-Tree$보다 훨씬 우수한 성능을 나타냄이 입증되었다.

  • PDF

Contour Tree를 이용한 LiDAR Point 데이터의 분할 (Segmentation of LiDAR Point Data Using Contour Tree)

  • 한동엽;김용일
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2006년도 춘계학술발표회 논문집
    • /
    • pp.463-467
    • /
    • 2006
  • Several segmentation algorithms have been proposed for DTM generation or building modeling from airborne LiDAR data. Three components are important for accurate segmentation: (i) the adjacent relationship of n-nearest points or mesh, etc. (ii) the effective decision parameters of height, slope, curvature, and plane condition, (iii) grouping methods. In this paper, we created the topology of point cloud data using the contour tree and implemented the region-growing Terrain and non-terrain points were classified correctly in the segmented data, which can be used also for feature classification.

  • PDF

머클트리를 활용한 영상무결성 검사 기법 (Video Integrity Checking Scheme by Using Merkle Tree)

  • 강윤희;장은영;권태언
    • Journal of Platform Technology
    • /
    • 제10권4호
    • /
    • pp.39-46
    • /
    • 2022
  • 최근 다양한 분야에서 영상과 사운드를 포함한 디지털 콘텐츠가 생성되어 인터넷을 통해 클라우드에 전송된 후 저장되어 활용되고 있다. 디지털 콘텐츠의 활용을 위해서는 해당 데이터 무결성(data integrity) 검증은 필수적이며, 검증 자료의 네트워크 대역폭 효율성 보장이 필요하다. 이 논문에서는 영상데이터의 무결성 검증을 위한 데이터들을 유지 및 관리하며 제공하는 서버의 설계 및 구현에 관하여 기술한다. 서버는 영상데이터를 획득하는 모듈인 Logger로부터 영상데이터를 전달받아 저장하며, 영상데이터의 검증을 수행하는 모듈인 Verifier에 검증에 필요한 데이터를 제공하는 기능을 수행한다. 이후 해시값을 사용하여 경량 머클트리를 구성한다. 경량 머클트리(light-weight Merkle tree)는 두 버젼의 영상프레임 인덱스의 해당 영상프레임 변경사항을 개별 해시값의 비교 없이도 빠르게 무결성 위반을 검출할 수 있다. 이를 위해 네트워크 대역폭 효율성을 갖도록 디지털 콘텐츠의 해시값을 생성하여 경량 머클트리를 구성하고, 이를 무결성 검증의 증명 수행 결과로 제시한다.

LiDAR 자료를 이용한 산림 CO2 흡수량 산출 연구 (Study of CO2 Absorption in Forest by Airborn LiDAR Data)

  • 고신영;박정기;조기성
    • 대한공간정보학회지
    • /
    • 제21권4호
    • /
    • pp.29-35
    • /
    • 2013
  • 산림지역에서 이산화탄소흡수량 산출을 위해서는 현지산림조사와 영상정보 등의 원격탐사 자료를 이용함으로써 흉고직경이나 수고와 같은 산림 탄소흡수량 추정에 필요한 기본자료를 정량적으로 수집하여 활용한다. 그러나 여전히 현장조사의 비중이 높고 혼효림이 많은 국내 산림 여건상 취득된 산림정보의 정확도가 낮은 실정이다. 따라서 본 연구에서는 LiDAR 자료를 이용하여 경사기반 영역확장법을 적용하여 수목의 수직적 구조를 파악하고 수목 정점추출 알고리즘을 통한 개체목의 수고 및 개체수를 파악하여 이를 현장조사를 통한 자료로부터 도출된 수고-흉고직경 관계식에 대입하여 정량적인 이산화탄소흡수량 산출에 필요한 기본데이터를 산출 할 수 있었다. 또한 총 3종류의 수목에 대한 이산화탄소흡수량을 계산하고 단위면적당 이산화탄소흡수량을 추정할 수 있었다.

맵리듀스 기반 DFP-Tree를 이용한 클러스터링 알고리즘 (Clustering Algorithm using the DFP-Tree based on the MapReduce)

  • 서영원;김창수
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.23-30
    • /
    • 2015
  • 빅 데이터가 이슈화됨에 따라 데이터 분석의 결과를 기반으로 동작하는 많은 응용들이연구되고 왔고, 대표적인 응용들은 전자상거래 시스템의 상품 추천 서비스, 검색 엔진에서의 검색 서비스, 소셜 네트워크 서비스에서의 친구 추천 서비스 등이 있다. 본 논문은 기존의 데이터 마이닝 기법 중 데이터 집합에서 나타나는 유사한 패턴들을 마이닝하는 빈발 패턴 트리와 컴퓨터 과학의 이론에 기초한 결정트리를 결합하여 결정 빈발 트리 알고리즘을 제안한다. 이는 기존의 빈발 패턴 트리 알고리즘은 패튼 트리에서 패턴 생성에 대한 정확성은 보장되나 소셜 데이터처럼 다양한 패턴이 나타는 데이터에 대해서는 많은 수의 패턴들을 생성시켜 분석에 대한 어려움이 있어, 서브트리들과의 수렴 여부를 판단하는 모델로 변형시켜 문제를 개선한다. 또한 맵리듀스로 모델링하여 분산처리를 통한 고속 처리 알고리즘을 제시한다.

A Comparative Study of Predictive Factors for Hypertension using Logistic Regression Analysis and Decision Tree Analysis

  • SoHyun Kim;SungHyoun Cho
    • Physical Therapy Rehabilitation Science
    • /
    • 제12권2호
    • /
    • pp.80-91
    • /
    • 2023
  • Objective: The purpose of this study is to identify factors that affect the incidence of hypertension using logistic regression and decision tree analysis, and to build and compare predictive models. Design: Secondary data analysis study Methods: We analyzed 9,859 subjects from the Korean health panel annual 2019 data provided by the Korea Institute for Health and Social Affairs and National Health Insurance Service. Frequency analysis, chi-square test, binary logistic regression, and decision tree analysis were performed on the data. Results: In logistic regression analysis, those who were 60 years of age or older (Odds ratio, OR=68.801, p<0.001), those who were divorced/widowhood/separated (OR=1.377, p<0.001), those who graduated from middle school or younger (OR=1, reference), those who did not walk at all (OR=1, reference), those who were obese (OR=5.109, p<0.001), and those who had poor subjective health status (OR=2.163, p<0.001) were more likely to develop hypertension. In the decision tree, those over 60 years of age, overweight or obese, and those who graduated from middle school or younger had the highest probability of developing hypertension at 83.3%. Logistic regression analysis showed a specificity of 85.3% and sensitivity of 47.9%; while decision tree analysis showed a specificity of 81.9% and sensitivity of 52.9%. In classification accuracy, logistic regression and decision tree analysis showed 73.6% and 72.6% prediction, respectively. Conclusions: Both logistic regression and decision tree analysis were adequate to explain the predictive model. It is thought that both analysis methods can be used as useful data for constructing a predictive model for hypertension.

R-트리에서 빈번한 변경 질의 처리를 위한 효율적인 기법 (An Efficient Technique for Processing Frequent Updates in the R-tree)

  • 권동섭;이상준;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.261-273
    • /
    • 2004
  • 정보 통신 기술의 발달은 데이타베이스 분야에도 새로운 응용들을 만들고 있다. 예를 들어, 수많은 객체들의 위치를 추적하는 이동 객체 데이타베이스나 각종 센서들로부터 들어오는 데이타 스트림을 처리하는 스트림 데이타베이스에서 다루는 데이타는 일반적으로 매우 빠르고 끊임없이 변경된다. 하지만, 전통적인 데이타베이스에서는 데이타를 사용자의 명시적인 변경이 있기 전까지는 변하지 않는 상대적으로 정적인 것으로 간주하고 있기 때문에, 전통적인 데이타베이스 시스템은 이러한 끊임없고 동적인 데이터의 변화를 효율적으로 처리하는데 문제를 지닌다. 특히 다차원 데이타 처리를 위한 대표적 인덱스 구조인 R-트리의 경우, 데이타의 삽입이나 삭제가 연속적인 노드의 분할이나 합병을 유발하고 있으므로 이러한 문제는 더 심각해진다. 본 논문에서는 이러한 빈번한 변경 효율적으로 처리하기 위하여 새로운 R-트리 갱신기법인 리프 갱신 기법을 제안한다. 리프 갱신 기법에서는 새로운 데이타가 이전에 속해있던 리프 노드의 MBR 내에 있으면 전체 트리를 변경하지 않고 해당 리프 노드만을 변경시킨다. 이러한 리프 갱신 처리와 리프 노드를 직접 접근하게 해주는 리프 접근 해시 테이블을 이용하여 리프 갱신 기법은 데이타의 변경연산 비용을 크게 줄인다. 제안기법은 기존 R-트리의 알고리즘과 구조를 그대로 이용하고, R-트리의 정확성을 보장하므로 다양한 R-트리 변종들에도 적용 가능하고 R-트리를 이용하는 다양한 응용 환경에 이용이 가능하다. 본 논문에서는 제안 기법이 기존 기법에 대하여 가지는 갱신 연산의 비용 이득을 수학적으로 분석하였고, 실험을 통하여 제안 기법의 우수성을 확인하였다.

저밀도 폴리에틸렌에서 부시형 전기트리에 수반되는 부분방전 펄스의 특성 (Properties of PD Pulses Accompanying with Bush-type Tree in LDPE)

  • 강성화;박영국;정수현;이광우;임기조
    • 한국전기전자재료학회논문지
    • /
    • 제11권12호
    • /
    • pp.1055-1059
    • /
    • 1998
  • The correlation between the propagation of electrical tree and distributions of partial discharge(PD) pulses accompanying with electrical tree of bush type in low density polyethylene were discussed. We measured the growth of electrical tree by using optical microscope and PD data simultaneously. The PD data detected and analyzed were PD magnitude, repetition rate, average discharge power, average phase angle, and $\psi$-q-n distribution pattern. The average discharge power and repetition rate of PD had good linear relation with area of tree. Repetition rate and peak discharge magnitude and width of discharge phase angle increased with the tree.

  • PDF

A File/Directory Reconstruction Method of APFS Filesystem for Digital Forensics

  • Cho, Gyu-Sang;Lim, Sooyeon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권3호
    • /
    • pp.8-16
    • /
    • 2022
  • In this paper, we propose a method of reconstructing the file system to obtain digital forensics information from the APFS file system when meta information that can know the structure of the file system is deleted due to partial damage to the disk. This method is to reconstruct the tree structure of the file system by only retrieving the B-tree node where file/directory information is stored. This method is not a method of constructing nodes based on structural information such as Container Superblock (NXSB) and Volume Checkpoint Superblock (APSB), and B-tree root and leaf node information. The entire disk cluster is traversed to find scattered B-tree leaf nodes and to gather all the information in the file system to build information. It is a method of reconstructing a tree structure of a file/directory based on refined essential data by removing duplicate data. We demonstrate that the proposed method is valid through the results of applying the proposed method by generating numbers of user files and directories.

대용량 데이터를 위한 효율적인 다차원 색인구조 (An Efficient Multi-Dimensional Index Structure for Large Data Set)

  • 이병엽;유재수
    • 한국지리정보학회지
    • /
    • 제5권2호
    • /
    • pp.54-68
    • /
    • 2002
  • 최근 지리정보시스템, 움직임 객체관리시스템, 동영상/이미지 내용기반 검색시스템, 시계열 데이터베이스시스템과 같이 다차원 데이터를 이용하는 응용에 대한 관심이 고조되고 있다. 이 논문은 다차원의 특징벡터를 벡터 근사치로 표현한 후 색인 트리를 구성하여 검색의 효율을 높이는 VA(vector approximate)-트리를 제안한다. 이 논문에서 제안하는 VA-트리는 전체적인 색인구조의 저장공간을 줄이기 위해서 VA-파일의 벡터 근사치 개념을 이용하여 데이터량이 증가해도 검색 성능이 저하되지 않도록 하는 트리 형태의 구조를 갖는다. VA-트리는 MBR 기반의 색인구조이지만 MBR 간에 겹침이 발생하지 않는 분할방법을 사용하여 검색 효율을 높인다. 제안하는 색인구조와 기존의 여러 다차원 색인구조와의 성능 평가를 통해 제안하는 방법의 우수함을 보인다.

  • PDF