• 제목/요약/키워드: Data Tree

검색결과 3,331건 처리시간 0.032초

Tree-based Approach to Predict Hospital Acquired Pressure Injury

  • Hyun, Sookyung;Moffatt-Bruce, Susan;Newton, Cheryl;Hixon, Brenda;Kaewprag, Pacharmon
    • International Journal of Advanced Culture Technology
    • /
    • 제7권1호
    • /
    • pp.8-13
    • /
    • 2019
  • Despite technical advances in healthcare, the rates of hospital-acquired pressure injury (HAPI) are still high although many are potentially preventable. The purpose of this study was to determine whether tree-based prediction modeling is suitable for assessing the risk of HAPI in ICU patients. Retrospective cohort study has been carried out. A decision tree model was constructed with Age, Weight, eTube, diabetes, Braden score, Isolation, and Number of comorbid conditions as decision nodes. We used RStudio for model training and testing. Correct prediction rate of the final prediction model was 92.4 and the Area Under the ROC curve (AUC) was 0.699, which means there is about 70% chance that the model is able to distinguish between HAPI and non-HAPI. The results of this study has limited generalizability as the data were from a single academic institution. Our research finding shows that the data-driven tree-based prediction modeling may potentially support ICU sensitive risk assessment for HAPI prevention.

대용량 DNA서열 처리를 위한 서픽스 트리 생성 알고리즘의 개발 (Suffix Tree Constructing Algorithm for Large DNA Sequences Analysis)

  • 최해원
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.37-46
    • /
    • 2010
  • 서픽스 트리는 데이터의 내부구조를 자세히 나타내고 선형시간 탐색이 가능한 효과적인 자료구조로서 DNA 서열분석 등에 유용하다. 그러나 서열을 서픽스 트리로 구축하는 경우 트리의 크기가 원본의 최소 30배 이상으로 커지므로 테라바이트(TB)급의 대용량 DNA 서열의 경우에 메모리상의 응용은 매우 어려운 문제점이 있다. 이에 본 논문에서는 디스크를 이용한 대용량 DNA의 서픽스 트리 응용기법을 제시한다. 이때 DNA 서열구조를 고려한 서픽스 트리 선형 탐색 특성 유지를 보장한다. 이를 검증하기 위하여 9G Byte의 유전자 단편 서열을 이용해 424G Byte의 서픽스 트리를 디스크에 구축한 다음, 임의의 질의 서열에 대해 KMP알고리즘과 비교한 결과 질의 응답시간에서 우수한 성능을 보였다.

Quad-tree Fresnelet 변환을 이용한 디지털 홀로그램 워터마킹 (Digital Hologram Watermarking using Quad-tree Fresnelet Transform)

  • 서영호;구자명;이윤혁;김동욱
    • 디지털산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.79-89
    • /
    • 2013
  • This paper proposes a watermarking scheme to protect ownership of a digital hologram, an ultra-high value-added content. It performs pre-defined levels of quad-tree Fresnelet transforms. The relationship among the same-positional-blocks is extracted as the digital pre-watermark. For the relationship, we use properties of a digital hologram that a hologram pixel retains all the information of the object and that the same size of partial holograms reconstructs the same size of object but different in their view points. Also we mix a set of private data with the pre-watermark and the result is encrypted by a block cipher algorithm with a private key. Experimental results showed that the proposed scheme is very robust for the various malicious and non-malicious attacks. Also because it extracts the watermarking data instead of inserting, the watermarking process does not harm the original hologram data. So, it is expected to be used effectively for invisible and robust watermark for digital holograms.

CANCER CLASSIFICATION AND PREDICTION USING MULTIVARIATE ANALYSIS

  • Shon, Ho-Sun;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.706-709
    • /
    • 2006
  • Cancer is one of the major causes of death; however, the survival rate can be increased if discovered at an early stage for timely treatment. According to the statistics of the World Health Organization of 2002, breast cancer was the most prevalent cancer for all cancers occurring in women worldwide, and it account for 16.8% of entire cancers inflicting Korean women today. In order to classify the type of breast cancer whether it is benign or malignant, this study was conducted with the use of the discriminant analysis and the decision tree of data mining with the breast cancer data disclosed on the web. The discriminant analysis is a statistical method to seek certain discriminant criteria and discriminant function to separate the population groups on the basis of observation values obtained from two or more population groups, and use the values obtained to allow the existing observation value to the population group thereto. The decision tree analyzes the record of data collected in the part to show it with the pattern existing in between them, namely, the combination of attribute for the characteristics of each class and make the classification model tree. Through this type of analysis, it may obtain the systematic information on the factors that cause the breast cancer in advance and prevent the risk of recurrence after the surgery.

  • PDF

영국철도시스템에 적용된 리스크평가 사례 (Application Cases of Risk Assessment for British Railtrack System)

  • 이동하;정광태
    • 대한인간공학회지
    • /
    • 제22권1호
    • /
    • pp.81-94
    • /
    • 2003
  • The British railway safety research group has developed a risk assessment model for the railway infrastructure and major railway accidents. The major hazardous factors of the railway infrastructure were identified and classified in the model. The frequency rates of critical top events were predicted by the fault tree analysis method using failure data of the railway system components and ratings of railway maintenance experts, The consequences of critical top events were predicted by the event tree analysis method. They classified the Joss of accident due to railway system into personal. commercial and environmental damages. They also classified 110 hazardous event due to railway system into three categories. train accident. movement accident and non-movement accident. The risk assessment model of the British railway system has been designed to take full account of both the high frequency low consequence type events (events occurring routinely for which there is significant quantity of recorded data) and the low frequency high consequence events (events occurring rarely for which there is little recorded data). The results for each hazardous event were presented in terms of the frequency of occurrence (number of events/year) and the risk (number of equivalent fatalities per year).

Protection of a Multicast Connection Request in an Elastic Optical Network Using Shared Protection

  • BODJRE, Aka Hugues Felix;ADEPO, Joel;COULIBALY, Adama;BABRI, Michel
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.119-124
    • /
    • 2021
  • Elastic Optical Networks (EONs) allow to solve the high demand for bandwidth due to the increase in the number of internet users and the explosion of multicast applications. To support multicast applications, network operator computes a tree-shaped path, which is a set of optical channels. Generally, the demand for bandwidth on an optical channel is enormous so that, if there is a single fiber failure, it could cause a serious interruption in data transmission and a huge loss of data. To avoid serious interruption in data transmission, the tree-shaped path of a multicast connection may be protected. Several works have been proposed methods to do this. But these works may cause the duplication of some resources after recovery due to a link failure. Therefore, this duplication can lead to inefficient use of network resources. Our work consists to propose a method of protection that eliminates the link that causes duplication so that, the final backup path structure after link failure is a tree. Evaluations and analyses have shown that our method uses less backup resources than methods for protection of a multicast connection.

희소 데이터 집합에서 효율적인 빈발 항목집합 탐사 기법 (Efficient Mining of Frequent Itemsets in a Sparse Data Set)

  • 박인창;장중혁;이원석
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.817-828
    • /
    • 2005
  • 빈발 항목집합 마이닝 분야의 주된 연구 주제는 수행과정에서의 메모리 사용량을 줄이고 짧은 수행 시간에 마이닝 결과 집합을 얻는 것으로서, 빈발항목 탐색을 위한 다수의 방법들은 Apriori 알고리즘에 기반을 둔 다중 탐색 방법들이다. 또한 최대 빈발 패턴의 길이가 길어질수록 마이닝 수행 시간이 급격히 증가되는 단점을 가진다. 이를 극복하기 위해서 이전의 연구에서 마이닝 수행 시간을 단축하기 위한 다양한 방법들이 제안되었다. 하지만, 다수의 이들 방법들은 희소 데이터 집합에서는 다소 비효율적인 성능을 나타낸다. 본 논문에서도 효율적인 빈발항목 탐색 방법을 제안하였다. 먼저 빈발항목 탐색을 위한 새로운 트리 구조인 $L_2$-tree 구조를 제안하였으며, 더불어 $L_2$-tree를 이용하여 빈발 항목집합을 탐색하는 $L_2$-traverse 알고리즘을 제안하였다. $L_2$-traverse 구조는 길이가 2인 빈발 항목집합 $L_2$에 기반하여 생성되는 것으로서 크기가 매우 작으며, 이를 활용한 $L_2$-traverse 알고리즘은 $L_2$-tree를 단순히 한번 탐색함으로써 전체 빈발 항목집합을 빠른 시간에 구한다. 또한 수행 시간을 보다 단축할 수 있는 방법으로 길이가 3인 빈발 항목집합 $L_3$가 될 수 없는 $L_2$ 패턴들을 미리 제거하는 $C_3$-traverse 알고리즘도 제안하였다. 다양한 실험을 통해 제안된 방법들은 특히 $L_2$가 상대적으로 적은 희소 데이터 집합 환경일 때 기존의 다른 방법들보다 우수함을 검증하였다.

블록 적응적인 Context Tree Weighting을 이용한 무손실 영상 압축 (Lossless Image Compression Using Block-Adaptive Context Tree Weighting)

  • 오은주;조현지;유훈
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.43-49
    • /
    • 2020
  • 본 논문은 입력 영상 데이터를 블록 적응적으로 Context Tree Weighting을 사용하여 산술 부호 기반의 무손실 영상 압축 방법을 제안한다. CTW 기법은 입력 데이터를 비트 단위로 예측 및 압축을 하는 특성을 가진다. 또한, CTW 기법은 미지의 모델 및 파라미터에 대해서도 효율적인 압축을 한다는 점에서 장점을 보여준다. 본 연구에서는 무손실 압축이 필요한 항공 및 위성 사진을 옵션 정보에 따라 분할한 다음 각각 CTW 기반의 산술 부호기를 적용하여 압축의 효율을 증대하고자 한다. 항공 및 위성 사진은 영상 내 정보의 가치가 높으므로 무손실 압축이 불가피하다. 또한, 영상 크기가 일반적인 영상에 비해 크기 때문에 고압축 역시 필요하다. 기존의 무손실 압축 기법으로는 대용량의 중요 영상을 압축하는 데에 어려움이 존재한다. 이러한 이유로, 본 논문에서는 분할하지 않은 영상을 압축할 때 보다 제안하는 방법을 통해 영상을 압축했을 때 더 높은 압축률을 보여주기 위한 실험을 제공한다. 실험을 통해 기존의 무손실 압축 기법을 사용하여 압축을 진행했을 때 보다 CTW 기법을 이용하여 분할한 영상을 압축했을 때의 압축률이 더 높음을 확인할 수 있다.

의사결정나무와 손실함수를 이용한 공정파라미터 허용차 설계에 관한 연구 (A Study on the Design of Tolerance for Process Parameter using Decision Tree and Loss Function)

  • 김용준;정영배
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.123-129
    • /
    • 2016
  • In the manufacturing industry fields, thousands of quality characteristics are measured in a day because the systems of process have been automated through the development of computer and improvement of techniques. Also, the process has been monitored in database in real time. Particularly, the data in the design step of the process have contributed to the product that customers have required through getting useful information from the data and reflecting them to the design of product. In this study, first, characteristics and variables affecting to them in the data of the design step of the process were analyzed by decision tree to find out the relation between explanatory and target variables. Second, the tolerance of continuous variables influencing on the target variable primarily was shown by the application of algorithm of decision tree, C4.5. Finally, the target variable, loss, was calculated by a loss function of Taguchi and analyzed. In this paper, the general method that the value of continuous explanatory variables has been used intactly not to be transformed to the discrete value and new method that the value of continuous explanatory variables was divided into 3 categories were compared. As a result, first, the tolerance obtained from the new method was more effective in decreasing the target variable, loss, than general method. In addition, the tolerance levels for the continuous explanatory variables to be chosen of the major variables were calculated. In further research, a systematic method using decision tree of data mining needs to be developed in order to categorize continuous variables under various scenarios of loss function.

이진트리구조를 이용한 동적 재배치 알고리즘 설계 및 구현 (A Design and Implementation for Dynamic Relocate Algorithm Using the Binary Tree Structure)

  • 최강희
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권6호
    • /
    • pp.827-836
    • /
    • 2001
  • 데이터는 컴퓨터 시스템에서 파일구조로 나타난다. 그러나 파일의 크기는 매우 커지고, 그것을 제어하고 전송하기에 어려운 점이 있다. 그래서 최근에 데이터 압축에 대한 새로운 알고리즘이 개발되고 있다. 그래서 본 논문에서는 허프만 압축기법의 단점을 보완하여 새로운 동적 압축 기법을 제안하고자 한다. 허프만 압축 기법에는 두 가지 단점이 있다. 첫 번째로 처음 파일내의 문자의 빈도수를 구할 때와 실제로 압축하기 위해서 동작할 때, 파일을 두 번 읽어들인다는 것과, 두 번째로, 트리에 대한 정보를 같이 저장해야되기 때문에, 그 만큼 압축 효율이 떨어진다는 것이다. 이러한 단점은 본 논문에서 제시한 방법은, 동적인 형태로 재배치된 데이터를 한번에 읽어들일 수 있고, 파이프라인 구조로 트리의 정보를 저장할 수 있기 때문에, 새로운 동적 재배치 방법으로 해결할 수 있다.

  • PDF