• 제목/요약/키워드: binary-tree

검색결과 300건 처리시간 0.025초

Path Level Reliability in Overlay Multicast Tree for Realtime Service

  • Lee, Chae-Y.;Lee, Jung-H.
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2006년도 추계학술대회
    • /
    • pp.312-315
    • /
    • 2006
  • Overlay Multicast is a promising approach to overcome the implementation problem of IP multicast. Real time services like internet broadcasting are provided by overlay multicast technology due to the complex nature of IP multicast and the high cost to support multicast function. Since multicast members can dynamically join or leave their multicast group, it is necessary to keep a reliable overlay multicast tree to support real time service without delay. In this paper, we consider path level reliability that connects each member node. The problem is formulated as a binary integer programming which maximizes the reliability of multicast tree. Tabu search based algorithm is presented to solve the NP-hard problem.

  • PDF

FT NIR 분광법 및 이진분류 머신러닝 방법을 이용한 소나무 종자 발아 예측 (Prediction of Germination of Korean Red Pine (Pinus densiflora) Seed using FT NIR Spectroscopy and Binary Classification Machine Learning Methods)

  • 김용율;구자정;구다은;한심희;강규석
    • 한국산림과학회지
    • /
    • 제112권2호
    • /
    • pp.145-156
    • /
    • 2023
  • 본 연구에서는 -18℃ 및 4℃에서 18년간 저장된 소나무 종자 963개에 대해 FT NIR 스펙트럼을 조사하여 7개 머신러닝 방법(XGBoost, Boosted Tree, Bootstrap Forest, Neural Networks, Decision Tree, Support Vector Machine, PLS-DA)을 이용한 종자발아 예측모델을 만들고, 그 성능을 비교하였다. XGBoost 및 Boosted Tree 모델의 예측성능이 가장 우수하였으며, 정확도, 오분류율 및 AUC 값은 각각 0.9722, 0.0278, 0.9735과 0.9653, 0.0347, 0.9647이었다. 2개 모델에서 종자발아 유무를 예측하는 데 있어 상대적 중요도가 높았던 54개 파수 변수들에 대한 파장대는 크게 6개(811~1,088 nm, 1,137~1,273 nm, 1,336~1,453 nm, 1,666~1,671 nm, 1,879~2,045 nm, 2,058~2,409 nm) 그룹으로 나눌 수 있었으며, 방향족 아미노산, 셀룰로스, 리그닌, 전분, 지방산 및 수분과 관련된 것으로 추정되었다. 이상의 결과를 종합할 때, 본 연구에서 얻어진 FT NIR 스펙트럼 데이터과 2개의 머신러닝 모델은 소나무 저장종자의 발아 유무를 정확도 96% 이상으로 예측할 수 있기에 장기저장 종자 유전자원의 비파괴적 활력검정에 유용하게 활용될 수 있을 것으로 생각된다.

Decision Tree를 이용한 효과적인 유방암 진단 (Effective Diagnostic Method Of Breast Cancer Data Using Decision Tree)

  • 정용규;이승호;성호중
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근 의료분야에서는 대규모의 데이터를 빠르게 검색 및 추출이 가능하게 의사결정트리 기법에 대한 연구들이 진행되고 있다. 현재 CART, C4.5, CHAID 등 여러 기법이 개발되었는데, 이러한 클레시파이 기법들은 몇몇 의사결정 나무 알고리즘이 이진분리로 분류를 하는데, 나머지 데이터의 결과가 손실될 우려가 있다. 그중 C4.5는 엔트로피의 측정값에 높고 낮음으로 트리 모양을 구성해 가는 방식이고, CART 알고리즘은 엔트로피 매트릭스를 사용하여 범주형 자료나 연속형 자료에 적용할수가 있다. 이에 본 논문에서는 클래시파이 기법 중 C4.5와 CART를 유방암 환자 데이터에 대해 적용하여 실험하여, 그 결과 분석을 통한 성능 평가를 수행하였다. 실험에서는 교차검증을 통해 그 결과에 대한 정확성을 측정하였다.

유비쿼터스 환경에서 콘텐츠 적응화 (Contents Adaptation in Ubiquitous Environments)

  • 신영옥
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.133-141
    • /
    • 2010
  • 콘텐츠 적응화란 하나의 콘텐츠를 다양한 디바이스에서 사용할 수 있도록 변환하는 기술이다. 특히, 여러 개의 서로 다른 매체를 포함하고 있는 문서에서는 매체 간의 동기화가 필요하고, 이를 위한 다양한 방법이 제시되었다. 본 논문에서는 어떤 일정시간(interval time) 동안 여러 개의 서로 다른 매체간의 시간적인 관계를 표현하는 방법으로 "시간지원 집계 트리 전략(TATS : Temporal Aggregate Tree Strategy)"모델을 제안한다. TATS 모델은 미디어들의 실행시간을 시작시간을 기준으로 부모노드가 자식노드의 간격시간을 포함하는 이진트리 형태인 집계트리를 만들어 집계 계산에 이용한다. 집계트리를 통하여 멀티미디어 객체 간의 시간 동기화를 구현하였다.

해마와 피질의 상호 관계를 이용한 객체 기반 영상 검색 기법 (An Object-Based Image Retrieval Techniques using the Interplay between Cortex and Hippocampus)

  • 홍종선;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.95-102
    • /
    • 2005
  • 본 논문에서는 해마와 피질 사이의 상호 작용을 이용하여 사용자 친화적인 객체 기반 영상 검색 시스템을 제안한다. 내용기반 영상 검색 시스템은 대부분 예제(example) 질의 혹은 스케치 질의 등을 이용하고 있고 이러한 방법들은 비교적 사용하기 불편하고 방법이 편중되어 있어서 일반 사용자들의 다양한 질의 요구에 적합하지 못하다. 제안하는 알고리즘은 CSB 트리맵 (Color and Spatial based Binary tree map)을 이용하여 객체를 추출하고 지역 라벨링 알고리즘을 이용하여 객체의 색상의 상관관계, 객체의 크기와 위치 정보를 비트 스트림 형태로 변환하고 이것을 해마와 피질 사이의 상호 작용의 관계를 이용한 해마 신경망을 사용하여 학습시킨다. 사람의 뇌 속에서 어떤 패턴을 인식을 하는 경우 해당 패턴의 특이한 특징에 대해 흥분하는 세포들이 특정 신호를 발생시킨다. 이것은 흥분학습에 의해 단기기억에서 장기기억으로 저장하는 해마의 기능으로 기존의 신경망에서는 입력되는 패턴의 특성과는 상관없이 특징 개수가 모두 동일하게 비교된다. 제안하는 해마 신경망은 호감도 조정에 의해서 입력되는 영상 패턴의 특징들을 흥분학습과 억제학습을 이용하여 불필요한 특징은 억제시키고 중요한 특징은 장기 기억 시켜서 적응성 있는 고속 검색 시스템을 구현한다.

Group Separation 알고리듬을 적용한 RFID system의 구현 (The Design of RFID System using Group Separation Algorithm)

  • 고영은;이석희;오경욱;방성일
    • 대한전자공학회논문지TC
    • /
    • 제44권11호
    • /
    • pp.25-32
    • /
    • 2007
  • 본 논문에서는 RFID Tag 충돌방지를 위한 Group Separation 알고리듬에 대해 연구 하였다. 이를 위해 기존의 RFID Tag 충돌방지 기법인 ALOHA기반의 기법과 이진 검색 충돌방지 기반의 알고리듬을 먼저 비교 분석하였다. 기존 알고리듬은 태그를 인식하기 위한 탐색횟수와 전송하는 데이터량을 감소시키는데 한계점을 가지고 있었다. 제안한 Group Separation 알고리듬은 인식범위 내의 태그를 구별하기 위해, 태그 ID의 1의 개수에 따라 그룹을 나누어 검색한다. 검색 초기에 식별 그룹을 세분화하였으므로 각 그룹의 호출에 응답 가능한 태그 ID의 개수는 크게 줄어들 뿐만 아니라 간단한 연산과정으로 쉽게 예상이 가능하다. 리더는 검색 이전에 각 그룹에서 발생 가능한 충돌 지점과 그에 따른 태그 ID를 산출하여 테이블로 구성하여 메모리에 저장하고, 충돌이 발생하면 메모리의 충들 테이블에서 충돌 지점에 따른 태그 ID를 검색한다. 알고리듬의 성능평가는 태그를 인식하기 위한 리더의 반복횟수와 전송 데이터 량으로 나타내었다. 성능평가 결과, 기존의 알고리듬과 비교하여 Group Separation 알고리듬의 반복횟수가 최대 20.4% 감소되었고, 전송 데이터 량도 1/4.5배 감소된 것을 확인할 수 있었다.

RFID의 효율적인 태그인식을 위한 Adaptive Decision 알고리즘 (Adaptive Decision Algorithm for an Improvement of RFID Anti-Collision)

  • 고영은;오경욱;방성일
    • 대한전자공학회논문지TC
    • /
    • 제44권4호
    • /
    • pp.1-9
    • /
    • 2007
  • 본 논문에서는 RFID Tag 충돌방지를 위한 Adaptive Decision 알고리즘에 대해 연구 하였다. 이를 위해 기존의 RFID Tag 충돌방지 기법인 ALOHA기반의 기법과 이진 검색 충돌방지 기반의 알고리즘을 먼저 비교?분석하였다. 기존 알고리즘은 태그를 인식하기 위한 탐색횟수와 전송하는 데이터량을 감소시키는데 한계점을 가지고 있었다. 제안한 Adaptive Decision 알고리즘은 인식범위 내의 태그를 구별하기 위해, 호출에 응답한 모든 태그의 ID 비트 별 '1'의 개수를 계산하고, 개수가 작은 그룹의 태그를 우선적으로 식별한다. 각 태그 ID 비트의 '1'의 개수는 리더의 메모리에 저장하고, 식별된 태그 ID 비트의 ‘1’의 개수를 감산한다. 이와 같은 과정을 반복함으로써 인식범위 내의 모든 태그를 식별한다. 논문에서 제안한 능동적인 태그 선택기준과 간단한 가감 과정을 통해 불필요한 탐색횟수를 줄 일 수 있다. 알고리즘의 성능평가는 태그를 인식하기 위한 리더의 반복횟수와 전송 데이터 량으로 나타내었다. 성능평가 결과, 기존의 알고리즘과 비교하여 Adaptive Decision 알고리즘의 반복횟수가 16.8% 감소되었고, 전송 데이터 량도 ¼배 감소된 것을 확인할 수 있었다.

인터넷 라우터에서의 패킷 분류를 위한 2차원 이진 검색 트리 (Two-dimensional Binary Search Tree for Packet Classification at Internet Routers)

  • 이고은;임혜숙
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.21-31
    • /
    • 2015
  • 현재의 인터넷 사용자들은 실시간으로 다양한 멀티미디어 서비스를 제공 받길 원한다. 이에 네트워크 트래픽의 속도는 매우 빨라지고 있으며, 처리하여야 하는 데이터의 양은 해마다 기하급수적으로 증가하고 있다. 데이터는 '패킷'이라는 단위의 데이터 형식으로 전송되며, 패킷분류는 인터넷 라우터의 가장 어려운 기능 중 하나로 모든 패킷에 대하여 선속도로 처리되어야 한다. 다양한 패킷 분류 알고리즘 중, 영역분할 패킷분류 알고리즘은 5개의 패킷 헤더 필드 정보를 동시에 검색할 수 있는 효율적인 알고리즘이다. 영역 분할 사분 트라이는 가장 대표적인 영역분할 패킷분류 알고리즘으로 메모리 요구량이 적은 알고리즘이지 만, 빠른 검색성능을 보장하지 못하는 단점이 있다. 본 논문에서는, 영역 분할 사분 트라이의 단점을 이진 검색 트리를 사용해 보완하는 새로운 알고리즘을 제안한다. 실험을 통하여 제안하는 알고리즘은 입력과 비교되는 룰의 수에 있어 영역 분할 사분 트라이 보다 검색 성능이 향상됨을 보았다.

Evaluation of Machine Learning Algorithm Utilization for Lung Cancer Classification Based on Gene Expression Levels

  • Podolsky, Maxim D;Barchuk, Anton A;Kuznetcov, Vladimir I;Gusarova, Natalia F;Gaidukov, Vadim S;Tarakanov, Segrey A
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권2호
    • /
    • pp.835-838
    • /
    • 2016
  • Background: Lung cancer remains one of the most common cancers in the world, both in terms of new cases (about 13% of total per year) and deaths (nearly one cancer death in five), because of the high case fatality. Errors in lung cancer type or malignant growth determination lead to degraded treatment efficacy, because anticancer strategy depends on tumor morphology. Materials and Methods: We have made an attempt to evaluate effectiveness of machine learning algorithms in the task of lung cancer classification based on gene expression levels. We processed four publicly available data sets. The Dana-Farber Cancer Institute data set contains 203 samples and the task was to classify four cancer types and sound tissue samples. With the University of Michigan data set of 96 samples, the task was to execute a binary classification of adenocarcinoma and non-neoplastic tissues. The University of Toronto data set contains 39 samples and the task was to detect recurrence, while with the Brigham and Women's Hospital data set of 181 samples it was to make a binary classification of malignant pleural mesothelioma and adenocarcinoma. We used the k-nearest neighbor algorithm (k=1, k=5, k=10), naive Bayes classifier with assumption of both a normal distribution of attributes and a distribution through histograms, support vector machine and C4.5 decision tree. Effectiveness of machine learning algorithms was evaluated with the Matthews correlation coefficient. Results: The support vector machine method showed best results among data sets from the Dana-Farber Cancer Institute and Brigham and Women's Hospital. All algorithms with the exception of the C4.5 decision tree showed maximum potential effectiveness in the University of Michigan data set. However, the C4.5 decision tree showed best results for the University of Toronto data set. Conclusions: Machine learning algorithms can be used for lung cancer morphology classification and similar tasks based on gene expression level evaluation.

A Comparative Study of Predictive Factors for Passing the National Physical Therapy Examination using Logistic Regression Analysis and Decision Tree Analysis

  • Kim, So Hyun;Cho, Sung Hyoun
    • Physical Therapy Rehabilitation Science
    • /
    • 제11권3호
    • /
    • pp.285-295
    • /
    • 2022
  • Objective: The purpose of this study is to use logistic regression and decision tree analysis to identify the factors that affect the success or failurein the national physical therapy examination; and to build and compare predictive models. Design: Secondary data analysis study Methods: We analyzed 76,727 subjects from the physical therapy national examination data provided by the Korea Health Personnel Licensing Examination Institute. The target variable was pass or fail, and the input variables were gender, age, graduation status, and examination area. Frequency analysis, chi-square test, binary logistic regression, and decision tree analysis were performed on the data. Results: In the logistic regression analysis, subjects in their 20s (Odds ratio, OR=1, reference), expected to graduate (OR=13.616, p<0.001) and from the examination area of Jeju-do (OR=3.135, p<0.001), had a high probability of passing. In the decision tree, the predictive factors for passing result had the greatest influence in the order of graduation status (x2=12366.843, p<0.001) and examination area (x2=312.446, p<0.001). Logistic regression analysis showed a specificity of 39.6% and sensitivity of 95.5%; while decision tree analysis showed a specificity of 45.8% and sensitivity of 94.7%. In classification accuracy, logistic regression and decision tree analysis showed 87.6% and 88.0% prediction, respectively. Conclusions: Both logistic regression and decision tree analysis were adequate to explain the predictive model. Additionally, whether actual test takers passed the national physical therapy examination could be determined, by applying the constructed prediction model and prediction rate.