• 제목/요약/키워드: Decision-tree technique

검색결과 201건 처리시간 0.032초

공공 DB 데이터마이닝 기법을 활용한 국내 청소년 삶의 만족도 분석에 관한 실증연구: 의사결정나무 기법을 중심으로 (Analysis of Korean Adolescents' Life Satisfaction based on Public Database and Data Mining Techniques: Emphasis on Decision Tree)

  • 조현진;고건우;이건창
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.297-309
    • /
    • 2020
  • 본 연구는 국내 공공 DB에 데이터마이닝 기법인 로지스틱 회귀분석과 의사결정나무 분석을 적용하여 국내 청소년의 삶의 만족도 증진에 관한 의미 있는 의사결정 규칙을 추출하는 과정을 분석한다. 분석을 위하여 한국아동·청소년패널조사(KYCPS) 중에서 중1 패널데이터의 4~6차연도 자료인 고등학생 학년별 자료를 활용하였다. 로지스틱 회귀분석으로 추출된 영향요인은 1학년은 전체 성적 만족도, 주의집중 문제, 우울, 자아 탄력성, 애정, 과잉간섭, 학습활동, 교사관계, 2학년은 가정의 경제 수준, 건강상태, 전체 성적 만족도, 신뢰, 소외, 학습활동, 학교규칙, 교우관계, 교사 관계, 3학년은 가정의 경제 수준, 전체 성적 만족도, 우울, 자아 탄력성, 애정, 학대, 학교규칙, 교사 관계로 나타났다. 의사결정나무 기법을 적용한 결과 국내 고등학생의 삶의 만족도는 개인의 정서 문제, 학교성적, 가정의 경제적 환경, 학교적응 등에 의하여 복합적으로 영향을 받는 것으로 파악되었다.

Predicting Discharge Rate of After-care patient using Hierarchy Analysis

  • Jung, Yong Gyu;Kim, Hee-Wan;Kang, Min Soo
    • International Journal of Advanced Culture Technology
    • /
    • 제4권2호
    • /
    • pp.38-42
    • /
    • 2016
  • In the growing data saturated world, the question of "whether data can be used" has shifted to "can it be utilized effectively?" More data is being generated and utilized than ever before. As the collection of data increases, data mining techniques also must become more and more accurate. Thus, to ensure this data is effectively utilized, the analysis of the data must be efficient. Interpretation of results from the analysis of the data set presented, have their own on the basis it is possible to obtain the desired data. In the data mining method a decision tree, clustering, there is such a relationship has not yet been fully developed algorithm actually still impact of various factors. In this experiment, the classification method of data mining techniques is used with easy decision tree. Also, it is used special technology of one R and J48 classification technique in the decision tree. After selecting a rule that a small error in the "one rule" in one R classification, to create one of the rules of the prediction data, it is simple and accurate classification algorithm. To create a rule for the prediction, we make up a frequency table of each prediction of the goal. This is then displayed by creating rules with one R, state-of-the-art, classification algorithm while creating a simple rule to be interpreted by the researcher. While the following can be correctly classified the pattern specified in the classification J48, using the concept of a simple decision tree information theory for configuring information theory. To compare the one R algorithm, it can be analyzed error rate and accuracy. One R and J48 are generally frequently used two classifications${\ldots}$

로지스틱 회귀모형과 의사결정나무 모형을 이용한 Cochlodinium polykrikoides 적조 탐지 기법 연구 (Study on Detection Technique for Cochlodinium polykrikoides Red tide using Logistic Regression Model and Decision Tree Model)

  • 박수호;김흥민;김범규;황도현;엥흐자리갈 운자야;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.777-786
    • /
    • 2018
  • 본 연구에서는 기계학습 기법의 한 갈래인 로지스틱 회귀모형과 의사결정나무 모형을 이용하여 인공위성 영상에서 Cochlodinium polykrikoides 적조 픽셀을 탐지하는 방법을 제안한다. 학습자료로 적조, 청수, 탁수해역에서 추출된 수출광량 분광 프로파일(918개)을 활용하였다. 전체 데이터셋의 70%를 추출하여 모형 학습에 활용하였으며, 나머지 30%를 이용하여 모형의 분류 정확도를 평가하였다. 정확도 평가 결과 로지스틱 회귀모형은 약 97%의 분류 정확도를 보였으며, 의사결정나무 모형은 약 86%의 분류 정확도를 보였다.

A Hybrid Model for Android Malware Detection using Decision Tree and KNN

  • Sk Heena Kauser;V.Maria Anu
    • International Journal of Computer Science & Network Security
    • /
    • 제23권7호
    • /
    • pp.186-192
    • /
    • 2023
  • Malwares are becoming a major problem nowadays all around the world in android operating systems. The malware is a piece of software developed for harming or exploiting certain other hardware as well as software. The term Malware is also known as malicious software which is utilized to define Trojans, viruses, as well as other kinds of spyware. There have been developed many kinds of techniques for protecting the android operating systems from malware during the last decade. However, the existing techniques have numerous drawbacks such as accuracy to detect the type of malware in real-time in a quick manner for protecting the android operating systems. In this article, the authors developed a hybrid model for android malware detection using a decision tree and KNN (k-nearest neighbours) technique. First, Dalvik opcode, as well as real opcode, was pulled out by using the reverse procedure of the android software. Secondly, eigenvectors of sampling were produced by utilizing the n-gram model. Our suggested hybrid model efficiently combines KNN along with the decision tree for effective detection of the android malware in real-time. The outcome of the proposed scheme illustrates that the proposed hybrid model is better in terms of the accurate detection of any kind of malware from the Android operating system in a fast and accurate manner. In this experiment, 815 sample size was selected for the normal samples and the 3268-sample size was selected for the malicious samples. Our proposed hybrid model provides pragmatic values of the parameters namely precision, ACC along with the Recall, and F1 such as 0.93, 0.98, 0.96, and 0.99 along with 0.94, 0.99, 0.93, and 0.99 respectively. In the future, there are vital possibilities to carry out more research in this field to develop new methods for Android malware detection.

인공지능을 이용한 급성 뇌졸중 환자의 재원일수 예측모형 개발 (Development of Predictive Model for Length of Stay(LOS) in Acute Stroke Patients using Artificial Intelligence)

  • 최병관;함승우;김촉환;서정숙;박명화;강성홍
    • 디지털융복합연구
    • /
    • 제16권1호
    • /
    • pp.231-242
    • /
    • 2018
  • 병원 재원일수의 효율적 관리는 병원의 수익과 환자의 진료비 절감을 위해 매우 중요한 요소이다. 이러한 재원일수의 효율적 관리를 위해서는 병원들이 재원일수에 대해서 벤치마킹을 할 수 있도록 지원이 필요하고 재원일수 절감의 구체적인 방향을 제시해 줄 수 있는 재원일수 예측모형의 개발이 필요하다. 본 연구에서는 2013년과 2014년도 퇴원손상환자자료 중 급성뇌졸중 환자를 추출하여 분석용 자료를 만들고 인공지능을 이용하여 급성뇌졸중 환자의 재원일수 예측모형을 개발하였다. 분석용 자료는 훈련용 60%, 평가용 40%로 분류하였다. 모형개발은 전통적 통계기법인 다중회귀분석기법과 인공지능기법인 대화식 의사결정나무기법, 신경망 기법, 그리고 이들을 모두 통합한 앙상블기법을 이용하였다. 모형평가는 Root ASE(Absolute error) 지표를 이용하였는데, 다중회귀분석은 23.7, 대화식결정나무 23.7, 신경망 분석은 22.7, 앙상블은 22.7로 나타났고 이를 통하여 재원일수 예측모형 개발에 인공지능기법의 유용성이 입증되었다. 앞으로 재원일수 예측모형개발에 인공지능 기법을 보다 효율적으로 활용할 수 있는 방안에 대해서 계속적인 연구가 이루어 질 필요가 있다.

의사결정 규칙을 이용한 데이터 통합에 관한 연구 (A Study on the Data Fusion Method using Decision Rule for Data Enrichment)

  • 김순영;정성석
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.291-303
    • /
    • 2006
  • 대용량의 데이터로부터 의미있는 지식을 찾는 과정에서 데이터의 질은 무엇보다도 중요하다. 본 연구에서는 데이터의 충실도를 높이기 위한 방법으로 여러 경로로부터 수집된 데이터의 정보를 활용하기 위해 데이터 마이닝 알고리즘인 의사결정 규칙을 이용한 데이터 통합 기법을 제안하고, 실제 데이터를 이용하여 모의실험을 통해 제안된 알고리즘의 효율성을 비교하였다. 실험결과 제안된 알고리즘이 데이터 통합의 성능을 향상시킴을 알 수 있었다.

Estimating Indoor Radio Environment Maps with Mobile Robots and Machine Learning

  • Taewoong Hwang;Mario R. Camana Acosta;Carla E. Garcia Moreta;Insoo Koo
    • International journal of advanced smart convergence
    • /
    • 제12권1호
    • /
    • pp.92-100
    • /
    • 2023
  • Wireless communication technology is becoming increasingly prevalent in smart factories, but the rise in the number of wireless devices can lead to interference in the ISM band and obstacles like metal blocks within the factory can weaken communication signals, creating radio shadow areas that impede information exchange. Consequently, accurately determining the radio communication coverage range is crucial. To address this issue, a Radio Environment Map (REM) can be used to provide information about the radio environment in a specific area. In this paper, a technique for estimating an indoor REM usinga mobile robot and machine learning methods is introduced. The mobile robot first collects and processes data, including the Received Signal Strength Indicator (RSSI) and location estimation. This data is then used to implement the REM through machine learning regression algorithms such as Extra Tree Regressor, Random Forest Regressor, and Decision Tree Regressor. Furthermore, the numerical and visual performance of REM for each model can be assessed in terms of R2 and Root Mean Square Error (RMSE).

결정트리 기반의 기계학습을 이용한 동적 데이터에 대한 재익명화기법 (Re-anonymization Technique for Dynamic Data Using Decision Tree Based Machine Learning)

  • 김영기;홍충선
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.21-26
    • /
    • 2017
  • 사물인터넷, 클라우드 컴퓨팅, 빅데이터 등 새로운 기술의 도입으로 처리하는 데이터의 종류와 양이 증가하면서, 개인의 민감한 정보가 유출되는 것에 대한 보안이슈가 더욱 중요시되고 있다. 민감정보를 보호하기 위한 방법으로 데이터에 포함된 개인정보를 공개 또는 배포하기 전에 일부를 삭제하거나 알아볼 수 없는 형태로 변환하는 익명화기법을 사용한다. 그러나 준식별자의 일반화 수준을 계층화하여 익명화를 수행하는 기존의 방법은 데이터 테이블의 레코드가 추가 또는 삭제되어 k-익명성을 만족하지 못하는 경우에 더 높은 일반화 수준을 필요로 한다. 이와 같은 과정으로 인한 정보의 손실이 불가피하며 이는 데이터의 유용성을 저해하는 요소이다. 따라서 본 논문에서는 결정트리 기반의 기계학습을 적용하여 기존의 익명화방법의 정보손실을 최소화하여 데이터의 유용성을 향상시키는 익명화기법을 제안한다

적응적 움직임 벡터 해상도 고속 결정 기법 (Fast Decision Method of Adaptive Motion Vector Resolution)

  • 박상효
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.305-312
    • /
    • 2020
  • 기존 동영상 부호화 표준보다 더 높은 효율의 표준에 대한 수요가 커지면서, 최근 MPEG과 VCEG에서 Versatile Video Coding(VVC)이라는 차세대 동영상 부호화 프로젝트를 개발하고 표준화하고 있다. 압축 효율 증대를 위하여 다양한 화면간 부호화 기법이 등장하였으며, 특히 움직임 벡터의 적응적인 해상도 부호화가 등장하여 VVC의 압축 효율을 올리는데 기여하였다. 다만, 최적의 움직임 벡터 해상도를 결정하기 위해 부호화기에서 다양한 율-왜곡 비용을 계산해야 했기에, 부호화기 시간 복잡도가 높아지게 되었다. 실시간 동영상 방송 및 스트리밍 서비스를 위해서는 부호화기의 복잡도를 줄이는 것이 필요하나, 아직 적응적 움직임 벡터 해상도 결정기법에 대한 복잡도 감소 연구는 미개척분야이다. 따라서, 본 논문에서는 이 움직임 벡터 해상도 결정을 위한 부호화 복잡도를 줄이는 연구를 제안한다. 이를 위해, VVC의 특별한 트리 구조인 multi-type tree 구조 내에서의 부호화된 문맥을 활용한 고속 결정기법을 고안한다. 실험 결과, 본 고속결정 기법은 VVC 참조 소프트웨어 대비 약간의 압축효율 감소 내에서 10%의 전체 부호화 시간을 줄임을 확인하였다.

데이터마이닝 기법을 활용한 맞춤형 고혈압 사후관리 모형 개발 (A Development of a Tailored Follow up Management Model Using the Data Mining Technique on Hypertension)

  • 박일수;용왕식;김유미;강성홍;한준태
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.639-647
    • /
    • 2008
  • 본 연구는 국민건강보험공단의 건강검진데이터, 자격 및 보험료 그리고 진료비 데이터를 활용하여 고혈압 관리를 위한 맞춤형 고혈압 사후관리모형(고혈압 진료예측모형 및 고혈압 진료순응도세분화모형)을 개발하고자 하였다. 모형 개발에는 데이터마이닝의 로지스틱 회귀모형, 의사결정나무 그리고 앙상블 모형을 활용하였다. 고혈압 진료예측모형에서는 3가지 모형 중 로지스틱 회귀모형이 가장 우수한 모형으로 채택되었으며, 고혈압 진료순응도세분화모형은 의사결정나무모형을 통해 개발되었다. 본 연구는 전국 규모의 수년간 축적된 자료를 데이터마이닝을 활용함으로써 고혈압의 진료 및 진료순응도에 이르는 고혈압 사후관리 프로세스 전반에 걸친 결과를 도출함으로써 우리나라 고혈압 사후관리체계 구축에 기여할 것으로 사료된다.