• 제목/요약/키워드: Improved Decision Tree

검색결과 82건 처리시간 0.028초

독성 감지를 위한 생물 조기 경보 시스템 (Biological Early Warning System for Toxicity Detection)

  • 김성용;권기용;이원돈
    • 한국정보통신학회논문지
    • /
    • 제14권9호
    • /
    • pp.1979-1986
    • /
    • 2010
  • 생물 조기 경보 시스템은 물속 생명체의 행동을 관찰하여 독성을 감지한다. 이 시스템은 분류기를 물의 독성의 유무와 정도를 판단하기 위해 사용한다. 이 분류기의 성능을 높이기 위해 적용할 수 있는 방법 중에 부스팅 알고리즘이 있다. 부스팅은 기본 분류기로는 예측 정확도가 낮았던 분류하기 어려운 사건에 집중할 수 있도록 다음 번 데이터에 해당 훈련 사건(event)들이 뽑힐 확률을 높여준다. 횟수가 진행될수록 분류기가 어려운 사건들을 집중적으로 고려하게 된다. 그 결과 분류하기 어려웠던 사건에 대한 예측 성능은 좋아지지만, 비교적 쉬운 훈련 사건들의 정보는 버려지는 단점이 있다. 본 논문에서는 이 같은 단점을 보완하기 위해 분류기에 확장된 데이터 표현을 위한 점진적 학습법의 적용을 제안한다. 확장된 데이터 표현의 가중치 변수를 사용하면 약하게 분류되는 사건 뿐 아니라 쉽게 분류되는 사건의 정보까지도 사용하여 분류기의 예측 정확도를 높일 수 있게 된다. 새로 적용된 알고리즘과 기존의 중요도 변수를 사용하지 않는 learn++를 비교하여 성능이 향상됨을 검증하였다.

학습 스타일 심리검사를 이용한 부진아 학습 지원 시스템의 개발 및 효과 분석 (Development and Effect Analysis of a Learning Support System for Underachievers Using Psychological Learning Style Tests)

  • 이종숙;장은실;이용규
    • 정보교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.299-306
    • /
    • 2007
  • 정부교육기관의 조사에 따르면 학습부진아에 대한 학습 지원이 절실한 상황이다. 이에 본 논문에서는 학습 스타일 심리검사를 이용하여 부진아에게 맞는 학습방법으로 학습을 지원하는 부진아 학습 지원 시스템을 구축하였다. 제안한 시스템은 첫째, 부진아의 특성으로 구성된 의사결정트리와 사전평가가 점수를 통하여 부진아를 진단한다. 둘째, 부진아로 판단된 학생은 학습 스타일 심리검사를 실시하여 강의형 학습(청각형), 멀티미디어형 학습(시각형), 게임형 학습(촉각형) 방법 중에 한 형태의 학습방법으로 학습을 지원한다. 셋째, 사후평가를 통하여 학업성취도를 학인하고 학업성취도가 낮은 학생에 대해서는 교수자와의 일대일 개별지도를 지원한다. 제안한 시스템을 사용하여 학습부진아를 실험집단과 비교집단으로 나누어 학습을 검증한 결과 학습 스타일 심리검사를 실시하여 학습을 했을 경우의 학습성취도가 평균 10% 향상되었다.

  • PDF

인터넷마케팅에서 CRM을 통한 지불의사 상승효과에 관한 연구 : 프로야구 산업을 중심으로 (The Implementation of Customer Relationship Management (CRM) to Increase Willingness to Pay by Internet Marketing : The Case of Domestic Professional Baseball Industry in Korea)

  • 곽청이;함유근;이미영
    • Journal of Information Technology Applications and Management
    • /
    • 제21권1호
    • /
    • pp.17-34
    • /
    • 2014
  • As the numbers of Internet users have grown dramatically in recent years due to increased use of mobile devices, businesses using internet are also expanding rapidly. Internet marketing has the advantage of expanding business without any constraint of time and space using the global network which connects tens of thousands of world's computers and mobile devices. In a way of utilizing internet marketing, the present study examines the applicability of Customer Relationship Management (CRM) to the domestic professional baseball industry in Korea. The study focuses on the issue of whether the intangible value of customer satisfaction can create higher profits. We combine both inductive and conductive methods for this study. First, we carry out a random survey of baseball spectators and find that customers are willing to pay more when their satisfaction level is improved. Next, we recognize satisfaction factors that are considered as important by customers through literature survey. Then we use Decision Tree to find which satisfaction factors are most important to each clustered customer group. Finally we estimate how much they would pay more when the most important satisfaction factor improves by each customer group. Therefore, this study demonstrates that CRM implementation to one-to-one internet marketing can improve the profitability of baseball industry. The major contribution of the present study is to show that the introduction of CRM can be used as a profit-generating strategy in various industries for future internet marketing.

상황인식 보안 서비스를 이용한 개선된 접근제어 (Improved Access Control using Context-Aware Security Service)

  • 양석환;정목동
    • 한국멀티미디어학회논문지
    • /
    • 제13권1호
    • /
    • pp.133-142
    • /
    • 2010
  • 유비쿼터스 기술의 보편화에 따라 유비쿼터스 환경의 보안 취약성을 해결하기 위한 보안기술의 연구가 주목받고 있다. 그러나 현재의 대다수 보안 시스템은 고정된 규칙을 기반으로 하는 것으로서, 유비쿼터스 기반 사용자의 다양한 상황에 제대로 대응하지 못하는 문제점이 있다. 또한 기존의 상황인식 보안 연구는 ACL (Access Control List) 혹은 RBAC (Role-Based Access Control) 계열의 연구가 많이 수행되고 있으나 보안정책의 관리에 대한 오버헤드가 크고, 또한 예상하지 못한 상황에 대한 대응이 어렵다는 문제점을 보이고 있다. 이에 본 논문에서는 FCM (Fuzzy C-Means) 클러스터링 알고리즘과 퍼지 결정트리를 이용하여 다양한 상황을 인식하고 적절한 보안기능을 제공하는 상황인식 보안 서비스를 제안한다. 제안 모델은 기존의 RBAC 계열의 시스템이 가진 고정 규칙에 따른 문제나 충돌 문제, 관리상의 오버헤드를 개선할 수 있음을 확인할 수 있다. 제안 모델은 헬쓰케어 시스템이나 응급구호 시스템 등 상황 인식을 통하여 사용자의 상황에 적합한 서비스를 제공하는 다양한 애플리케이션에 응용 가능할 것으로 기대된다.

웨이브렛 기반 가변 블록 크기 플랙탈 영상 부호화 (Wavelet-Based Variable Block Size Fractal Image Coding)

  • 문영숙;전병민
    • 방송공학회논문지
    • /
    • 제4권2호
    • /
    • pp.127-133
    • /
    • 1999
  • 기존의 이산 웨이브렛 변환 기반 플랙탈 영상 압축은 프랙탈 부호화시 고정된 블럭 크기를 사용하므로 낮은 비트율에서 PSNR을 감소시킨다. 본 논문에서는 플랙탈 부호화시 가변 블록 크기를 사용하여 PSNR을 개선하는 이산 웨이브렛 기반 프랙탈 영상 부호화를 제안한다. 제안된 방법에서는 먼저 이산 웨이브렛 변환 계수들의 절대값을 최하고, 같은 공간 영역에 해당하는 다른 고주파 부대역의 이산 웨이브렛 변환 계수들을 묶어서 레인지 블록과 도메인 블록을 만든다. 그리고 각각의 레인지 블록 레벨의 레인지 블록에 대한 프랙탈 코드를 지정하고, 프랙탈 부호화,\ulcorner0\ulcorner부호화와 스칼라 양자화중 하나를 선택하여 만든 집합인 결정 트리 C를 만들고 스칼라 양자화기의 집합 q를 선택한다. 웨이브렛 계수, 프랙탈 코드와 결정 트리를 적응적 산술 부호화기를 사용하여 엔트로피 nq호화 한다. 제안된 방법은 낮은 비트율에서 PSNR을 개선하고 복원 영상의 블록킹 현상을 제거한다. 실험 결과를 통해서 제안한 방법은 기존의 프랙탈 부호화 방법과 웨이브렛 변환 부호화 방법에 비해 더 좋은 PSNR과 더 높은 압축율을 얻었다.

  • PDF

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

SMOTE와 Light GBM 기반의 불균형 데이터 개선 기법 (Imbalanced Data Improvement Techniques Based on SMOTE and Light GBM)

  • 한영진;조인휘
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권12호
    • /
    • pp.445-452
    • /
    • 2022
  • 디지털 세상에서 불균형 데이터에 대한 클래스 분포는 중요한 부분이며 사이버 보안에 큰 의미를 차지한다. 불균형 데이터의 비정상적인 활동을 찾고 문제를 해결해야 한다. 모든 트랜잭션의 패턴을 추적할 수 있는 시스템이 필요하지만, 일반적으로 패턴이 비정상인 불균형 데이터로 기계학습을 하면 소수 계층에 대한 성능은 무시되고 저하되며 예측 모델은 부정확하게 편향될 수 있다. 본 논문에서는 불균형 데이터 세트를 해결하기 위한 접근 방식으로 Synthetic Minority Oversampling Technique(SMOTE)와 Light GBM 알고리즘을 이용하여 추정치를 결합하여 대상 변수를 예측하고 정확도를 향상시켰다. 실험 결과는 Logistic Regression, Decision Tree, KNN, Random Forest, XGBoost 알고리즘과 비교하였다. 정확도, 재현율에서는 성능이 모두 비슷했으나 정밀도에서는 2개의 알고리즘 Random Forest 80.76%, Light GBM 97.16% 성능이 나왔고, F1-score에서는 Random Forest 84.67%, Light GBM 91.96% 성능이 나왔다. 이 실험 결과로 Light GBM은 성능이 5개의 알고리즘과 비교하여 편차없이 비슷하거나 최대 16% 향상됨을 접근 방식으로 확인할 수 있었다.

데이터마이닝 기법을 이용한 상수도 시스템 내의 탁도 예측모형 개발에 관한 연구 (A Study on the Turbidity Estimation Model Using Data Mining Techniques in the Water Supply System)

  • 박노석;김순호;이영주;윤석민
    • 대한환경공학회지
    • /
    • 제38권2호
    • /
    • pp.87-95
    • /
    • 2016
  • 탁도는 송 배수 관로의 부식 등에 의해 발생되는 것으로 알려진 'Discolored Water'현상을 수용가의 물 사용자가 인지할 수 있는 주요 지표로서 활용되고 있다. 즉, 'Discolored Water'는 수돗물 사용자가 육안으로 인지할 수 있는 정도의 탁도를 가진 상태로 정의할 수 있으며, 사용자는 수돗물에 존재하는 불특정의 용존 물질보다는 미세한 입자들에 대한 시각적인 인지인 탁도를 통해서 'Discolored Water'를 인식하게 된다. 이에 본 연구에서는 실제 국내 상수도 시스템 내에서 관측된 다항목의 수질데이터(탁도, pH 및 잔류염소)를 대상으로 하여 탁도 이외의 수질데이터들을 예측모형의 설명변수로 설정한 후 데이터 마이닝 기법(data mining)을 통해 기계학습(machine learning)을 수행하여, 상수도 시스템 내에서의 탁도 변화를 예측하는 모형을 수립하고자 하였다. 수집된 수질 데이터를 대상으로 데이터 마이닝 기법인 Decision Tree를 이용해 탁도 예측모형을 구축한 결과 pH 및 잔류염소를 설명변수로 적용한 모형이 가장 높은 예측결과를 나타내었다. 하지만 예측모형들은 peak 관측치에 대해서는 예측오차가 다소 증가하였는데 이를 보완하기 위해 고주파통과필터를 이용한 전처리 과정을 적용하였다. 그 결과 탁도 데이터의 시계열변화 및 peak 관측치에 대한 예측오차가 감소하는 것으로 나타났다.

비신뢰성 링크를 가진 로우 듀티사이클 무선센서네트워크 환경에서 향상된 동적 스위칭 기반 플러딩 방법 (An Enhanced Dynamic Switching-based Flooding scheme in Low-Duty-Cycled WSNs with unreliable links)

  • ;;염상길;김동수;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.216-217
    • /
    • 2015
  • Duty-cycling could efficiently prolong the life time of Wireless Sensor Networks (WSNs) by let nodes be in dormant state most of the time, and only wake up (for sending or receiving) for a very short period. Flooding is one critical operation of WSNs. Many studies have been studied to improve the delay and/or energy efficiency of flooding. In this paper, we propose a novel time slot design, and the switching decision that reduce energy consumption for the schedule-based flooding tree. Each node, if failed to receive from its parent, will look for other candidate, among its siblings to overhear the flooding packet. By accurately collect information from other siblings, each node can make the best as possible switching decision; therefore the energy efficiency of the network is improved.

연속 어휘 인식 시스템에서 어휘 클러스터링 모델의 성능 지원을 위한 검색 시스템 (Retrieve System for Performance support of Vocabulary Clustering Model In Continuous Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제10권9호
    • /
    • pp.339-344
    • /
    • 2012
  • 기존의 연속 어휘 인식 시스템에서는 의사 결정 트리 기반 공유 모델링 방법을 사용하여 인식률 향상 시킬 수 있었으나 이들 음소 데이타에 대한 검색을 지원할 수 없는 문제로 인해 시스템 모델의 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 연속 어휘 클러스터링 모델에서 음소 단위로 확률 모델을 검색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 95.88%의 인식률을 나타내었다.