• 제목/요약/키워드: 의사결정 알고리즘

검색결과 583건 처리시간 0.029초

빅데이터마이닝을 이용한 회계정보처리 모형 (Accounting Information Processing Model Using Big Data Mining)

  • 김경일
    • 융합정보논문지
    • /
    • 제10권7호
    • /
    • pp.14-19
    • /
    • 2020
  • 확장성 보고서 언어인 XML기술을 회계보고 영역에 응용한 인터넷 표준인 XBRL에 기초한 회계정보처리 모형을 제안하고자 한다. 기업마다 문서의 특성이 상이하기에 의사결정자에게 유용한 정보를 제공하여야 한다는 회계의 목적에 비추어 그 중요성이 크다. 본 연구는 X-Hive 데이터베이스 내에 XBRL로 저장된 XML 계층구조를 기반으로 하는 데이터 마이닝 모형을 제안하고자 한다. 데이터마이닝 분석은 연관규칙으로 실험되었고 XBRL을 기반으로 DC-Apriori 데이터마이닝 방법을 Apriori알고리즘과 X쿼리를 결합하여 제안한다. 마지막으로 제안 모형의 타당성과 유효성에 대해서는 실험을 통해 검증하였다.

건설업의 산업재해 특성분석을 위한 의사결정나무 기법의 상용 최적 알고리즘 선정 (Selection of an Optimal Algorithm among Decision Tree Techniques for Feature Analysis of Industrial Accidents in Construction Industries)

  • 임영문;최요한
    • 대한안전경영과학회지
    • /
    • 제7권5호
    • /
    • pp.1-8
    • /
    • 2005
  • The consequences of rapid industrial advancement, diversified types of business and unexpected industrial accidents have caused a lot of damage to many unspecified persons both in a human way and a material way Although various previous studies have been analyzed to prevent industrial accidents, these studies only provide managerial and educational policies using frequency analysis and comparative analysis based on data from past industrial accidents. The main objective of this study is to find an optimal algorithm for data analysis of industrial accidents and this paper provides a comparative analysis of 4 kinds of algorithms including CHAID, CART, C4.5, and QUEST. Decision tree algorithm is utilized to predict results using objective and quantified data as a typical technique of data mining. Enterprise Miner of SAS and AnswerTree of SPSS will be used to evaluate the validity of the results of the four algorithms. The sample for this work chosen from 19,574 data related to construction industries during three years ($2002\sim2004$) in Korea.

사상체질 임상자료 기반 의사결정나무 생성 알고리즘 비교 (Comparison among Algorithms for Decision Tree based on Sasang Constitutional Clinical Data)

  • 진희정;이수경;이시우
    • 한국한의학연구원논문집
    • /
    • 제17권2호
    • /
    • pp.121-127
    • /
    • 2011
  • Objectives : In the clinical field, it is important to understand the factors that have effects on a certain disease or symptom. For this, many researchers apply Data Mining method to the clinical data that they have collected. One of the efficient methods for Data Mining is decision tree induction. Many researchers have studied to find the best split criteria of decision tree; however, various split criteria coexist. Methods : In this paper, we applied several split criteria(Information Gain, Gini Index, Chi-Square) to Sasang constitutional clinical information and compared each decision tree in order to find optimal split criteria. Results & Conclusion : We found BMI and body measurement factors are important factors to Sasang constitution by analyzing produced decision trees with different split measures. And the decision tree using information gain had the highest accuracy. However, the decision tree that produced highest accuracy is changed depending on given data. So, researcher have to try to find proper split criteria for given data by understanding attribute of the given data.

데이터 마이닝과 집단 지성 기법을 활용한 소셜 콘텐츠 추천 방법에 대한 연구 (A Study on Social Contents-Recommendation method using Data Mining and Collective Intelligence)

  • 강대현;박한샘;이정민;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1050-1053
    • /
    • 2014
  • 웹 기반 서비스의 발전과 스마트 기기의 보급으로 사용자들은 다양한 웹 서비스들을 이용할 수 있게 되었고, 소셜 웹과 같은 사람들 간의 관계를 형성함으로써 정보를 주고받는 서비스에 접근하여 자신만의 콘텐츠를 생성, 공유하기가 용이해졌다. 그러나 소셜 웹 사용자들이 증가하고 지식의 양이 늘어남에 따라, 방대한 양의 지식들 중 필요한 정보만을 효율적으로 창출해내고자 하는 연구 또한 시도되어 왔다. 그러나, 기존의 방법은 다수의 서비스 사용자들의 공통적인 관심사가 반영된 결과를 도출해내기에는 부족하다는 단점이 있었다. 그리하여, 본 논문에서는 집단 지성 알고리즘과 의사 결정 나무를 활용하여 소셜 웹을 이용하는 사용자들의 태그와 URL 정보를 토대로 트렌드를 분석, 콘텐츠를 추천하는 방법을 제안하고, 이를 통하여 다수 사용자들의 기호가 반영된 다양한 정보들을 소셜 웹 사용자들에게 제공해줄 수 있음을 보인다.

대표적인 의사결정나무 알고리즘의 해석력 비교 (Interpretability Comparison of Popular Decision Tree Algorithms)

  • 홍정식;황근성
    • 산업경영시스템학회지
    • /
    • 제44권2호
    • /
    • pp.15-23
    • /
    • 2021
  • Most of the open-source decision tree algorithms are based on three splitting criteria (Entropy, Gini Index, and Gain Ratio). Therefore, the advantages and disadvantages of these three popular algorithms need to be studied more thoroughly. Comparisons of the three algorithms were mainly performed with respect to the predictive performance. In this work, we conducted a comparative experiment on the splitting criteria of three decision trees, focusing on their interpretability. Depth, homogeneity, coverage, lift, and stability were used as indicators for measuring interpretability. To measure the stability of decision trees, we present a measure of the stability of the root node and the stability of the dominating rules based on a measure of the similarity of trees. Based on 10 data collected from UCI and Kaggle, we compare the interpretability of DT (Decision Tree) algorithms based on three splitting criteria. The results show that the GR (Gain Ratio) branch-based DT algorithm performs well in terms of lift and homogeneity, while the GINI (Gini Index) and ENT (Entropy) branch-based DT algorithms performs well in terms of coverage. With respect to stability, considering both the similarity of the dominating rule or the similarity of the root node, the DT algorithm according to the ENT splitting criterion shows the best results.

다기준의사결정기법과 수정 A-STAR 알고리즘을 이용한 목적지 최적경로 탐색 기법 개발 (Development of Destination Optimal Path Search Method Using Multi-Criteria Decision Making Method and Modified A-STAR Algorithm)

  • 최미형;서민호;우제승;홍순기
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.891-897
    • /
    • 2021
  • In this paper, we propose a destination optimal route algorithm for providing route finding service for the transportation handicapped by using the multi-criteria decision-making technique and the modified A-STAR optimal route search algorithm. This is a method to set the route to the destination centering on safety by replacing the distance cost of the existing A-STAR optimal route search algorithm with the safety cost calculated through AHP/TOPSIS analysis. To this end, 10 factors such as road damage, curb, and road hole were first classified as poor road factors that hinder road driving, and then pairwise comparison of AHP was analyzed and then defined as the weight of TOPSIS. Afterwards, the degree of driving safety was quantified for a certain road section in Busan through TOPSIS analysis, and the development of an optimal route search algorithm for the transportation handicapped that replaces the distance cost with safety in the finally modified A-STAR optimal route algorithm was completed.

자이로 센서를 활용한 선형회귀 기반 건물 기울기 위험도 산출 시스템 (System for Computation of Inclination Risk of Building Based on Linear Regression Using Gyro Sensor)

  • 김다현;황도경;김동주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.61-64
    • /
    • 2021
  • 2016, 2017년 경주와 포항에서 발생한 규모 5.4 이상의 지진 당시 건물에 많은 피해가 속출함에 따라 지진 발생 시 건물 안전에 관한 관심이 증가하고 있다. 이러한 이유로 지진 등의 재난 상황 시 건물의 위험도를 신속하게 판단할 수 있는 방법론이 필요한 실정이다. 본 논문에서는 지진 등의 재난 상황 시 건물 안전에 위협이 될 수 있는 건물 기울기에 대한 위험도를 자이로 센서 데이터에 기반해 산출하는 시스템을 제안한다. 본 논문에서는건물 기울어짐 데이터를 확보함에 어려움이 있어 모의 거동 환경을 구축하여 데이터를 수집 및 분석하였다. 제안된 시스템은 자이로 센서로부터 수집된 실시간 기울기 데이터를 Mean Filter를 통해 데이터 평탄화 및 선형화를 수행 후 머신러닝 기법중 하나인 선형 회귀 알고리즘을 적용해 건물 기울기를 추정한다. 이후 국토교통부에서 고시한 건물 기울기 위험도 산출표를 바탕으로 측정된 기울기의 위험도를 산출한다. 해당 시스템은 실제 지진 등의 재난 발생 시 실시간 건물 기울기 위험 판단을 통해 신속한 재난 의사 결정에 도움이 될 것으로 기대된다.

  • PDF

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

CRT 알고리즘을 이용한 우리나라 노인의 사회활동 영향요인 예측 모형 개발 (Development of Predictive Model of Social Activity for the Elderly in Korea using CRT Algorithm)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.243-248
    • /
    • 2018
  • 노년기의 사회참여는 사회적 상호작용의 기회를 제공하여 삶의 만족감을 고취시키기 때문에 성공적인 노화를 달성하기 위해서 중요하다. 이 연구는 우리나라 지역사회 노인을 대상으로 노년기 사회 활동의 관련요인과 사회 참여를 예측하는 통계적 분류 모형을 구축하였다. 분석 대상은 2015년도 지역사회 건강조사를 완료한 60세 이상 노인 1,864명(남 829명, 여 1,035명)이었다. 결과 변수는 지난 1달 간 사회 활동 경험(있음, 없음)으로 정의하였다. 예측모형은 Classification and Regression Trees(CRT) 알고리즘 기반 의사결정나무모형을 이용하여 구축하였다. 연구결과, 사회참여의 유의미한 분류 변수는 주관적 건강, 이웃과의 만남빈도, 친척과의 만남빈도, 배우자 동거여부이었고, 그 중에서도 가장 우선적으로 관여하는 예측 요인은 주관적 건강수준이었다. 본 연구의 결과를 기초로 도래하는 초고령사회의 성공적인 노화를 대비하기 위해서 노인의 사회 활동에 대한 사회적 관심과 지원이 요구된다.

쉴드 TBM 디스크 커터 교체 유무 판단을 위한 머신러닝 분류기법 성능 비교 (Performance comparison of machine learning classification methods for decision of disc cutter replacement of shield TBM)

  • 김윤희;홍지연;김범주
    • 한국터널지하공간학회 논문집
    • /
    • 제22권5호
    • /
    • pp.575-589
    • /
    • 2020
  • 최근 국내 터널에서 지속적으로 증가하고 있는 쉴드 TBM 공법의 주된 굴착도구는 디스크 커터로 굴진과정에서 자연스럽게 마모가 발생하고 이는 TBM의 굴진효능을 현저히 저하시키기 때문에 적절한 시기에 교체하는 것이 중요하다. 따라서 본 연구에서는 디스크 커터 교체 여부를 판단할 수 있는 예측 모델을 머신러닝 기법을 사용한 방법으로 제안하였다. 이를 위해 국내 기 시공된 쉴드 TBM 현장의 데이터 중 디스크 커터 소모에 상관성이 높은 굴진데이터(TBM 기계데이터, 지반정보 등)와 교체이력을 입력데이터로 사용하여 다양한 머신러닝 분류기법 중 서포트 벡터 머신, 최근접이웃 알고리즘, 의사결정트리 알고리즘을 사용하여 최적의 예측 모델을 구축하고 모델의 성능을 평가하기 위하여 분류성능평가 지표로 비교 분석하였다.