• 제목/요약/키워드: C4.5알고리즘

검색결과 200건 처리시간 0.037초

진로교육을 위한 희망진로 예측프로그램 설계 (Design of a Hopeful Career Forecasting Program for the Career Education)

  • 김근호;김의정
    • 한국정보통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1055-1060
    • /
    • 2018
  • 4차 산업혁명을 맞이하여 학교 교육에 있어서 진로교육의 문제가 크게 대두되고 있다. 일선 현장에서도 인공지능 및 빅 데이터들을 효과적으로 처리하기 위한 서비스 또는 기술에 대하여 다양한 연구가 진행되고 있으나, 교육분야에 있어서는 학생들에 대한 데이터들을 단순처리과정을 거칠 뿐이다. 이에 본 논문에서는 인공지능 및 빅데이터를 활용한 학생들의 진로교육을 위한 진로 예측 프로그램을 설계 제시하고자 한다. 영재교육원 학생들의 관찰데이터를 이용하여 의사결정 트리중 가장 인공지능에 가깝고 효과적이라고 알려진 C4.5알고리즘으로 의사결정 트리를 구성하고 학생들의 희망 진로를 예측하는 것이다. 판별결과 카파계수는 0.7을 넘어 상당한 일치도를 보였고 평균절대오차도 0.1정도로 상당히 낮은 수치를 보였다. 이에 따라서 본 연구에서 보이듯이 많은 연구 및 데이터를 구축하여 학생들의 상담에 활용 진로를 제시하고 수업태도 및 방향을 제시하는데 도움이 될 것으로 사료된다.

해외선물 스캘핑을 위한 강화학습 알고리즘의 성능비교 (Performance Comparison of Reinforcement Learning Algorithms for Futures Scalping)

  • 정득교;이세훈;강재모
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.697-703
    • /
    • 2022
  • 최근 Covid-19 및 불안한 국제정세로 인한 경기 침체로 많은 투자자들이 투자의 한 수단으로써 파생상품시장을 선택하고 있다. 하지만 파생상품시장은 주식시장에 비해 큰 위험성을 가지고 있으며, 시장 참여자들의 시장에 대한 연구 역시 부족한 실정이다. 최근 인공지능 분야의 발달로 파생상품시장에서도 기계학습이 많이 활용되고 있다. 본 논문은 해외선물에 분 단위로 거래하는 스캘핑 거래의 분석을 위해 기계학습 기법 중 하나인 강화학습을 적용하였다. 데이터 세트는 증권사에서 거래되는 해외선물 상품들 중 4개 상품을 선정해, 6개월간 1분봉 및 3분봉 데이터의 종가, 이동평균선 및 볼린저 밴드 지표들을 이용한 21개의 속성으로 구성하였다. 실험에는 DNN 인공신경망 모델과 강화학습 알고리즘인 DQN(Deep Q-Network), A2C(Advantage Actor Critic), A3C(Asynchronous A2C)를 사용하고, 학습 데이터 세트와 테스트 데이터 세트를 통해 학습 및 검증 하였다. 에이전트는 스캘핑을 위해 매수, 매도 중 하나의 행동을 선택하며, 행동 결과에 따른 포트폴리오 가치의 비율을 보상으로 한다. 실험 결과 에너지 섹터 상품(Heating Oil 및 Crude Oil)이 지수 섹터 상품(Mini Russell 2000 및 Hang Seng Index)에 비해 상대적으로 높은 누적 수익을 보여 주었다.

전해콘덴서 없는 단상/3상 겸용 11kW, 5.5kW/L 전기차 탑재형 충전기 (E-capless 11kW, 5.5kW/L EV On-Board Charger with Single and Three-Phase Grid Compatibility)

  • 김형진;박준영;함자벨카멜;라마단;최세완
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2020년도 전력전자학술대회
    • /
    • pp.25-27
    • /
    • 2020
  • 본 논문은 단상/3상 겸용 단일단 800V 전기차 탑재형 충전기를 제안한다. 제안하는 단일단 충전기는 넓은 단상/3상의 계통전압(120V-240V)에도 스위치의 ZVS 턴 온을 보장하며 전해 콘덴서 없이 DC충전이 가능하다. 2상 인터리브드 토템폴 구조로 구성되어 입력필터가 작으며 전해콘덴서가 없어서 5.5kW/L의 높은 전력밀도를 달성하였다. 또한 4차 고조파 주입 알고리즘을 통해 고조파 규정인 EN 61000-3-2 규정을 만족한다. 시작품의 타당성 및 성능 검증을 위해 SiC 소자를 적용하여 스위칭 주파수 150kHz의 11kW급 충전기를 제작하였고 제안하는 컨버터의 타당성 및 성능을 검증하였다.

  • PDF

Naive Bayes 분석기법을 이용한 유방암 진단 (Breast Cancer Diagnosis using Naive Bayes Analysis Techniques)

  • 박나영;김장일;정용규
    • 서비스연구
    • /
    • 제3권1호
    • /
    • pp.87-93
    • /
    • 2013
  • 선진국형 질병으로만 알려져 있던 유방암이 우리나라 현대 여성들에게 발병률이 꾸준히 증가하고 있다. 유방암은 보통 50대 이상의 여성에서 발병하는 병으로 알려져 있지만 우리나라의 경우 40대의 서양보다 젊은 여성들에게 발병률이 꾸준히 증가하고 있다. 따라서 우리나라 성인여성을 기준으로 유방암에 대한 정확한 진단을 할 수 있는 매뉴얼을 구축하는 것이 시급한 과제이다. 본 논문에서는 데이터마이닝기법을 이용하여 유방암을 예측하는 방법을 제시한다. 데이터마이닝이란 데이터베이스 내에 숨어 있는 일정한 패턴이나 변수들 간의 관계를 정교한 분석모형을 이용하여 쉽게 드러나지 않은 유용한 정보를 찾아내는 과정을 말한다. 실험을 통하여 Deicion Tree와 Naive Bayes 분석기법을 사용하여 유방암을 진단하는 분석기법을 비교분석을 하였다. Deicison Tree는 C4.5 알고리즘을 적용하여 분석하였고 두 알고리즘이 상당히 좋은 분류 정확도를 나타냈다. 그러나 Naive Bayes 분류방법이 Decision Tree방법보다 더 상회하는 정확도를 보였고 이는 의료데이터의 특성에 많이 기인한다고 볼 수 있다.

  • PDF

불완전한 데이터를 처리하기 위한 데이터 확장기법 (A data extension technique to handle incomplete data)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제12권2호
    • /
    • pp.7-13
    • /
    • 2021
  • 본 논문은 학습 데이터에 손실값을 포함하고 있는 불완전한 데이터를 위하여 확률을 나타낼 수 있는 형식으로 변환한 후 손실값을 보상하는 알고리즘을 소개한다. 기존에 이러한 데이터 변환을 사용한 방법에서는 손실 변수가 가질 수 있는 균등한 확률로 손실값을 할당하여 불완전한 데이터를 처리하는 것이었다. 이 방법으로 많은 문제에 적용하여 좋은 결과를 얻었으나, 손실 변수에 남아있는 모든 정보를 무시하고 새로운 값을 할당한다는 점에서 정보의 손실이 있다는 지적이 있었다. 이에 반해 새로운 제안 방법은 손실값을 포함하지 않는 완전한 정보만을 잘 알려진 분류 알고리즘(C4.5)에 입력하고 학습하는 중에 결정트리가 구축된다. 그리고 이 결정트리로 부터 손실값에 대한 확률을 구하여 이를 손실 변수의 추정값으로 할당한다. 즉, 불완전한 학습 데이터에서 손실되지 않은 많은 정보들을 사용하여 손실된 일부 정보를 복구하는 것이다.

TMS320C5416을 이용한 SOLA-B 알고리즘과 G.729A 보코더의 음질 향상된 가변 전송률 보코더의 실시간 구현 (Real-time Implementation of Variable Transmission Bit Rate Vocoder Improved Speech Quality in SOLA-B Algorithm & G.729A Vocoder Using on the TMS320C5416)

  • 함명규;배명진
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.241-250
    • /
    • 2003
  • In this paper, we implemented the vocoder of variable rate by applying the SOLA-B algorithm to the G.729A to the TMS320C5416 in real-time. This method using the SOLA-B algorithm is that it is reduced the duration of the speech in encoding and is played at the speed of normal by extending the duration of the speech in decoding. But the method applied to the existed G.729A and SOLA-B algorithm is caused the loss of speech quality in G.729A which is not reflected about length variation of speech. Therefore the proposed method is encoded according as it is modified the structure of LSP quantization table about the length of speech is reduced by using the SOLA-B algorithm. The vocoder of variable rate by applying the G.729A and SOLA-B algorithm is represented the maximum complexity of 10.2MIPS about encoder and 2.8MIPS about decoder in 8kbps transmission rate. Also it is evaluated 17.3MIPS about encoder, 9.9MIPS about decoder in 6kbps and 18.5MIPS about encoder, 11.1MIPS about decoder in 4kbps according to the transmission rate. The used memory is about program ROM 9.7kwords, table ROM 4.69kwords, RAM 5.2kwords. The waveform of output is showed by the result of C simulator and Bit Exact. Also, the result of MOS test for evaluation of speech quality of the vocoder of variable rate which is implemented in real-time, it is estimated about 3.68 in 4kbps.

  • PDF

유전자 알고리즘 및 국소 적응 오퍼레이션 기반의 의료 진단 문제 자동화 기법 연구 (Medical Diagnosis Problem Solving Based on the Combination of Genetic Algorithms and Local Adaptive Operations)

  • 이기광;한창희
    • 지능정보연구
    • /
    • 제14권2호
    • /
    • pp.193-206
    • /
    • 2008
  • 의료 진단 문제는 기정의된 특성치들로 표현되는 환자의 상태 데이터로부터 병의 유무를 판단하는 일종의 분류 문제로 간주할 수 있다. 본 연구는 혼용 유전자 알고리즘 기반의 분류방법을 도입함으로써 의료 진단 문제와 같은 다차원의 패턴 분류 문제를 해결할 수 있는 방안을 제안하고 있다. 일반적으로 분류 문제는 데이터 패턴에 존재하는 여러 클래스 간 구분경계를 생성하는 접근방법을 사용하는데, 이를 위해 본 연구에서는 일단의 영역 에이전트들을 도입하여 이들을 유전자 알고리즘 및 국소 적응조작을 혼용함으로써 데이터 패턴에 적응하도록 유도하고 있다. 일반적인 유전자 알고리즘의 진화단계를 거친 에이전트들에 적용되는 국소 적응조작은 영역 에이전트의 확장, 회피 및 재배치로 이루어지며, 각 에이전트의 적합도에 따라 이들 중 하나가 선택되어 해당 에이전트에 적용된다. 제안된 의료 진단용 분류 방법은 UCI 데이터베이스에 있는 잘 알려진 의료 데이터, 즉 간, 당뇨, 유방암 관련 진단 문제에 적용하여 검증하였다. 그 결과, 기존의 대표적인 분류기법인 최단거리이웃방법(the nearest neighbor), C4.5 알고리즘에 의한 의사 결정트리(decision tree) 및 신경망보다 우수한 진단 수행도를 나타내었다.

  • PDF

MPEG 영상/비디오 압축을 위한 디지털 워터마킹 기법 (A Digital Watermarking Technique for MPEG Image/Video Compression)

  • 유병석;최현준;서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.406-414
    • /
    • 2005
  • 디지털 컨텐츠, 특히 정보 집약성이 큰 특성으로 인해 가장 선호되는 영상/비디오 컨텐츠에 대한 저작권보호 기술의 필요성이 크게 대두되고 있다. 이러한 문제를 해결하기 위해 본 논문에서는 가장 비전 있는 기술로 인식되는 디지털 워터마킹 알고리즘을 제안하였다. 본 알고리즘은 MPEG 압축 시스템을 대상으로 하였고 워터마킹 과정은 압축 과정 중에 수행되며 워터마크는 I 프레임의 명암성분에 삽입된다. 실험 결과에서는 제안된 방법이 여러 공격에 대해서 비가시성과 강인성을 모두 만족하는 것을 보였고 워터마킹 과정을 수행한 압축된 이미지들과 수행하지 않은 압축된 이미지들(색차 포맷 Y:Cb:Cr=4:2:0을 사용하는 TM-5 기반 압축에 대해서 평균 압축률이 약 27:1 이었다)사이의 평균 PSNR의 차가 단지 1.8dB($4.2\%$)의 낮은 값이 측정되었다. 공격 후에 영상을 재사용할 수 있는 경우에 대해서는 추출된 워터마크와 원 워터마크의 정규화 상관도가 0.8 이상의 높은 값이 측정되었다.

Gaussian Mixture Model 기반 전완 근전도 패턴 분류 알고리즘 (A Gaussian Mixture Model Based Pattern Classification Algorithm of Forearm Electromyogram)

  • 송영록;김서준;정의철;이상민
    • 재활복지공학회논문지
    • /
    • 제5권1호
    • /
    • pp.95-101
    • /
    • 2011
  • 본 논문에서는 의수환자의 일상생활을 고려한 1-자유도 동작을 손을 쥐고 폄으로 정의하고, 두 동작에 대한 근전도 패턴 분류를 위한 가우시안 혼합 모델 기반의 근전도 패턴 분류 알고리즘을 제안한다. 근전도 패턴 분류 알고리즘의 핵심이 되는 근전도 신호의 특징점 추출을 위하여 근전 신호의 진폭 특성을 고려하는 절대차분평균치(DAMV)와 평균절대값(MAV)을 사용한다. 또한 동작에 대한 근전 신호의 진폭 특성을 보다 명확히 구분하기 위하여 D_DAMV와 D_MAV를 제안한다. 본 논문에서는 4명의 성인남성을 대상으로 실험을 실시하였고, 두 동작에 대한 근전도 패턴의 정확한 분류 여부를 확인하였다.

신경회로망을 이용한 스마트 무인기용 가스터빈 엔진의 성능진단에 관한 연구 (A Study on Performance Diagnostic of Smart UAV Gas Turbine Engine using Neural Network)

  • 공창덕;기자영;이창호;이승현
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2006년도 제26회 춘계학술대회논문집
    • /
    • pp.213-217
    • /
    • 2006
  • PW206C 터보 축 엔진을 위해 신경회로망을 이용한 지능형 성능 진단 프로그램이 제안되었다. 이 엔진은 항공우주연구원에서 개발 중에 있는 틸트 로터 타입 스마트 무인기의 추진시스템으로 선정되었다. 1개의 은닉층, 입력층, 출력층을 가지는 BPN(Back Propagation Network)이 신경회로망을 훈련시키기 위해 이용되었다. 입력층은 7개의 뉴런을 가지는데 SHP, MF, P2, T2, P4, T4 및 T5와 같은 측정파라미터이며 출력층은 6개의 뉴런으로 구성되어 있으며 각각은 압축기, 압축기 터빈, 동력 터빈의 유량 함수 및 효율이다. 신경망을 훈련하고 테스트하기 위한 데이터 베이스는 가스터빈 성능모사 프로그램을 이용하여 구성하였다. 훈련된 신경망을 PW206C 터보 축 엔진의 진단에 적용한 결과 제안된 진단 알고리즘이 압축기 오염과 압축기 터빈의 침식과 같은 단일 손상을 탐지하는데 유용함을 확인하였다.

  • PDF