• 제목/요약/키워드: 기계학습법

검색결과 170건 처리시간 0.03초

기계학습을 이용한 복숭아 경락가격 및 거래량 예측모형 비교 (The Comparison of Peach Price and Trading Volume Prediction Model Using Machine Learning Technique)

  • 김미혜;홍성민;윤상후
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2933-2940
    • /
    • 2018
  • 과일의 경우 다른 작물보다 날씨의 영향을 많이 받으므로, 농업인의 고부가가치 창출을 위해서는 날씨를 고려한 작물모형개발이 필요하다. 본 연구에서는 과실류 중에서 비교적 제한된 조건에서 생산되는 복숭아를 연구대상으로 선정하였으며, 옥답 4.0에서 제공하는 2015년부터 2017년까지 대구에서 거래된 복숭아자료를 사용하였다. 분석에 사용되는 기상자료는 재배면적에 대한 가중치를 부여하여 생성하였으며, 1일 전부터 7일 전까지 날씨자료 중 상관성이 높은 변수를 사용하였다. 분석 방법으로는 기계학습법에 해당하는 랜덤포레스트와 그래디언트부스팅(gradient boosting machine), XGboost을 사용하였다. 분석결과, XGboost의 성능이 가장 우수하게 나타났으며, 경락가격 예측은 비교적 잘 예측할 수 있었지만, 거래량 예측의 정확성은 그리 높지 않았다. 복숭아 거래량 예측에 영향을 미치는 상위 3개의 기상변수로는 최저온도, 평균최대온도, 강수량으로 나타났다.

fMRI 데이터에 적용한 인디언 뷔페 프로세스 닮은 성분 분석법 (Indian Buffet Process Inspired Component Analysis for fMRI Data)

  • 김준식;김은솔;임병권;이충연;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.191-194
    • /
    • 2011
  • 문서를 이루는 단어들의 빈도수가 지수법칙(power law)를 따른다는 지프의 법칩(Zipf's law)이 있다. 이러한 단어분포를 고려하여 문서의 토픽을 찾아내는 기계학습법이 디리쉴레 프로세스(Dirichlet process) 이다. 이를 발전시켜서 데이터의 잠재 요인(latent factor)들을 베이즈 확률모델에 기반한 샘플링 바탕으로 찾는 방법이 인디언 뷔페 과정(Indian buffet process) 이다. 우리는 25가지의 특징(feature)들에 대한 점수(rating)들이 볼드(blood oxygen dependent level) 신호와 함께 주어지는 PBAIC 2007 데이터에 주성분 분석법(principal component analysis)를 적용했다. PBAIC 2007 데이터는 비디오 게임을 수행하며 기능적뇌영상(functional magnetic resonance imaging, fMRI) 촬영을 하여 얻어진 공개데이터이다. 우리의 연구에서는 주성분 분석법을 이용하여 10개의 독립 성분(independent component)들을 찾았다. 그리고 1.75초 마다 촬영된 BOLD 신호와 10개의 고유벡터(eigenvector)들간의 내적을 취하여 가중치(weight)를 구하였다. 성분들의 가중치를 낮은 순서로 정렬함으로써 각 시간마다 주도적으로 영향을 미치는 성분들을 알아낼 수 있었다.

U-Net과 cWGAN을 이용한 탄성파 탐사 자료 보간 성능 평가 (Comparison of Seismic Data Interpolation Performance using U-Net and cWGAN)

  • 유지윤;윤대웅
    • 지구물리와물리탐사
    • /
    • 제25권3호
    • /
    • pp.140-161
    • /
    • 2022
  • 탄성파 탐사 자료 획득 시 자료의 일부가 손실되는 문제가 발생할 수 있으며 이를 위해 자료 보간이 필수적으로 수행된다. 최근 기계학습 기반 탄성파 자료 보간법 연구가 활발히 진행되고 있으며, 특히 영상처리 분야에서 이미지 초해상화에 활용되고 있는 CNN (Convolutional Neural Network) 기반 알고리즘과 GAN (Generative Adversarial Network) 기반 알고리즘이 탄성파 탐사 자료 보간법으로도 활용되고 있다. 본 연구에서는 손실된 탄성파 탐사 자료를 높은 정확도로 복구하는 보간법을 찾기 위해 CNN 기반 알고리즘인 U-Net과 GAN 기반 알고리즘인 cWGAN (conditional Wasserstein Generative Adversarial Network)을 탄성파 탐사 자료 보간 모델로 사용하여 성능 평가 및 결과 비교를 진행하였다. 이때 예측 과정을 Case I과 Case II로 나누어 모델 학습 및 성능 평가를 진행하였다. Case I에서는 규칙적으로 50% 트레이스가 손실된 자료만을 사용하여 모델을 학습하였고, 생성된 모델을 규칙/불규칙 및 샘플링 비율의 조합으로 구성된 총 6가지 테스트 자료 세트에 적용하여 모델 성능을 평가하였다. Case II에서는 6가지 테스트 자료와 동일한 형식으로 샘플링된 자료를 이용하여 해당 자료별 모델을 생성하였고, 이를 Case I과 동일한 테스트 자료 세트에 적용하여 결과를 비교하였다. 결과적으로 cWGAN이 U-Net에 비해 높은 정확도의 예측 성능을 보였으며, 정량적 평가지수인 PSNR과 SSIM에서도 cWGAN이 높은 값이 나타나는 것을 확인하였다. 하지만 cWGAN의 경우 예측 결과에서 추가적인 잡음이 생성되었으며, 잡음을 제거하고 정확도를 개선하기 위해 앙상블 작업을 수행하였다. Case II에서 생성된 cWGAN 모델들을 이용하여 앙상블을 수행한 결과, 성공적으로 잡음이 제거되었으며 PSNR과 SSIM 또한 기존의 개별 모델 보다 향상된 결과를 나타내었다.

초월평면 최적화를 이용한 최근접 초월평면 학습법의 성능 향상 방법 (An Optimizing Hyperrectangle method for Nearest Hyperrectangle Learning)

  • 이형일
    • 한국지능시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.328-333
    • /
    • 2003
  • 메모리기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안된 NGE이론에 기반한 최근접 초월평면법은 학습자료를 초월평면상에 투영시켜 생성된 초월평면을 이용한다. 이때 학습자료에 포합될 수 있는 오류자료가 그대로 초월평면에 포함되어 분류의 정확성을 저해하는 요인으로 작용하는 단점을 가지고 있다. 본 논문에서는 기존의 최근접 초월평면의 단점을 보완한 초월평면 최적화(OH:Optimizing Hyperrectangle) 방법을 제안 한다. 제안된 방법은 특징가중치 벡터를 초월평면마다 할당하여 학습하고, 학습 후 생성된 모든 초월평면에 대해 특징별 최빈구간을 추출하여 최적초월평면을 구성하여 분류 시 사용한다. 제안된 방법은 EACH시스템과 마찬가지로 k-NN분류기에서 필요로 하는 메모리 공간의 40%정도를 사용하며, 분류에 있어서는 EACH시스템 보다 우수한 인식 성능을 보이고 있다.

반자동구축된 개체명 주석코퍼스 DecoNAC과 KoBERT를 이용한 개체명인식 플랫폼 DecoNERO (A Named Entity Recognition Platform Based on Semi-Automatically Built NE-annotated Corpora and KoBERT)

  • 김신우;황창회;윤정우;이성현;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.304-309
    • /
    • 2020
  • 본 연구에서는 한국어 전자사전 DECO(Dictionnaire Electronique du COreen)와 다단어(Multi-Word Expressions: MWE) 개체명을 부분 패턴으로 기술하는 부분문법그래프(Local-Grammar Graph: LGG) 프레임에 기반하여 반자동으로 개체명주석 코퍼스 DecoNAC을 구축한 후, 이를 개체명 분석에 활용하고 또한 기계학습에 필요한 도메인별 학습 데이터로 활용하는 DecoNERO 개체명인식 플랫폼을 소개하는 데에 목적을 두었다. 최근 들어 좋은 성과를 보이는 것으로 보고되고 있는 기계학습 방법론들은 다양한 도메인을 기반으로한 대규모의 학습데이터를 필요로 한다. 본 연구에서는 정교하게 설계된 개체명 사전과 다단어 개체명 시퀀스에 대한 언어자원을 바탕으로 하는 반자동으로 학습데이터를 생성하는 방법론을 제안하였다. 본 연구에서 제안된 개체명주석 코퍼스 DecoNAC 기반 접근법의 성능을 실험하기 위해 온라인 뉴스 기사 텍스트를 바탕으로 실험을 진행하였다. 이 실험에서 DecoNAC을 적용한 경우, KoBERT 모델만으로 개체명을 인식한 결과에 비해 약 7.49%의 성능향상을 기대할 수 있음을 확인하였다.

  • PDF

反復 學習槪念을 利용한 두 臺의 로봇의 衝突回避 軌跡計劃 (Collision-Free Trajectory Planning for Dual Robot Arms Using Iterative Learning Concept)

  • 정낙영;서일홍;최동훈
    • 대한기계학회논문집
    • /
    • 제15권1호
    • /
    • pp.69-77
    • /
    • 1991
  • 본 연구에서는 주로 약결합된 경우의 다로봇시스템에 대한 효과적인 운동조정 법을 개발하였다. 약결합된 경우의 다로봇시스템은 아크용접, 분사 도료, 금속면의 디버링, 복잡한 조립작업, 검사등 수많은 작업에 투입될 수 있다.그와 같은 작업들 은 대부분 연적경로제어(continuous path control)방법을 요구하고 있는데 다로봇시스 템인 경우 작업대 주위의 정지 혹은 이동 장애물이나 제로봇상호간의 충격포험성을 해 결할 수 있는 효과적인 장애물회피 능력을 추가적으로 요구하고 있다. 그리고 연적 경로제어 형태의 거의 대부분의 첨단부의 속도를 정속도로 유지해주어야만 한다. 따 라서 모든 로봇들을 지정된 경로의 이탈없이 가능한 최대등속도로 운동시키기 위한 다 로봇시스템의 충격회피운동제어 알고리즘을 개발하게되었다.

SNP 데이터의 중요도 평가와 SVM 학습법을 이용한 폐암 감수성 예측 (Prediction of Lung Cancer Susceptibility using an Importance Evaluation of SNP Data and SVM Learning)

  • 류명춘;김상진;박창현
    • 한국콘텐츠학회논문지
    • /
    • 제8권10호
    • /
    • pp.11-19
    • /
    • 2008
  • 본 논문에서는 폐암의 발생에 관여하는 유전자 데이터인 SNP 데이터의 중요도 평가와 SVM 학습법을 이용하여 폐암 감수성을 예측하는 방법을 제안한다. 학습에 사용될 폐암 관련 양성 데이터에 비하여 음성 데이터의 수가 훨씬 많은 이유로 각 양성 데이터에 대하여 같은 성별과 적은 나이 차를 갖는 음성 데이터를 찾아서 쌍이 되도록 한다. 또한 각 SNP가 발병 예측에 미칠 영향력을 계산하는 수식을 도입하여 각 SNP의 중요도를 평가하고 SNP를 중요도에 따라 서열화 한다. 실험에서는 학습에 사용되는 순위별 SNP 개수에 따라 변화되는 예측률을 관측하였고, LOOCV 테스트 결과 제안된 방법은 실험 데이터에 대하여 최대 65.0%의 예측 정확도를 보였다.

기초 공학의 창의적인 실습 능력 향상을 위한 PBL 적용 사례 연구 (A Study Basic Engineering for Improving the Creative Practice PBL Case)

  • 박일수
    • 한국산학기술학회논문지
    • /
    • 제14권11호
    • /
    • pp.5396-5402
    • /
    • 2013
  • 본 연구에서는 공과대학 1학년을 대상으로 한 기초 공학 실습의 창의성 교육을 활성화하기 위한 대안으로 문제기반학습(PBL : Problem-Based Learning) 교육시스템을 적용하였다. 이러한 교육시스템의 개발의 이유는 공학에 관련된 지식과 실습능력이 전혀 없는 공과대학 1학년 학생들에 대한 기초이론과 기초실습에서 사용하는 재료의 특성과 공구사용법, 기계사용법을 숙달되도록 하였다. 기존의 실습교육은 정형화된 학습계획에 의해 교수 중심의 실습교육이 일률적으로 진행되어 학생들의 실습능력에 한계를 보여 왔다. 그러나 본 연구에서는 PBL에 입각하여 교재는 학생 스스로 선행학습을 하며 학습자 중심의 문제를 도출하고 소규모 단위실습 진행방법을 결정하여 실습 능력 향상에 대한 교육 프로세스를 제시하고자 한다. 이러한 연구결과로 기존의 실습교육보다 약 30% 학습 능력의 향상을 보였다.

선삭에서 비원형 단면 가공을 위한 제어 연구 (A Learning Control Algorithm for Noncircular Cutting with Lathe)

  • 이재규;오창진;김옥현
    • 한국정밀공학회지
    • /
    • 제12권6호
    • /
    • pp.96-104
    • /
    • 1995
  • A study for a lathe to machine workpiece with noncircular cross-section is presented. The noncircular cutting is accomplished by controlling radial tool position synchronized with revolution angle of the spindle according to the desired cross-sectional shape. A learning control algorithm is suggested for the tool positioning. The learning law of the algorithm is based on pole-zero cancellation, which guarantees the control stability. The control performances are analyzed and simulated on a numerical computer that the effectiveness of the control algorithm is convinced. The algorithm is tested on a conventional NC-lathe which shows some successful results.

  • PDF

A Comparative Study on Requirements Analysis Techniques using Natural Language Processing and Machine Learning

  • Cho, Byung-Sun;Lee, Seok-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.27-37
    • /
    • 2020
  • 본 연구의 목적은 다양한 도메인에 대한 소프트웨어 요구사항 명세서로부터 수집된 요구사항을 데이터로 활용하여 데이터 중심적 접근법(Data-driven Approach)의 연구를 통해 요구사항을 분류한다. 이 과정에서 기존 요구사항의 특징과 정보를 바탕으로 다양한 자연어처리를 이용한 데이터 전처리와 기계학습 모델을 통해 요구사항을 기능적 요구사항과 비기능적 요구사항으로 분류하고 각 조합의 결과를 제시한다. 그 결과로, 요구사항을 분류하는 과정에서, 자연어처리를 이용한 데이터 전처리에서는 어간 추출과 불용어제거와 같은 토큰의 개수와 종류를 감소하여 데이터의 희소성을 좀 더 밀집형태로 변형하는 데이터 전처리보다는 단어 빈도수와 역문서 빈도수를 기반으로 단어의 가중치를 계산하는 데이터 전처리가 다른 전처리보다 좋은 결과를 도출할 수 있었다. 이를 통해, 모든 단어를 고려하여 가중치 값은 기계학습에서 긍정적인 요인을 볼 수 있고 오히려 문장에서 의미 없는 단어를 제거하는 불용어 제거는 부정적인 요소로 확인할 수 있었다.