• 제목/요약/키워드: 이종데이터학습

검색결과 128건 처리시간 0.023초

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

창업가의 실패 귀인 지향성이 재창업에 미치는 영향: 기업가적 자기 효능감과 회복 탄력성의 조절효과를 중심으로 (The Effects of Serial Entrepreneurs' Failure Attribution on Subsequent Venture: Moderating Effect of Entrepreneurial Self-efficacy and Resilience)

  • 이종선;김나미
    • 벤처창업연구
    • /
    • 제14권3호
    • /
    • pp.13-26
    • /
    • 2019
  • 사회경제적 부가가치 산출 및 파급효과가 높은 창업에 대한 관심이 증가하고 있는 추세이다. 창업이 가져오는 긍정적인 측면에 집중하여 적극적으로 권장되고 있지만, 실패에 대한 두려움은 창업을 주저하게 만드는 가장 큰 원인으로 꼽히고 있다. 불확실성과 위험성이 높은 창업이 가지는 근본적인 특성상 창업가는 실패를 경험하게 될 가능성이 크다. 하지만 실패하게 되더라도, 창업을 통해 습득했던 기업인의 경험과 지식은 재창업 시 중요한 원천으로 작용할 수 있으며 결코 사장되어서는 안 될 사회적 자산이 될 수 있다. 특히 재창업 시 동일한 산업에 재도전하는 것은 이전 창업 경험을 통한 학습효과를 극대화하는 것으로 보고된 바 있다. 이렇듯 실패 후 재창업은 창업 관련 연구에 있어 매우 중요한 주제임에도 이와 관련한 체계적인 연구는 부족한 실정이다. 본 연구는 창업가가 실패에 대해 귀인하는 경향성에 주목하여 이것이 재창업 과정에 어떠한 영향을 미치는지에 대하여 실증분석을 실시하였다. 또한 이 과정에서 기업가적 자기효능감과 회복 탄력성이 미치는 조절 효과를 함께 고찰해보고자 하였다. 이를 위하여 재기중소기업개발원을 통하여 실패 후 창업을 시도한 연속 창업가들을 대상으로 설문을 진행하여 데이터를 수집하여 분석을 실시하였다. 분석 결과, 창업 실패의 원인을 내부적으로 귀인하는 경향이 높을수록 재창업 시 기존에 창업한 바 있는 동일한 산업을 그대로 유지하려 하는 것으로 나타났다. 또한 이러한 실패 내부 귀인 경향이 재창업 시 동일 산업 유지에 미치는 긍정적 영향은 기업가적 자기 효능감이 높을 때와 회복 탄력성이 높을 경우에 그 효과가 강해지는 것으로 나타났다.

학술 소셜 네트워킹 서비스에서의 학문 분야별 연구자의 셀프 아카이빙 동기 분석 (Self-archiving Motivations across Academic Disciplines on an Academic Social Networking Service)

  • 이종욱;오상희
    • 한국도서관정보학회지
    • /
    • 제51권4호
    • /
    • pp.313-332
    • /
    • 2020
  • 본 연구에서는 학술 소셜 네트워킹 서비스에서의 연구자 셀프 아카이빙 동기를 학문 분야별로 비교하였다. 대표적인 학술 소셜 네트워킹 서비스인 ResearchGate 이용자를 대상으로 선행연구에서는 온라인 설문조사 결과를 실시하여 연구자의 18가지 셀프 아카이빙 동기 요인(흥미, 개인적/직업적 이익, 평판, 학습, 자기효능감, 이타심, 호혜성, 신용, 공동체 이익, 사회 참여, 홍보, 접근성, 문화, 외부적 요인, 신뢰, 시스템 안정성, 저작권 문제, 부가적인 시간 및 노력)을 도출하였다. 후속 연구인 본 연구에서는 Biglan의 학문 분류 기준을 적용하여 연구자의 학문 분야를 구분하고, 이들 분야별 셀프 아카이빙 동기를 비교하였다. 먼저 연구자들의 학문 분야를 경성-순수, 경성-응용, 연성-순수, 연성-응용으로 구분하여 동기를 분석하였으며, 그 다음 단계에서는 경성-연성과 순수-응용으로 구분하여 비교하였다. 나아가 연구자의 인구통계학적 특성과 ResearchGate 이용 현황에 따른 동기의 차이도 살펴보았다. 연구 결과, 학문 분야에 따라 흥미, 접근성, 외부적 요인, 부가적인 시간 및 노력에 대한 동기에 차이가 있는 것으로 밝혀졌다. 예를 들어 경성-순수 분야의 이용자들은 다른 분야의 이용자들에 비해 흥미에 대한 높은 동기를 가지고 있었으며, 연성-순수 분야의 이용자들은 다른 분야 이용자들과 비교하여 개인적/직업적 이익에 대해 높은 동기를 가지고 있었다. 이러한 다양한 학문분야의 연구자들의 동기에 대해 살펴본 연구 결과는 학술 소셜 네트워킹 서비스에서의 연구 데이터와 결과물 공유 활성화를 위한 전략 개발에 도움이 될 것으로 기대한다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.

레이저 용접을 이용한 전기차 배터리 이종접합 성공 확률 예측 프로그램 개발에 관한 연구 (A Study on the Development of a Program for Predicting Successful Welding of Electric Vehicle Batteries Using Laser Welding)

  • 김철환;문찬수;이관수;김진수;조애령;신보성
    • 마이크로전자및패키징학회지
    • /
    • 제30권4호
    • /
    • pp.44-49
    • /
    • 2023
  • 탄소중립을 위한 세계적인 노력 속에서 전기자동차의 사용이 급속하게 증가함에 따라 배터리에 대한 수요도 증가하고 있다. 따라서, 전기자동차의 높은 효율을 달성하기 위해 차체 무게 감소와 배터리에 대한 고려가 중요한 요소로 부각되고 있다. 경량 소재로 알려진 구리와 알루미늄은 레이저 용접을 통해 효과적으로 접합될 수 있다. 그러나 두 소재의 물리적 특성이 서로 다르기 때문에 이를 접합하는 것은 여전히 기술적인 어려움이 존재한다. 본 연구에서는 구리와 알루미늄을 레이저 용접으로 접합하기 위한 최적의 레이저 파라미터를 찾기 위해 시뮬레이션을 수행하였다. 또한, 결과를 시각적으로 제시하기 위해서 Python 언어를 활용하여 GUI(Graphic User Interface) 프로그램을 개발하였다. 이 프로그램은 기계 학습 이미지 데이터를 활용하여 접합 성공을 예측하며, 안전하고 효율적인 레이저 용접 가이드로 활용될 것으로 예상되어, 전기차 배터리 조립 공정의 안전성과 효율성에 기여할 것으로 기대된다.

동적 $H_2^{15}O$ PET에서 앙상블 독립성분분석법을 이용한 심근 혈류 정량화 방법 개발 (Development of Quantification Methods for the Myocardial Blood Flow Using Ensemble Independent Component Analysis for Dynamic $H_2^{15}O$ PET)

  • 이병일;이재성;이동수;강원준;이종진;김수진;최승진;정준기;이명철
    • 대한핵의학회지
    • /
    • 제38권6호
    • /
    • pp.486-491
    • /
    • 2004
  • 목적: 요소분석법. 독립성분분석법 등이 PET을 이용하여 심근혈류를 비침습적으로 측정하기 위하여 사용되어 왔다. 이론적으로 뛰어나고 새로운 방법인 앙상블 독려성분분석법을 이용하여 $H_2^{15}O$ 동적 심근 PET데이터의 정량분석방법을 개발하였다. 이 연구에서 사용한 앙상블 독려성분분석법을 이용하여 환자의 혈류를 정량화 하였다. 대상 및 방법: 관동맥질환이 의심되어 관류 SPECT를 시행한 환자 20명을 대상으로 $H_2^{15}O$ 동적 심근 PET을 시행한 후 앙상블 독립성분분석법을 이용하여 심근 독립성분영상을 추출하였으며, 좌심실영역과 심근영역에 대한 영상대조도를 조사하였다. 앙상블 학습은 독립성분과 가중치 행렬에 대한 확률분포를 가정하고 베이지안 이론에 의해서 혼합자료에 대한 확률분포를 추정한다. 이렇게 추정한 혼합자료의 확률분포와 실제 분포간의 차이인 Kullback-Leibler 발산치가 최소가 되도록 독립성분과 가중치 행렬을 순차적으로 변화시켜가며 최종 해를 찾는 방식이다. 이 연구에서 사후확률분포는 동적 핵의학 영상에 적합한 비음성제약조건과 함께 수정된 가우시안 분포를 이용하여 최적화 하였다. 혈류량은 심첨부, 중벽 네 부분, 하벽 네 부분의 9개 영역으로 나누어 측정하였으며, 측정결과에 대해 관류 SPECT 소견과 관동맥조영술의 소견과 비교하였다. 결과: 전체 20명의 휴식기 및 부하기 영상에서 5명을 제외한 15명의 데이터에 대해 심근혈류를 측정할 수 있었다. $H_2^{15}O$ 동적 심근 PET에서 앙상블 독립성분분석법을 이용하여 정량화한 휴식기 혈류량은 $1.2{\pm}0.40$ ml/min/g, 부하기 혈류량은 $1.85{\pm}1.12$ml/min/g이었다. 같은 영역에 대해 두 번 측정했을 때 측정된 심근혈류값의 상관계수는 0.99로 재현성이 높았다. 분리된 독립성분영상에서 영상대조도는 좌심실에 대한 심근영역의 비는 평균 1:2.7이었다. 관동맥 조영술을 시행한 9명에서 협착이 없는 분절과 협착이 있는 분절의 혈류예비능에 유의한 차이가 있었다(P<0.01). 또한, 관동맥조영술에서 협착이 확인된 66분절의 심근관류 SPECT 소견에서 가역적 혈류감소를 보인 분절의 혈류예비능이 더 많이 감소되는 경향을 보였으나 통계적 유의성을 보이지는 않았다. 결론: 앙상블 학습을 이용한 독립성분분석방법을 이용하여 심근혈류가 측정이 되었다. 앙상블 독립성분분석법을 이용한 $H_2^{15}O$ 동적 심근 PET 분석방법이 관상동맥 질환의 분석 및 동적 핵의학 영상 데이터의 연구에 도움이 될 것으로 기대된다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

KOMPSAT-3A 전정색 영상의 윤곽 정보를 이용한 중적외선 영상 시인성 개선 (Improvement of Mid-Wave Infrared Image Visibility Using Edge Information of KOMPSAT-3A Panchromatic Image)

  • 이진민;김태헌;김한울;이홍탁;한유경
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1283-1297
    • /
    • 2023
  • 중적외선(mid-wave infrared, MWIR) 영상은 피복 및 객체의 온도를 파악할 수 있어 환경, 국방 등 다양한 분야에서 핵심 데이터로 사용된다. KOMPSAT-3A 위성은 타 위성에 비해 높은 공간해상도의 MWIR 영상을 제공하지만, 광학(electro-optical, EO) 영상에 비해 상대적으로 낮은 시인성을 가져 활용성의 확대에 어려움을 겪는다. 이에 본 연구에서는 KOMPSAT-3A 전정색(panchromatic, PAN) 영상의 윤곽 정보를 기반으로 시인성이 높은 MWIR 융합 영상을 제작하고자 한다. 먼저, 이종 센서에서 취득된 PAN 영상과 MWIR 영상의 상대 기하오차를 제거하는 전처리를 수행하고, 딥러닝 기반 윤곽 정보 추출 기술인 Pixel difference network (PiDiNet)의 사전 학습 모델을 이용하여 PAN 영상에 대한 윤곽 정보를 추출한다. 이후 전처리된 MWIR 영상과 추출된 윤곽 정보를 중첩하여 객체 경계면이 강조된 MWIR 융합 영상을 제작한다. 제안 방법을 이용하여 서로 다른 세 지역에 대한 MWIR 융합 영상을 제작하였으며, 이를 시각적으로 분석하였다. 본 기법을 통해 제작된 MWIR 융합 영상은 지형 및 지물의 경계면이 강조되어 시인성이 개선되었으며, 세부적으로 관심 지역에 대한 열 정보를 전달할 수 있었다. 특히, MWIR 융합 영상에서는 저해상도의 원본 MWIR 영상에서 식별할 수 없었던 비행기, 선박 등의 객체를 육안으로 판독할 수 있었다. 본 연구는 가시적인 정보와 열 정보를 동시에 고려할 수 있는 단일 영상 제작 방법론을 제시하였으며, 이는 MWIR 영상의 활용성 확대에 이바지할 수 있을 것으로 사료된다.