• 제목/요약/키워드: market performance index

검색결과 218건 처리시간 0.027초

코스피 방향 예측을 위한 하이브리드 머신러닝 모델 (Hybrid Machine Learning Model for Predicting the Direction of KOSPI Securities)

  • 황희수
    • 한국융합학회논문지
    • /
    • 제12권6호
    • /
    • pp.9-16
    • /
    • 2021
  • 과거 주가 데이터와 금융 관련 빅 데이터를 사용해 머신러닝 기법으로 주식시장을 예측하는 연구는 다양하게 있어 왔지만, HTS와 MTS를 통해 거래가 가능한 주가지수 연동 ETF가 생기면서 주가지수를 예측하는 연구가 최근 주목받고 있다. 본 논문에서는 KOSPI 연동 ETF를 거래할 목적으로 KOSPI의 상승 예측을 위한 머신러닝 모델과 하락예측을 위한 모델을 각각 구현한다. 이들 모델은 매개변수의 그리드 탐색을 통해 최적화 된다. 또한 정밀도를 개선해 ETF 거래 수익률을 높일 수 있도록 개별 모델들을 조합한 하이브리드 머신러닝 모델을 제안한다. 예측 모델의 성능은 정확도와 ETF 거래 수익률에 큰 영향을 미치는 정밀도로 평가된다. 하이브리드 상승 예측 모델의 정확도와 정밀도는 72.1 %와 63.8 %이고 하락 예측 모델은 79.8 %와 64.3 %이다. 하이브리드 하락 예측 모델에서 정밀도는 개별 모델보다 최소 14.3 %, 최대 20.5 % 개선되었다. 테스트 기간에 하이브리드 모델은 하락에서 10.49 %, 상승에서 25.91 %의 ETF 거래 수익률을 보였다. 인버스×2와 레버리지 ETF로 거래하면 수익률을 1.5 ~ 2배로 높일 수 있다. 하락예측 머신러닝 모델에 대한 추가 연구로 수익률을 더 높일 수 있을 것으로 기대한다.

워터쉐드와 U-net을 이용한 마네킹 패션 이미지의 자동 3D 데이터 추출 방법 (Automatic 3D data extraction method of fashion image with mannequin using watershed and U-net)

  • 박영민
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.825-834
    • /
    • 2023
  • 인터넷 쇼핑에서 상품의 사진과 동영상을 대체해 3D콘텐츠와 웹 3D 소프트웨어로 사용자에게 친숙한 이미지를 제공하려는 시도가 이어지고 있다 본 연구에서는 2D 이미지를 3D로 변환하여 고객들이 다양한 위치에서 상품을 파악할 수 있는 웹 3D 기술에 접목시키고 변환에 필요한 비용과 계산 시간을 줄일 수 있는 자동 변환기술을 제안하였다. 단 8대의 카메라 만을 사용하여 마네킹을 회전하는 턴테이블 위에 올려 놓고 촬영하는 시스템을 개발하였다. 이러한 시스템에서 촬영한 이미지에서 옷 부분만 추출하기 위해 U-net을 이용하여 마커를 제거하고, 배경 영역과 마네킹 영역의 컬러 특징 정보를 파악하여 옷 영역만을 추출하는 알고리즘을 제안하였다. 이 알고리즘을 이용하면 이미지를 촬영한 후 옷 영역만을 추출하는데 걸리는 시간이 이미지 하나당 2.25초며, 한 개의 옷에 대해 64장의 이미지를 촬영하는 경우에 총 144초(2분 4초)가 소요되어 매우 우수한 성능으로 3D오브젝트를 추출할 수 있다.

의무보유 종료와 VC투자가 주가에 미치는 영향 (Lock-up Expiration and VC Investments: Impact on Stock Prices)

  • 이진석;홍민구
    • 벤처창업연구
    • /
    • 제18권6호
    • /
    • pp.133-145
    • /
    • 2023
  • 본 연구에서는 제2벤처붐에 따른 VC의 스타트업 투자와 해당 주식에 대한 투자자들의 반응을 살펴보고자 하였다. VC는 비상장기업에 투자 후 기업가치를 제고하여 주식시장에 상장하고, 의무보유 기간 이후 매각함으로써 수익을 창출한다. 주식시장의 투자자들이 VC들의 투자방식에 적응하였는지 여부를 검증하기 위해 의무보유 기간 종료 전후 주식가격 변화에 차이가 존재함을 가정하였으며, 2017년 하반기 이후 기반이 마련된 제2벤처붐의 영향에 따른 차이를 살펴보기 위해 과거(2015년부터 2017년까지)와 최근(2020년부터 2022년까지)의 주가 영향을 비교 분석하였다. 본 연구의 주요 분석결과는 다음과 같다. 첫째, 의무보유 기간 종료에 따른 주가 변화는 과거에 종료일 전후 초과수익을 올릴 수 있었던 것과 달리 최근에는 시장보다 낮은 수익을 갖는 것으로 나타났다. 둘째, 의무보유 기간별 주가에 미치는 영향을 분석한 결과, 1개월과 12개월에서만 유의한 영향을 보여주었다. 특히, 제2벤처붐 이후 의무보유 기간이 1개월인 벤처금융 및 전문투자자의 주식은 의무보유에 대한 정보에 미리 반응하는 것을 확인할 수 있었다. 마지막으로 VC투자 여부에 따른 주가 영향에서는 제2벤처붐 이전과 달리 이후에 VC투자여부에 따라 누적초과수익률에서 차이가 존재하였다. 시사점으로는 첫째, VC들은 회수 전략을 변경할 필요성이 존재한다. VC들의 투자 및 회수 방식은 정보비대칭을 기반으로 하고 있는데, 분석결과 해당 정보로는 시장초과수익률을 달성하기 어렵기 때문이다. 둘째, 의무보유 권장기간 변경에 대한 고민이 필요하다. 상장 후 갑작스러운 주가 하락을 방지하기 위한 제도의 목적과 달리 의무보유 대상 주식은 오히려 가격 하락위험에 노출될 수 있기 때문이다. 따라서 의무보유 대상 및 권장기간을 재고하여 상장 후 투자자 보호에 대한 논의가 필요하다.

  • PDF

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

데이터마이닝을 활용한 기업 R&D역량 특성에 관한 탐색 연구 (A Study on the Characteristics of Enterprise R&D Capabilities Using Data Mining)

  • 김상국;임정선;박완
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.1-21
    • /
    • 2021
  • 글로벌 경영환경 변화로 기술개발과 시장니즈의 불확실성이 커지고 기업 간 상호 경쟁이 심화되면서 개별 기업들의 연구개발 활동에 대한 관심과 요구가 증가하고 있다. 이러한 환경변화에 대응하기 위하여 연구개발 기업들은 설비투자에 더욱 신중을 가하면서 연구개발의 질적인 경쟁력을 제고시키기 위한 수단 중 하나로 연구개발 투자를 강화하고 있다. 결과적으로 설비나 연구개발 투자 요소는 연구개발 기업들의 입장에서는 미래 불확실성을 떠안아야하는 부담이 될 수 밖에 없다. 단지 연구개발 역량을 제고시키기 위한 수단으로 연구개발 투자를 증가시키는 경영 전략은 기업성과측면에서 불확실성이 높은 것이 사실이다. 본 연구에서는 데이터마이닝 기법을 활용하여 기업들의 연구개발 역량에 영향을 주는 특성들을 기술경영능력, 연구개발능력, 그리고 기업분류 속성 관점에서 탐색하고 이러한 개별 요인들이 연구개발 역량의 수준에 따라 나타나는 특성들을 탐색하였다. 이를 위해서 국내 연구개발 기업 전체를 대상으로 증거데이터에 근거해 군집분석과 실험결과를 제시하였다. 상기의 3개 관점마다 세부 평가지표를 각각 7개, 2개, 4개로 구성하여 해당 영역에서의 개별적인 수준을 정량적으로 측정하고자 하였다. 기술경영능력과 연구개발능력의 경우 현행 기술력 평가기관들이 주도적으로 활용하고 있는 소항목 평가지표를 참조하였으며, 이때 정량적으로 자료 확보가능한지 여부를 고려하여 최종적인 세부 평가지표를 새롭게 구성하였다. 기업분류 속성의 경우에는 가장 기본적인 기업 분류 프로파일 정보를 고려하여 구성하였다. 특히 연구개발 역량수준의 동질성 파악을 위해서 기술경영능력과 연구개발능력의 세부평가지표를 활용하여 개별기업별 종합점수를 부여하였으며, 이때 역량수준을 5개의 등급으로 분류하여 군집분석 결과와 비교하였다. 분석된 군집과 역량수준 등급과의 비교평가에 따른 의미를 부여하기 위해서 군집별로 연구개발 역량수준이 높은 경향과 낮은 경향이 존재하는 군집들을 탐색하였다. 이후 해당 군집에서 세부 평가지표에 따른 특징들을 분석하였다. 이와 같은 연구수행 방법을 통해 연구 개발 역량수준이 높은 군집이 2개, 낮은 군집이 1개로 분석되었으며, 나머지 2개의 군집들은 역량수준이 거의 높은 발생 빈도로 유사하게 나타났다. 결과적으로 본 연구에서는 역량수준이 높은 2개 군집과 낮은 1개의 군집들을 대상으로 세부 평가지표에 따른 개별적 특징들을 분석하였다. 본 연구의 결과가 제시하고 있는 시사점은 기술변화 속도와 시장수요의 변화에 효과적으로 대응할 수 있는 전문 경영자의 교체주기가 빠를수록 연구개발 역량 제고에 기여할 가능성이 높다는 점이다. 개인기업의 경우에 법인기업으로의 전환을 통해 연구개발 인력들의 기업에 대한 소속감을 제고시킴으로써 연구개발 역량의 투입강도를 높일 필요가 있으며, 조직적 측면에서도 팀단위의 조직구성을 통해 책임과 권한의 정확성을 제공할 필요가 있다는 점이다. 기술상용화 실적건수나 기술인증건수는 역량제고에 기여하는 경우와 그렇지 않은 경우 모두 발생되고 있어, 경영자 입장에서 연구개발 역량제고를 위한 중요 인자로 검토하는데 한계가 있는 것으로 확인되었다. 마지막으로 실용신안출원의 경험 여부는 연구개발 역량에 중요한 영향을 미치는 요인으로 파악되어, 연구개발 역량 제고를 위해서는 실용신안출원 장려를 위한 동기부여를 제공할 필요성을 확인하였다. 이처럼 본 연구결과는 개별 기업들의 연구개발 역량 제고를 위한 기업 경영전략의 중요한 시사점을 제공할 수 있을 것으로 기대된다.

RFM 다차원 분석 기법을 활용한 암시적 사용자 피드백 기반 협업 필터링 개선 연구 (A Study on Improvement of Collaborative Filtering Based on Implicit User Feedback Using RFM Multidimensional Analysis)

  • 이재성;김재영;강병욱
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.139-161
    • /
    • 2019
  • 전자상거래 시장의 이용이 보편화 되며 고객들에게 좋은 품질의 물건을 어디서, 얼마나 합리적으로 구매할 수 있는지가 중요해졌다. 이러한 구매 심리의 변화는 방대한 정보 속에서 오히려 고객들의 구매 의사결정을 어렵게 만드는 경향이 있다. 이때 추천 시스템은 고객의 구매 행동을 분석하여 정보 검색에 드는 비용을 줄이고 만족도를 높이는 효과가 있다. 하지만 대부분 추천 시스템은 책이나 영화 등 동종 상품 분류 내에서만 추천이 이뤄진다. 왜냐하면 추천 시스템은 특정 상품에 매긴 구매 평점 데이터를 기반으로 해당 상품 분류 내 유사한 상품에 대한 구매 만족도를 추정하기 때문이다. 그밖에 추천 시스템에서 사용하는 구매 평점의 신뢰성에 대한 문제도 제시되고 있으며 오프라인에선 평점 확보 자체가 어렵다. 이에 본 연구에서는 일련의 문제를 개선하기 위해 RFM 다차원 분석 기법을 활용하여 기존에 사용하던 고객의 구매 평점을 객관적으로 대체할 수 있는 새로운 지표의 활용 가능성을 제안하는 바이다. 실제 기업의 구매 이력 데이터에 해당 지표를 적용해서 검증해본 결과 높게는 약 55%에 해당하는 정확도를 기록했다. 이는 총 4,386종에 달하는 이종 상품들 중 한번도 이용해 본 적 없는 상품을 추천한 결과이기 때문에 검증 결과는 상대적으로 높은 정확도와 활용가치를 의미한다. 그리고 본 연구는 오프라인의 다양한 상품데이터에서도 적용할 수 있는 범용적인 추천 시스템의 가능성을 시사한다. 향후 추가적인 데이터를 확보한다면 제안하는 추천 시스템의 정확도 향상도 기대할 수 있다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.