• Title/Summary/Keyword: Data Classification Systems

검색결과 1,440건 처리시간 0.031초

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

특허의 기술이전 활성화를 위한 소셜 태깅기반 지적재산권 추천플랫폼 (Social Tagging-based Recommendation Platform for Patented Technology Transfer)

  • 박윤주
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내에서 출원되는 특허건수는 매년 증가하고 있으나, 이러한 특허들 중 상당수는 활용되지 못하고 사장되고 있다. 2012년 국정감사 자료에 따르면, 우리나라 대학 및 공공연구기관이 보유한 특허의 약 73%가 사회적 가치창출로 연결되지 못하는 휴면특허라고 한다. 즉, 대학/연구소 또는 사업화가 어려운 개인이 소유하고 있는 특허가, 이를 필요로 하는 수요기업에 성공적으로 기술 이전되지 못하는 것을 휴면특허 증가의 주요 문제점으로 생각할 수 있다. 본 연구는 급격히 축적되는 방대한 특허 자원들 속에서, 기업의 관심분야에 적합한 지식재산을, 보다 쉽고, 효과적으로 선별할 수 있도록 하는 소셜태깅 기반의 특허 추천플랫폼을 제안한다. 제안된 시스템은 기존 특허들로부터 핵심적인 내용 및 기술 분야를 추출하여 초기 추천을 수행하고, 이후 사용자들의 태그정보가 축적되면, 사회적 지식 (social knowledge)을 추천에 함께 반영하게 된다. 이러한 연구에는 특허청에서 운영하고 있는 KIPRIS(Korea Industrial Property Rights Information Service) 시스템에서 실제 특허자료 총 1638건을 수집한 후, 현재 특허 데이터에는 존재하지 않는 가상의 태그 정보를 추가한 반가상(semi-virtual) 데이터를 구성하여 활용하였다. 제안된 시스템은 프로그래밍 언어 JAVA를 활용하여 핵심 알고리즘을 구현하였으며, 그래픽사용자 인터페이스(Graphic User Interface)에 대한 프로토타입의 설계를 수행하였다. 또한, 시나리오테스트 방식으로 시스템의 운영타당성 및 추천 효과성을 확인하였다.

투자자별 거래정보와 머신러닝을 활용한 투자전략의 성과 (Performance of Investment Strategy using Investor-specific Transaction Information and Machine Learning)

  • 김경목;김선웅;최흥식
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.65-82
    • /
    • 2021
  • 주식시장에 참여하는 투자자들은 크게 외국인투자자, 기관투자자, 그리고 개인투자자로 구분된다. 외국인투자자 같은 전문투자자 집단은 개인투자자 집단과 비교하여 정보력과 자금력에서 우위를 보이고 있으며, 그 결과 시장 참여자들 사이에는 외국인투자자들이 좋은 투자 성과를 보이는 것으로 알려져 있다. 외국인 투자자들은 근래에는 인공지능을 이용한 투자를 많이 하고 있다. 본 연구의 목적은 투자자별 거래량 정보와 머신러닝을 결합하는 투자전략을 제안하고, 실제 주가와 투자자별 거래량 데이터를 이용하여 제안 모형의 포트폴리오 투자 성과를 분석하는 것이다. 일별 투자자별 매수 수량과 매도 수량 정보는 한국거래소에서 공개하고 있는 자료를 활용하였으며, 여기에 인공신경망을 결합하여 최적의 포트폴리오 전략을 도출하고자 하였다. 본 연구에서는 자기 조직화 지도 모형 인공신경망을 이용하여 투자자별 거래량 데이터를 그룹화하고 그룹화한 데이터를 변환하여 오류역전파 모형을 학습하였다. 학습 후 검증 데이터 예측결과로 매월 포트폴리오 구성을 하도록 개발하였다. 성과 분석을 위해 포트폴리오의 벤치마크를 지정하였고 시장 수익률 비교를 위해 KOSPI200, KOSPI 지수 수익률도 구하였다. 포트폴리오의 동일배분 수익률, 복리 수익률, 연평균 수익률, MDD, 표준편차, 샤프지수, 벤치마크로 지정한 시가총액 상위 10종목의 Buy and Hold 수익률 등을 사용하여 성과 분석을 진행하였다. 분석 결과 포트폴리오가 벤치마크 대비 2배 수익률을 올렸으며 시장 수익률보다 좋은 성과를 보였다. MDD와 표준편차는 포트폴리오와 벤치마크가 비슷한 결과로 성과 대비 비교한다면 포트폴리오가 좋은 성과라고 할 수 있다. 샤프지수도 포트폴리오가 벤치마크와 시장 결과보다 좋은 성과를 내었다. 이를 통해 머신러닝과 투자자별 거래정보 분석을 활용한 포트폴리오 구성 프로그램 개발의 방향을 제시하였고 실제 주식 투자를 위한 프로그램 개발에 활용할 수 있음을 보였다.

조경산업 관점에서 4차 산업혁명 기술의 탐색 (Exploring the 4th Industrial Revolution Technology from the Landscape Industry Perspective)

  • 최자호;서주환
    • 한국조경학회지
    • /
    • 제47권2호
    • /
    • pp.59-75
    • /
    • 2019
  • 본 연구는 조경산업의 관점에서 4차 산업혁명 기술을 탐색하여, 선순환적 가치증대에 필요한 기초자료를 제공하고자 수행하였다. 4차 산업혁명, 조경산업과 도시재생의 특성 등을 고찰하고, 체계적 연구에 적합한 기술 분류 체계를 틀로 선정하는 등 방법론을 설정하여 연구하였다. 먼저, 조경산업의 선순환적 가치증대에 활용이 가능한 디지털 데이터 기반의 4차 산업혁명 기술을 선별하였다. '요소기술 수준'에서 '핵심기술'인 사물인터넷, 클라우드 컴퓨팅, 빅데이터, 인공지능, 로봇, '주변기술'인 가상 증강현실, 드론, 3D 4D 프린팅, 3D 스캐닝이 디지털 데이터 기반의 4차 산업혁명 기술로 조명되었다. 조경산업에 특화하여 '트렌드 수준'으로 응용하면 선순환적 가치증대에 활용이 가능한 것으로 나타났다. '시스템 수준'은 하나의 범용기술로 분석하였으며, 플랫폼을 중심으로 요소기술 수준, 컴퓨터와 스마트기기 등이 유기적으로 상호연계되어 시스템화된 디지털 데이터 기반의 4차 산업혁명 기술로 조명되었다. 조경산업에 특화하여 '트렌드 수준'으로 응용하면 선순환적 가치증대에 효과적인 기술로 나타났다. 요소기술 수준을 응용한 트렌드 수준에서 제시된 모든 활용 방안의 구현과 시너지효과 창출이 가능하다. 스마트정원, 스마트공원 등이 추구해야 하는 수준으로 분석되었다. 트렌드 수준의 인접산업 기술 중에는 스마트시티, 스마트홈, 스마트팜 및 정밀농업, 스마트관광, 스마트헬스케어가 협업에 의한 연계성이 클 것으로 판단되었다. 다음으로, 도시재생 공공공간을 포함한 조경공간의 조성 유지관리 및 서비스에서 도구이자 소재로서, 트렌드 수준으로 응용된 관련 기술의 다양한 활용 방안이 조명되었다. 즉, 유비쿼터스 컴퓨팅의 실현으로 조경공간에서 디지털 기술의 기본적 특성이 반영된 초연결화, 초실감화, 초지능화, 초융합화되는 방안들이 제시되었다. 조경산업이 도시재생 사업에 참여함에 있어서도, 기존 업무를 비롯하여 새로운 성격의 요구 수용 및 조율, 교육, 컨설팅 등에서 가치를 증대하는데 효과적인 것으로 분석되었다. 특히, 조경영역 전반이 전략적 교두보로 유지관리를 연계하여, 트렌드 수준의 관련 기술을 시스템화할 때 선순환적 가치증대에 효과적인 것으로 나타났다. 산업구조 상, 다양한 경로에서 생산된 데이터와 정보를 유통시키는데 효과적이기 때문이다. 향후 디지털 데이터 기반의 4차 산업혁명 기술을 실제 조경공간의 조성 유지관리 및 서비스에 융합하여 실증하는 등의 후속적 연구가 필요하다.

Product-Service System(PSS) 성공과 실패요인에 관한 탐색적 사례 연구 (Exploratory Case Study for Key Successful Factors of Producy Service System)

  • 박아름;진동수;이경전
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.255-277
    • /
    • 2011
  • PSS(Product Service System) 시스템은 제품과 서비스가 하나로 통합되어 고객에게 차별화된 가치를 제공하고, 기업이 경쟁력을 가지고 지속적인 성장을 할 수 있게 지원하는 시스템이다. 본 논문에서는 PSS 시스템으로 성공한 Amazon의 Kindle과 Apple의 iPod, 실패한 Microsoft의 Zune과 Sony의 e-book reader를 채택하여 중다 사례연구 방법론을 통해 성공요인과 실패요인을 도출하고자 한다. 이를 위하여, 사례 분석을 통해 가설을 도출하고, 연관 문헌연구와의 비교 및 분석을 통하여 PSS 시스템에서 상업적으로 성공하기 위한 전략적 시사점을 제시하였다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

식물에 의한 호수생태계 건강성 평가법에 대한 고찰 (Review of a Plant-Based Health Assessment Methods for Lake Ecosystems)

  • 정연숙;이경은
    • 생태와환경
    • /
    • 제46권2호
    • /
    • pp.145-153
    • /
    • 2013
  • 물관리 정책이 수질평가 중심에서 수생태계 건강성 평가로 전환되고 있는 것은 세계적인 추세이다. 현재까지 수계의 평가기법은 수질이나 하상구조와 같은 물리화학적 요소 및 플랑크톤, 저서동물과 같은 일부 생물의 평가에 국한되어 개발되어 왔다. 식물은 호수의 물리, 화학 및 생물 변화를 민감하게 반영하는 지표인데 개발이 늦었다. 환경부에서는 전국의 호수와 저수지를 생태계로써 평가하고 관리할 목적으로 생태계의 평가 기법을 마련 중에 있다. 이 연구사업의 일환으로 식물을 이용하여 우리나라 호수생태계에 적합한 건강성 평가기법을 개발하기 위해서 기개발된 국외의 평가기법 중 주로 다변수법을 주로 고찰하였다. 다변수법의 적용은 시간과 비용이 많이 소요되고 변수 간의 상관성 등의 한계점이 있다. 그러나 현재 단일 변수로 쓸 만한 지표가 개발되어 있지 않으며 다변수법은 다면평가와 데이터 축적의 장점이 크다. 다변수법을 세 단계, 즉 평가지표의 선정, 점수화, 평가지수의 결정과 검증단계로 나누어 검토하였다. 평가지표 선정단계에서 가장 적용가능한 지표는 종조성과 수도 및 종 풍부도와 다양성 관련 지표들이다. 국외에서 대부분 포함하는 지표종은 아직 개발이 불완전해서 우리나라에서 적용하기에 한계가 있다. 다수 조사자가 참여할 경우 식물상에 대한 오동정이 결과에 영향을 미칠 수 있으므로 이 점의 사전 고려가 필요하다. 지표의 점수화 단계도 한계가 있다. 우리나라에 인위적 교란이 거의 없는 기준 호수가 없기 때문에 대안으로 다수의 호수를 조사하고, 조사된 호수의 지표값을 상대화하여 적용해야 한다. 같은 이유로 지수에 대한 검증과정도 어렵다. 종합할 때, 여러 가지 한계가 있지만 현장에서 조사 가능한 지표를 이용하여 식물을 이용한 호수 건강성의 다변수평가체계를 구축하는 것은 가능하다. 추후, 식물종의 질적 가치에 대한 지표를 추가하고 보다 많은 호수 조사의 결과가 누적되면 수준 높은 평가체계로 발전시킬 수 있을 것이다.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

도서관경영(圖書館經營)에 있어서의 시스팀 분석기법응용(分析技法應用)에 관한 연구(硏究) (A Study on Systems Analysis Applied to Library Management)

  • 권기원
    • 한국비블리아학회지
    • /
    • 제2권1호
    • /
    • pp.178-210
    • /
    • 1974
  • It needs to put into practice the systems analysis in the analysis of some operations and status of library for the purpose of systematizing the work of reforming in the new easier form to process, to storage, to retrieve and to make use of the increasing informations and data of library. In this study, some of systems which are generally using in every library was caught in the case study of K university library. Having analyzed them with the two methods of the flowcharting and mathematical analysis, we found the obstructive factors in operation. As the result of this research, it was gained the new system as the alternative one. A. Alternative System B. Advantages of alternative systems 1. In the reference room When it converts the present system into the new system, it can profit 6.771 won/user (13.815won-7.044won=6.771 won). Therefore, a half the average required cost of the present system can be saved. If this saving would be alloted for the cost 33,000won required to make the cataloging cards, it would be taken for 94 days (33,000 won ${\div}$ 6,771 won/user=4,874users. 4,874users ${\div}$ 52users/day=94days) to get it. The saving cost/year by the new system will be 95,417 won, and in the first year the initial cost (33,000won) reduces the saving cost to 62,417won. 2. In the periodical room The average required time for using the materials of the present system is 17 minutes/user and the average required cost/user is 23.775won, while the average required time of the new system is 4 minutes and the average required cost/user is 5.33won. Therefore, the new system has profit 4 times of the present system. Accordingly, it occurs when the dispersed periodical materials get together. 3. In the classification and cataloging When one processes - the oriental books - by the Linear Programming Technique, the maximum of the process can be increased from 11.6 volumes per librarian of the present system to 12 volumes per librarian of the new system increased 0.4 volume in a day, and cataloging by the manual printer can be shorten from 3 minutes per card of the present system to 1.5 minutes per card of the new system. Consequently, we can complete the other operations (books equipment, updating of cataloging cards, etc.) with 141 minutes which are saved in the course of the afore-mentioned works. 4. In the status of collections The average growth rate of 4 years from 1968 to 1971 is 9.825 %, and that of the purchased materials is 6.2% similar to the advanced nations, but it has the different position from 215,000 volumes by the Standard Degree for Establishment of College and University, and the difference between the total collections 151,671 volumes and Dunns' growth model ($N_t=N_oe^{-at}$) claimed by Leimkuhler 155,297 volumes in 1971 is 3,626 volumes, and for the purpose of compensation the difference, we found the fact that it needs to have the increased budget of 24~30% per year, Thus, if the budget of 24~30 % per year. Thus, if the budget would be increased per year as the rate of the afore-mentioned figure, it would be reached at the Standard Degree for Establishment of College and University in 1975, and thereafter, it can be decreased to the lebel which is able to maintain the growth rate of 5~6% per year.

  • PDF