• 제목/요약/키워드: Neural network classification

검색결과 1,730건 처리시간 0.028초

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

바이오칩을 이용한 간암진단 예측 시스템 (Liver cancer Prediction System using Biochip)

  • 이형근;김충원;이준;김성천
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.967-970
    • /
    • 2008
  • 우리나라 암 발생빈도 중 간암은 위암에 이어 두 번째로 흔한 암으로, 초기에는 특이 증상이나 증후 없이 서서히 진행되는 경우가 많아 증상이 생긴 후 간암으로 진단될 경우, 대부분 마땅한 치료방법이 별로 없어 어떠한 치료를 해도 환자의 예후는 불량하나, 조기에 발견될 경우는 치료성적이 우수하여 조기 발견이 대단히 중요시된다. 본 시스템은 간암의 조기발견을 위한 시스템으로, 간암으로 확진된 환자와 간암이외의 대조군의 혈액을 바이오침에 반응시켜 바이오칩 프로파일을 기계학습을 통해 분류하는 시스템이다. 본 논문에서는 총 50샘플로 구성된 간암환자 와 100샘플로 구성된 간암 이외의 대조군의 혈액시료를 1149의 서로 다른 올리고로 구성된 바이오칩에 반응시켜 획득한 데이터를 인공신경 망을 통해 분석한 결과 $92{\sim}96%$의 분류 성능을 보였다.

  • PDF

CNN 기반 위장관 랜드마크 분류기를 이용한 위장관 교차점 추정 (Estimating Gastrointestinal Transition Location Using CNN-based Gastrointestinal Landmark Classifier)

  • 장현웅;임창남;박예슬;이광재;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권3호
    • /
    • pp.101-108
    • /
    • 2020
  • 최근의 영상 처리 분야는 딥러닝 기법들의 성능이 입증됨에 따라 다양한 분야에서 이와 같은 기법들을 활용해 영상에 대한 분류, 분석, 검출 등을 수행하려는 시도가 활발하다. 그중에서도 의료 진단 보조 역할을 할 수 있는 의료 영상 분석 소프트웨어에 대한 기대가 증가하고 있는데, 본 연구에서는 데이터 셋이 방대하고 판단에 시간이 오래 걸리는 캡슐내시경 영상에 주목하였다. 본 논문의 목적은 캡슐내시경 영상의 판독에서 모든 환자에 대해 공통으로 수행되고, 판독하는 데 많은 시간을 차지하는 위장관 랜드마크를 구별하고 위장관 교차점을 추정하는 것이다. 이를 위해, 위장관 랜드마크를 식별할 수 있는 CNN 학습 모델을 설계하였으며, 이를 이용하여 결괏값을 필터링해 위장관 교차점을 추정하였다. 무작위로 환자 데이터를 샘플링한 모델을 이용해서 나온 결과를 필터링 후에 위장관 교차점을 추정하였을 때, 88% 환자는 위장에서 소장으로 변화하는 위장관 교차점(유문판) 의심 구역 안에 들어왔으며, 소장에서 대장으로 변화하는 위장관 교차점(회맹판)의 경우 100% 환자가 위장관 교차점 의심 구역 안에 들어온 것을 확인할 수 있었다. 100프레임 범위로 위장관 교차점 의심 구역을 찾을 수 있었으며, 판독자가 초당 10프레임의 속도로 판독을 진행한다면 10초안에 위장관 교차점을 찾아낼 수 있다.

주식 시장 예측을 위한 π-퍼지 논리와 SVM의 최적 결합 (An Optimized Combination of π-fuzzy Logic and Support Vector Machine for Stock Market Prediction)

  • 다오두안훙;안현철
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.43-58
    • /
    • 2014
  • 최근 정보기술의 발전으로 복잡하고 방대한 양의 주가 데이터에 대한 실시간 분석이 가능해지면서 인공지능 기법을 활용해 주식 시장의 등락을 예측하고, 이를 기반으로 매매 거래를 수행하는 트레이딩 시스템에 대한 세간의 관심이 높아지고 있다. 본 연구는 이러한 트레이딩 시스템의 시장 예측 알고리즘으로 활용될 수 있는 새로운 주식 시장 등락 예측 모형을 제시한다. 본 연구의 제안 모형은 ${\pi}$-퍼지 논리를 이용해 모든 입력변수의 차원을 low, medium, high로 퍼지변환한 입력값을 대상으로 Support Vector Machine(SVM)을 적용하여 익일 시장의 등락을 예측하도록 설계되었다. 그런데 이 경우 입력변수의 수가 3배로 늘어나기 때문에, 적절한 입력변수의 선택이 요구된다. 이에 본 연구에서는 유전자 알고리즘을 활용하여 입력변수 선택 집합을 최적화하도록 하였으며, 동시에 ${\pi}$-퍼지 논리 및 SVM에 적용되는 조절 파라미터들의 값도 함께 최적화 하도록 하였다. 모형의 성능을 검증하기 위해, 본 연구에서는 지난 2004년부터 2013년까지의 10년치 국내 주식시장 데이터를 기반으로 한 KOSPI 200 지수의 등락 예측에 제안모형을 적용해 보았다. 이 때, 비교모형으로 로지스틱 회귀모형, 다중판별분석, 의사결정나무, 인공신경망, SVM, 퍼지SVM 등도 함께 적용시켜 성과를 정밀하게 검증해 보고자 하였다. 그 결과, 제안모형이 예측 정확도는 물론 투자수익률(Return on Investment) 측면에서도 다른 모든 비교모형들에 비해 월등히 우수한 성능을 보임을 확인할 수 있었다.

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

X선 토모그램의 Smoothing 효과가 암석의 물성 예측에 미치는 영향 분석 (Smoothing Effect in X-ray Microtomogram and Its Influence on the Physical Property Estimation of Rocks)

  • 이민희;김영석
    • 지구물리와물리탐사
    • /
    • 제12권4호
    • /
    • pp.347-354
    • /
    • 2009
  • 암석의 물성을 정확히 예측하기 위해서는 물성에 일차적인 효과를 미치는 공극구조에 대한 이해가 매우 중요하며, 정확한 공극구조와 물성시뮬레이션을 이용한 다양한 물성예측 및 변화양상의 정량적 상관관계는 많은 지구물리분야에 응용할 수 있다. 최근 비파괴 구조해석방법, 특히 X선 토모그래피를 이용한 고분해능 스캔 등이 상용화되고 컴퓨터의 성능이 향상됨에 따라 실제의 공극구조를 이용하여 투수율을 예측하는 연구가 시도되고 있다. 본 연구에서는 이러한 연구를 투수율뿐만 아니라 속도와 전기전도도의 영역으로 확장하려는 시도를 하였다. 하지만 토모그래피 방법에서 발생하는 smoothing 효과에 의해 공극구조가 왜곡되고 계산된 물성에 오차가 발생하여, 영상처리기법(sharpening filtering 및 인공신경망 분류법)을 사용하여 smoothing 효과를 제거하는 방법을 시도하였다. 그 결과 가시적으로 향상된 공극구조를 얻을 수 있었고, 투수율 및 전기전도도의 계산값도 이론적 모델링과 유사한 정도의 정확도를 얻을 수 있었다. 하지만 속도의 경우에는 smoothing 효과의 제거에도 불구하고 오차도 상대적으로 크고 향상정도도 매우 미미하였다. 박편과 토모그래피에서 얻어진 공극구조의 비교 연구를 통하여 본 연구에서 사용된 사암의 경우에는 토모그래피에서 얻어진 해상도가 너무 낮은 것을 확인할 수 있었으며, 이러한 이유로 smoothing 효과가 제거되어도 속도예측의 향상은 그리 크지 않은 것으로 나타났다. 결론적으로 본 연구에서 제시된 방법은 토모그램의 smoothing 효과를 효율적으로 제거하였으며 이는 토모그래피방법으로 공극구조를 획득할 때 유용하게 사용될 것으로 기대된다. 또한 속도예측의 경우 토모그램의 해상도가 매우 중요한 인자로 판명되었으며 투수율 예측에 일반적으로 사용되는 해상도보다 최소 세 배 이상의 높은 해상도가 요구되는 것으로 파악되었다.

PVA-ECC단면 이미지의 섬유 분류 및 검출 기법 (Fiber Classification and Detection Technique Proposed for Applying on the PVA-ECC Sectional Image)

  • 김윤용;이방연;김진근
    • 콘크리트학회논문집
    • /
    • 제20권4호
    • /
    • pp.513-522
    • /
    • 2008
  • 섬유복합재료의 우수한 인장 성능은 섬유가 매트릭스의 균열 면에서 가교작용을 함으로써 발현되기 때문에 섬유의 분포 특성이 복합재료의 성능에 결정적인 영향을 미치게 된다. 그러나 PVA 섬유를 보강 섬유로 사용하는 섬유복합재료의 경우 PVA 섬유와 매트릭스 사이의 낮은 명암비와 PVA의 비전도성 특징으로 인하여 섬유의 위치 및 분포특성을 정량적으로 평가히는 방법은 연구가 미흡한 실정이다. 이 연구에서는 PVA 섬유를 보강 섬유로 사용하는 섬유복합재료의 섬유 분포 특성 등을 평가할 때 가장 중요한 과정인 섬유의 검출에 대하여 검출 성능을 향상 시킬 수 있는 알고리즘을 제시하였다. 제안한 알고리즘은 형광 현미경을 사용하여 얻은 섬유 이미지를 유형별로 분류하고, 분류된 분류된 섬유 이미지의 특성에 따라 분수령 알고리즘 (watershed algorithm)과 형태학적 재구성 (morphological reconstruction)을 이용하여 보다 정확히 섬유를 검출하는 과정으로 구성된다. 이 과정에서 섬유 이미지를 총 5가지 유형으로 분류하였으며, 인공신경회로망(ANN)을 분류기로 활용하기 위하여 형상 특성을 나타내는 5가지 특징값 즉, $F_s$, $F_c$, $F_p$, $F_l$$F_{rl}$을 추출하였다. 추출된 특징값에 대한 데이터베이스를 구축하여 ANN을 학습하여 분류기를 구축함으로써 섬유의 유형을 자동으로 분류할 수 있도록 하였다. 또한 5가지 섬유 이미지 유형 중에서 잘못 검출된 섬유이미지를 분수령 알고리즘과 형태학적 재구성을 통하여 섬유를 정확히 검출할 수 있는 기법을 제안하였다.

LIBS를 이용한 흑색 플라스틱의 자동선별 시스템 개발 (Development of Automatic Sorting System for Black Plastics Using Laser Induced Breakdown Spectroscopy (LIBS))

  • 박은규;정밤빛;최우진;오성권
    • 자원리싸이클링
    • /
    • 제26권6호
    • /
    • pp.73-83
    • /
    • 2017
  • 소형가전 제품은 종류가 다양할 뿐만 아니라 구성부품의 재질도 복잡하여 폐기시 재활용이 매우 어려운 실정이다. 특히, 폐소형가전의 경우 흑색 플라스틱의 함유량이 높을 뿐만 아니라 재질이 다양하여 재활용 공정에서 발생하는 플라스틱의 재질을 인식하여 효율적으로 선별 회수하는 것이 매우 어렵다. 본 연구에서는 기존 선별기술이 가지고 있는 흑색 플라스틱의 재질별 선별에 대한 기술적 한계 및 단점을 보완하기 위하여 레이저유도붕괴분광법(Laser-Induced Breakdown Spectroscopy, LIBS)을 기반으로 하는 흑색 플라스틱의 재질별 자동선별 시스템을 개발하였다. 본 시스템은 정량 공급장치, 위치 자동인식 장치, 레이저유도기반분광분석(LIBS) 장치, 선별분리장치 및 Control unit 등으로 구성되어 있다. 레이저유도붕괴분광법(LIBS)을 이용하여 흑색 플라스틱의 재질별 특성 스펙트럼 데이터를 획득하고, 인공지능형 알고리즘을 적용한 분류기를 설계하여 적용함으로써 흑색 플라스틱의 재질을 효율적으로 인식하고 분류할 수 있다. 본 연구에서 개발한 방사형기저함수신경회로망(RBFNNs) 분류기의 분류율은 약 97% 이상으로 나타났으며, 자동선별 시스템의 흑색 플라스틱의 재질별 인식률은 약 94.0% 이상, 선별효율은 80.0% 이상으로 조사되었다. 본 연구에서는 실험실 규모의 자동선별장치를 개발하였으며, 본 장치에 대한 실험결과를 바탕으로 흑색 플라스틱 재질인식 및 선별효율 등을 분석하므로써 향후 폐소형가전의 재활용 현장에 적용할 예정이다.