• 제목/요약/키워드: Cap models

검색결과 72건 처리시간 0.018초

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.

미계측 유역관리를 위한 WASP5 모형의 개선 및 적용성 검토 (Modification of WASP5 for Ungauged Watershed Management and Its Application)

  • 김진호;신동석;권순국
    • 한국농림기상학회지
    • /
    • 제9권1호
    • /
    • pp.29-36
    • /
    • 2007
  • 유량 및 수질자료가 부족한 미계측 유역의 수질환경 평가를 간편하게 수행할 수 있는 대유역 수질관리를 위한 수질모형 Modified-WASP5을 개발하고, 금강하구 수질재현에 활용을 통해 그 적용성을 입증하였다. Modified-WASP5은 부하모형과, 수리모형, 수질모형으로 구성되어 있으며, 부하모형은 동리 단위로 조사된 점원 및 비점원 자료와 배출원 단위를 입력하여 소유역 배출부하량을 계산하고, 이를 통계적으로 구한 유달함수에 대입하여 유달부하량을 출력한다. 부하모형의 결과, 금강하구 유역의 BOD, TN, TP의 총 유달부하량의 상대오차는 각각 44%, 32%, 26%이고 상관계수는 0.91, 0.96, 0.87을 보였다. 위와 같은 결과를 볼 때, 자료의 분산이 나타나기는 하나, 제한된 자료로부터 실측치와 계산치가 유사한 경향을 가지므로 미계측 유역에 적용이 가능하다고 판단된다. 수리계산에 필요한 유량자료에 있어서, 경계조건으로 분류되는 상류 소유역의 유랑관측자료가 존재하지 않으므로, 부득이하게 비유량 방법을 이용하였으나, 별다른 유출입 유량이 없는 경우에도 하류에서 유량이 급등하는 등 실제 상황을 정확히 재현하는데는 어려움이 따른다. 이러한 특이 값을 제거한 후, 측정지점에 대한 비유량을 각각 구하고 이들 비유량의 평균을 사용하였으나, 현재 가용한 자료의 제한성으로 더 나은 결과를 계산할 수 없다. 수질모형의 결과, 공주와 강경의 평균 BOD 농도는 2.6mg/L 및 2.8mg/L, 모의결과는 각각 2.5mg/L와 2.4 mg/L로 나타나 개발모형에 대한 호수 및 하천구간의 예측에 무리가 없음을 확인하였다. 이와 같이, 본 연구에서는 하천과 호수가 연계된 수계에 적용이 가능한 동적 수질모형(WASP-M)을 개발하여 WASP5의 범용성을 높였으며, 개발된 부하모형과 수질모형을 이용하여 대청호 및 금강하구 유역에 적용한 결과, 그 적용성이 입증되었으며, 위에서 언급한 과제들이 연구개선 될 경우 우리나라 수계에 범용으로 적용가능하고, 미계측 유역의 수질환경평가에 이용될 수 있을 것이다.