• 제목/요약/키워드: systems approach method

검색결과 3,708건 처리시간 0.032초

A Study on the Intelligent Online Judging System Using User-Based Collaborative Filtering

  • Hyun Woo Kim;Hye Jin Yun;Kwihoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.273-285
    • /
    • 2024
  • 교육 분야에서 온라인 저지 시스템이 활발하게 활용됨에 따라 학습자 데이터를 활용하는 다양한 연구가 진행되고 있다. 본 연구에서는 학습자 데이터를 활용하여 학습자의 문제 선택을 지원할 수 있는 사용자 기반 협업 필터링 방식의 문제추천 기능을 제안한다. 온라인 저지 시스템에서 학습자의 문제 선택을 위한 지원은 그들의 향후 학습에 영향을 미치므로 교육의 효과성 제고를 위해 필요하다. 이를 위해 학습자의 문제풀이 성향과 유사한 학습자를 식별하고 그들의 문제풀이 이력을 활용한다. 제안 기능은 충북교육연구정보원에서 운영하는 알고리즘과 프로그래밍 관련 온라인 저지 사이트에 구현됐고, 서비스 유용성과 사용 편이성 측면에서 델파이 기법을 통한 전문가 검토를 수행했다. 또한 사이트 사용자 대상 시범 운영에서 바른코드 제출 비율을 분석한 결과 추천문제에 대해 제출한 경우가 전체 제출에 비해 16% 정도 높았고, 추천문제 사용자 대상 설문조사에서 '도움 된다' 응답은 78%였다. 시범 운영에서는 추천문제 선택과 사용자 피드백 관련 설문 응답 비율이 낮았으므로, 향후 연구과제로 제안 기능의 접근성 향상, 사용자 피드백 수집 및 학습자 데이터 분석 다각화 등을 제시했다.

주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법 (Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being)

  • 최석재;송영은;권오병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.83-105
    • /
    • 2016
  • 의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다.

스마트러닝의 공교육 정착을 위한 성공전략 연구 (A Study on the Development Strategy of Smart Learning for Public Education)

  • 김예진;조지연;이봉규
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.123-131
    • /
    • 2015
  • 최근 정보통신기술의 발전으로 스마트한 기술들이 확산되면서 이전과 다른 방법으로 소통하고 콘텐츠를 활용할 수 있게 되었다. 이러한 변화는 보다 다양한 학습방법을 가능하게 함으로써 교육산업에 큰 변화를 가져오고 있다. 한국은 e-러닝에 이어 스마트러닝 선도국으로 도약하기 위해 2011년 스마트교육 추진 정책 수립을 시작으로 공교육에 스마트러닝 도입을 적극 추진해왔다. 그러나 아직까지 스마트러닝의 추진 성과는 미미한 것으로 판단된다. 따라서 현 시점에서 공교육의 스마트러닝 추진 문제점을 파악하고 개선안을 마련할 필요가 있다. 본 연구는 스마트러닝이 공교육에 정착하기 위한 성공전략을 제안하는 것을 목적으로 한다. 이를 위하여 공교육과 스마트러닝 환경을 종합적으로 검토하고, SWOT 분석과 AHP 기법을 통해 전략 요인과 우선순위를 도출하였다. 분석 결과, 국내 공교육 환경에 스마트러닝을 성공적으로 정착시키기 위해서는 약점을 보완하여 위협을 극복하는 WT전략에 초점을 맞춰야 하는 것으로 나타났다. 세부 요인으로는 미흡한 스마트러닝 관련 교사 연수 제도(W2), 제도차원 교육환경기반 및 추진역량(S4), 스마트러닝 추진에 대한 제한적 정부지원(T4) 순으로 나타났다. 특히 정부의 제도적 기반이 우선적으로 검토되어야 한다는 시사점이 도출되었다. 이 연구는 향후 스마트러닝 추진을 위한 정책과 지원제도 수립 과정에 전략적 가이드라인을 제공할 수 있을 것으로 기대된다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구 (A Study on Ontology and Topic Modeling-based Multi-dimensional Knowledge Map Services)

  • 정한조
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.79-92
    • /
    • 2015
  • 미래 핵심 가치 기술 발굴 및 탐색을 위해서는 범국가적인 국가R&D정보와 과학기술정보의 연계 융합이 필요하다. 본 논문에서는 국가R&D정보와 과학기술정보를 온톨로지와 토픽모델링을 사용하여 연계 융합하여 지식베이스를 구축한 방법론을 소개하고, 이를 기반으로 한 다차원 연계 지식맵 서비스를 소개한다. 국가R&D정보는 국가R&D과제와 참여인력, 해당 과제에 대한 성과 정보, 논문, 특허, 연구보고서 정보들을 포함한다. 과학기술정보는 논문, 특허, 동향 등의 과학기술연구에 대한 기술 문서를 일컫는다. 본 논문에서는 지식베이스에서의 지식 처리 및 관리의 효율성을 높이기 위해 Lightweight 온톨로지를 사용한다. Lightweight 온톨로지는 국가R&D과제 참여자와 성과정보, 과학기술정보를 과제-성과 관계, 문서-저자 관계, 저자-소속기관 관계 등의 단순한 연관관계를 이용하여 국가R&D정보와 과학기술정보를 융합한다. 이러한 단순한 연관관계만을 이용함으로써 지식 처리의 효율성을 높이고 온톨로지 구축 과정을 자동화한다. 보다 구체적인 Concept 레벨에서의 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 국가R&D정보와 과학기술정보 문서들의 토픽 주제어를 추출하고 각 문서 간 연관관계를 추출한다. 일반적인 Concept 레벨에서의 Fully-Specified 온톨로지를 구축하기 위해서는 거의 100% 수동으로 해야 하기 때문에, 많은 시간과 비용이 소모된다. 본 연구에서는 이러한 수동적인 온톨로지 구축이 아닌 자동화된 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 온톨로지 구축에 필요한 문서와 토픽 키워드 간의 관계, 문서 간 의미 상 연관관계를 자동으로 추출한다. 마지막으로, 이와 같이 구축된 지식베이스의 트리플(Triple) 정보를 활용하여, 연구자들의 공동저자관계, 문서간의 공통주제어관계 등을 연구자, 주제어, 기관, 저널 등의 다차원 연관관계를 방사형 네트워크 형식을 이용하여 시각화한 지식맵 서비스들을 소개한다.

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

동북아 항공물류허브을 구축하기 위한 다자적 접근방안 (Multilateral Approach to forming Air Logistics Hub on North East Asia Region)

  • 홍석진
    • 항공우주정책ㆍ법학회지
    • /
    • 제19권2호
    • /
    • pp.97-136
    • /
    • 2004
  • 동북아 항공운송시장에서는 중국시장의 개방으로 항공운송시장이 전에 없는 급팽창을 하고 있으며, 전 세계 항공운송시장에서 아시아-태평양의 비중이 커지고 있다. 향후 점차적으로 확대될 이 지역의 인적, 물적, 서비스 그리고 정보의 교류를 위해서는 동북아 역내에서 보다 자유로운 항공편의 연결이 필요하다. 이런 측면에서 이 글에서는 지역 내 항공운송시장 통합을 위한 동북아 항공운송시장에 적용 가능한 대안을 제시하였다. 첫째, 각 국의 국내 항공운송시장에 대한 정책 변화가 필요하고, 둘째, 각 국 국내시장의 자유화 정책의 확대, 셋째, 동북아 지역 내의 양자협정의 보다 자유로운 항공협정의 체결이 필요 넷째, 동북아 항공시장에 참여하고 있는 각 국 항공사 간 전략적제휴의 확대, 다섯째, 경쟁력 있는 공항 및 노선 또는 저수요 노선부터 단계적으로 자유화 실시, 여섯째, 동북아 3 국의 주요 공항 간 셔틀 운영 필요, 일곱째, 동북아 삼국간 국제표준의 항공안전 및 보안체계의 공동 구축, 여덟째, 항공 외의 분야에서 우선적 자유화 추진, 마지막으로 아시아-태평양 지역 민간항공기구의 설립과 한, 중, 일간의 협의기구를 설립하여 각 국이 정기적으로 항공운송시장의 통합과 자유화에 대한 의견 개진을 통한 점진적인 자유화를 유도해야 할 것이다. 동북아에서 항공자유화를 위한 단기적 차원의 진전은 어려울 것이다. 그러나 중국 항공사의 계속적인 성장과 일본계 항공사들의 저비용 구조화에 대한 진전이 이루어질 경우 의외로 조속한 항공운송시장의 통합이 이루어질 수 도 있다. 항공운송시장은 과거 25년간 대변혁의 과정을 겪었다. 대 변혁의 과정 중에 가장 크게 영향을 미친것은 자유화였으며, 그 결과로 요금은 인하되고, 항공수요는 증가하였다. 이로써 침체되어있던 항공운송산업은 새로운 성장 산업으로 등장하게 되었다. 자유화 정책의 확대 추진을 통해서 만이 지역 내 교류를 활성화 할 수 있으며, 이를 주도한 국가가 지역의 중심으로서 역할을 수행할 수 있을 것이다.

  • PDF

정신모형과 감성 요소를 이용한 소프트웨어 사용성 평가 모델 개발 (An Evaluation Model for Software Usability using Mental Model and Emotional factors)

  • 김한샘;김효영;한혁수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.117-128
    • /
    • 2003
  • 소프트웨어의 사용성은 소프트웨어 제품 평가시, 사용하기 쉬운 정도, 효율성의 정도, 만족도의 정도 등으로 판단되는 소프트웨어의 특성이다. 이러한 사용성은 소프트웨어 제품의 품질을 결정하는 중요한 요소이다. 따라서 소프트웨어 제품들은 그 자체의 사용성에 대해 평가를 받고 개선지침을 추출하여 이를 기반으로 지속적인 개선이 이루어져야 한다. 그러나 제품마다 사용성 요소들의 중요도가 다르고, 같은 요소에 대해서도 사용자들은 서로 다른 환경과 지식으로 인해 엇갈린 평가를 내릴 수 있으므로 사용성 평가는 제품의 적합성을 판단하고 개선방향을 얻기 위해 다양한 요소들을 고려하여 개발되는 것이 중요하다. 그러나 기존의 만족도 평가와 수행도 평가는 문제점의 원인 발견 평가결과를 수정에 반영하기 힘들고, 모든 영역에 적용되도록 만들어진, 획일화된 평가항목과 내용으로는 평가 대상 제품의 특징을 반영하기가 어려웠다. 따라서 본 논문에서는 대상 제품의 평가 항목별로 사용자의 정신모형과 감성을 평가하는 모델을 개발하였다. 설계자들의 개념 모형과 사용자의 정신 모형의 일치여부를 평가하여 그 결과를 바탕으로 개선 지침을 제공할 수 있는 평가방법과 시스템에 대한 만족도를 높이고 보다 효과적으로 작업할 수 있도록 하기 위해 사용시의 감성과 이에 영향을 미치는 시스템의 구성요소들을 분석하여 평가하고 개선 지침을 추출하는 감성요소론 기반으로 하는 평가방법을 합하여 개발한 평가 모델을 제안한다. 그리고 이 평가 모델에 대한 사례연구로 GUI 프레임워크를 사례로 채택해서 평가하고 개선 방향을 추출하였다. 본 논문에서 제안한 평가 모델은 제품 사용자의 작업분석을 기반으로 추출된 작업항목에 대한 평가요소를 가지고 평가를 수행함으로서, 제품의 특성을 반영할 뿐만 아니라, 수정되어야 할 항목을 정확히 나타내 줌으로서 효과적인 사용성 평가를 가능하게 할 것이다.

유아 영재의 판별과 역동적 평가 (Early Identification of Gifted Young Children and Dynamic assessment)

  • 장영숙
    • 영재교육연구
    • /
    • 제11권3호
    • /
    • pp.131-153
    • /
    • 2001
  • 유아기에 영재를 판별하여 유아 영재의 흥미와 능력에 적합한 교육 프로그램을 제공하면, 유아영재의 잠재력은 극대화될 수 있다. 유아기에는 다른 연령에 비해 특히 실제의 발달과 잠재적 발달간의 차이가 특히 많기 때문에, 혼자 해결하도록 할 때보다 적절한 교육적 개입을 해주었을 때 더 많은 잠재적 능력을 발휘할 수 있다. 유아가 가진 영재성을 사장시키지 않기 위해서는 유아의 영재성을 조기에 판별하여 그들에게 적절한 교육적 프로그램을 제공하는 것이 필요하다. 본 연구의 목적은 역동적 평가방법을 적용한 유아 영재 판별방법을 제시하고자 하는 것이다. 이를 위해. 본 연구에서는 기존의 유아 영재 판별 방법들을 검토하고 이에 대한 문제점을 살펴보았다. 그런 후에 역동적 평가의 특징과 유형을 살펴보고, 마지막으로, 역동적 평가가 유아 영재를 판별하고자 할 때 어떻게 적용될 수 있는지를 탐색해 보았다. 유아기에 역동적 평가방법을 이용해 영재를 판별하면 다음과 같은 점에서 유용성이 있다. 첫째, 유아 영재의 판별에 역동적 평가방법을 사용하면 표준화 검사에 능력을 보이지 않는 잠재력이 있는 유아를 판별할 수 있다. 둘째, 역동적 평가방법은 학습에 대한 산출물보다 학습에 대한 과정을 평가할 수 있다. 셋째, 역동적 검사는 유아 영재를 조기에 발견하고 이에 적절한 교육적 처치를 할 수 있는 정보를 제공받을 수 있어 개별화교육이 가능하도록 해준다. 넷째, 역동적 평가는 진단과 교수를 연결시킴으로써 유아의 잠재력을 더욱 정확하게 측정할 수 있도록 해주며, 유아 영재들이 계속적인 성장을 할 수 있도록 교육적인 환경을 제공해 줄 수 있다.ject-orientation. For the convenience of input, output analysis, GUI(Graphic User Interface) of menu, window, dialog box, etc. are provided to the user, For the execution of DADSim, Silicon Graphic IRIX 6.3 or high version is required. DADSim can be used for the effectiveness analysis of­defence systems. Some illustrative examples will be shown in this paper.s, namely resources of military force planing requirement for 15 years, is given already for the accomplishment of military strategy. The purpose of this study is to seek a direction of the ROK′s military build-up policy in a viewpoint of capability-based military build-up.group, no difference was found in its fragrance. And, no difference was found in brightness and viscosity between samples. As a result of conducting the palatability test,

  • PDF

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.