• 제목/요약/키워드: Portal system

검색결과 631건 처리시간 0.035초

해외 출국에 영향을 미치는 온라인 미디어 효과 분석: 아시아 5개국을 중심으로 (Analyzing the Effect of Online media on Overseas Travels: A Case study of Asian 5 countries)

  • 이혜인;문현실;김재경
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.53-74
    • /
    • 2018
  • 해외 시장 의존형 경제구조를 지닌 우리나라에서 관광산업은 국가경제에 중요한 산업으로 이를 육성하기 위해 정확한 관광 수요 예측이 필요하다. 그에 따라 많은 연구들이 출국 수요를 예측하기 위해 노력해왔으며 출국수요에 영향을 미치는 요인에 대해 다각도로 연구가 이루어져 왔다. 특히 정보기술의 발전으로 최근에는 출국자들의 출국지 선택 등 관광객의 의사결정에 온라인 뉴스, 소셜 네트워크 서비스 등의 온라인 미디어가 많은 영향을 끼치고 있다. 이에 본 연구는 온라인 미디어가 발생시키는 구전 효과가 출국 수요에 미치는 영향을 살펴보고 그 영향 관계를 규명하고자 하였다. 온라인 미디어는 쉽게 접근이 가능하고 공유가 활발하다는 측면에서 구전 효과가 발생되어 사용자들의 의사결정에 영향을 주고 있다. 이를 위해 본 연구에서는 온라인 미디어를 공적 미디어인 뉴스와 사적 미디어인 블로그로 구분하였으며 실제 아시아 5개국의 출국자 수에 이들 미디어가 미치는 영향 관계를 패널 모형을 통해 분석하였다. 그 결과, 온라인 뉴스의 구전 효과는 출국자 수에 부정적인 영향을 미치지만 블로그의 경우 긍정적 영향 관계를 보였다. 따라서 향후 출국 수요 예측에 있어 온라인 미디어의 구전 효과를 반영해야 하며 이는 미디어의 종류에 따라 차별적으로 적용해야 함을 시사한다. 또한 각 국가별로 온라인 미디어의 특성에 따라 미치는 영향 관계가 차이가 있음을 분석하였다. 즉, 출국 국가에 따라 온라인 미디어의 영향력이 다름에 따라 국가별로 차별적인 예측 및 관리 모형이 필요하다. 본 연구 결과를 통해 관광산업종사자들의 국가와 미디어별 온라인 미디어 기반의 마케팅 전략 수립에 도움을 줄 수 있으리라 기대된다.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;권희용;황호영
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.469-478
    • /
    • 2003
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 이용해서 인터넷에 연결되어 있는 수 많은 웹 서버들을 주기적 또는 비주기적으로 방무나여 자체적인 인텍싱 방법에 따라 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축하고 변겨아는 작업을 계속하고 있다. 이런 일련의 작업은 인터넷 상에 분산되어 있는 막대한 정보를 쉽고 정확하게 찾을 수 있는 게이트 사이트로서의 역할을 담당하기 위한 전략적인 목적으로 진행되고 있다. 수천만 이상의 웹 사이트들을 상대로 하는 정보 수집은 검색 엔진 사이트 중심으로 기존 데이터의 수정과 삭제 등과 같은 데이터 베이스 유지 관리와 신규 사이트들에 대한 자료 수집 작업이 이루어지고 있다. 이러한 작업은 웹 서버에 대한 사전 지식 없이 정보 추출을 위해 웹 로봇을 실행하므로 인터넷 상에 수많은 요구가 전송되고 이는 인터넷 트래픽을 증가 시키는 원인이 되고 있다. 따라서 웹 서버가 사전에 자신이 공개할 문서에 대한 변경 정보를 웹 로봇에게 통보하고 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 한다면 불필요한 인터넷 트래픽을 감소시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 해당 문서에 대한 정보수집 작업을 한다면 불필요한 인터넷 트래픽을 감소 시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 시스템 부하와 검색 엔진의 시스템 부하를 줄일 수 있는 효과를 가질 수 있을 것이다. 본 논문에서는 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동 사항들을 종합 정리해서 변경 문서에 대한 정보를 통보 받기 원하는 등록된 각 웹 로봇에게 전송하는 검사 통보 시스템을 설계 구현하였다. 웹 로봇을 운영하는 검색 엔진에서는 통보된 요약 정보를 이용해서 웹 서버로부터 해당 문서를 전송 받아 필요로 하는 인덱스 정보를 추출해서 데이터베이스를 구축하는 효율적인 웹 로봇을 설계 구현하였다.

유방암 절선조사 시 종속조사면 병합방법의 불균등한 선량분포 확인 (Verification of Non-Uniform Dose Distribution in Field-In-Field Technique for Breast Tangential Irradiation)

  • 박병문;배용기;강민영;방동완;김연래;이정우
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제33권3호
    • /
    • pp.277-282
    • /
    • 2010
  • 본 연구의 목적은 유방암 환자의 절선조사 시 종속조사면 병합(FIF) 치료방법을 2차원 이온전리함을 이용하여 불균등한 선량분포를 확인하고자하였다. 실험을 위해 2차원 이온전리함 배열(MatriXX, Wellhofer Dosimetrie, Germany)와 치료계획장치(Eclipse, ver 6.5, Varian, Palo Alto, USA)가 사용되었다. 불균등한 선량분포 확인을 위해 FIF 방법으로 치료계획 한 20명의 환자를 선택하여 각각 90 cGy를 처방하여 하이브리드계획을 수행하였으며, 측정값과 비교를 위해 동일한 기하학적 조건에서 MatriXX를 이용해 측정하였다. 정량적인 분석을 위해 상용화된 분석 소프트웨어(OmniPro IMRT, ver, 1.4, Wellhofer, Dosimetrie, Germany)를 이용하여 분석하였다. 실험 결과로 기준점에 선량처방 시 계산값과 측정값이 평균 1.6% 차이를 보였고, 선형프로파일(Line-Profile)을 통해 분석한 결과 종단면에서는 1.3-5.5%(평균 : 2.4%), 횡단면에서는 0.9-3.9%(평균 : 2.5%)로 변동을 보였다. 감마인덱스 히스토그람(기준 : 3 mm, 3%)로 분석한 결과 90.23-99.69%(평균 : 95.11%, 표준편차 : 2.81) 범위를 나타냈다(유효범위 ; $\gamma$-index $\geq$ 1). 본 실험에서는 MatriXX 이용하여 측정한 결과 치료계획 선량과 측정값이 오차범위 이내로 일치하였으며, 향후 다양한 종양치료에 있어 FIF방법의 활용도를 높이는 연구가 필요하다고 생각한다.

전산화단층촬영모의치료장치를 이용한 배와위 두개척수 방사선치료 계획 (CT Simulation Technique for Craniospinal Irradiation in Supine Position)

  • 이석;김용배;권수일;추성실;서창옥
    • Radiation Oncology Journal
    • /
    • 제20권2호
    • /
    • pp.165-171
    • /
    • 2002
  • 목적 : 척수에 전이가 가능한 뇌종양 치료를 위한 두개척수 방사선치료 시 복와위가 불가능한 경우 전산화단층촬영모의치료장치(volumetric spiral CT)와 가상모의 치료기(virtual simulator) 및 3차원 방사선치료계획장치를 이용하여 배와위로 두개척수 방사선치료계획 방법을 개발하고 기하학적 검증을 통하여 유용성을 고찰하고자 하였다. 대상 및 방법 : 2005년 5월에서 2001년 12월까지 연세암센터 방사선종양학과에서 배와위로 두개척수 방사선치료를 받은 환자 9명을 대상으로 하였다. 복와위가 불가능한 중증의 뇌종양 환자를 배와위로 하여 두경부는 두부고정틀 (thermoplastic mast $Aquaplast^{circledR}$) 로 고정시키고, 전신은 $Vac-Loc^{\circledR}$ (전성물산, 한국)으로 고정한 후 전산화단층촬영모의치료장치를 이용하여 전신체적영상(volumetric image)을 얻었다. 환자 자세의 재현성 확인 및 검증을 위해 두부에 세 개의 점과 전신에 기준선 및 기준점 등을 표시하였다. 이후 가상현실 영상(virtual fluoroscopy)에서 인체의 크기와 방향에 제약이 없고 치료 침대와 고정기구에 대한 시각장애를 제거함으로써 자유롭게 모의치료를 할 수 있었으며, 조사면과 빔을 결정하고 디지털화재구성사진(digitally reconstructed radiography, DRR)과 디지털화합성사진(digitally composited radiography, DCR)을 통하여 분해능이 좋은 화질의 투시 및 모의치료영상을 획득하였다. 기하학적 검증은 치료중심점 이동시 얻은 모의치료영상과 첫 치료 시에 얻은 조사면 검증 사진(port verification film) 등을 전산화단층촬영영상으로부터 재구성한 DRR 영상과 시각적, 정량적으로 비교, 분석하였다. 결과 : 전산화단층촬영모의치료장치와 가상모의치료기 및 3차원 방사선치료계획 장치 등을 이용하여 복와위가 불가능한 환자의 두개척수 방사선 치료계획을 배와위로 원활히 수행할 수 있었다. 가상현실영상에서 대부분의 설계작업이 이루어지므로 환자의 자세고정을 요하는 시간은 전신체적 영상을 얻는 10분 이내이므로 환자의 불편을 줄일 수 있을 뿐 아니라 모의치료과정 중의 체위 변동 변수를 제거할 수 있었다. 또한 전산화단층촬영영상을 얻음으로써 중요정상조직인 안구, 척수 등을 정확하게 설정할 수 있었고, 조사면 결정과 차폐의 정확성을 증진시킬 수 있었다. 환자 자세 오차는 디지털화재구성사진과 치료 시마다 얻은 포트필름에서 치료중심점과 척수 사이의 거리를 측정하여 3 mm 이내의 정확성을 얻을 수 있었다. 결론 : 전산화단층촬영모의치료장치로 체적영상을 얻고 가상현실모의치료계획으로 배와위 두개척수 방사선치료계획을 정확하고 용이하게 실현할 수 있었다. 따라서 배와위 두개척수 방사선치료는 복와위를 취할 수 없어서 치료가 힘든 소아환자, 전신상태가 좋지 않거나 기관절개술이 시행되어 있는 환자에서 유용한 방법임을 알 수 있었다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

기업의 빅데이터 투자가 기업가치에 미치는 영향 연구 (The effect of Big-data investment on the Market value of Firm)

  • 권영진;정우진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.99-122
    • /
    • 2019
  • IDC(International Data Corporation) 사(社)의 최근 보고서에 따르면, 2025년에는 2016년에 생성된 데이터의 10배에 달하는 163제타바이트의 데이터가 생성될 것이고 그 주체의 비중은 소비자에서 기업으로 이동하고 있다고 한다. 이러한 소위 '빅데이터의 물결'은 도래하고 있고 그 파장은 산업 전반적으로 영향을 미칠 것이다. 따라서, 방대한 데이터를 효과적으로 관리하는 것은 기업의 관점에서 그 어느 때보다 더 중요하다. 하지만, IT 투자에 대한 효과를 측정한 선행 연구는 다수 존재함에도 불구하고 빅데이터 투자 효과를 측정한 선행 연구는 거의 전무한 실정이다. 따라서, 해당 투자 효과를 정량적으로 분석한다면 기업의 의사 결정을 도울 수 있을 것이다. 본 연구는 효율적 시장 가설을 이론적 바탕으로 둔 사건연구방법론(Event Study Methodology)을 적용하여, 기업의 빅데이터 투자가 시장 투자자들의 반응에 미치는 영향을 측정하였다. 또한, 보다 심층적으로 이 효과를 분석하기 위해서 5가지 하위 변수를 설정했고 그 내용은 기업 크기 구분, 산업 구분(Finance와 ICT), 투자 구축 완료 구분, 벤더 유무 구분이다. 분석 결과, 91개 기업은 빅데이터 투자 공시 이후 시장 가치가 평균 0.92% 상승한다는 사실을 확인하였다. 특히 Finance 기업, non-ICT 기업, 시가 총액이 작은 기업, 빅데이터 전문 벤더 기업을 통해 투자한 기업, 그리고 빅데이터 시스템이 구축 완료됐다는 공시에 해당하는 기업의 시장 가치가 두드러지게 상승한다는 사실을 알 수 있었다. 본 연구는 빅데이터 투자 효과를 측정한 선행 연구가 거의 전무하다는 점에서 학문적인 의의를 지니고, 빅데이터 투자를 고려 중인 기업 의사 결정자들에게 실질적인 참고 자료가 될 수 있다는 점에서 실무적인 시사점을 갖는다.

기계학습모델을 이용한 이상기상에 따른 사일리지용 옥수수 생산량에 미치는 피해 산정 (Calculation of Damage to Whole Crop Corn Yield by Abnormal Climate Using Machine Learning)

  • 김지융;최재성;조현욱;김문주;김병완;성경일
    • 한국초지조사료학회지
    • /
    • 제43권1호
    • /
    • pp.11-21
    • /
    • 2023
  • 본 연구는 기계학습을 기반으로 제작한 수량예측모델을 이용하여 PCR 4.5 시나리오에 따른 사일리지용 옥수수(WCC)의 피해량 산정 및 전자지도를 작성할 목적으로 수행하였다. WCC 데이터는 수입적응성 시험보고서(n=1,219), 국립축산과학원 시험연구보고서(n=1,294), 한국축산학회지(n=8), 한국초지조사료학회지(n=707) 및 학위논문(n=4)에서 총 3,232점을 수집하였으며, 기상데이터는 기상청의 기상자료개방포털에서 수집하였다. 본 연구에서 이상기상에 따른 WCC의 피해량은 RCP 4.5 시나리오에 따른 월평균기온 및 강수량을 시간단위로 환산하여 준용하여 산정하였다. 정상기상에서 DMY 예측값은 13,845~19,347 kg/ha 범위로 나타났다. 이상기상에 따른 피해량은 이상기온 2050 및 2100년 각각 -263~360 및-1,023~92 kg/ha, 이상강수량 2050 및 2100년 각각 -17~-2 및-12~2 kg/ha였다. 월평균기온이 증가함에 따라서 WCC의 DMY는 증가하는 경향으로 나타났다. RCP 4.5 시나리오를 통해 산정한 WCC의 피해량은 QGIS를 이용하여 전자지도로 제시하였다. 본 연구는 온실가스 저감이 진행된 시나리오를 이용했지만, 추가 연구는 온실가스 저감이 되지 않은 RCP 시나리오를 이용한 연구를 수행할 필요가 있다.

국내 주요 10대 기업에 대한 국민 감성 분석: 다범주 감성사전을 활용한 빅 데이터 접근법 (Public Sentiment Analysis of Korean Top-10 Companies: Big Data Approach Using Multi-categorical Sentiment Lexicon)

  • 김서인;김동성;김종우
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.45-69
    • /
    • 2016
  • 최근에 빅 데이터를 활용하여 감성을 측정하는 시도가 활발히 이루어지고 있다. 통신 매체와 SNS의 발달로 기업은 국민의 감성을 파악하고 즉시 대응해야할 필요성이 생겼다. 우리나라의 경제는 대기업에 대한 의존도가 높기 때문에 10대 기업에 대한 감성분석은 의미가 있다고 할 수 있다. 이러한 측면에서 본 연구는 다 범주를 기준으로 구축한 감성사전을 활용하여 우리나라 10대 기업에 대한 감성을 분석하였다. 빅 데이터를 이용하여 감성을 분석한 기존의 선행연구는 감성을 차원으로 분류하는 경향이 있다. 차원적 감성으로 감성을 분류하는 것은 분류의 기준이 학술적으로 증명되었기에 감성 분석에 주로 사용되어 왔지만 전문가 정도의 지식이 있어야 분류할 수 있어 보편적인 감성을 대변하는 데 비효과적이기에 보완이 필요하다고 할 수 있다. 개별 범주적 감성은 이 점을 보완할 수 있는 분류 방식으로 일정 수준의 주관성이 개입되지만 보편적으로 느낄 수 있는 감성을 측정하는데 효과적이다. 따라서 본 연구는 보편적인 감성의 측정을 위해 감성을 차원으로 분류하지 않고 개별 범주로 분류하여 9가지 영역으로 나누었다. 선행 연구에서 추출한 9가지 범주에 해당하는 감성 단어에 기초하여 감성사전을 구축하였으며 감성 단어가 검출된 빈도를 기준으로 감성을 분석했다. 대상 데이터는 2014년 1월부터 2016년 1월까지 우리나라 10대 기업에 대하여 축적된 뉴스 데이터이다. 대상 데이터에서 검출된 감성 단어의 빈도를 기준으로 각 기업에 대한 감성 순위를 나누고 분포를 확인하였다. 기업에 따라서 감성이 다를 수 있는지, 특정 사건이 각 기업에 대한 감성에 영향을 줄 수 있는지 가설을 세우고 검정하였다. 결론적으로, 다 범주 감성 사전을 활용한 감성 분석은 기업 간 비교와 시점 간 비교에 유의한 것으로 나타났다. 본 연구는 빅 데이터에 산재해있는 감성을 국민의 시각으로 측정하는 하나의 대안으로서 의의가 있다.

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.