• 제목/요약/키워드: Predictive

검색결과 5,402건 처리시간 0.044초

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

ADHD 진단에서 K-CBCL 6-18의 임상적 유용성 -아동복지시설 심리장애 아동에의 적용- (The clinical utility of K-CBCL 6-18 in diagnosing ADHD -focused on children with psychological disorders in child welfare institution-)

  • 김상아;하은혜
    • 한국아동복지학
    • /
    • 제56호
    • /
    • pp.253-281
    • /
    • 2016
  • 본 연구의 목적은 아동복지시설에 거주하는 심리장애 아동의 ADHD를 진단하는 데 있어 K-CBCL 6-18 주의력 관련 지표의 임상적 유용성을 검증하는 것이다. 연구대상은 '2013-2014 아동복지시설 아동 치료 재활 지원 시범 사업'에 참여하였던 심리장애 초등학생 509명이다. 그들에게 치료 전 실시하였던 사전 심리 검사 자료 중 K-ARS와 K-CBCL 6-18의 5가지 주의력 관련 지표인 문제행동총점, 외현화총점, 주의집중문제, 공격행동, DSM ADHD 척도만을 이용하였다. 연구 결과, K-ARS와 K-CBCL 6-18의 주의력 관련 지표와의 상관관계가 높게 나타났다. 또한 K-ARS를 기준으로 대상 아동을 ADHD집단(n=334)과 비ADHD집단(n=175)으로 나누어 K-CBCL 6-18 주의력 관련 지표의 집단 간 차이를 확인한 결과, 5가지 지표 모두 ADHD집단의 평균이 유의하게 높았다. K-CBCL 6-18 주의력 관련 지표의 임상적 절단점 64T, 70T를 기준으로 산출한 분류적중률은 모든 지표에서 60-70%의 백분율을 나타냈으며 문제행동총점과 외현화 총점 척도의 민감도가 높았고 주의집중문제와 DSM ADHD, 공격행동 척도의 특이도가 높게 나타났다. 한편, 종합심리검사 결과를 기준으로 ADHD집단(n=95)과 정서장애집단(n=30)을 나누어 K-CBCL 6-18 주의력 관련 지표의 집단 간 차이를 확인한 결과, 주의집중문제 척도와 DSM ADHD 척도에서 ADHD 집단이 정서 장애 집단에 비해 유의하게 높았다. 임상적 절단점 70T를 기준으로 산출한 두 척도의 분류적중률은 약 55%의 비슷한 값을 나타냈으며 두 척도 모두 민감도가 낮고 특이도가 높았다. 종합적으로 K-CBCL 6-18 주의력 관련 지표는 ADHD를 변별해내는 데 유용한 것으로 나타났으며 특히 DSM ADHD 척도가 주의집중척도와 함께 임상 집단 내에서 ADHD 진단 능력이 높은 것으로 나타났다. 아동복지시설과 같이 여러 검사 도구를 통한 정확한 진단이 어려운 환경에서 ADHD 진단 능력이 높은 척도를 규명하였다는 데 본 연구의 의의가 있다.

MaxEnt 분석을 통한 한반도 특산식물 개느삼 서식 가능지역 분석 (Distribution and Potential Suitable Habitats of an Endemic Plant, Sophora koreensis in Korea)

  • 안종빈;성찬용;문애라;김소담;정지영;손성원;신현탁;박완근
    • 한국환경생태학회지
    • /
    • 제35권2호
    • /
    • pp.154-163
    • /
    • 2021
  • 본 연구는 한국 특산식물이고, IUCN Red List의 EN(위기종) 등급에 속하는 개느삼을 대상으로 자생지 분포, 자생지 분포 예측을 하기 위해 수행되었다. 개느삼의 자생지 분포 조사 결과,강원도 양구군 13곳, 인제군 3곳, 춘천시 2곳, 홍천군 1곳 총 19곳에 분포하는 것을 확인하였다. 우리나라에서 가장 북쪽 자생지는 양구군 임당리, 동쪽 인제군 한계리, 서쪽 춘천시 지내리, 남쪽 홍천군 성동리로 각각 확인되었다. 개느삼 자생지의 해발고도는 169-711m에 분포하는 것으로 나타났고, 평균 해발고도는 375m로 조사되었다. 개느삼 자생지의 면적은 8,000-734,000m2인 것으로 분석되었고, 평균 202,789m2로 조사되었다. 대부분의 개느삼 자생지는 간벌, 가지치기 등과 같은 숲가꾸기가 이루어진 곳으로 조사되었다. 개느삼 잠재 분포지 분석을 MaxEnt 프로그램을 이용하여 수행한 결과, AUC값은 0.9762로 분석되었다. 분포예측 자생지는 강원도 양구군, 인제군, 춘천시, 화천군 지역에 집중되어 분포하는 것으로 나타났다. 자생지 분포예측에 가장 영향을 많이 미치는 변수는 연간강수량, 토양탄소함유량, 최한월 기온으로 분석되었다. 본 연구 결과를 토대로 개느삼은 광량이 풍부하고 능선부에 주로 서식하는 것을 확인하였고, 향후 본 연구결과의 자생지 정보를 토대로 개느삼 자생지를 보전하기 위한 보호지역 지정 등을 위한 기초자료로 활용될 수 있을 것으로 판단된다.

제주도 표선유역 중산간지역의 최적 지하수위 예측을 위한 인공신경망의 활성화함수 비교분석 (Comparative analysis of activation functions of artificial neural network for prediction of optimal groundwater level in the middle mountainous area of Pyoseon watershed in Jeju Island)

  • 신문주;김진우;문덕철;이정한;강경구
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1143-1154
    • /
    • 2021
  • 활성화함수의 선택은 인공신경망(Artificial Neural Network, ANN) 모델의 지하수위 예측성능에 큰 영향을 미친다. 특히 제주도의 중산간 지역과 같이 지하수위의 변동폭이 크고 변동양상이 복잡한 경우 적절한 지하수위 예측을 위해서는 다양한 활성화함수의 비교분석을 통한 최적의 활성화함수 선택이 반드시 필요하다. 본 연구에서는 지하수위의 변동폭이 크고 변동양상이 복잡한 제주도 표선유역 중산간지역 2개 지하수위 관측정을 대상으로 5개의 활성화함수(sigmoid, hyperbolic tangent (tanh), Rectified Linear Unit (ReLU), Leaky Rectified Linear Unit (Leaky ReLU), Exponential Linear Unit (ELU))를 ANN 모델에 적용하여 지하수위 예측결과를 비교 및 분석하고 최적 활성화함수를 도출하였다. 그리고 최근 널리 사용되고 있는 순환신경망 모델인 Long Short-Term Memory (LSTM) 모델의 결과와 비교분석하였다. 분석결과 지하수위 변동폭이 상대적으로 큰 관측정과 상대적으로 작은 관측정에 대한 지하수위 예측에 대해서는 각각 ELU와 Leaky ReLU 함수가 최적의 활성화함수로 도출되었다. 반면 sigmoid 함수는 학습기간에 대해 5개 활성화함수 중 예측성능이 가장 낮았으며 첨두 및 최저 지하수위 예측에서 적절하지 못한 결과를 도출하였다. 따라서 ANN-sigmoid 모델은 가뭄기간의 지하수위 예측을 통한 지하수자원 관리목적으로 사용할 경우 주의가 필요하다. ANN-ELU와 ANN-Leaky ReLU 모델은 LSTM 모델과 대등한 지하수위 예측성능을 보여 활용가능성이 충분히 있으며 LSTM 모델은 ANN 모델들 보다 예측성능이 높아 인공지능 모델의 예측성능 비교분석 시 참고 모델로 활용될 수 있다. 마지막으로 학습기간의 정보량에 따라 학습기간의 지하수위 예측성능이 검증 및 테스트 기간의 예측성능보다 낮을 수 있다는 것을 확인하였으며, 관측지하수위의 변동폭이 크고 변동양상이 복잡할수록 인공지능 모델별 지하수위 예측능력의 차이는 커졌다. 본 연구에서 제시한 5개의 활성화함수를 적용한 연구방법 및 비교분석 결과는 지하수위 예측뿐만 아니라 일단위 하천유출량 및 시간단위 홍수량 등 지표수 예측을 포함한 다양한 연구에 유용하게 사용될 수 있다.

양극성 장애 환자의 개인적·사회적 기능 상태에 대한 관련 요인 (Factors Associated with Personal and Social Performance Status in Patients with Bipolar Disorder)

  • 김민정;이전호;윤현철;정현강;김승현
    • 수면정신생리
    • /
    • 제26권1호
    • /
    • pp.33-43
    • /
    • 2019
  • 목 적 : 양극성 장애 환자의 기능은 증상의 심각도, 약물 순응도, 수면의 질, 사회적 지지와 관련되어 있다고 알려져 있다. 본 연구에서는, 정신사회적 요인들과 인구학적 요인들이 양극성 장애 환자의 기능 상태와 갖는 연관성에 대해 알아보고자 하였다. 방 법 : 본 연구에서는 양극성 장애 환자 52명을 대상으로 하였다. 다음과 같은 임상적 척도들이 수행되었다: 한국판 personal and social performance scale (K-PSP), 한국판 Hamilton rating scale for depression (K-HDRS), 한국판 young mania rating scale (K-YMRS), 한국판 Pittsburgh sleep quality index (PSQI-K), 한국판 drug attitude inventory (K-DAI), mood disorders insight scale (MDIS), multidimensional scale of perceived social support (MSPSS). 연구 대상의 기능 상태와 임상적 변수들 간의 관계는 상관 분석을 사용하여 분석하였고, 이어 다중 선형 회귀분석을 시행하였다. 결 과 : 전체 K-PSP 점수의 평균은 $57.92{\pm}13.76$이었다. 전체 K-PSP 점수는 K-HDRS 점수와는 음의 상관관계를 나타냈다(r = -0.387, p = 0.005). 반면, K-YMRS 점수와 전체 K-PSP 점수는 통계적으로 의미 있는 관계가 도출되지 않았다(r = -0.205, p = 0.145). 전체 K-PSP 점수는 PSQI-K 총점(r = -0.378, p = 0.005) 및 전반적인 수면의 질(r = -0.353, p = 0.010)과 음의 상관관계를 나타냈다. 전체 K-PSP 점수는 KDAI 점수(r = 0.409, p = 0.003) 및 총 MSPSS 점수(r = 0.334, p = 0.015)와는 양의 상관관계를 보였다. 전체 K-PSP에 대하여 설명 가능한 변수들은 PSQI-K 중 전반적인 수면의 질과 MSPSS 중 가족에 의한 지지였다(adjusted $R^2=28.3%$). 결 론 : 본 연구에서는 우울 증상이 심할수록, 전반적인 수면의 질이 낮을수록, 약물에 대해 부정적으로 인식할수록, 사회적 지지가 적을수록 양극성 장애 환자의 기능 수준이 저하된다는 결과를 제시해주었다. 양극성 장애 환자의 기능 상태는 환자가 보고하는 전반적인 수면의 질과 가족에 의한 사회적 지지를 통해 예측 가능하므로, 환자의 수면 만족도를 증진시키고 가족에 의하여 적절한 지지를 제공하는 것이 양극성 장애 환자의 기능 회복과 사회적 복귀에 있어서 중요한 부분이라고 시사된다.

한국인 선천성 갑상선기능저하증에 대한 신생아선별검사의 14년간의 후향적 연구; 발생빈도와 유효성 (Evaluation of the Congenital Hypothyroidism for Newborn Screening Program in Korea: A 14-year Retrospective Cohort Study)

  • 윤혜란;안선현;이향자
    • 대한유전성대사질환학회지
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2019
  • 목적: 선천성 갑상선기능저하증(Congenital hypothyroidism, CH)은 전세계적으로 출생아 3,000-4,000명 당 1명의 빈도로 발생하는 신생아기에 가장 흔한 내분비질환이다. 본 연구는 1991년부터 2004년까지 남한의 선천성 갑상선기능저하증 발생률의 빈도 및 현재까지 적용되어온 광범위한 신생아 선별검사의 검사방법과 결과를 재평가하기 위해 수행되었다. 방법: 서울 지역에 위치하지만 전국적인 지사를 운영하고 있는 검사기관 서울의과학 연구소(SCL)에서는 서울 외 6개 광역시(부산, 인천, 대구, 대전, 광주, 울산)와 9개도(경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주)로 한국을 15개 지역으로 분류하였다. 15개 지역으로부터 신생아의 채혈지를 수집하여 서울본원에서 수집하여, TSH 및 유리 T4를 ELISA 검사법으로 신생아선별검사를 수행하였다. SCL 데이터 및 복지부에 보고된 전국적인 양성자수를 검토하였다. 선천성갑상선기능저하증에 대한 신생아선별 검사법의 cut-off 치는 신생아 갑상선자극호르몬(TSH) 측정을 위해서는 20 mIU/L를 유리 T4의 검사를 위해서는 0.8 ng/dL 이하를 사용하였다. TSH 및 유리 T4 ELISA 분석에 기초한 선천성 갑상선기능저하증에 대해 1차 선별검사에서 선천성 갑상선기능저하증 양성은 신생아 671,805명 중 신생아 159명에서 발견되었으며, 이의 발병빈도는 4,225명 중 1명으로 추정되었다 결과: TSH 분석에서 cut-off 20 mIU/ L를 사용했을 때 민감도, 특이도 및 양성 측도(PPV)는 각각 100.0%, 99.7% 및 10.8%였다. 유리 T4 분석을 위해 0.8 ng/dL cut-off를 사용했을 때 민감도, 특이도 및 양성 예측도는 각각 100.0%, 98.5% 및 3.9%였다. 결론: NBS를 통해 얻은 CH의 발병빈도는 2004년 이전에 해외의 여러 국가에서 보고 된 발병빈도와 비교할 만큼 유사하였다.

  • PDF

초기 시청시간 패턴 분석을 통한 대흥행 드라마 예측 (Prediction of a hit drama with a pattern analysis on early viewing ratings)

  • 남기환;성노윤
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.33-49
    • /
    • 2018
  • TV 드라마는 타 장르에 비해 시청률과 채널 홍보 효과가 매우 크며, 한류를 통해 산업적 효과와 문화적 영향력을 확인시켜줬다. 따라서, 이와 같은 드라마의 흥행 여부를 예측하는 일은 방송 관련 산업에서 매우 중요한 부분임은 주지의 사실이다. 이를 위해서 본 연구에서는 2003년부터 2012년까지 10년간, 지상파 채널을 통해 방송된, 총 280개의 TV 미니시리즈 드라마를 분석하였다. 이들 드라마 중 평균 시청률 상위 45개, 하위 시청률 45개를 선정하여 흥행 드라마의 시청시간 분포 (5%~100%, 11-Step) 모형을 만들었다. 이들 기준 모형과 신규 드라마의 시청시간 분포와의 이격 거리를 Euclidean/Correlation으로 측정한 유사도(Similarity)를 통해, 시청자의 초기(1~5회) 시청시간 분포로 신규 드라마의 성패 여부를 예측하는 모델을 만들었다. 또한 총 방송 시간 중 70% 이상 시청한 시청자를 열혈 시청층(이하 열혈층) 으로 분류하고, 상위/하위 드라마의 평균값과 비교하여, 신규 드라마의 흥행여부를 판별할 수 있도록 설계하였다. 연구 결과 드라마의 초반 시청자 충성도(시청시간)는 드라마의 대흥행 여부를 예측하는데 중요한 요소임을 밝혔으며, 최대 75.47%의 확률로 대흥행 드라마의 탄생을 예측할 수 있었다.

유방암 수술환자의 디스트레스 및 연관인자 : 단면연구 (Distress and Associated Factors in Patients with Breast Cancer Surgery : A Cross-Sectional Study)

  • 이상신;임효덕;우정민
    • 정신신체의학
    • /
    • 제26권2호
    • /
    • pp.77-85
    • /
    • 2018
  • 연구목적 유방암 환자가 치료 초기에 경험하는 디스트레스는 유방암 생존기까지 지속되는 만성 디스트레스의 위험요소로 알려져 있다. 본 연구는 유방암 첫 치료로써 수술을 받은 환자를 대상으로 디스트레스 온도계(distress thermometer, DT)를 이용하여 디스트레스의 정도와 이와 연관된 인자를 조사하는 것이다. 방 법 2013년 4월 1일부터 2017년 3월 31일 사이에 경북대학교병원에서 유방암 첫 치료로써 수술을 받고 일주일 이내에 있는 환자를 대상으로 하였다. DT로 디스트레스의 정도를 측정하였고 한국판 세계보건기구 삶의 질척도 단축형(Korean version of the World Health Oganization Quality of Life Scale Abbreviated Version, WHOQOL-BREF)으로 삶의 질을 측정하였다. 그 외 기본 인구학적 자료, 암 및 암 치료 관련 자료를 수집하였다. DT 점수 4점 이상인 대상자를 디스트레스 군으로 분류하였다. 디스트레군과 연관된 인자를 알기 위하여 디스트레스군과 비-디스트레스 군 사이의 변수 차이를 단변수 분석(univariable analysis) 하였다. 로지스틱 회귀분석을 시행하여 디스트레스 군을 예측할 수 있는 인자를 조사하였다. 결 과 대상자는 총 307명이었다. 이 중에서 DT에 응답하지 않은 39명, WHOQOL-BREF에서 6개 항목 이상 답을 하지 않아서 채점을 할 수 없었던 4명을 제외한 264명이 분석 대상자였다. 65.5%(n=173)가 디스트레스 군으로 분류되었다. 단변수 분석(univariable analysis)에서 디스트레스 군이 비-디스트레스 군과 비교하여 더 젊었으며(p=0.045), 배우자와 동거하지 않는 경우가 더 많았다(p=0.032). 삶의 질 영역에서 디스트레스 군이 전반적 삶의 질(p=0.009), 전반적 건강상태(p=0.005), 신체건강영역 p<0.001), 심리건강영역(p=0.002)에서 더 나쁜 삶의 질을 보였다. 로지스틱 회귀분석에서 60세 이상의 환자에 비하여 40-49세의 환자가 디스트레스에 이환 될 확률이 약 3배 높았고[OR=2.992, 95% confidence intervals (CI) 1.241-7.215], WHOQOL-BREF영역 중 신체건강영역이 디스트레스를 예측할 수 있는 인자로 나타났다(OR=0.777, 95% CI 0.692-0.873). 결 론 유방암 수술 치료 초기단계에서부터 상당한 수의 환자가 유의한 수준의 디스트레스를 경험하고 있다. 특히 생산성이 왕성한 삶의 주기에 있는 40대의 환자가 60대 이상의 환자에 비하여 수술 후 일주일 이내에 겪는 심리적 고통이 심할 가능성이 높다. 이러한 환자들에게서 수술 초기부터 신체적 삶의 질과 연관된 영역(예 : 통증, 불면, 피로 등)에 대해 평가하고 개입하는 것이 디스트레스 수준을 경감시킬 가능성이 있다.

MMPI-2를 이용한 생체 간 공여자들의 심리적 특성에 대한 연구 (Psychological Characteristics of Living Liver Transplantation Donors using MMPI-2 Profiles)

  • 이진혁;최태영;윤서영
    • 정신신체의학
    • /
    • 제27권1호
    • /
    • pp.42-49
    • /
    • 2019
  • 연구목적 생체 간이식은 간 질환으로 치료가 어려운 환자들에게 타인의 간을 제공하는 치료 방법 중 하나로, 수혜자에 비해 생체 간 공여자들의 특성에 대한 연구가 상대적으로 부족하다. 본 연구는 생체 간 공여 예정자들의 정서상태와 성격 특성을 평가하고, 공여 여부와 수혜자와의 관계 및 성별에 따른 차이점 유무를 확인하고자 하였다. 방 법 2012년 8월 1일부터 2018년 7월 31일까지 대구가톨릭대학교병원 정신건강의학과 외래에 방문한 생체 간 공여 예정자 218명(남자 126명, 여자 92명)의 의무 기록을 후향적으로 검토하여 사회인구학적 특성 및 정신건강의학과적 평가에 관한 정보를 수집하였다. 공여 예정자들의 수술 시행 여부, 공여자-기증자의 관계와 성별에 따라 군을 나눈 후 사회인구학적 특성과 다면적 인성검사 II (Minnesota Multiphasic Personality Inventory-2) 척도값을 비교하였다. 결 과 대상자들의 평균 연령은 $32.19{\pm}10.91$ 세였다. 본원에서 공여자 간절제술을 받은 자는 187명, 받지 않은 자는 31명이였다. 공여자-수혜자 관계에서 남편-아내는 40명, 부모-자식은 157명, 형제-자매는 12명, 기타 친족 및 지인은 9명이였다. 대상자들은 대조군과 비교했을 때 타당도 척도 L, F, K와 모든 임상 척도에서 유의미한 차이를 보였다. 공여자 간절제술을 받은 대상자들은 받지 않은 대상자들에 비해 타당도 척도 K와 S에서 유의미하게 높은 수치를, 타당도 척도 F(b)와 F(p) 및 임상 척도 Pa와 함께 성격병리 척도 AGGR, PSYC, DISC, NEGE에서 유의미하게 낮은 수치를 보였다. 공여자 간절제술 시행 여부의 예측 변인으로 타당도 척도 F, 임상 척도 D와 성격병리 척도 NEGE가 있었다. 공여자-수혜자 관계와 성별에 따른 차이점을 비교하였을 때, 일부 척도들에서 통계적으로 유의미한 차이를 보였다. 결 론 생체 간 공여자들의 평가에서 심리적 문제의 축소 보고 가능성을 유념해야 한다. 또한 공여자들을 평가할 때 정서 상태, 공여를 결정하기까지의 과정과 배경, 가족 구성원들과의 관계 또한 파악하는 것이 필요하겠다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.