• 제목/요약/키워드: prediction performance

검색결과 5,534건 처리시간 0.032초

분광학을 이용한 토양 유기물 추정 및 분포도 작성 (Estimation and Mapping of Soil Organic Matter using Visible-Near Infrared Spectroscopy)

  • 최은영;홍석영;김이현;장용선
    • 한국토양비료학회지
    • /
    • 제43권6호
    • /
    • pp.968-974
    • /
    • 2010
  • 본 연구에서는 토양의 가시 근적외선 스펙트럼의 피크중첩에 의한 분석오차를 감소시킴으로써 토양유기물 추정의 정확도 향상을 위해 이산 웨이블릿 변환 (DWT) 신호처리기법의 적용을 검토하고 공간정보모델링을 통해 토양유기물의 분포도를 작성하고자 하였다. 토양유기물 함량에 따른 스펙트럼의 정량적 변화의 강조를 위해 Continuum 제거, 도함수 변환과 함께 Haar, Daubechies DWT 변환된 스펙트럼을 PLSR 모델에 대입하여 산출한 토양유기물 추정식들은 거의 비슷한 결과를 도출하였고 $R^2$ > 0.6, RPD > 1.5 의 '대략적인' 추정 결과를 보였다. 잡음을 줄이고 신호값을 향상시키기 위해 이산 웨이블렛 변환을 적용한 결과에서 오히려 약간 낮은 성능을 나타내었는데 성긴 근사값 (Coarser approximation) 스펙트럼으로 변환되어 추정식의 유의성이 낮아졌을 가능성이 있다. 따라서 토양의 분광스펙트럼에 더 적합한 이산 웨이블렛 필터와 수준 등의 DWT 조건을 찾고 적용함으로써 추정식의 유의성을 향상시킬 수 있을 것으로 본다. 또한, 유기물에 의한 에너지의 흡수, 반사를 일으키는 주요 파장대의 상관성을 분석하여 선택적으로 해당 영역의 스펙트럼이나 파라미터 값을 산출하여 추정모델에 적용하는 시도도 필요할 것으로 사료된다. 이러한 토양유기물의 추정값과 실측값을 이용해 구역 크리깅을 수행하여 분포지도를 작성하였다. 토양 샘플의 유기물 분석값은 평균값을 중심으로 정규분포를 나타내었는데 크리깅 지도에서도 전반적으로 유사한 패턴의 값이 분포하였다. 추정값을 이용한 크리깅 결과도 실측값을 이용한 분포지도와 유사한 공간적 패턴을 나타내었다. 지도의 우하단부와 중앙 부분에서 실측값 분포보다 추정값 분포지도에서 약간 더 높은 경향을 보였는데 이는 토양 유기물의 추정치와 실측치 간의 오차에 의한 것으로 판단된다. 분광 스펙트럼을 이용한 추정 모델은 정확도 제고가 필요한 단계이나 신속성, 용이성 면에 있어서 토양 특성에 대해 광역 단위에서 다량의 시료 분석에 유용할 것으로 보이고, 또한 지역, 세계 규모의 디지털 토양 매핑, 토양 분류 및 원격탐사 자료와의 연계 분석에 활용될 수 있을 것으로 기대된다.

고준위방사성폐기물 처분장 모니터링용 피에조센서의 온도 스트레스에 관한 가속수명시험 설계 (Design of accelerated life test on temperature stress of piezoelectric sensor for monitoring high-level nuclear waste repository)

  • 황현중;박창희;홍창호;김진섭;조계춘
    • 한국터널지하공간학회 논문집
    • /
    • 제24권6호
    • /
    • pp.451-464
    • /
    • 2022
  • 고준위방사성폐기물 처분장은 심지층 처분시스템으로 사용후핵연료를 취급하는 특성상 고온, 방사선 및 지하수 등의 복합적인 환경조건에 노출되어 있다. 지속적인 노출에 의해 시간이 지남에 따라 구조물의 균열 및 열화가 발생할 수 있다. 한편 고준위방사성폐기물 처분장은 초장기 기대수명이 요구되며 이에 따른 장기적인 구조물 건전성 모니터링이 필수적이다. 구조물 건전성 모니터링에는 가속도계, 토압계, 변위계 등 다양한 센서들이 활용될 수 있으며, 이 중 일반적으로 피에조센서가 사용된다. 따라서 피에조센서의 내구성 평가를 바탕으로 고내구성 센서를 개발할 필요가 있다. 본 연구에서는 피에조센서의 내구성 평가 및 수명예측을 위한 가속수명시험을 설계하였다. 문헌연구를 바탕으로 단일 스트레스 인자에 대한 가속 스트레스 수준 수 및 각 수준 별 시료 수를 선정하였다. 또한 고준위방사성폐기물 처분장 환경조건에서 발생할 수 있는 피에조센서의 고장모드 및 고장메커니즘을 분석하였다. 온도 스트레스 인자에 대한 최대 가혹조건 탐색 실험을 두 가지 방법으로 제안하였으며 피에조센서의 신뢰도 높은 동작한계를 도출하였다. 이를 이용하여 가속수명시험의 합리적인 가속 스트레스 수준을 설정하였다. 본 연구에서 제시된 최대 가혹조건 탐색 실험방법은 경제적이며 실용적인 아이디어를 담고 있으며, 추후 피에조센서의 가속수명시험 설계에 널리 활용될 수 있을 것으로 판단된다.

최근 12년간 아까시나무 만개일의 변화와 과정기반모형을 활용한 지역별 만개일 예측 (Recent Changes in Bloom Dates of Robinia pseudoacacia and Bloom Date Predictions Using a Process-Based Model in South Korea)

  • 김수경;김태경;윤석희;장근창;임혜민;이위영;원명수;임종환;김현석
    • 한국산림과학회지
    • /
    • 제110권3호
    • /
    • pp.322-340
    • /
    • 2021
  • 최근 급격한 봄철 기온 상승과 기후변화의 영향으로 한반도에 분포하고 있는 아까시나무의 개화 시기가 변화하면서 지역간에 동시 개화 현상(simultaneous blooming)이 관측되고 있다. 이러한 변화는 국내 양봉 산업에 큰 변화를 초래하였고, 이로 인해 정확도 높은 아까시나무 개화시기 정보에 대한 수요가 증가하고 있다. 따라서, 본 연구를 통해 아까시나무의 지역별 개화 시기 변화를 잘 설명할 수 있는 신뢰도 높은 개화 시기 예측 모형을 개발하고자 하였다. 이를 위해 지난 12년(2006~2017년)간 전국 26개 지점에서 관측된 아까시나무 만개일 자료와 과거 일기온 복원 자료를 활용하여 봄철 기온 및 아까시나무 만개일 변화의 경향성을 권역별로 파악하고, 과정기반모형을 활용하여 지역 통합 모형(SM)과 함께 지역적 특성을 반영하는 세 모형-SM에 지점별 보정계수를 도입한 수정 통합 모형(MSM), 권역별로 모수를 추정하는 권역별 통합 모형(GM), 관측 지점별로 모수를 추정하는 지역 모형(LM)-을 도출, 성능을 비교하였다. 기온 및 만개일의 경향 분석 결과, 남부 지역에 비해 봄철 기온 상승률이 2배 이상 높았던 중북부 내륙 지역의 경우 만개일이 빠른 속도로 앞당겨져, 결과적으로 남서부 해안 지역과의 만개일 차이는 1년에 0.7098일씩 감소하였다(p-value=0.0417). 전체 지역에 대한 모형의 성능 비교 결과, 지역 특이성이 반영되지 않은 SM에 비해서 MSM은 24% 이상, LM은 15% 이상 감소한 RMSE 값을 나타냈다. 또한 LM과 MSM의 예측 알고리즘을 전국 범위로 확대하여 4년 간(2014~2017년) 16개의 추가 관측 지점을 대상으로 검증한 결과, LM에 코크리깅(Co-kriging)기법을 적용한 방법이 보정계수 전국 분포도를 추정하여 SM을 보정하는 방법보다 예측력이 더 뛰어났으며, 오차의 분포는 두 모형 간에 통계적으로 유의한 차이를 보였다(RMSE: p-value=0.0118, Bias: p-value=0.0471). 본 연구는 아까시나무의 개화 시기 예측에 있어 지역 단위 예측의 신뢰도를 향상시키고 모형을 넓은 지역 범위로 확대, 적용하기 위한 방안을 제시하였다.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

기계학습을 활용한 특허수명 예측 및 영향요인 분석 (Prediction of patent lifespan and analysis of influencing factors using machine learning)

  • 김용우;김민구;김영민
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.147-170
    • /
    • 2022
  • 특허의 사적 가치(private value)를 나타내는 특허수명 추정은 오래전부터 연구되었으나 추정과정에서 선형모델에 의존하는 경우가 대부분이었고, 기계학습 방법을 사용하더라도 변수 간 관계에 대한 해석이나 설명이 부족하였다. 본 연구에서는 특허의 생존 기간이 특허의 가치를 대리한다는 기존 연구결과를 바탕으로 특허 등록 이후의 생존 기간(연장횟수) 예측을 통해 특허의 가치를 추정한다. 이를 위해 1996~2017년까지 미국 특허청(USPTO)에 출원하여 등록된 특허 4,033,414개를 수집하였다. 특허수명을 예측하기 위해 기존 연구에서 특허수명에 영향을 미친다고 밝혀진 특허의 특성, 특허의 소유자 특성, 특허의 발명가 특성을 반영할 수 있는 다양한 변수가 사용되었다. 서로 다른 4개의 모델(Ridge Regression, Random Forest, Feed-forward Neural Network, Gradient Boosting Models)을 생성하고, 모델 학습 과정에서는 5-fold Cross Validation으로 초매개변수 조정이 이루어졌다. 이후 생성된 모델의 성능을 평가하고 특허수명을 추정할 수 있는 예측변수의 상대적 중요도를 제시하였다. 또한, 성능이 우수했던 Gradient Boosting Model을 기반으로 Accumulated Local Effects Plot을 제시하여 예측변수와 특허수명 간 관계를 시각적으로 나타내었다. 마지막으로 모델에 의해서 평가된 개별 특허의 평가 근거를 제시하기 위하여 Kernal SHAP(SHapley Additive exPlanations)을 적용하고 특허평가 시스템에의 적용 가능성을 제시한다. 본 연구는 기존에 특허수명을 추정하는 연구에 누적적으로 기여한다는 점 그리고 선형성을 바탕으로 진행된 기존 특허수명 추정 연구들의 한계를 보완하고 복잡한 비선형 관계를 설명가능한 방식으로 제시하였다는 점에서 학문적 의의가 있다. 또한, 개별 특허의 평가 근거를 도출하는 방법을 소개하고 특허평가 시스템에의 적용 가능성을 제시하였다는 점에서 실무적 의의가 있다.

4차 산업혁명시대 대학무용학과 커리큘럼의 방향모색 (Seeking for a Curriculum of Dance Department in the University in the Age of the 4th Industrial Revolution)

  • 백현순;유지영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권3호
    • /
    • pp.193-202
    • /
    • 2019
  • 4차 산업시대에 대학무용학과의 커리큘럼은 무엇을 변화시켜야 하는가에 초점을 둔 연구이다. 이는 무용학과의 교육과정이 미래 직업 창출과 무관하지 않음으로 4차 산업과 연관 지어 무용전공자의 미래 직업을 전망해 본다면 지금 대학 무용학과 커리큘럼으로는 미래 직업을 창출하기 힘들다는 생각에 따른 것이다. 따라서 서울에 소재하고 있는 5개 대학의 무용학과 커리큘럼을 비교 분석해 보았으며 그 후 4차 산업혁명시대에 적응하고 새로운 기술의 개념이 포함된 무용교육을 하려면 무엇을 어떻게 배워야 할 것인가 하는 무용학과 커리큘럼에 대해 5개의 교과목을 제시하였다. 첫째, 무용과 통합교육이다. 이는 창의성과 과학교육을 통합한 교육으로 STEAM(Science-Technology-Engineering-Art-Methematics)이라는 대 주제를 중심으로 아이디어와 창의성을 향상시키고 나아가 예술적 감수성 등을 키울 수 있는 교과이다. 둘째, 빅데이터 분석 및 빅데이터로 미래를 전망해 보는 교과로 이는 무용의 전반적인 것에 대한 대중들의 의견이나 평가, 감정 등을 분석함으로써 무용공연이나 무용전공자의 진로방향, 직업창출 등에서 유용하게 활용할 수 있는 학문이다. 셋째, 영상교육으로 영상은 현 시대의 대표적 표현매체로 오늘날 대부분의 예술표현영역을 영상이 차지함을 볼 때 영상을 통한 무용은 기존의 무용작품을 새로운 형태의 작품으로 창조적으로 변형시킬 수 있으며 학문적으로나 공연예술로서 무용의 영역을 넓힐 수 있다. 넷째, VR과 AR은 스마트 미디어시대의 중요한 기술로 미래 무용학이 공연이든 교육이든 산업이든 간에 시대의 흐름에 맞춰 디지털식 방법을 갖춰야 한다면 VR이나 AR에 대한 학습을 할 필요가 있다. 다섯째, 4차 산업혁명과 무용예술교과는 4차 산업혁명시대의 변화를 미리 예견하고 무용교과의 변화, 발전 모색 등을 교육하는 교과로 필요하다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

인공지능이 의사결정에 미치는 영향에 관한 연구 : 인간과 인공지능의 협업 및 의사결정자의 성격 특성을 중심으로 (A Study on the Impact of Artificial Intelligence on Decision Making : Focusing on Human-AI Collaboration and Decision-Maker's Personality Trait)

  • 이정선;서보밀;권영옥
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.231-252
    • /
    • 2021
  • 인공지능(Artificial Intelligence)은 미래를 가장 크게 변화시킬 핵심 동력으로 산업 전반과 개인의 일상생활에 다양한 형태로 영향을 미치고 있다. 무엇보다 활용 가능한 데이터가 증가함에 따라 더욱더 많은 기업과 개인들이 인공지능 기술을 이용하여 데이터로부터 유용한 정보를 추출하고 이를 의사결정에 활용하고 있다. 인공지능에 관한 기존 연구는 모방 가능한 업무의 자동화에 초점을 두고 있으나, 인간을 배제한 자동화는 장점 못지않게 알고리즘 편향(Algorithms bias)으로 발생되는 오류나 자율성(Autonomy)의 한계점, 그리고 일자리 대체 등 사회적 부작용을 보여주고 있다. 최근 들어, 인간지능의 강화를 위한 증강 지능 (Augmented intelligence)으로서 인간과 인공지능의 협업에 관한 연구가 주목을 받고 있으며 기업도 관심을 가지기 시작하였다. 본 연구는 의사결정을 위해 조언(Advice)을 제공하는 조언자의 유형을 인간, 인공지능, 그리고 인간과 인공지능 협업의 세 가지로 나누고, 조언자의 유형과 의사결정자의 성격 특성이 의사결정에 미치는 영향을 살펴보았다. 311명의 실험자를 대상으로 사진 속 얼굴을 보고 나이를 예측하는 업무를 진행하였으며, 연구 결과 의사결정자가 조언활용을 하려면 먼저 조언의 유용성을 높게 인지하여하는 것으로 나타났다. 또한 의사결정자의 성격 특성이 조언자 유형별로 조언의 유용성을 인지하고 조언을 활용하는 데에 미치는 영향을 살펴본 결과, 인간과 인공지능의 협업 형태인 경우 의사결정자의 성격 특성에 무관하게 조언의 유용성을 더 높게 인지하고 적극적으로 조언을 활용하는 것으로 나타났다. 인공지능 단독으로 활용될 경우에는 성격 특성 중 성실성과 외향성이 강하고 신경증이 낮은 의사결정자가 조언의 유용성을 더 높게 인지하고 조언을 활용하는 것으로 나타났다. 본 연구는 인공지능의 역할을 의사결정과 판단(Decision Making and Judgment) 연구 분야의 조언자의 역할로 보고 관련 연구를 확장하였다는데 학문적 의의가 있으며, 기업이 인공지능 활용 역량을 제고하기 위해 고려해야 할 점들을 제시하였다는데 실무적 의의가 있다.

국가 감염병 공동R&D전략 수립을 위한 분류체계 및 정보서비스에 대한 연구: 해외 코로나바이러스 R&D과제의 분류모델을 중심으로 (The Classification System and Information Service for Establishing a National Collaborative R&D Strategy in Infectious Diseases: Focusing on the Classification Model for Overseas Coronavirus R&D Projects)

  • 이도연;이재성;전승표;김근환
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.127-147
    • /
    • 2020
  • 세계는 신형 코로나바이러스 감염증(COVID-19)으로 수 많은 인명 피해와 경제적 손실을 기록하고 있는 상황이다. 우리나라 정부는 연구개발(Research & Development)을 통해 국가 감염병 위기를 극복하려는 전략을 수립하고 실행하기 위한 투자방향을 수립하였다. 기존 기술분류나 과학기술 표준분류에 따른 통계를 활용하면 특정 R&D 분야의 특이점 및 변화를 발견하기 어렵다는 한계가 존재해왔다. 최근 우리나라 감염병 연구개발 과제를 대상으로 수요자의 목적에 맞게 분류체계를 수립하고 연구비 비교 분석을 통해 투자가 요구되는 연구 분야를 제시하는 연구들이 진행되었다. 하지만 현재 국가 보건 안보와 신성장 산업육성이라는 목표를 달성하기 위한 실행방안으로 요구되고 있는 전염병 연구분야의 국가간 협력전략 수립에 필요한 정보를 체계적으로 제공하고 있지 못한 상황이다. 따라서 국가 공동 연구개발 전략 수립을 위한 분류체계와 분류모델기반의 정보서비스에 대한 연구가 요구되고 있다. 우선 감염병관련 NTIS 과제데이터를 기반으로 정성분석을 통해 7개의 분류체계를 도출하였다. 스코퍼스(Scopus) 데이터와 양방향 RNN모델을 사용하여, 분류체계 모델을 학습시켰다. 최종적인 모델의 분류 성능은 90%이상의 높은 정확도와 강건성을 확보하였다. 실증연구를 위해 주요 국가의 코로나바이러스 연구개발 과제를 대상으로 전염병 분류체계를 적용하였다. 주요 국가의 감염병(코로나바이러스) 연구개발 과제를 분류체계별로 분석한 결과, 세계적으로 유행하는 바이러스의 예상치 못한 창궐이 확산되는 속도에 비해 백신과 치료제 개발이 제대로 이뤄지지 않는 원인의 배경을 간접적으로 확인할 수 있었다. 국가별 비교분석을 통해 미국과 일본은 상대적으로 모든 영역에 골고루 연구개발 투자를 하고 있는 것으로 나타난 반면, 유럽은 상대적으로 특정 연구분야에 많은 투자를 하는 집중화 전략을 취하는 것으로 나타났다. 동시에 주요 국가의 코로나 바이러스 주요 연구조직에 대한 정보를 분류체계별로 제공하여 국제 공동R&D 전략의 기초정보를 제공하였다. 본 연구 결과를 통해 세 가지 정책적 의미를 도출할 수 있다. 첫째, 데이터기반 과학기술정책 관점에서 수요자 관심분야에 대한 국가 R&D사업의 정보를 글로벌 기준으로 문서를 분류하는 방안을 제시하였다. 둘째, 감염병관련 국가 R&D사업 영역에 대한 정보분석 서비스 기획의 기반을 마련하였다. 마지막으로 국가 감염병 R&D 분류체계 수립을 통해 분류 체계의 궁극적 목표인 산업, 기업, 정책 정보를 제공할 수 있는 기반을 마련한 것이다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.