• 제목/요약/키워드: Forecast model

검색결과 1,641건 처리시간 0.026초

주택수와 인구증가 변화를 반영한 지역별 부동산 시장 예측 (Prediction of the Real Estate Market by Region Reflecting the Changes in the Number of Houses and Population)

  • 배영민
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.229-236
    • /
    • 2021
  • 인구 증감과 주택공급의 변화를 반영하여 지역별 주택 수급 예측에 대한 중·장기적인 연구는 부족하였다. 본 연구에서는 최근 35년간 인구 1,000 명당 주택 수, 지역별 인구 변화율 그리고 향후 예측되는 지역별 인구증가 예측율을 반영하여 부동산 시장의 수요와 공급 측면에서 지역별 주택수 공급과 수요에 대하여 마코프 체인 모형의 전이확률을 적용하여 중·장기적인 지역별 주택수를 확인한다. 모형 수행결과, 지역별 부동산 시장은 경기, 인천, 서울 등 수도권에 대한 주택공급은 지역별 인구변화를 고려할 때 상당기간 부족할 것으로 예상되며 시간이 지나면서 다른 지역은 전국평균 주택수에 수렴하는 경향을 통해 안정화 될 것으로 예측되었고 부동산 시장 안정을 위해서는 지역별 주택공급 차별화를 적극 적용할 필요가 있는 것으로 확인되었다. 이번 연구에서 제시된 방법에 대해 실용적으로 사용될 수 있는 점과 지역별 인구증감 예측을 반영한 지역별 부동산 시장의 중·장기적인 방향성을 확인한다는 점에서 의미를 기대할 수 있다.

소셜미디어를 통한 직원의 기업전망 평가와 고용증가와의 상관성 : 잡플래닛 기업전망을 대상으로 (Employee's Business Outlook Disclosed Through Social Media And Employment Growth : The Case of Jobplanet)

  • 김병수;강주영
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.9-21
    • /
    • 2022
  • 최근 소셜미디어의 사용 확대는 사회, 경제, 정치, 문화 등 여러 방면에서 이용자들의 의견을 실시간으로 표현할 수 있는 계기가 되었고, 기업에 관한 다양한 정보를 제공하는 플랫폼들이 많이 늘어났다. 그중에서 2008년 미국에서 시작된 글래스도어(Glassdoor.com)는 기업의 전현직 직원이 자신이 근무한 기업의 처우를 평가하고 기업의 성장성에 관한 전망을 제공하고 있다. 이러한 플랫폼은 취업 또는 이직하려는 구직자에 필요한 정보를 제공하는 효용성이 있다. 이 외에도 여러 연구에서 이러한 플랫폼을 통해 제공되는 기업의 정보가 투자자에게도 유용하다는 점이 밝혀지고 있다. 본 연구에서는 국내에서 글래스도어와 대표적으로 유사한 기능을 하는 플랫폼인 잡플래닛(Jobplanet)에서 제공되는 직원들의 기업성장 전망이 실재 기업성장을 예측하는 예측력이 있는지 파악하였다. 잡플래닛에서 제공되는 전망과 에프앤가이드에서 받은 기업의 재무지표 데이터를 취합하여 패널데이터로 구성한 뒤 고정효과 모형 회귀분석을 이용하여 분석하였다. 그 결과 긍정적인 전망을 받은 회사가 부정적인 전망을 받은 회사보다 고용증가율이 더 높은 것으로 나타났다. 전망이 중립인 경우에도 전망이 부정적인 회사보다 고용증가율이 더 높은 것으로 나타났다.

BDS 통계와 DVS 알고리즘을 이용한 수문시계열의 비선형성 분석 (Detecting Nonlinearity of Hydrologic Time Series by BDS Statistic and DVS Algorithm)

  • 최강수;경민수;김수전;김형수
    • 대한토목학회논문집
    • /
    • 제29권2B호
    • /
    • pp.163-171
    • /
    • 2009
  • 수문시계열 분석과 예측을 위하여 통상적으로 기존의 선형적인 모형들을 이용하여 왔다. 그러나 최근 자연현상이나 수문시계열의 패턴 그리고 변동성에 비선형구조가 존재하고 있다는 것이 입증되고 있다. 따라서 기존의 선형적인 방법들에 의한 시계열분석이나 예측은 비선형 시스템에 대해서 적절하지 않을 것이다. 최근, 시계열의 비선형성 구조를 판단하기 위해 카오스 이론을 토대로 한 상관적분으로부터 BDS(Brock-Dechert-Scheinkman) 통계 기법이 유도되었다. BDS 통계는 시스템의 비선형구조와 무작위성 구조를 구별하는데 매우 효과적으로 이용되어 오고 있다. 또한 DVS(Deterministic Versus Stochastic) 알고리즘은 카오스와 추계학적 시스템을 구별하고 예측하는데 주로 이용되어 왔다. 그러나 본 연구에서는 DVS 알고리즘에 의해 시계열의 비선형성을 판별할 수 있음을 보이고자 한다. 따라서 본 연구에서는 추계학적 시계열과 수문학적 시계열들의 비선형성을 검사하고자 한다. ARMA 모형과 TAR(Threshold autoregressive) 모형으로부터로 발생시킨 추계학적 시계열, 미국 유타주 GSL 체적자료, 미국 플로리다 주 St. Johns 강 Cocoa 지점의 유출량 자료, 소양강 댐 일 유입량 자료 등의 수문시계열에 대해 비선형성 분석을 수행하고 그 결과를 비교하였다. 분석결과 BDS 통계가 선형 및 비선형 시계열을 구분하는데 매우 강력한 도구임을 보였고, DVS 알고리즘 또한 시계열의 비선형성을 구별하는데 효과적으로 이용될 수 있음을 보였다.

"유사 통행행태 집단"의 Trip-chaining을 고려한 통행발생 모형 (A Study on Trip Generation Model considering Trip-chaining by Behavioral Homogeneous Person Group)

  • 이선하;윤진숙
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.709-716
    • /
    • 2006
  • 최근 들어 싱글족, 맞벌이 부부 증가 등 가구구성 체계에 많은 변화가 발생하였고, 이로 인한 개인들의 일상적인 업무수행의 변화는 통행행태에도 지대한 영향을 미치게 되었다. 이 중 중요한 특징 중의 하나는 예를 들어 출근 중에 자녀들을 등교시키거나, 퇴근 길에 구매 또는 여가활동을 수행하는 다수의 통행목적을 하나의 out-going 통행으로 처리되는 비중이 늘고 있다는 것이다. 따라서 통행을 하나의 목적을 수행하기 위하여 독립적으로 발생하는 것이 아닌 하루 동안 개인이 다양한 활동을 수행하기 위하여 장소를 이동한 activity-based 개념의 통행고리의 형태로 파악하고 이에 기반 한 통행발생 모형의 필요성이 높다. 본 논문은 통행발생 모형에 있어서 직업, 승용차 보유여부 등을 기준으로 "유사한 통행특성"을 갖는 집단을 분류하고, 집단별 구성원들의 평균적인 1일 중 activity diary를 분석하여 업무수행 순서, 통행고리별 발생시간, 이용 교통수단 등 통행특성에 의하여 총 통행량을 추정하는 모형을 개발하였다. 실증적인 검증으로서 공주시 가구통행실태조사를 수행하여 "유사통행행태" 집단의 분류, 집단별 통행행태의 특성과 이에 기초한 교통지구 별 통행발생량을 추정하였다. "유사통행행태" 집단의 구분은 통행발생에 있어서 유의성이 높은 설명인자인 직업과 승용차의 보유여부, 학생인지의 여부를 기준으로 하였다. 분석결과 이와 같은 구분기준이 기존 국내 교통계획모형에서 일반적으로 적용되고 있는 산업군 분류기준에 비하여 비교적 통행특성을 잘 반영하고 있는 것으로 나타났다. 또한 집단별 통행고리 특성에 기반 한 통행발생 추정 결과 교통지구별 통행발생량들이 교통지구별 인구, 직장인수, 자동차 보유율과 인구유입시설 등의 각종 사회 경제지표의 특성 등도 잘 반영하는 것으로 나타났다.

노동력수급의 요인분석과 전망 (An Empirical Analysis of The Determinants and Long-term Projections for The Demand and Supply of Labor force)

  • 김중수
    • 한국인구학
    • /
    • 제9권1호
    • /
    • pp.41-53
    • /
    • 1986
  • The purpose of this paper is two-fold. One is to investigate the determinants of the demand supply of labor, and another is to project long-term demand and supply of labor. The paper consists of three parts. In the first part, theoretical models and important hypotheses are discussed: for the case of a labor supply model, issues regarding discouraged worker model, permanent wage hypothesis, and relative wage hypothesis are examined and for the case of a demand model, issues regarding estimating an employment demand equation within the framework of an inverted short-run produc- tion function are inspected. Particularly, a theoretical justification for introducing a demographic cohort variable in a labor supply equation is also investigated. In the second part, empirical results of the estimated supply and demand equations are analyzed. Supply equations are specified differently between primary and secondary labor force. That is, for the case of primary labor force groups including males aged 25 and over, attempts are made to explain the variations in participation behavior within the framework of a neo-classical economics oriented permanent wage hypothesis. On the other hand, for the case of females and young male labor force, variations in participation rates are explained in terms of a relative wage hypothesis. In other words, the participation behavior of primary labor force is related to short-rum business fluctuations, while that of secondary labor force is associated with intermediate swings of business cycles and demographic changes in the age structure of population. Some major findings arc summarized as follows. (1) For the case of males aged 14~19 and 2O~24 groups and females aged 14∼19, the effect of schhool enrollment rate is dominant and thus it plays a key role in explaining the recent declining trend of participation rates of these groups. (2) Except for females aged 20∼24, a demographic cohort variable, which captures the impact of changes in the age structure on participation behavior, turns out to show positive and significant coefficients for secondary labor force groups. (3) A cyclical variable produce significant coefficients for prime-age males and females reflecting that as compared to other groups the labor supply behavior of these groups is more closely related to short-run cyclical variations (4) The wage variable, which represents a labor-leisure trade-off turns out to yield significant coefficients only for older age groups (6O and over) for both males and females. This result reveals that unlike the experiences of other higer-income nations, the participation decision of the labor force of our nation is not highly sensitive with respect to wage changes. (5)The estimated result of the employment demand equation displays that given that the level of GNP remains constant the ability of the economy to absord labor force has been declining;that is, the elasticity of GNP with respect to labor absorption decreasre over time. In the third part, the results of long-term projections (for the period of 1986 and 1995) for age-sex specific participation rates are discussed. The participation rate of total males is anticipated to increase slightly, which is contrary to the recent trend of declining participation rates of this group. For the groups aged 25 and below, the participation rates are forecast to decline although the magnitude of decrease is likely to shrink. On the other hand, the participation rate of prime- age males (25 to 59 years old) is predicted to increase slightly during 1985 and 1990. For the case of females, except for 20∼24 and 25∼34 age groups, the participation rates are projected to decrease: the participation rates of 25∼34 age group is likely to remain at its current level, while the participation rate of 20∼24 age group is expected to increase considerably in the future (specifi- cally, from 55% in 1985 to 61% in 1990 and to 69% in 1995). In conclusion, while the number of an excess supply of labor will increase in absolute magnitude, its size as a ratio of total labor force is not likely to increase. However, the age composition of labor force is predicted to change; that is, the proportion of prime-age male and female labor force is projected to increase.

  • PDF

수직 혼합 모수화 기법과 탁도에 따른 황해 수온 민감도 실험 (Sensitivity of Simulated Water Temperature to Vertical Mixing Scheme and Water Turbidity in the Yellow Sea)

  • 곽명택;서광호;최병주;김창신;조양기
    • 한국해양학회지:바다
    • /
    • 제18권3호
    • /
    • pp.111-121
    • /
    • 2013
  • 지역규모의 정확한 일기예보와 해양생태계 변화 이해에 있어서 수온 예측은 매우 중요하다. 황해는 조류가 매우 빠르고 탁도가 높다. 이러한 해역에서는 수치 모델의 수직 혼합 기법 및 해수의 탁도에 따른 수형(water type)이 수온 구조 결정에 많은 영향을 미친다. 수직 혼합 기법 변화와 탁도의 변화에 따른 황해 수온 모사의 민감도를 알아보기 위해 3차원 해양 순환 모델인 Regional Ocean Modeling System (ROMS)을 사용하여 수치 실험을 수행하였다. 수직 혼합 기법은 해양 순환 모델에서 많이 사용되는 Mellor-Yamada level 2.5 closure(M-Y)와 K-Profile parameterization (KPP)을 사용하고, 탁도는 Jerlov의 분류에 따른 수형 1, 3, 5를 사용하여 수치 실험을 수행하고 그 결과를 국립수산과학원에서 제공하는 정선 해양 관측 자료와 비교, 분석하였다. M-Y 기법은 수직적 혼합을 상대적으로 강하게 모의하였으며 그 결과로 저층수온이 높게 형성되었다. 높은 저층 수온은 탁도를 높게 설정하면 완화되지만 표층 수온이 높아지는 단점이 있다. KPP 기법은 M-Y 기법보다는 수직 혼합을 약하게 모의하고 이 약한 수직 혼합 때문에 황해 연안을 따라 형성되는 조석전선을 잘 재현하지 못하였으나, 저층 수온은 관측 수온에 더 가깝게 재현하였다. 결과적으로 황해 3차원 해양순환 모델실험에서 M-Y 기법은 수직 혼합이 잘 되어 표층과 저층의 수온 차이가 작게 나타나고, KPP 기법은 이와 반대로 모의하였다. 탁도의 영향을 표현하는 Jerlov 수형은 높을수록 일사량이 낮은 수심까지만 투과되어 성층을 잘 표현하였고, 낮을수록 깊은 수심까지 일사량이 투과되어 표층과 저층의 수온차를 작게 모의하였다.

기상청 전지구 해양자료동화시스템(GODAPS): 개요 및 검증 (Global Ocean Data Assimilation and Prediction System in KMA: Description and Assessment)

  • 장필훈;황승언;추성호;이조한;이상민;부경온
    • 대기
    • /
    • 제31권2호
    • /
    • pp.229-240
    • /
    • 2021
  • 본 연구에서는 기상청에서 2018년부터 운영 중인 전지구 해양자료동화시스템 GODAPS에 대하여 소개하였으며, 2015년 2월부터 2016년 1월까지 일년간의 실험 수행을 통한 결과를 분석하여 이 시스템의 특성을 살펴보았다. GODAPS는 크게 해양-해빙 모델과 3차원 변분법 기반의 자료동화 시스템으로 구성되어 있고, 전지구적으로 수집된 현장 및 위성 관측자료를 자료동화하여 매일 1회 분석장과 예측장을 생산한다. 이때 해수면온도, 수온과 염분 프로파일, 해수면고도 변이, 그리고 해빙농도 관측자료를 자료동화한다. 분석증분 및 배경장/분석장으로부터의 관측증분에 대한 분석, 자료동화를 적용하지 않은 실험과의 비교 등을 통해 GODAPS 자료동화 결과를 비교검증하였다. 자료동화는 관측자료들을 효과적으로 활용하고 있었으며, 전지구 규모에서 편차를 줄인 분석장과 예측장을 생산하고 있는 것으로 나타났다. 이외에도, 변동성이 강한 중위도 해역의 쿠로시오와 걸프만 해류의 중규모 현상을 재현하는데 있어서도 결정적인 영향을 미치는 것으로 확인하였다. 해양초기장을 향상시키기 위해서는 모델과 자료동화 기술의 개발과 더불어, 다양한 관측자료를 활용하는 것이 중요하다. 하지만, 현업에서 활용할 수 있는 해양관측자료는 한계가 있으며, 따라서 가용한 자료를 자료동화 과정에 포함시키는 노력이 요구된다. 수온에 비해 염분의 경우 상대적으로 관측자료가 부족한데, 최근에는 SMAP (Soil Moisture Active Passive) 등 인공위성을 활용한 표층 염분자료가 제공되고 있으며, 기상청에서도 자료동화 과정에 독립적인 위성 염분자료를 활용한 분석장 검증 및 자료동화에 직접적용하는 연구를 추진하고 있다. 특히, 표층 염분의 자료동화를 통해 열대해역의 혼합층 깊이가 개선되고, 결과적으로 기후예측성을 향상시키는 연구결과(Hackert et al., 2020) 등을 고려할 때, 향후 위성관측 표층염분의 자료동화는 기후예측 분야에 있어서 점차 중요해질 것으로 판단된다. 본 연구의 실험결과에서도 GODAPS의 염분 관측증분 오차가 표층에서 상대적으로 크게 나타나고 있어, 해양초기장의 정확성을 높이고 나아가 기후예측성을 높이는데 위성 염분자료가 효과적으로 사용될 수 있을 것으로 기대된다.

농업기상재해 조기경보시스템의 풍속 예측 기법 개선 연구 (Minimizing Estimation Errors of a Wind Velocity Forecasting Technique That Functions as an Early Warning System in the Agricultural Sector)

  • 김수옥;박주현;황규홍
    • 한국농림기상학회지
    • /
    • 제24권2호
    • /
    • pp.63-77
    • /
    • 2022
  • 농업기상재해 조기경보시스템에서 모의되는 농장 규모 풍속 예측자료의 추정오차를 개선하기 위해, 농촌진흥청 농업기상관측망의 2020년 1~12월 풍속 관측자료와 해당 지점에 대한 조기경보시스템 모의 풍속을 이용하여, 87지점 일 8시간대(00, 03, 06 … 21시) 각각 풍속 추정오차를 종속변수로, 추정풍속을 독립변수로 하는 일차 회귀식(Y=aX+b)을 도출하였다. 상관계수가 0.5를 초과하였을 때는 회귀식을 풍속 보정식으로 활용하고, 상관계수가 0.5 이하일 때는 회귀식 대신 해당 지점 및 시간대의 ME를 보정값으로 대체하였다. 풍속 모형을 전국적으로 적용할 수 있도록 87지점×8개 시간의 회귀계수 a와 b, 상관계수 R과 ME 값으로 거리역산가중법으로 공간내삽하여 250m 격자해상도의 분포도를 제작하였다. 모형의 검증을 위하여 회귀계수 a와 b, 상관계수 R과 ME 공간내삽 분포도로 부터 농산촌 지역 13개 기상관측지점의 격자값을 추출하고, 13곳의 2019년 1~12월의 조기경보시스템 모의 풍속(00, 03, 06 … 21시)를 보정한 다음, 기존 추정 풍속과 함께 추정오차를 비교하였다. 검증 지점 풍속의 평균 ME는 0.68m/s에서 보정 후 0.45m/s로 감소하였으며, 평균 RMSE는 1.30m/s에서 1.05m/s로 감소하였다. 조기경보시스템의 풍속은 전 시간대에서 모두 과대 추정되고 있는데, 보정 기법을 적용한 후에는 15시 경을 제외하고 모두 과대추정 경향이 감소하여 ME가 약 33%, RMSE는 19.2% 더 개선되었다. 농업기상재해 조기경보시스템에서 농작물의 풍해 위험 판단은 일 8회의 풍속 평균값으로부터 도출된 일 최대순간풍속을 기반으로 하는데, 풍속의 과대모의 현상을 개선하여 강풍 위험 경보의 오보를 감소시킬 것으로 기대된다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.