• 제목/요약/키워드: predictive growth model

검색결과 146건 처리시간 0.031초

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

아동의 지역아동센터 이용시간의 종단적 변화유형과 영향요인에 관한 연구 (A Study on the Longitudinal Trajectories of Use Time and the Related factors for the Children in Community Children Centers)

  • 김동하
    • 사회복지연구
    • /
    • 제49권2호
    • /
    • pp.159-180
    • /
    • 2018
  • 본 연구는 지역아동센터 이용아동을 대상으로 시간의 경과에 따른 지역아동센터 이용시간의 변화궤적을 유형화하고, 각 유형과 관련된 예측요인과 발달요인을 검증하는 데 목적이 있다. 이를 위해 지역아동센터 아동패널조사의 2기 패널자료 1차 시점(2014년)에서 3차 시점(2016년)의 자료를 활용하였고, 분석대상은 총 606명이다. 분석방법은 3년에 걸쳐 초등학생의 지역아동센터 이용시간 변화궤적의 유형을 구분하기 위해 잠재계층성장분석을 실시하였으며, 이후 다중로지스틱 회귀분석과 로지스틱 회귀분석을 통해 유형과 관련된 예측요인과 발달요인을 검증하였다. 분석결과, 지역아동센터 이용시간 변화궤적은 '높은 이용집단', '낮은 이용집단', '초기 고이용-급감소 이용집단'으로 분류되었으며, 예측요인으로는 성별, 부모감독, 이용기간이 영향을 미치는 것으로 나타났다. 또한 유형에 따른 발달결과의 차이를 검증한 결과 유형별로 학업성적과 학교적응은 유의미한 차이가 나타났으나 공격성과 비행행동은 차이가 나타나지 않았다. 이러한 연구결과들을 바탕으로 지역아동센터의 향후 발전방향에 대한 제언을 하였다.

토지이용균형 모델을 이용한 기후변화에 따른 주거용 토지이용변화 - 제주 지역을 대상으로 - (A Study of Future Residential Land Use Change considering Climate Change using Land Use Equilibrium Model in Jeju)

  • 유소민;이우균;;김지영;김문일;임철희
    • 한국기후변화학회지
    • /
    • 제6권1호
    • /
    • pp.1-10
    • /
    • 2015
  • Climate change lead to environmental pollution caused by the radical economic growth and development of industry. The amount of damage from abnormal climate is increasing rapidly for this reason in Korea. In particular, the cities is a lot of carbon emission quantity from the radical growth. Thus the government present "low carbon green growth" for eco-friendly city planning. As one of the important factors effecting climate change, active researches on land use change is performed. In this study, we knew land use change of each scenarios using land use equilibrium model which is kind of predictive model of land use in Japan. First, we selected study area to Jeju lsland. For this study, indicators for input data were selected and spatial data for input data were established using GIS program. Second, we established future scenarios based in 2040s. There are 2 future scenarios: dispersion scenario, compact scenario. Third, we compared with residential area of current and residential area for future scenarios. Results showed that residential area of the difference between current and dispersion scenario were 1,230 ha and residential area of the difference between current and compact scenario were 1,515 ha. Finally, for comparing carbon dioxide absorption volume between dispersion scenarios and compact scenarios, we calculated carbon dioxide absorption volume according to residential area decreased of each future scenarios. Results showed that carbon dioxide absorption volume in dispersion scenario was 477,878 ton and carbon dioxide absorption volume in compact scenario was 588,606 ton. Therefore, the study showed that land use equilibrium model is expected to put to use for future enhancement in creating data for climate change stabilization. And it is also expected to be utilized for city planning research in Korea.

Prediction of spatio-temporal AQI data

  • KyeongEun Kim;MiRu Ma;KyeongWon Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제30권2호
    • /
    • pp.119-133
    • /
    • 2023
  • With the rapid growth of the economy and fossil fuel consumption, the concentration of air pollutants has increased significantly and the air pollution problem is no longer limited to small areas. We conduct statistical analysis with the actual data related to air quality that covers the entire of South Korea using R and Python. Some factors such as SO2, CO, O3, NO2, PM10, precipitation, wind speed, wind direction, vapor pressure, local pressure, sea level pressure, temperature, humidity, and others are used as covariates. The main goal of this paper is to predict air quality index (AQI) spatio-temporal data. The observations of spatio-temporal big datasets like AQI data are correlated both spatially and temporally, and computation of the prediction or forecasting with dependence structure is often infeasible. As such, the likelihood function based on the spatio-temporal model may be complicated and some special modelings are useful for statistically reliable predictions. In this paper, we propose several methods for this big spatio-temporal AQI data. First, random effects with spatio-temporal basis functions model, a classical statistical analysis, is proposed. Next, neural networks model, a deep learning method based on artificial neural networks, is applied. Finally, random forest model, a machine learning method that is closer to computational science, will be introduced. Then we compare the forecasting performance of each other in terms of predictive diagnostics. As a result of the analysis, all three methods predicted the normal level of PM2.5 well, but the performance seems to be poor at the extreme value.

인공신경망을 이용한 식물플랑크톤의 대량 증식 제어 알고리즘 개발 (Development of Mass Proliferation Control Algorithm of Phytoplankton Using Artificial Neural Network)

  • 박성화;김종구;권민선
    • 해양환경안전학회지
    • /
    • 제29권5호
    • /
    • pp.435-444
    • /
    • 2023
  • 새만금 내에서는 종종 식물플랑크톤이 증식하기에 알맞은 환경조건이 생성되며 일시에 식물플랑크톤 대증식이 발생하면서 조류 관리기준을 초과하는 사례가 발생하고 있다. 이를 대비하기 위하여 과학적 예측기법을 토대로, 식물플랑크톤의 종별로 가장 효과적이고 효율적인 녹조발생 억제 방안을 제안하기 위하여 식물플랑크톤 대증식 가능성을 예측하고, 제어할 수 있는 모델을 개발하였다. 즉, 하천에서 유입하는 영양염(DIN, PO4-P)을 정책적으로 조절하고, 갑문운영을 통해 호 내 염분을 제어하는 것이다. 먼저 관측치로부터 인공신경망 알고리즘을 이용해 식물플랑크톤 대증식 가능성을 예측 결과, 모델의 Kappa 수는 0.7889 ~ 1.0000의 범위로, good ~ excellent 수준이었다. 다음으로 Garson 알고리즘을 이용하여 종별로 설명변수의 중요도를 평가하였고, 또한 DIN 및 염분 값의 변화에 따른 식물플랑크톤 대량 증식 확률을 예측하였다. 그 결과, 각 종별로 식물플랑크톤의 대증식을 억제할 수 있는 DIN과 염분 농도를 정량적으로 예측할 수 있었다. 따라서, 향후 새만금과 같은 거대한 인공 호수에서 식물플랑크톤의 대증식을 억제하기 위한 효율적이고 효과적인 대응방안을 마련할 수 있도록 녹조제어모델을 활용할 수 있을 것으로 판단된다.

예측미생물학을 활용한 미강 식이섬유 함유 떡갈비의 유통기한 설정 (Application of Predictive Microbiology for Shelf-life Estimation of Tteokgalbi Containing Dietary Fiber from Rice Bran)

  • 허찬;김현욱;최윤상;김천제;백현동
    • 한국축산식품학회지
    • /
    • 제28권2호
    • /
    • pp.232-239
    • /
    • 2008
  • 본 연구는 미강 추출 식이섬유 혼합물을 첨가한 떡갈비의 미생물학적 안전성 확보와 유통기한 산출을 위하여 예측미생물학을 이용하였다. 이를 위해 미강 추출 식이섬유 혼합물을 0, 1, 2, 3%의 비율로 첨가하였으며 냉장($4{\pm}1^{\circ}C$) 조건에서 15일간 저장하며 일반세균수, 혐기성균, 저온균, 내열성균, 대장균군의 미생물학적 변화를 관찰하였다. 일반세균수의 초기 균수(저장 0일)의 경우 3.23-3.85 log CFU/g을 나타내었으며 혐기성균, 저온균의 경우 비슷한 초기균수를 나타내었다. 일반세균수와 혐기성균의 경우 저장 3-5일차에서 균수의 급격한 증가를 나타내었다. 저장기간 동안 측정된 균수를 Baranyi function을 바탕으로 성장예측곡선과 생육 지표를 예측하였으며, 성장예측곡선의 적합성을 검증한 결과 일반세균수, 혐기성균, 저온균의 경우 처리구간 모두 0.923 이상의 높은 $R^2$값을 나타내었으며 $B_f$, $A_f$의 경우 역시 이상적인 값인 1에 가까운 값은 나타내었다. RSME 값 역시 모두 0.65 이하를 나타내어 실측치와 예측치 간의 높은 정확성을 나타내었다. Baranyi function 식 (1), (2)을 이용하여 계산된 균수가 5 log CFU/g이 되는 시점인 predicted shelf-life의 경우 control, T1, T2, T3의 경우 각각 2.5, 3.5, 3.5, 3.6일로 예측되었으며 안전계수(1/1.5)를 고려한 estimated shelf-life의 경우 1.7, 2.3, 2.3, 2.4일로 측정되었다 미강 식이섬유 혼합물이 첨가된 처리구가 control보다 약 0.6-0.7일 긴 유통기한을 가지는 것으로 측정되었고 식이섬유가 3% 함유된 떡갈비가 2.4일로 가장 긴 유통기한을 갖는 것으로 나타났다. 본 연구를 통해, 미강 추출 식이섬유 혼합물이 첨가된 떡갈비의 유통기한을 예측미생물학을 적용하여 측정할 수 있었으며, 식품산업에 있어서 이러한 예측미생물학은 식품의 제조 가공 판매 등을 결정할 때 미생물의 정량적 위험성을 판단하는 도구로서 사용될 수 있을 것으로 기대된다.

빅데이터 분석을 활용한 마늘 생산에 미치는 날씨 요인에 관한 영향 조사 모형 개발 (Development of Examination Model of Weather Factors on Garlic Yield Using Big Data Analysis)

  • 김신곤
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.480-488
    • /
    • 2018
  • 정보통신 기술의 발전으로 농업분야에서도 다량의 데이터로부터 가치 있는 정보를 생성하고 그 활용을 위해 빅데이터 기술을 적용하는 연구가 활발히 진행되고 있다. 농업에서 재배 가능한 작물과 품종은 기온, 강수량, 일조시간 등의 자연환경의 영향에 따라 결정된다. 본 논문은 마늘의 생육과정과 일별로 측정되는 기상변수를 활용하여 농작물 생산에 영향을 미치는 기상기후 요인을 도출하고 마늘을 대상으로 단위면적당 생산량 예측(단수) 모형을 도출하였다. 기상변수는 마늘의 생육단계를 고려하여 빅데이터 분석 기법을 이용하였다. 탐색적 자료 분석과정에서는 통계청, 농촌진흥청, 농촌경제연구원으로부터 생산량, 도매시장 반입량, 생육 데이터 등 다양한 농산물 생산 데이터를 제공받아 활용하였다. 또한 기상청으로부터 AWS, ASOS, 특보현황 등 다양한 기상관측 데이터를 수집하여 활용하였다. 상관관계 분석 과정은 변수선택, 후보모형 도출, 모형진단, 시나리오 예측 등을 통해 도출한 모형의 모형 적합도와 생산량 예측력을 비교하여 마늘생산단수예측 모형을 설계하였다. 수많은 기상요인 변수는 요인분석을 이용하여 차원을 감소시키고 설명변수로 선정하였다. 이 방법을 이용함으로써 회귀분석에서 발생할 수 있는 다중공선성과 낮은 자유도의 문제를 효과적으로 통제할 수 있었으며 회귀분석의 적합도와 예측력을 높일 수 있었다.

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

외식프랜차이즈기업 부실예측모형 예측력 평가 (Evaluating Distress Prediction Models for Food Service Franchise Industry)

  • 김시중
    • 유통과학연구
    • /
    • 제17권11호
    • /
    • pp.73-79
    • /
    • 2019
  • Purpose: The purpose of this study was evaluated to compare the predictive power of distress prediction models by using discriminant analysis method and logit analysis method for food service franchise industry in Korea. Research design, data and methodology: Forty-six food service franchise industry with high sales volume in the 2017 were selected as the sample food service franchise industry for analysis. The fourteen financial ratios for analysis were calculated from the data in the 2017 statement of financial position and income statement of forty-six food service franchise industry in Korea. The fourteen financial ratios were used as sample data and analyzed by t-test. As a result seven statistically significant independent variables were chosen. The analysis method of the distress prediction model was performed by logit analysis and multiple discriminant analysis. Results: The difference between the average value of fourteen financial ratios of forty-six food service franchise industry was tested through t-test in order to extract variables that are classified as top-leveled and failure food service franchise industry among the financial ratios. As a result of the univariate test appears that the variables which differentiate the top-leveled food service franchise industry to failure food service industry are income to stockholders' equity, operating income to sales, current ratio, net income to assets, cash flows from operating activities, growth rate of operating income, and total assets turnover. The statistical significances of the seven financial ratio independent variables were also confirmed by logit analysis and discriminant analysis. Conclusions: The analysis results of the prediction accuracy of each distress prediction model in this study showed that the forecast accuracy of the prediction model by the discriminant analysis method was 84.8% and 89.1% by the logit analysis method, indicating that the logit analysis method has higher distress predictability than the discriminant analysis method. Comparing the previous distress prediction capability, which ranges from 75% to 85% by discriminant analysis and logit analysis, this study's prediction capacity, which is 84.8% in the discriminant analysis, and 89.1% in logit analysis, is found to belong to the range of previous study's prediction capacity range and is considered high number.

GIS를 이용한 지표화 확산예측모델의 개발 (Development of the Surface Forest Fire Behavior Prediction Model Using GIS)

  • 이병두;정주상;이명보
    • 한국산림과학회지
    • /
    • 제94권6호
    • /
    • pp.481-487
    • /
    • 2005
  • 이 연구에서는 지표화 중심의 산불확산예측 알고리즘을 기반으로 GIS 환경에서 운용이 가능한 지표화 확산예측모델을 개발하였다. 이 모델은 지형, 연료, 기상 등 산불환경인자를 분석하고 입력하는 부분과 시간에 따라 확산속도, 화선에서의 산불강도, 연소면적을 예측하는 지표화 확산예측 부분, 마지막으로 예측결과를 사용자에게 제시하는 출력 부분으로 구성되었다. 산불확산속도를 계산하기 위해서 산불행동에 영향을 미치는 산불환경인자중에서 지형인자는 경사, 기상인자는 풍속, 풍향, 실효습도를 고려하였다. 또한 연료인자는 수치임상도를 이용하여 연료깊이, 연료량, 소화습도를 계산할 수 있는 연료모듈을 개발하여 입력되도록 하였다. 연료습도는 실효습도, 최고온도, 강수량, 일일 적산량의 함수관계로 추정하였다. 모델을 2002년 청양에서 발생한 산불에 적용한 결과 확산속도에 대해 61%의 일치도를 보였다.