• 제목/요약/키워드: statistical prediction

검색결과 1,566건 처리시간 0.029초

도시공간적 요인을 고려한 로지스틱 회귀분석 기반 체감더위 예측 모형 개발 (Development of a Prediction Model for Personal Thermal Sensation on Logistic Regression Considering Urban Spatial Factors)

  • 성욱제;박형민;임재연;서유진;손정민;민진규;엄정희
    • 한국지리정보학회지
    • /
    • 제27권1호
    • /
    • pp.81-98
    • /
    • 2024
  • 본 연구는 시민들이 직접 체감하는 더위인 체감더위를 열환경 단위로 설정하여 공간적 요인과의 상관관계를 분석하고 체감더위 예측 모형을 개발하였다. 체감더위를 수집하기 위해 리빙랩이라는 시민 참여형 연구방법론을 적용하여 시민들이 직접 체감더위를 기록하고 주변의 온도를 측정하도록 하였다. 수집한 체감더위 정보의 입력지점에 기반하여 주변 도시공간적 요소를 수집하여 통계 분석을 위한 데이터셋을 구축하였다. 구축한 데이터를 활용하여 로지스틱 회귀분석을 수행하였다. 분석 결과, 기온은 주변 공간환경에 영향을 받으며, 건물 높이, 녹지율, 도로율과 음의 상관관계를 가지고, 기온과 천공률과 양의 상관관계를 가진다고 분석되었다. 또한 도로율, 천공률, 녹지율 순으로 체감더위에 강한 영향을 미치는 것으로 나타났다. 본 연구의 결과는 기후변화 대응을 위한 국지적인 열환경 대책을 마련하기 위한 열환경 평가의 기초자료로 활용될 수 있을 것으로 기대된다.

한우의 유전체 육종가의 정확도 추정 (Estimation of the Accuracy of Genomic Breeding Value in Hanwoo (Korean Cattle))

  • 이승수;이승환;최태정;최연호;조광현;최유림;조용민;김내수;이중재
    • Journal of Animal Science and Technology
    • /
    • 제55권1호
    • /
    • pp.13-18
    • /
    • 2013
  • 본 연구는 농협 한우개량사업소 후대검정우 552두의 도체중, 배최장근단면적, 등지방두께 및 근내지방도를 측정한 후 고밀도 SNP 패널(777K)을 사용하여 유전체 혈연 행렬(Genetic Relationship Matrix, GRM)을 추정하고 GBLUP (Genomic Best Linear Unbiased Prediction) 방법으로 GEBV (Genomic Estimated Breeding Value)를 구하여 교차 검증(Cross-validation) 방법으로 그 정확도를 추정함으로써 유전체 선발 기법을 한우 유전평가 체계에 적용하기 위한 기초자료로 이용하고자 수행하였다. 교차 검증 방법으로 각 형질별로 추정된 유전체 육종가의 정확도는 0.915~0.957로 상당히 높게 추정되었다. 대립유전자의 빈도로 계산된 유전체 혈연 행렬을 이용하여 GBLUP 방법으로 추정된 육종가 정확도의 최대 차이는 후대검정우 534두에 대하여 도체중, 배최장근단면적, 등지방 두께 및 근내지방도 순으로 각각 9.56%, 5.78%, 5.78% 및 4.18% 정도의 수준으로 상승했고, 혈통 기록상의 모든 개체 3,674두에 대해서는 형질 별로 최대 13.54%, 6.50%, 6.50% 및 4.31% 정도의 수준으로 증가한 결과가 추정되었다. 이는 한우 보증씨수소의 선발 시스템에서 아직 표현형 자료를 생산할 수 없는 당대검정 후보축 대한 집단을 조성할 때 유전체 정보를 이용한 사전 선발을 활용하면 기존의 상대적으로 낮았던 육종가의 정확도의 상승 효과와 세대 간격의 단축으로 인하여 유전적 개량량을 증대시킬 수 있을 것으로 기대된다. 본 연구에서 genomic breeding value 추정을 위하여 조성된 집단의 경우는 후대 검정우 집단으로서 개체들 간의 혈연관계가 높으며, 이미 전통적인 BLUP 방법으로도 상당히 높은 정확도를 가진 집단을 이용하였다. 그러나, 현재 한우 집단에 대한 유전체 자료 구축 시 이용할 수 있는 정확한 자료는 후대검정우 집단 외에는 참조 집단을 조성할 수 있는 대안이 없으므로, 지속적인 유전체 검정을 위해서는 다양한 유전적 조성이 구축된 참조 집단을 구축해야 할 것으로 사료된다. 또한 유전체 검정을 통한 정확도 상승효과를 기대하기 위해서 지속적으로 참조 집단의 크기를 늘릴 필요성이 있다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

작물모형의 생물계절 및 잠재수량 예측력 개선 방법 탐색: I. 유전 모수 정보 향상으로 콩의 개화시기 및 잠재수량 예측력 향상이 가능한가? (Exploring Ways to Improve the Predictability of Flowering Time and Potential Yield of Soybean in the Crop Model Simulation)

  • 정유란;신평;서명철
    • 한국농림기상학회지
    • /
    • 제19권4호
    • /
    • pp.203-214
    • /
    • 2017
  • 본 연구에서는 진주, 수원, 춘천의 정보로만 추정한 유전 모수(New1~New3)와 지역 조합으로 추정한 유전 모수(New4~New7), NICS (2010)와 Kim et al. (2004)의 유전 모수의 개화시기 및 잠재수량의 예측력을 평가하여 기존의 유전 정보와 새로운 유전 정보에 대한 불확실 정도를 알고 다음 후속 연구에 활용 가능성을 알아보고자 수행했다. 결과적으로, 개별 및 지역조합 유전 모수에서 모수 추정 지점 혹은 참여한 지점의 유전 모수의 평가 지표들은 비교적 좋은 결과를 보여 주었지만 뚜렷하게 나타나지 않았다. 대구, 밀양, 전주에서 New7 유전 모수의 개화시기의 예측력은 NICS (2010)나 Kim et al. (2004)의 유전 모수의 개화 시기 예측력보다 개선되지 않았다. 그러나 New7 유전 모수의 잠재수량의 예측력은 큰 차이는 아니지만 NICS (2010)나 Kim et al. (2004)의 유전 모수의 잠재 수량 예측력보다 개선되는 현상을 보였다. 예를 들면, 밀양에서 NICS (2010)와 Kim et al. (2004)의 유전 모수의 잠재수량 결정계수가 0.00과 0.01로 전혀 예측력이 없는 것으로 평가하였지만 New7 유전 모수의 잠재수량 결정계수는 0.31로 나타났다. 반면, 전주에서 NICS (2010)과 Kim et al. (2004)의 유전 모수의 잠재수량 결정계수는 0.66과 0.41로 평가되었는데, New7 유전 모수의 잠재수량 결정계수는 0.00으로 예측력이 없는 것으로 평가되었다. 새로운 유전 모수의 예측력(New1~New7)이 기존의 유전 모수(NICS (2010)과 Kim et al. (2004))의 예측력보다 크게 개선되지는 않았지만, 평가 결과가 좋은 지역 조합 유전 모수를 지역별 개화시기 및 잠재수량을 예측하는 데에는 활용할 수 있을 것으로 판단된다.

18~34 남성의 최대산소 섭취량 추정 (Prediction of Maximal Oxygen Uptake Ages 18~34 Years)

  • 전유정;임재형;이병근;김창환;김병완
    • 한국체육학회지인문사회과학편
    • /
    • 제51권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 본 연구의 목적은 신체변인과 최대하 대사반응을 이용하여 최대산소섭취량(VO2max)을 간편하고 정확하게 추정하는 데 있다. 18~34세 남성 250명을 대상으로 추정집단(n=179)과 타당도 검증집단(n=71)으로 나누어 최대 운동부하검사를 실시하였으며 3분인 1단계와 6분인 2단계 종료 시점의 대사반응을 측정하였다. 추정 집단을 대상으로 단계선택법(stepwise method)으로 다중회귀분석 (multiple regression analysis)을 실시하였다. 단계별분석법으로 분석한 모형 1의 추정변인은 체중, 6분HR, 6분VO2이고 R은 0.64(p<.01)이었으며 SEE와 CV는 각각 4.74, 11.7%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 72.256-0.340(Weight)-0.220(6분HR)+0.013(6분VO2)이며 다중공선성이 나타나지 않았다. 모형 2의 추정변인은 체중, 6분HR, 6분VO2, 6분VCO2이고 R은 0.66(p<.01)이었으며 SEE와 CV는 각각 4.59, 11.3%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 68.699-0.277(Weight) -0.206(6분HR)+0.020(6분VO2)-0.009(6분VCO2)이며, 역시 다중공선성이 나타나지 않았다. 모형 1과 비교했을 때 모형 2는 상관이 더 높지만 다중공선성 측면에서는 다소 불리하게 나타났다. 모형 1과 모형 2를 교차타당도 검증집단에 적용했을 때, 측정된 VO2max와 추정된 VO2Max 간에 유의한 상관관계가 나타났다(R=0.53, 0.56, P<.001). 타당도 검증을 통해 유용성과 간편성을 고려하면, 본 연구에서 얻은 신체변인 및 최대하 대사반응을 이용한 추정모형들이 모두 사용가능하나 모형 2가 정확도 측면에서 다소 유리하다.

UV/$TiO_2$/HAP 시스템에서 Sulfamethoxazole의 흡착과 광촉매반응에 대한 동역학적 및 통계적 해석 (Kinetic and Statistical Analysis of Adsorption and Photocatalysis on Sulfamethoxazole Degradation by UV/$TiO_2$/HAP System)

  • 천석영;장순웅
    • 한국지반환경공학회 논문집
    • /
    • 제13권5호
    • /
    • pp.5-12
    • /
    • 2012
  • 항생제는 환경에 지속적인 노출과 저항성으로 인해 우려물질로 간주되고 있다. 항생제의 제한적인 생분해능에 따른 하수처리장에서의 불완전한 제거와 광범위한 사용으로 인해 상대적으로 많은 양이 환경에 방류되고 있는 실정이다. 이에 본 연구에서는 다양한 촉매(Titanium dioxide; $TiO_2$, Hydroxyapatite; HAP)를 통해 항생제의 하나인 sulfamethoxazole의 동역학적 흡착과 광촉매반응에 대해 연구하였으며, 부가적으로 통계적 분석방법인 반응표면법(RSM)을 이용하여 UV/$TiO_2$/HAP 시스템에서의 운전인자의 영향을 살펴보았다. 동역학적 연구결과로 $TiO_2$/HAP의 흡착반응은 유사 2차 반응을 따르는 것으로 나타났으며, 입자내 확산 모델의 적용 결과, 반응속도 상수는 각각 $TiO_2$=$0.064min^{-1}$, HAP=$0.2866min^{-1}$$TiO_2$/HAP=$0.3708min^{-1}$으로 나타났다. RSM의 결과로는 ANOVA에서의 회귀항의 유의성이 나타났으며(P-value<0.05) 높은 결정계수 값($R^2$=96.2%, $R^2_{Adj}$=89.3%)이 나타나 이차 회귀모델의 예측이 만족스러운 것으로 관찰되었다. 그리고 Y(SMX 제거율, %)에 대해 예측된 최적 조건들은 코드화된 인자 기준으로 각각 $x_1$(SMX의 초기농도)=-0.7828, $x_2$(촉매의 양)=0.9974 그리고 $x_3$(반응시간)=0.5738로 나타났다. 입자내 확산 모델과 광촉매 산화 반응의 결과에 따르면 $TiO_2$/HAP 공정이 일반적인 고도산화공정에 비해 효율적인 것으로 관찰되었다.

유전자 알고리즘을 활용한 소셜네트워크 기반 하이브리드 협업필터링 (Social Network-based Hybrid Collaborative Filtering using Genetic Algorithms)

  • 노희룡;최슬비;안현철
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.19-38
    • /
    • 2017
  • 본 연구는 사용자 평점 이외에 사용자 간 직접 간접적 신뢰 및 불신 관계 네트워크의 분석 결과를 추가로 반영한 새로운 하이브리드 협업필터링(Collaborative filtering, CF) 추천방법을 제안한다. 구체적으로 사용자 간의 유사도를 계산할 때 사용자 평가점수의 유사성만을 고려하는 기존의 CF와 다르게, 사용자 신뢰 및 불신 관계 데이터의 사회연결망분석 결과를 추가적으로 고려하여 보다 정교하게 사용자 간의 유사도를 산출하였다. 이 때, 사용자 간의 유사도를 재조정하는 접근법으로 특정 이웃 사용자가 신뢰 및 불신 관계 네트워크에서 높은 신뢰(또는 불신)를 받을 때, 추천 대상이 되는 사용자와 해당 이웃 간의 유사도를 확대(강화) 또는 축소(약화)하는 방안을 제안하고, 더 나아가 최적의 유사도 확대 또는 축소의 정도를 결정하기 위해 유전자 알고리즘(genetic algorithm, GA)을 적용하였다. 본 연구에서는 제안 알고리즘의 성능을 검증하기 위해, 특정 상품에 대한 사용자의 평가점수와 신뢰 및 불신 관계를 나타낸 실제 데이터에 추천 알고리즘을 적용하였으며 그 결과, 기존의 CF와 비교했을 때 통계적으로 유의한 수준의 예측 정확도 개선이 이루어짐을 확인할 수 있었다. 또한 신뢰 관계 정보보다는 불신 관계 정보를 반영했을 때 예측 정확도가 더 향상되는 것으로 나타났는데, 이는 사회적인 관계를 추적하고 관리하는 측면에서 사용자 간의 불신 관계에 대해 좀 더 주목해야 할 필요가 있음을 시사한다.

작물 생육 모델을 이용한 지역단위 콩 수량 예측 (Predicting Regional Soybean Yield using Crop Growth Simulation Model)

  • 반호영;최덕환;안중배;이변우
    • 대한원격탐사학회지
    • /
    • 제33권5_2호
    • /
    • pp.699-708
    • /
    • 2017
  • 본 연구에서는 재배 방법, 토양 특성 등의 정보를 상세하게 수집하기 어려운 지역단위의 콩 작황을 작물생육 모델을 이용하여 예측하는 방법을 개발하고자 하였다. 작물 생육 모델은 DSSAT에 포함된 CROPGRO-Soybean 모델을 이용하였고, 미국의 주요 콩 생산지역인 Illinois주를 연구 사례지역으로 선택하였다. CROPGRO-Soybean 모델을 이용하여 Illinois주의 콩 수량을 예측하기 위한 첫 단계로 다양한 성숙군에 속하는 국내외 품종들을 수집하여 서울대학교농장($37.27^{\circ}N$, $126.99^{\circ}E$)에서 2년동안 파종기 실험을 하여 성숙군(maturity group) I~VI까지의 성숙군별 대표 품종모수(genetic coefficients)를 추정하였다. 대표 품종모수는 각 성숙군 내에 포함되어 있는 품종들의 발육을 매우 정확하게 추정하였다. $10km{\times}10km$ 격자 단위의 기상자료를 바탕으로 성숙군(3), 파종시기(3), 관개여부(2) 등을 조합하여 18가지 조건으로 2000년에서 2011년까지 수량을 각각 모의 하였다. 성숙군과 파종시기는 Illinois주를 위도에 따라 3등분하여 각각 다르게 설정하였다. 관개 및 무관개 조건으로 구분하여 격자 별 모의결과로부터 Illinois주 전체 평균 모의수량을 구하여 연도 별 통계 수량과 비교한 결과 두 경우 모두 실제 수량과 큰 차이를 보일 뿐만 아니라 연차에 따른 수량 변동과 증가 경향을 반영하지 못하였다. 이러한 한계를 극복하고자 처리 별 격자 별로 모의된 수량을 수량을 18개 모의 조건 별로 평균하여 구한 9개 농업지구의 연도별 수량을 독립 변수, 농업지구의 연도별 통계수량을 종속 변수로 하는 중회귀 모델을 구축하였다. 18개 모의 조건 별 수량 외에 품종 개량, 재배 기술 발전 등에 따른 수량의 연차적 변화경향을 반영하기 위하여 연도를 독립변수로 추가하였으며, 중회귀모델은 농업지구와 연도별 수량 변이를 비교적 잘 예측($R^2=0.61$, n=108)하였다. 중회귀 모델로 추정한 9개 농업지구의 연도별 수량을 농업지구별 재배 면적으로 가중 평균한 Illinois의 연도별 추정수량은 통계수량에 매우 근사하였다($R^2=0.80$). 뿐만 아니라 모델 구축 대상연도가 아니고 가뭄으로 수량이 크게 감소한 2012년의 예측 수량은 $3006kg\;ha^{-1}$로 통계수량 $2890kg\;ha^{-1}$$116kg\;ha^{-1}$의 근사한 차이를 보였다.

중소기업 기술 유출에 대한 조기경보시스템 개발에 대한 연구 (Development on Early Warning System about Technology Leakage of Small and Medium Enterprises)

  • 서봉군;박도형
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.143-159
    • /
    • 2017
  • 급속한 IT의 발전으로 인해 개인정보뿐만 아니라 기업이 보유하고 있는 핵심 기술 및 정보에 대한 유출 위협이 중요한 이슈로 인식되고 있다. 기업에게 있어서 보유하고 있는 핵심 기술은 기업의 생존 및 지속적으로 경쟁 우위를 차지하기 위해 매우 중요한 부분이다. 최근 기술 침해 사례가 많이 일어나고 있는데, 기술 유출은 기업에게 있어서 주가하락 등의 막대한 재무적인 손실을 가져올 뿐만 아니라, 기업의 신뢰에 손상을 입게 되고, 기업의 발전을 지연시키게 되는 악영향을 미치게 된다. 특히, 대기업에 비해 핵심기술이 기업 내 중요한 많은 부분을 차지하는 중소기업에 있어서 기술 유출에 대한 대비는 기업의 존립에 있어서 필수적인 요소로 볼 수 있다. 이처럼 정보 보안 관리의 필요성과 중요성이 대두되면서 기업 입장에서 조기에 기술 침해 위협에 대해 확인하고 대비할 필요가 있다. 본 연구에서는 기술 유출에 영향을 미치는 요인들을 탐색하는 실증 분석을 수행하고, 인공지능 알고리즘을 통해 기술유출 조기경보시스템을 개발하고자 한다. 구체적으로 본 연구에서는 중소기업이 보유한 기술 유출에 영향을 미치는 요인들을 로지스틱 회귀분석을 통해 확인해보고, 통계분석을 통해 검증된 요인들을 기반으로 인공지능 여러 기법들 중 하나인 Support Vector Machine을 활용하여 기술침해 가능성을 조기에 알려주는 모형을 개발하였다. 본 연구에서 제안하는 기술 유출 가능성에 대한 조기 경보 모형을 통해 기업 및 정부 관점에서 기술 유출을 미리 예방할 수 있는 기회를 제공할 수 있을 것으로 기대된다.

WRF-Chem 모델과 결합된 CFD 모델을 활용한 도시 지역의 일산화탄소 확산 연구 (Carbon Monoxide Dispersion in an Urban Area Simulated by a CFD Model Coupled to the WRF-Chem Model)

  • 권아름;박수진;강건;김재진
    • 대한원격탐사학회지
    • /
    • 제36권5_1호
    • /
    • pp.679-692
    • /
    • 2020
  • 본 연구에서는 CFD 모델을 WRF-Chem 모델과 결합(WRF-CFD 모델)하였고, 서울 영등포구에 소재한 건물 밀집 지역에서 흐름과 일산화탄소(carbon monoxide, CO) 분포 특성을 조사하였다. 이를 위하여, 자동기상관측소에서 측정한 풍속, 풍향과 도시대기측정소에서 측정한 CO 농도를 이용하여 수치 모의 결과를 검증하였다. AWS 510 지점에서는 남풍과 남서풍 계열 바람이 측정되었고, 야간 시간 보다는 주간 시간에 높은 풍속이 측정되었다. WRF-Chem 모델은 주로 동남동풍에서 서남서풍 계열의 바람을 수치 모의하였고, 측정 풍속을 과대 모의하였다. WRF-CFD 모델이 수치 모의한 풍향은 WRF-Chem 모델 풍향에 대한 의존도가 높았고, 측정 풍속을 상대적으로 잘 수치 모의하였다. 통계적 검증 지수에 대한 목표 값과 추천 범위를 고려하였을 때, WRF-CFD 모델이 WRF-Chem 모델에 비해 측정 풍속을 통계적으로 더 현실적으로 수치 모의하였다. WRF-Chem 모델은 측정 CO 농도를 크게 과소 모의하였고, WRF-CFD 모델은 CO 농도 예측을 개선하였다. 통계적 검증 결과를 종합한 결과, WRF-CFD 모델은 도시 지역에 복잡하게 분포한 건물과 이동 오염원을 고려함으로써 CO 농도 예측 성능을 개선하였다. 5월 22일 04시에는 AQMS가 위치한 지역에는 하강류가 존재하고, 상층으로부터 비교적 낮은 농도의 CO가 유입되면서 주변 지역에 비해 낮은 농도가 수치 모의되었다. 5월 22일 15시에는 AQMS 측정 지점에 약한 상승류가 형성되었고, 이에 따라 주변보다 다소 높은 CO 농도가 나타났다. WRF-CFD 모델은 상승류에 의해 도로의 이동 오염원으로부터 배출된 CO를 AQMS 측정 고도까지 수송하여, 결과적으로, 측정 CO 농도를 잘 재현한 것으로 판단된다. 5월 22일 18시 사례는 CO 배출량 증가, 상승류 발생 지역 증가, 풍속 증가로 인한 지면 근처의 난류운동에너지 생성 증가에 따른 난류 확산 증가 등으로 인해 전체적으로 높은 CO 농도가 수치 모의되었다. AQMS 지점에서는 하강류가 수치 모의되었지만, 풍상측에 형성된 고농도의 CO 밴드로 인해 WRF-CFD 모델은 측정 CO 농도를 과대 모의하였다.