• 제목/요약/키워드: Accuracy assessment of data

검색결과 671건 처리시간 0.025초

Deep Neural Network를 활용한 초미세먼지 농도 예측에 관한 연구 (A Study on Prediction of PM2.5 Concentration Using DNN)

  • 최인호;이원영;은범진;허정숙;장광현;오종민
    • 환경영향평가
    • /
    • 제31권2호
    • /
    • pp.83-94
    • /
    • 2022
  • 본 연구는 국가측정망(에어코리아)에서 제공하는 2017년, 2019년 및 2020년도 대기질확정 데이터를 이용하여 Deep Neural Network(DNN) 모델을 학습하고, 2016년과 2018년도 데이터를 이용하여 학습된 모델을 평가·검증하였다. 피어슨 상관계수 0.2를 기준으로 SO2, CO, NO2, PM10 항목을 독립변수로 하여 초기 모델링을 진행하였고, 예측의 정확도를 높이기 위한 방법으로 시계열적 요소를 반영한 월별 모델링(개선모델)을 진행하여 초기모델과 비교·분석하였다. 분석에 사용한 지표는 RMSE(Root mean square error) 방법으로 오차를 계산하였으며, 예측 결과 초기모델의 RMSE값은 5.78로 국가측정망의 예측이동 평균모델의 결과(10.77)와 비교하여 초기모델에서 약 46% 오차가 감소하였다. 또한, 개선모델의 경우, 초기모델 대비 11월 모델을 제외한 모든 월별모델에서 정확도 향상이 있었다. 따라서, 본 연구에서는 DNN 모델링이 PM2.5 농도 예측에 효과적인 방법임을 제안할 수 있었으며, 향후 추가적인 독립변수 선정 및 시계열 요소를 고려한 방법으로 모델의 정확도 개선 가능성을 확인할 수 있었다.

스테레오 비전 센서 기반 프리팹 강구조물 조립부 형상 품질 평가 (Dimensional Quality Assessment for Assembly Part of Prefabricated Steel Structures Using a Stereo Vision Sensor)

  • 김종혁;전해민
    • 한국전산구조공학회논문집
    • /
    • 제37권3호
    • /
    • pp.173-178
    • /
    • 2024
  • 본 논문에서는 스테레오 비전 센서를 이용한 프리팹 강구조물(PSS: Prefabricated Steel Structures)의 조립부 형상 품질 평가 기법을 소개한다. 스테레오 비전 센서를 통해 모형의 조립부 영상과 포인트 클라우드 데이터를 수집하였으며, 퍼지 기반 엣지 검출, 허프 변환 기반 원형의 볼트 홀 검출 등의 영상처리 알고리즘을 적용하여 조립부 영역의 볼트홀을 검출하였다. 영상 내 추출된 볼트홀 외곽선 위 세 점의 위치 정보에 대응되는 3차원 실세계 위치 정보를 깊이 영상으로부터 획득하였으며, 이를 기반으로 각 볼트홀의 3차원 중심 위치를 계산하였다. 통계적 기법 중 하나인 주성분 분석 알고리즘(PCA: Principal component analysis) 알고리즘을 적용함으로써 3차원 위치 정보를 대표하는 최적의 좌표축을 계산하였다. 이를 통해 센서의 설치 방향 및 위치에 따라 센서와 부재 간 평행이 아니더라도 안정적으로 볼트홀 간의 거리를 계측하도록 하였다. 각 볼트홀의 2차원 위치 정보를 기반으로 볼트홀의 순서를 정렬하였으며, 정렬된 볼트홀의 위치 정보를 바탕으로 인접한 볼트홀 간의 각 축의 거리 정보를 계산하여 조립부 볼트홀 위치 중심의 형상 품질을 분석하였다. 측정된 볼트홀 간의 거리 정보는 실제 도면의 거리 정보와의 절대오차와 상대오차를 계산하여 성능 비교를 진행하였으며, 중앙값 기준 1mm 내의 절대오차와 4% 이내의 상대오차의 계측 성능을 확인하였다.

탄성파 속성 분석을 위한 탄성파 자료 무작위 잡음 제거 연구 (Study on the Seismic Random Noise Attenuation for the Seismic Attribute Analysis)

  • 원종필;신정균;하지호;전형구
    • 자원환경지질
    • /
    • 제57권1호
    • /
    • pp.51-71
    • /
    • 2024
  • 탄성파 탐사는 지하자원 개발, 지반 조사, 지층 모니터링 등에 널리 사용되고 있는 지구물리탐사 방법으로 정확한 지층 구조 영상을 제공해주기 때문에 지층의 지질학적 특성 해석에 필수적으로 활용된다. 일반적으로는 탄성파 구조 보정 영상을 시각적으로 분석하여 지질학적 특성을 해석하지만 최근에는 탄성파 구조 보정 자료에 대한 정량적인 분석을 통해 원하는 지질학적 특성을 정확하게 추출하고 해석하는 탄성파 속성 분석이 널리 연구되고 있다. 탄성파 속성 분석은 탄성파 자료에 기반한 지질학적 해석에 정량적인 근거를 제시해줄 수 있기 때문에 석유 및 가스 저류층 분석, 단층 및 균열대 조사, 지층 가스 분포 파악 등의 다양한 분야에서 활용되고 있다. 하지만 탄성파 속성 분석은 탄성파 자료 내 잡음에 취약하므로 속성 분석의 정확도 향상을 위해서는 중합 후 탄성파 자료에 대한 추가적인 잡음 제거가 수반되어야 한다. 본 연구에서는 중합 후 탄성파 자료에 대한 무작위 잡음 제거 및 및 탄성파 속성 분석 정확도 개선을 위해 4가지의 잡음 제거 방법을 적용하고 비교한다. FX 디콘볼루션, DSMF, Noise2Noiose, DnCNN을 각각 포항 영일만 고해상 탄성파 자료에 적용하여 탄성파 무작위 잡음을 제거하고 잡음이 제거된 탄성파 자료로부터 에너지, 스위트니스, 유사도 속성을 계산한다. 그리고 각 잡음 제거 방법의 특성, 잡음 제거 결과, 탄성파 속성 분석 결과를 정성적 및 정량적으로 분석한 후, 이를 기반으로 탄성파 속성 분석 결과 향상을 위한 최적의 잡음 제거 방법을 제안한다.

한반도 연안 수온자료의 확률분포함수 추정 (Estimation of Probability Distribution Functions for Water Temperature Data in Korean Coasts)

  • 정신택;조홍연;고동휘;오남선;손경표
    • 한국해안·해양공학회논문집
    • /
    • 제25권1호
    • /
    • pp.11-19
    • /
    • 2013
  • 수온자료는 다수의 첨두를 가진 분포형태를 보이고 있기 때문에 정규분포로 가정하는 경우 분석에 큰 오차가 수반된다. 본 연구에서는 쌍봉 분포함수 형태인 가우스 혼합분포 함수를 수온의 분포함수로 가정하여 최적매개변수를 추정하고, 추정된 최적 매개변수와 자료의 기본적인 통계정보(평균 및 분산 등)의 관계분석을 수행하였다. 또한 자료의 주 특성값인 평균, 표준편차, 왜곡도로부터 가우스 혼합분포 매개변수인, ${\alpha}_1$, ${\mu}_1$, ${\sigma}_1$, ${\alpha}_2$, ${\mu}_2$, ${\sigma}_2$를 산정하여 수온 자료의 빈도분포를 산정하는 추정공식을 개발하였다. 개발된 추정공식은 RMS 오차가 5% 정도로 관측 자료를 이용한 결과와 우수한 일치를 보이고 있다.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

Multi-fidelity uncertainty quantification of high Reynolds number turbulent flow around a rectangular 5:1 Cylinder

  • Sakuma, Mayu;Pepper, Nick;Warnakulasuriya, Suneth;Montomoli, Francesco;Wuch-ner, Roland;Bletzinger, Kai-Uwe
    • Wind and Structures
    • /
    • 제34권1호
    • /
    • pp.127-136
    • /
    • 2022
  • In this work a multi-fidelity non-intrusive polynomial chaos (MF-NIPC) has been applied to a structural wind engineering problem in architectural design for the first time. In architectural design it is important to design structures that are safe in a range of wind directions and speeds. For this reason, the computational models used to design buildings and bridges must account for the uncertainties associated with the interaction between the structure and wind. In order to use the numerical simulations for the design, the numerical models must be validated by experi-mental data, and uncertainties contained in the experiments should also be taken into account. Uncertainty Quantifi-cation has been increasingly used for CFD simulations to consider such uncertainties. Typically, CFD simulations are computationally expensive, motivating the increased interest in multi-fidelity methods due to their ability to lev-erage limited data sets of high-fidelity data with evaluations of more computationally inexpensive models. Previous-ly, the multi-fidelity framework has been applied to CFD simulations for the purposes of optimization, rather than for the statistical assessment of candidate design. In this paper MF-NIPC method is applied to flow around a rectan-gular 5:1 cylinder, which has been thoroughly investigated for architectural design. The purpose of UQ is validation of numerical simulation results with experimental data, therefore the radius of curvature of the rectangular cylinder corners and the angle of attack are considered to be random variables, which are known to contain uncertainties when wind tunnel tests are carried out. Computational Fluid Dynamics (CFD) simulations are solved by a solver that employs the Finite Element Method (FEM) for two turbulence modeling approaches of the incompressible Navier-Stokes equations: Unsteady Reynolds Averaged Navier Stokes (URANS) and the Large Eddy simulation (LES). The results of the uncertainty analysis with CFD are compared to experimental data in terms of time-averaged pressure coefficients and bulk parameters. In addition, the accuracy and efficiency of the multi-fidelity framework is demonstrated through a comparison with the results of the high-fidelity model.

흡연상태에 관한 자가보고 설문의 타당도 평가: 제1기(2009-2011) 국민환경보건기초조사 자료 분석 (Validity Assessment of Self-reported Smoking Status: Results from the Korean National Environmental Health Survey (KoNEHS) 2009-2011)

  • 최욱희;박경화;김현정;류정민;유승도;최경희;김수진
    • 한국환경보건학회지
    • /
    • 제40권6호
    • /
    • pp.492-501
    • /
    • 2014
  • Objectives: The purpose of this study was to assess the validity of self-reported cigarette smoking status and investigate factors associated with the accuracy self-reported and measured urinary cotinine in Korean adults. Methods: We used data from the $1^{st}$ Korean National Environmental Health Survey (2009-2011) among adults aged ${\geq}19$ years (N=6,246). The survey examined self-reported smoking status, and urinary cotinine was regarded as the biomarker of exposure to tobacco smoke. Urinary cotinine was analyzed using a gas chromatography-mass spectrometry (GC/MS) and data analysis was conducted using IBM SPSS version 20.0, which uses the sample weight and calculates variance estimates to adjust for the unequal probability of selection into the survey. Results: We calculated a cut-off point (53.3 ug/L) by using a ROC (Receiver Operating Characteristic) curve. The smoking prevalence was 24.6% based on self-reported data and 28.2% based on urinary cotinine concentrations. When we assessed the agreement between self-reported and urinary cotinine, we found an average agreement of 97.7% among self-reported smokers and 94.5% among self-reported non-smokers. Among self-reported smokers, factors affected the discrepancy were age, household economic status and average number of cigarettes smoked per day. On the other hand, gender, former smoking experience, and exposure to SHS (second hand smoke) were associated with discrepancies among self-reported non-smokers. Conclusion: These results suggest that self-reported data on smoking status provide a valid estimate of actual smoking status. In future research, we will conduct a continuous monitoring study for reliability verification of the data to reduce potential interpretation errors.

지리정보시스템(GIS) 및 Weight of Evidence 기법을 이용한 강릉지역의 퇴적기원의 비금속 광상부존가능성 분석 (Sedimentary type Non-Metallic Mineral Potential Analysis using GIS and Weight of Evidence Model in the Gangreung Area)

  • 이사로;오현주;민경덕
    • Spatial Information Research
    • /
    • 제14권1호
    • /
    • pp.129-150
    • /
    • 2006
  • 본 연구에서는 GIS 및 확률 기법을 이용하여 광상의 위치와 지질, 지화학 및 지구물리 자료들 간의 상관관계를 분석하고, 광상부존가능도(Mineral potential map) 작성 및 검증을 수행하였다. 연구지역은 1:25만 강릉도폭지역 a이며, 구축된 데이터베이스 자료는 1:25만 광상분포도, 지화학도, 지질도, 부우게 중력이상도, 자력이상도이다. 본 연구에 사용된 광상은 퇴적기원의 비금속광상(고령토, 도석, 규석, 운모, 연옥, 석회석, 납석)이다. 원소별 지화학도 작성은 채취된 각 시료 3,595개의 원소별 분석치를 이용하여 IDW 보간법으로 만들었다. 구축된 지화학도는 Al, Alkalinity, As, Ba, Ca, Cd, Co, Cr, Cu, Fe, K, Li, Mg, Mn, Mo, Na, Ni, Pb, Si, Sr, V, W, Zn, $Cl^-,\;F^-,\;{NO_2}^-,\;{NO_3}^-,\;{PO_4}^{3-},\;{SO_4}^{2-}$, pH, Eh 및 Conductivity로 총 32개이다. 이러한 광상과 관련 요인들 간의 상관관계는 확률기법인 weight of evidence를 적용하여 계산하였고, 이를 바탕으로 광상부존가능도를 작성하였다. 광상부존가능도는 wieght of evidence의 W+와 W- 값을 GIS 중첩분석에 적용하여 작성하였다. 계산된 광상부존가능지수는 기존 광상부존가능성을 정량적으로 설명하고 표현하며 검증할 수 있는 값이다. 각 기법을 이용하여 작성한 광상부존가능도의 검증결과는 85.66%의 정확도를 나타내었다.

  • PDF

Sentinel-1 SAR 토양수분 산정 연구: 식생에 따른 토양수분 모의평가 (Estimation of soil moisture based on Sentinel-1 SAR data: Assessment of soil moisture estimation in different vegetation condition)

  • 조성근;정재환;이슬찬;최민하
    • 한국수자원학회논문집
    • /
    • 제54권2호
    • /
    • pp.81-91
    • /
    • 2021
  • Synthetic Aperture Radar (SAR)를 활용하여 토양수분을 산출 할 시 기존의 위성기반 자료에 비해 고해상도의 공간 자료를 생산할 수 있다. 고해상도의 광역 토양수분 자료는 기존의 위성 기반 토양수분 대비 보다 세밀한 지표면 토양수분 변동 관측이 가능하게 하므로, 산사태, 산불 및 홍수와 같은 자연재해 연구에 활용성이 뛰어나다. 하지만 SAR 신호인 후방산란계수는 토양수분 뿐만 아니라, 식생에 의한 영향도 포함하기 때문에 정확한 토양수분을 산정하기 위해서는 이러한 영향을 고려하는 단계가 요구된다. 본 연구에서는 한반도 중부의 농지, 산지, 및 초지의 식생조건 하에서 Sentinel-1 위성 SAR 자료를 활용하여 토양수분을 산정하기 위한 연구를 수행하였다. 식생의 영향을 고려하기 위해 대표적인 지표면 레이더 신호 산란 모형인 Water Cloud Model (WCM)을 사용하였으며, 식생 인자로 Radar Vegetation Index (RVI)를 활용하였다. 연구 지역으로는 토지피복도에 따라 농지와 초지, 산지 각각 2개 지역, 총 6개 대상 지역을 선정하였다. WCM의 매개변수 모의를 위해 지상 관측 토양수분 자료를 활용하였다. 관측 토양수분과의 검증 결과 초지, 산지, 농지 순으로 높은 정확도가 나타났으며, 특히 산지에서는 짙은 식생에도 불구하고 상관계수 값이 0.5 이상으로 나타난 반면 농지에서는 0.3 미만의 매우 낮은 값이 관측되었다. 연구 결과를 통해 다양한 식생 피복에서 SAR 기반 토양수분 산정에 적합한 관측 토양수분 조건을 제시 하였다. 향후 식생 높이, 식생 종류 등 과 융합한 연구가 수행된다면 보다 정확한 토양수분을 산정 할 수 있을 것으로 판단된다.

LSTM을 활용한 고속도로 교통정보 예측 모델 개발 방법론 (Methodology for Developing a Predictive Model for Highway Traffic Information Using LSTM)

  • 이요셉;진형석;김예진;박성호;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권5호
    • /
    • pp.1-18
    • /
    • 2023
  • 최근 빅데이터 및 딥러닝 기술의 발전으로 다양한 교통정보가 널리 수집 및 활용되고 있다. 특히 시계열 특성을 갖는 교통정보 예측 분야에서는 장단기 메모리(long short term memory, LSTM)가 널리 사용되고 있다. LSTM에 입력되는 시계열 데이터의 추세, 계절성, 주기 등이 상이하기 때문에 시계열 데이터를 기반으로 한 예측 모델에서도 데이터의 특성에 따라 하이퍼 파라미터의 적합한 값을 찾는 시행착오법이 필수적이다. 이에 적합한 하이퍼 파라미터를 찾는 방법론이 정립된다면, 정확도가 높은 모델 구성에 소요되는 시간을 줄일 수 있다. 따라서, 본 연구에서는 국내 고속도로 차량검지기 데이터와 LSTM을 기반으로 교통정보 예측 모델을 개발하였으며, LSTM의 하이퍼 파라미터별 평가지표 변화를 통해 예측 결과에 미치는 영향평가를 수행하였다. 또한, 이를 기반으로 교통분야에서 고속도로 교통정보 예측에 적합한 하이퍼 파라미터를 찾는 방법론을 제시하였다.