• 제목/요약/키워드: Averaging Approach

검색결과 96건 처리시간 0.021초

Percentile-Based Analysis of Non-Gaussian Diffusion Parameters for Improved Glioma Grading

  • Karaman, M. Muge;Zhou, Christopher Y.;Zhang, Jiaxuan;Zhong, Zheng;Wang, Kezhou;Zhu, Wenzhen
    • Investigative Magnetic Resonance Imaging
    • /
    • 제26권2호
    • /
    • pp.104-116
    • /
    • 2022
  • The purpose of this study is to systematically determine an optimal percentile cut-off in histogram analysis for calculating the mean parameters obtained from a non-Gaussian continuous-time random-walk (CTRW) diffusion model for differentiating individual glioma grades. This retrospective study included 90 patients with histopathologically proven gliomas (42 grade II, 19 grade III, and 29 grade IV). We performed diffusion-weighted imaging using 17 b-values (0-4000 s/mm2) at 3T, and analyzed the images with the CTRW model to produce an anomalous diffusion coefficient (Dm) along with temporal (𝛼) and spatial (𝛽) diffusion heterogeneity parameters. Given the tumor ROIs, we created a histogram of each parameter; computed the P-values (using a Student's t-test) for the statistical differences in the mean Dm, 𝛼, or 𝛽 for differentiating grade II vs. grade III gliomas and grade III vs. grade IV gliomas at different percentiles (1% to 100%); and selected the highest percentile with P < 0.05 as the optimal percentile. We used the mean parameter values calculated from the optimal percentile cut-offs to do a receiver operating characteristic (ROC) analysis based on individual parameters or their combinations. We compared the results with those obtained by averaging data over the entire region of interest (i.e., 100th percentile). We found the optimal percentiles for Dm, 𝛼, and 𝛽 to be 68%, 75%, and 100% for differentiating grade II vs. III and 58%, 19%, and 100% for differentiating grade III vs. IV gliomas, respectively. The optimal percentile cut-offs outperformed the entire-ROI-based analysis in sensitivity (0.761 vs. 0.690), specificity (0.578 vs. 0.526), accuracy (0.704 vs. 0.639), and AUC (0.671 vs. 0.599) for grade II vs. III differentiations and in sensitivity (0.789 vs. 0.578) and AUC (0.637 vs. 0.620) for grade III vs. IV differentiations, respectively. Percentile-based histogram analysis, coupled with the multi-parametric approach enabled by the CTRW diffusion model using high b-values, can improve glioma grading.

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

버스운송 수익증대를 위한 버스 외부광고 활성화 방안: 서울시를 중심으로 (Strategies to Revitalize Bus Exterior Advertisement for Enhancing Bus Transportation Profits: Focused in Seoul)

  • 임광균
    • 대한토목학회논문집
    • /
    • 제44권3호
    • /
    • pp.361-373
    • /
    • 2024
  • 국내 버스 외부광고는 1988년 서울올림픽 운영자금 조달 목적으로 1985년부터 시작되었다. 그러나 버스 외부광고의 방법(시트지 부착), 면적 및 부착위치에 관한 규정은 많은 기술의 발전에도 지금까지 거의 변함없이 그대로 유지되어 버스 외부광고의 수익성, 효율성 등의 성장에 한계가 있었다. 서울시 기준 2006년 대비 2019년(코로나 영향 이전) 대중교통 통행량 중 철도는 23 % 증가된 반면, 버스는 10 % 감소되었다. 이에 버스 재정 지원금액도 최근 5년(2018~2022) 평균 약 4,500억 원으로 과거 10년(2013~2022) 평균 대비 약 1.27배로 빠르게 증가하였다. 버스운송 기관의 수입은 운임 81.1 %, 서울시 보조금 17.5 %로 대부분을 차지하여 운임 외 수익 비중 확대가 매우 필요하다. 본 연구에서는 버스 외부광고에 대한 기능 확대(광고 면적 확대)를 운임 외 수익 증대 방안으로 제시하였다. 해외 사례 조사를 통한 버스 외부광고 규제를 개선하고, 광고면적을 현재 보다 17 %, 94 % 각각 증가시키는 대안을 설정한 후 그 효과를 분석하였다. 그 결과 광고수익이 최소 32억 원에서 최대 539억 원까지 증가될 수 있고, 재정지원금은 최대 11.9 %까지 절감되는 것으로 분석되었다. 버스 외부광고에 대한 적극적인 규제 개선과 기능 강화는 운송수입의 다변화와 공공 보조금을 줄일 수 있는 좋은 방안으로 활용될 수 있다.

천부 굴절법 탄성파 탐사 자료의 정보정 (Statics corrections for shallow seismic refraction data)

  • Palmer Derecke;Nikrouz Ramin;Spyrou Andreur
    • 지구물리와물리탐사
    • /
    • 제8권1호
    • /
    • pp.7-17
    • /
    • 2005
  • 천부 탄성파 굴절법 탐사를 이용하여 굴절이 발생하는 지층의 속도를 산출하는 것은 ill-posed 문제이다. 계산된 시간 변수들에서의 작은 변화들이 이로부터 산출된 속도들에 커다란 수평적 변화를 가져올 수 있으며 이는 종종 역산 알고리듬의 인위적인 오차를 유발한다. 이러한 인위적인 오차들은 모델링을 통해 인지되거나 보정되지 않는다. 그러므로 만약 모델에 근거한 역산을 통해 정밀한 지하 굴절 모델을 얻고자 한다면 정확한 초기 모델이 필요하다. 탄성파속도에서 인위적인 오차의 원인은 일반적으로 불규칙한 굴절면에 있다. 대부분의 경우에 GRM 방법을 이용하면 불규칙한 굴절면을 다룰 수 있고 굴절면의 정밀한 초기 모델을 만들 수 있다. 하지만 지표에 매우 가까운 극천부 지역 또한 불규칙하다면 GRM 방법의 효능은 감소하고 풍화대 보정이 필요하다. 천부 불균질대에 대한 일반적인 보정방법들은 수평적 확장이 제한된 극천부지역의 불균질대의 경우 효과적이지 못하다. 이럴 경우 GRM 평활화 통계적 방법(Smoothing Statics Method; SSM)이 지층의 속도를 좀 더 정확하게 평가할 수 있는 간단하고 실용적인 방법이다. GRM SSM 방법은 제로 XY 값을 가지고 계산된 시간-심도값들로부터 실제 XY 값을 가지고 얻어진 시간-심도값들의 평균값을 빼줌으로써 평활화 정보정을 수행한다. 심도가 깊어질수록 시간-심도값들이 XY 값에 따라 크게 변하지 않으므로 이들의 평균값은 최적값과 훨씬 더 같아진다. 그러나 극천부의 불균질대에 대해 시간-심도값들은 XY 값들이 증가함에 따라 수평적으로 이동하고 평균화 과정을 통해 대폭 감소한다. 결과적으로, XY값들에 대해 평균화된 시간-심도단면도는 천부의 불균질대에 대한 보정에 효과적이다. 또한 제로 XY 값을 가지고 계산된 시간-심도값들은 천부 불균질대의 영향과 대상 굴절면에 대한 시간-심도값들의 합으로 주어지므로 그들의 차는 정보정을 위해 주시로부터 빼주어야 할 대략적인 값들을 제공한다. GRM SSM 방법은 결정론적인 풍화대에 대한 보정법이라기 보다는 평활화 과정이다. 이 방법은 수평적으로 확장이 매우 제한된 천부 불균질대에 대해 가장 효과적이다. 모델과 현장 적용 결과들을 통해 GRM SSM 방법을 이용하여 불규칙한 굴절면을 가진 지층들에 대해 좀 더 신뢰할 수 있는 정밀한 탄성파 속도를 산출할 수 있음을 보여주고 있다.

작물 생육 모델을 이용한 지역단위 콩 수량 예측 (Predicting Regional Soybean Yield using Crop Growth Simulation Model)

  • 반호영;최덕환;안중배;이변우
    • 대한원격탐사학회지
    • /
    • 제33권5_2호
    • /
    • pp.699-708
    • /
    • 2017
  • 본 연구에서는 재배 방법, 토양 특성 등의 정보를 상세하게 수집하기 어려운 지역단위의 콩 작황을 작물생육 모델을 이용하여 예측하는 방법을 개발하고자 하였다. 작물 생육 모델은 DSSAT에 포함된 CROPGRO-Soybean 모델을 이용하였고, 미국의 주요 콩 생산지역인 Illinois주를 연구 사례지역으로 선택하였다. CROPGRO-Soybean 모델을 이용하여 Illinois주의 콩 수량을 예측하기 위한 첫 단계로 다양한 성숙군에 속하는 국내외 품종들을 수집하여 서울대학교농장($37.27^{\circ}N$, $126.99^{\circ}E$)에서 2년동안 파종기 실험을 하여 성숙군(maturity group) I~VI까지의 성숙군별 대표 품종모수(genetic coefficients)를 추정하였다. 대표 품종모수는 각 성숙군 내에 포함되어 있는 품종들의 발육을 매우 정확하게 추정하였다. $10km{\times}10km$ 격자 단위의 기상자료를 바탕으로 성숙군(3), 파종시기(3), 관개여부(2) 등을 조합하여 18가지 조건으로 2000년에서 2011년까지 수량을 각각 모의 하였다. 성숙군과 파종시기는 Illinois주를 위도에 따라 3등분하여 각각 다르게 설정하였다. 관개 및 무관개 조건으로 구분하여 격자 별 모의결과로부터 Illinois주 전체 평균 모의수량을 구하여 연도 별 통계 수량과 비교한 결과 두 경우 모두 실제 수량과 큰 차이를 보일 뿐만 아니라 연차에 따른 수량 변동과 증가 경향을 반영하지 못하였다. 이러한 한계를 극복하고자 처리 별 격자 별로 모의된 수량을 수량을 18개 모의 조건 별로 평균하여 구한 9개 농업지구의 연도별 수량을 독립 변수, 농업지구의 연도별 통계수량을 종속 변수로 하는 중회귀 모델을 구축하였다. 18개 모의 조건 별 수량 외에 품종 개량, 재배 기술 발전 등에 따른 수량의 연차적 변화경향을 반영하기 위하여 연도를 독립변수로 추가하였으며, 중회귀모델은 농업지구와 연도별 수량 변이를 비교적 잘 예측($R^2=0.61$, n=108)하였다. 중회귀 모델로 추정한 9개 농업지구의 연도별 수량을 농업지구별 재배 면적으로 가중 평균한 Illinois의 연도별 추정수량은 통계수량에 매우 근사하였다($R^2=0.80$). 뿐만 아니라 모델 구축 대상연도가 아니고 가뭄으로 수량이 크게 감소한 2012년의 예측 수량은 $3006kg\;ha^{-1}$로 통계수량 $2890kg\;ha^{-1}$$116kg\;ha^{-1}$의 근사한 차이를 보였다.

가우시안 군집분석을 이용한 천리안 위성의 대기운동벡터 표적추적 알고리듬 개발 및 분석 (Development and Analysis of COMS AMV Target Tracking Algorithm using Gaussian Cluster Analysis)

  • 오유림;김재환;박형민;백강현
    • 대한원격탐사학회지
    • /
    • 제31권6호
    • /
    • pp.531-548
    • /
    • 2015
  • 위성영상을 이용하여 산출된 대기운동벡터(AMV)와 라디오존데 바람 관측 자료를 이용한 검증결과는 산출된 AMV가 지속적으로 관측 자료에 비해서 풍속이 약하게 나타나는 Slow Speed Bias(SSB)를 보여 주었다. 이러한 SSB는 표적추적, 표적선정, 그리고 고도할당 단계의 오차에 의해 야기될 수 있으며, 이 중 고도할당 단계의 오차는 SSB를 발생시키는 주된 요인으로 여겨진다. 그러나 최근 연구에서는 고도할당 단계의 개선만으로는 SSB 문제를 해결하는데 한계가 있음을 밝혔다. 그러므로 본 연구에서는 새로운 표적추적 알고리듬을 개발하여 SSB를 감소시킴으로서 기상청 현업 AMV 알고리듬의 성능을 개선하고자 하였다. 표적추적 단계의 오차는 표적 내에 다양한 시 공간 규모의 바람이 포함되어 벡터가 과도하게 평균된 움직임으로 계산되거나, 구름이 추적 시간동안 형태를 유지하지 못하고 변형되는 경우에 발생한다. 이러한 문제를 해결하기 위해 개발된 표적추적 알고리듬에서는 가우시안 군집분석(GMM)을 이용하여 변형이 적고 추적에 용이한 저온 군집을 표적으로 재선정하고, 이미지를 변형시켜 군집의 움직임을 보다 쉽게 추적할 수 있게 하였다. 또한 표적을 추적하기 위한 방법으로 거리제곱합 방법을 사용하였다. 개발된 알고리듬과 기존 COMS 알고리듬을 천리안 위성의 적외채널 영상에 적용하여 AMV를 산출하였으며, 이를 라디오존데 관측 자료와 비교 검증해 보았다. 제안된 알고리듬으로 산출된 AMV는 기존 알고리듬으로 산출된 AMV보다 평균 풍속이 $2.7ms^{-1}$증가함에 따라 SSB가 평균 29%까지 감소하는 개선된 결과를 보여주었다. 그러나 개발된 알고리듬으로 산출된 AMV는 중 하층의 정확도가 감소하였고, 기존 알고리듬에 비해 산출되는 AMV 벡터수가 약 40%까지 감소함을 보였다. 이에 따라 중 하층의 정확도 개선과 기존의 알고리듬과 비교하여 산출되는 벡터 개수가 감소하는 문제를 보완하기 위한 연구가 필요할 것으로 판단된다.