• 제목/요약/키워드: Input Variable Importance

검색결과 47건 처리시간 0.026초

Spatial distribution of phytoplankton in Gamak Bay in spring, with emphasis on small phytoplankton

  • Yeongji Oh;Yoonja Kang
    • 환경생물
    • /
    • 제40권4호
    • /
    • pp.374-386
    • /
    • 2022
  • Phytoplankton communities, with emphasis on picoplankton and nanoplankton, were investigated in Gamak Bay, South Korea, where freshwater input and coastal water intrusion shape ecosystem functions. Shellfish farms and fish farms are located in the inner bay and outer bay, respectively, and tides translocate uneaten food and urine production from aquaculture farms toward the inner bay. Water masses were distinctly different based on a significantly different density between the surface and bottom layer and among three water masses, including the inner bay, outer bay, and Yeosu Harbor. Phytoplankton communities were quantified using flow cytometry and size-fractionated chlorophyll-a (chl-a) was measured. Salinity was a principal variable separating phytoplankton communities between the surface and bottom layer, whereas Si(OH)4 controlled the communities in the inner bay, and NH4+ and PO43- governed the outer bay communities. While phycocyanin-containing (PC) cyanobacteria dominated in the outer bay, phycoerythrin-containing (PE) cyanobacteria dominance occurred with cryptophyte dominance, indicating that nutrients affected the distribution of pico- and nanoplankton and that cryptophytes potentially relied on a mixotrophic mode by feeding on PE cyanobacteria. Interestingly, picoeukaryotes and eukaryotes larger than 10 ㎛ were mostly responsible for the ecological niche in the western region of the bay. Given that chl-a levels have historically declined, our study highlights the potential importance of increased small phytoplankton in Gamak Bay. Particularly, we urge an examination of the ecological role of small phytoplankton in the food supply of cultivated marine organisms.

Exploring geometric and kinematic correspondences between gear-based crank mechanism and standard reciprocating crankshaft engines: An analytical study

  • Amir Sakhraoui;Fayza Ayari;Maroua Saggar;Rachid Nasri
    • Structural Engineering and Mechanics
    • /
    • 제90권1호
    • /
    • pp.97-106
    • /
    • 2024
  • This paper presents a significant contribution to aided design by conducting an analytical examination of geometric links with the aim of establishing criteria for assessing an analogy measure of the extrinsic geometric and kinematic characteristics of the Variable Compression Ratio (VCR) engine with a Geared Mechanism (GBCM) in comparison to the existing Fixed Compression Ratio (FCR) engine with a Standard-Reciprocating Crankshaft configuration. Employing a mechanical approach grounded in projective computational methods, a parametric study has been conducted to analyze the kinematic behavior and geometric transformations of the moving links. The findings indicate that in order to ensure equivalent extrinsic behavior and maintain consistent input-output performance between both engine types, precise adjustments of intrinsic geometric parameters are necessary. Specifically, for a VCR configuration compared to an FCR configuration, regardless of compression ratio and gearwheel radius, for the same crankshaft ratios and stroke lengths, it is imperative to halve lengths of connecting rods, and crank radius. These insights underscore the importance of meticulous parameter adjustment in achieving comparable performance across different engine configurations, offering valuable implications for design optimization.

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

SVM 기반 음성/음악 분류기의 효율적인 임베디드 시스템 구현 (Efficient Implementation of SVM-Based Speech/Music Classification on Embedded Systems)

  • 임정수;장준혁
    • 한국음향학회지
    • /
    • 제30권8호
    • /
    • pp.461-467
    • /
    • 2011
  • 제한된 대역폭을 효율적으로 사용하기 위해서 도입된 가변 전송률은 먼저 신호의 정확한 분류를 필요로 한다. 특히 멀티미디어 서비스가 보편화 되면서 음성/음악 신호 분류의 중요성도 높아지게 되었다. 음성/음악 분류기 중, 서포트벡터머신 (SVM)을 이용한 분류기는 높은 분류 정확도로 주목받고 있다. 그러나 SVM는 많은 계산량과 저장 공간을 요구하므로 효율적인 구현이 요구되며, 특히 임베디드 시스템과 같이 자원이 제한 적인 경우에는 더욱 그러하다. 본 논문에서는 먼저 SVM을 이용한 음성/음악 분류기의 임베디드 시스템으로의 구현을 실행시간과 에너지소비의 관점에서 분석하고, 효율적인 구현을 위한 두가지 방법들을 제안한다. 서포트벡터의 판별결과에의 기여도를 바탕으로 기여도가 낮은 벡터들을 제외하는 방법과, 음성/음악 신호에 기본적으로 존재하는 각 프레임간의 상관관계를 이용하여 입력신호의 일부를 건너뛰는 방법이다. 이 기법들은 SVM의 학습 시 사용되는 다른 최적화 기법에 관계없이 적용이 가능하며, 실험을 통해 분류의 정확도, 실행시간, 그리고 에너지소비의 관점에서 그 성능을 증명하였다.

부분최소자승법과 인공신경망을 이용한 고분자전해질 연료전지 스택의 모델링 (Modeling of a PEM Fuel Cell Stack using Partial Least Squares and Artificial Neural Networks)

  • 한인수;신현길
    • Korean Chemical Engineering Research
    • /
    • 제53권2호
    • /
    • pp.236-242
    • /
    • 2015
  • 고분자전해질 연료전지 스택의 성능 및 주요 운전 변수를 예측하기 위해 부분최소자승법과 인공신경망의 두 가지 데이터 기반 모델링 기법을 제시한다. 30 kW급 고분자전해질 연료전지 스택 실험으로부터 확보한 데이터를 사용하여 부분최소자승 및 인공신경망 모델들을 구성한 후 각 모델의 예측 성능 및 계산 시간을 비교하였다. 모델의 복잡성을 줄이기 위해 부분최소자승법에 기초한 VIP(Variable Importance on PLS Projections) 선정기준을 모델링 절차에 포함하여, 초기 입력변수의 집합으로부터 모델링에 필요한 입력변수들을 선정하였다. 모델링 결과, 인공신경망이 스택의 평균 셀전압과 캐소드(cathode) 출구 온도를 예측하는데 있어서, 부분최소자승법 보다 우수한 성능을 보였다. 그러나 부분최소자승법 또한 입력변수와 출력변수 간에 선형적 상관관계만을 모델링 할 수 있음에도 불구하고 비교적 만족할 만한 예측 성능을 나타냈다. 모델의 정확도와 계산속도의 요구조건에 따라 두 모델링 기법은 고분자전해질 연료전지의 설계 및 운전 분야의 성능 예측, 온라인 및 오프라인 최적화, 제어 및 이상 진단을 위해 적용될 수 있을 것으로 판단된다.

설마천유역 혼효림에서 실측된 증발산과 토양수분을 이용한 SWAT모형의 적용성 평가 (Evaluation of Evapotranspiration and Soil Moisture of SWAT Simulation for Mixed Forest in the Seolmacheon Catchment)

  • 조형경;이지완;신형진;박근애;김성준
    • 한국농림기상학회지
    • /
    • 제12권4호
    • /
    • pp.289-297
    • /
    • 2010
  • 국내 수문관측자료의 부족으로SWAT(Soil Water Assessment Tool) 모형의 적용성 평가는 대부분 유출자료만을 사용하여 이루어진다. 본 연구는 실측된 여러 수문자료가 SWAT수문모형의 불확실성 및 오차의 감소를 위해 어떻게 이용될 수 있는 지에 대하여 알아보고자 하였다. 이를 위해 전형적인 산지 유역인 설마천 유역을 대상으로 준분포형 장기강우유출모형인 SWAT 모형을 적용하여 수문성분의 특성을 살펴보았다. 먼저 모형의 입력자료인 기상자료 및 지형자료를 획득하여 구축하였고, 모형의 검 보정 위하여 유출, 증발산, 토양수분 실측자료를 획득하였다. SWAT 모형은 유츨량, 증발산, 토양수분 자료가 동시에 측정된 2007년 자료를 사용하여 보정된 후, SWAT 모형의 모의값은 유출량은 2003~2008년, 증발산과 토양수분은 2008년의 관측값과 비교, 분석한 뒤 전체적인 검증을 통해 모형의 적용성 평가를 실시하였다. 유출량의 검 보정 이용한 모의결과보다 다른 실측자료를 이용한 모의결과가 신뢰성이 높게 나타났다(결정계수($R^2$) 상향: 유출량은 0.72에서 0.76, 토양수분은 0.49에서 0.59, 증발산은 0.52에서 0.59). 유역의 실제적인 상황을 근접하게 모의하기 위해서는 다른 수문성분의 정확하고 신뢰성 있는 자료의 구축과 적용이 매우 중요하다고 판단된다.

미래의 한국의 환경규제여건에 따른 2001년도의 원자력과 석탄화력 발전단가비교 -민감도와 불확실도 분석- (Power Generation Cost Comparison of Nuclear and Coal Power Plants in Year 2001 under Future Korean Environmental Regulations -Sensitivity and Uncertainty Analysis-)

  • Lee, Byong-Whi;Oh, Sung-Ho
    • Nuclear Engineering and Technology
    • /
    • 제21권1호
    • /
    • pp.18-31
    • /
    • 1989
  • 대기오염의 제어가 발전 단가에 미치는 영향을 분석하기 위하여 전산 모델이 개발 되었다. POGEN은 석탄 화력 발전소에 대해 대기오염 제어 비용을 가산한 균등화 발전 단가를 계산한다. 부 프로그램 Pollution은 대기 오염 제어 비용을 가산한 지배 방정식을 사용하여 총 자본 비용과 변동비용을 계산한다. 이 비용은 균등화 발전 단가를 계산하는 부 프로그램 GENeration의 추가 입력으로 사용된다. 탈황설비의 직접 비용에 대한 Pollution을 이용한 결과는 경험이 풍부한 선진국에서 발간된 비용 자료로써 검증하였다. 2001년의 전력 생산비용은 석탄화력발전소에 적용된 세 가지의 규제 시나리오에 의해 추정되었다. 입력 변수의 중요도와 미래 발전소에 대한 입력 변수에 포함된 불확실성 때문에 생기는 불확실도의 전파를 검토하기 위해 Latin Hypercube Sampling과 Multiple Least Squares 방법을 사용하여 민감도 분석과 불확실도 분석을 수행하였다. 가장 민감한 입력 변수는 원자력, 화력 공히 할인률이다. 배출가스제어 비용으로서 9-11 mills/kWh 정도가 추가되어야 한다. 이 비용은 전력 생산비용의 거의 20 퍼센트가 되고, 이에 해당하는 투자비는 1GW 용량의 석탄 화력발전소 초기 투자비용의 40%가 될 것이다. 원자력 발전에 대한 단가는 90퍼센트의 신뢰도로써 32.6-65.9, 석탄 화력에 대해서는 45.5-60.5 mills/kWh가 되며, 엄격한 규제 분위기 하에서는 원자력이 95%의 신뢰도로써 유리할 것이 전망된다.

  • PDF

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.

탄소성 균열개시조건에 대한 원주방향 관통균열 배관의 부분안전계수 계산 (Estimates of Partial Safety Factors of Circumferential Through-Wall Cracked Pipes Based on Elastic-Plastic Crack Initiation Criterion)

  • 이재빈;허남수
    • 대한기계학회논문집A
    • /
    • 제38권11호
    • /
    • pp.1257-1264
    • /
    • 2014
  • 최근 제4세대 원자로의 기기 최적설계를 위해 목표파손확률 기반 설계기법에 대한 연구가 활발히 진행되고 있다. 시스템기반코드(System-Based Code, SBC)가 대표적인 예로 설계 혹은 평가 결과는 부분안전계수(Partial Safety Factor, PSF)의 형태로 도출된다. 따라서 부분안전계수는 가동 기간 중 목표파손확률 기반 설계 및 평가를 위한 핵심 요소 가운데 하나이다. 본 연구에서는 특정 목표파손확률 하에서 원주방향 관통균열이 존재하는 배관의 탄소성 균열개시 조건에 대한 부분안전계수 계산 기법을 정립하고 각 평가 인자가 균열개시에 미치는 중요도를 정량적으로 평가하였다. 균열 배관의 J-적분은 GE/EPRI법과 참조응력법으로 계산하였으며, 부분안전계수는 일차 및 이차신뢰도지수법으로 계산하였다. 또한 재료물성치의 통계적 분포 특성이 미치는 영향도 함께 평가하였다.

농업용(전작 및 답작용) 지하수 이용량 추정을 위한 회귀나무 모형의 적용 (Application of Regression Tree Model for the Estimation of Groundwater Use at the Agricultural (Dry-field Farming and Rice Farming) Purpose Wells)

  • 김규범;황찬익
    • 지질공학
    • /
    • 제29권4호
    • /
    • pp.417-425
    • /
    • 2019
  • 농업용 지하수 이용은 국내 지하수 이용량의 51.8%를 차지하고 있어 정확한 이용량 산정은 지하수의 효율적 정책 추진을 위하여 중요하다. 본 연구에서는 370개 관정의 이용량 실측 자료를 토대로 회귀나무 모형을 적용한 농업용(전작 및 답작용) 관정의 지하수 이용량의 산정 기법을 개발하고자 하였다. 모델의 입력 변수는 우물의 심도, 토출관 구경, 양수능력 등 3개가 유의한 것으로 평가되었으며, 모델에서의 각 변수의 중요도는 우물의 심도가 75%, 토출관 구경이 17%, 양수능력이 8%로 나타났다. 회귀나무 모형에 의한 농업용(전작 및 답작용) 관정의 일 이용량은 실측 이용량과 매우 유사한 것으로 평가되었으며, 기존의 국토교통부에서 제시한 추정식에 비하여 실측 이용량에 보다 근사한 것으로 나타났다. 향후 추가적인 실측 표본 자료를 확보하여 본 방법을 보완, 적용한다면 지하수 이용량 통계의 신뢰도가 크게 향상될 것으로 기대된다.