• 제목/요약/키워드: 변수 선별

검색결과 235건 처리시간 0.024초

부분선형모형에서 LARS를 이용한 변수선택 (Variable selection in partial linear regression using the least angle regression)

  • 서한손;윤민;이학배
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.937-944
    • /
    • 2021
  • 본 연구는 부분선형모형에서 변수선택의 문제를 다룬다. 부분선형모형은 평활화모수 추정과 같은 비모수 추정과 선형설명변수에 대한 추정의 문제를 함께 포함하고 있어 변수선택이 쉽지 않다. 본 연구에서는 빠른 전진선택법인 LARS 를 이용한 변수선택법을 제시한다. 제안된 방법은 LARS에 의하여 선별된 변수들에 대하여 t-검정, 가능한 모든 회귀모형 비교 또는 단계별 선택법을 적용한다. 제안된 방법들의 효율성을 비교하기 위하여 실제데이터에 적용한 예제와 모의실험 결과가 제시된다.

매개변수 추정방법의 개선을 위한 전문가 시스템의 개발 (Development of an Expert System to Improve the Methods of Parameter Estimation)

  • 이범희;이길성
    • 한국수자원학회논문집
    • /
    • 제31권6호
    • /
    • pp.641-655
    • /
    • 1998
  • 급속한 도시화의 영향에 따른 수자원 및 환경문제를 보다 효율적으로 해결하기 위하여 전문가 시스템의 개발 및 적용방안을 제안하였다. 이에 따라 도시유역의 유출 및 수질에 영향을 미치는 주요 매개변수들을 선별하고 민감도 분석 등을 통해 그 거동특성을 제시하였으며, 이러한 특성들을 바탕으로 효과적 매개변수 결정법칙 등을 제안하였다. CLIPS 6.0을 적용하여 ‘사실’과‘규칙’을 기본으로 한 전문가 시스템 ESPE를 개발하였으며, 이를 안양천 유역에 적용하였다. 결과적으로 유출관련 매개변수들의 추정결과를 매우 적용성이 높았으나, 수질관련 매개변수들의 추정결과는 그 모의과정의 복잡성과 의사결정 규칙의 부족 등으로 인하여 제시된 방법들에 대한 개선의 필요가 있음을 보여주었다.

  • PDF

원자력시설 해체부지의 재이용을 위한 방사선학적 리스크 평가모델 (A Mathematical Model to Evaluate the Radiological Risks for the Reuse of Decommissioning Site)

  • 정재학
    • 방사성폐기물학회지
    • /
    • 제4권4호
    • /
    • pp.353-363
    • /
    • 2006
  • 원자력시설 해체부지를 재이용하는 과정에서 유발될 수 있는 방사선학적 리스크를 사전에 선별하기 위한 목적으로 단순화된 방사선량 평가모델을 개발하고, 이를 Microsoft $Excel{\circledR}$ 스프레드시트와 내장된 Visual Basic 및 마크로 기능을 활용하여 기능별로 모듈화된 평가도구를 구현하였다. 이와 함께 부지 특성자료가 불충분할 경우 신속한 사전평가를 위해 적용할 수 있는 일련의 입력변수 값 목록을 제안하였다. 동일한 조건에서 이 연구에서 개발된 평가도구를 이용해 유도한 사전 선별준위가 RESRAD Ver.6.2를 이용해 계산된 유도농도지침한계 및 독일 방사선방호령에 규정된 핵종별 부지 재이용 기준농도를 합리적으로 근사할 수 있음을 확인하였다.

  • PDF

L, LH, LQ-모멘트의 비교와 GEV 분포의 매개변수 추정 (Comparison of L, LH, LQ-moments and Parameter Estimation of GEV Distribution)

  • 이길성;진락선
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1137-1141
    • /
    • 2004
  • 본 연구에서는 Probability Weighted Moments의 새로운 선형조합기법인 LQ-moments를 이용하여 GEV 분포의 매개변수를 추정하고 L, LH, LQ-moments를 사용하여 뉴욕주의 Donnattsburg에 위치한 Independence River의 홍수량을 빈도 해석하였다. LH, LQ-moments가 제시된 근본적인 이유는 L-moments가 극치값에 내해 지나치게 민감한 단점을 보완하기 위해서인데, 이번 연구의 결과에 의하면 오히려 LH, LQ-moments가 극치값에 대해 민감하게 반응하여 부정확한 결과가 도출되었다. 그러므로 항상 LH, LQ-moments가 L-moments의 대안이 될 수 있는 것은 아님을 알게 되었다. 그리고 수학적 유도에서 L, LH, LQ-moments는 좀더 쉽고 간편한 메개변수 추정을 위해 Probability Weighted Moments의 선형조합을 통해 고안되었다는 공통점을 가지고 있지만, 이 점을 제외한 나머지 부분의 수식 유도에서는 서로 많은 차이가 있어서 지역적인 특성과 확률분포형의 특성을 고려하여 L, LH, LQ-moments 중에서 선별 사용해야 할 것이다.

  • PDF

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.35-47
    • /
    • 2020
  • 박스 오피스 예측은 영화 이해관계자들에게 중요하다. 따라서 정확한 박스 오피스 예측과 이에 영향을 미치는 주요 변수를 선별하는 것이 필요하다. 본 논문은 영화의 박스 오피스 예측 정확도 향상을 위해 다변량 시계열 데이터 분류와 주요 변수 선택 방법을 제안한다. 연구 방법으로 한국 영화 일별 데이터를 KOBIS와 NAVER에서 수집하였고, 랜덤 포레스트(Random Forest) 방법으로 주요 변수를 선별하였으며, 딥러닝(Deep Learning)으로 다변량 시계열을 예측하였다. 한국의 스크린 쿼터제(Screen Quota) 기준, 딥러닝을 이용하여 영화 개봉 73일째 흥행 예측 정확도를 주요 변수와 전체 변수로 비교하고 통계적으로 유의한지 검정하였다. 딥러닝 모델은 다층 퍼셉트론(Multi-Layer Perceptron), 완전 합성곱 신경망(Fully Convolutional Neural Networks), 잔차 네트워크(Residual Network)로 실험하였다. 결과적으로 주요 변수를 잔차 네트워크에 사용했을 때 예측 정확도가 약 93%로 가장 높았다.

라이브 커머스에서의 소비자 반응 요인 도출 : 소비자 생성 텍스트 데이터를 기반으로 (Identifying Consumer Response Factors in Live Commerce : Based on Consumer-Generated Text Data)

  • 박재형;이한솔;강주영
    • 정보화정책
    • /
    • 제30권2호
    • /
    • pp.68-85
    • /
    • 2023
  • 라이브 커머스의 방송 데이터를 수집하여 채팅 활성화 정도를 기준으로 방송을 분류하고, 방송 내의 소비자가 생성한 텍스트 반응 분포 데이터를 분석하였다. 국내 라이브 커머스 시장에서 가장 점유율이 높은 '네이버 쇼핑라이브'의 총 2,282개의 방송 가운데 시청자의 반응이 가장 활발하게 나타난 200개 방송을 선별하였으며, 그 가운데 시청자의 반응이 급격하게 증감하는 구간이 존재하는 방송을 최종적으로 선별하였다. 라이브커머스 시청 의도 및 참여 동기에 관한 기존 문헌의 변수들을 종합하여 연구 목적에 맞는 변수 테이블을 생성하였고, 이를 방송 내의 장치 및 이벤트에 대입하였다. 이를 통해 본 연구는 기존 연구들에서 발견된 소비자 반응에 관한 변수들이 방송 내의 어떤 요소에 의해 자극되는지를 확인하였으며, 라이브 커머스에 참여하는 소비자의 심리를 데이터를 통해 실증적으로 확인하였다.

Research on Selecting Influential Climatic Factors and Optimal Timing Exploration for a Rice Production Forecast Model Using Weather Data

  • Jin-Kyeong Seo;Da-Jeong Choi;Juryon Paik
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.57-65
    • /
    • 2023
  • 쌀 생산량 예측의 정확성을 높이기 위한 대다수의 연구는 모델의 정확도 증진에 초점이 맞춰져 있다. 이에 비해, 예측 모델을 적용할 대상 데이터 자체에 관한 연구는 상대적으로 미흡하다. 쌀 생산량 데이터에 동일한 종속변수와 예측 모델을 사용하여 다른 특성들로 구성된 두 부류의 데이터에 적용하면, 결과의 차이가 발생하는데 이때 어느 데이터 셋이 더 우수한지 판단하기는 어려운 일이다. 이러한 문제를 해결하기 위해, 예측 모델 적용 전에 데이터 내에서 예측 결과에 큰 영향을 미칠 가능성이 있는 특성들을 선별하고, 이를 중심으로 모델링을 수행하면, 데이터의 구성이 다르더라도 안정적인 예측 결과를 얻을 수 있을 것이다. 본 연구에서는 기상청의 종관기상관측(ASOS) 데이터를 활용하여, 쌀 생산량의 안정적이고 일관된 예측을 위해 데이터 구성 특성들의 조정을 통해 최적의 기반 변수를 선별하는 방법에 대해 제안한다. 본 연구의 결과는 향후 다른 연구에서 성능평가의 유용성을 높이는 데 기여할 것으로 기대한다.

Copula 함수를 이용한 호우사상의 빈도해석 산정 (Estimation of storm events frequency analysis using copula function)

  • 안희진;이문영;김시연;전설;안영민;정동화;박대룡
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.200-200
    • /
    • 2022
  • 본 연구에서는 총 강우량과 강우강도을 고려한 이변수 분석으로 연최대 호우사상을 선별하고, 두 변수를 Copula 함수로 결합하여 최적의 모델조합을 찾는 확률호우사상 산정 방법론을 제시하였다. 국내 69개 관측소의 2020년까지의 관측 자료를 대상으로 1mm 이하의 강우는 제거한 뒤, IETD(Inter-Event Time Definition) 12시간을 기준으로 강우자료를 독립적인 호우사상으로 분리하였다. 호우사상의 여러 특성 중 양의 상관관계를 갖는 총 강우량과 강우강도를 변수로 선택해 이변수 지수분포에 대입하였고, 각 지점의 연최대 호우사상 시계열을 생성하였다. 2변수 지수분포의 매개변수는 전체 기간과 연도별로 나누어 추정해 본 결과 연도별 변동성이 큰 것을 확인해 연도별 추정 방식을 선택하였다. 연최대 강우사상 시계열의 총 강우량과 강우강도는 극한 강우에 적용하는 확률분포형 중 Lognarmal, Gamma, Gumbel, GEV(Generalized Extreme Value), GPD(Generalized Pareto Distribution) 5가지를 사용하여 각각 CDF(Cumulative distribution Function) 값을 추정하였다. 계산된 CDF 값은 3가지 Copula 모형으로 결합해 joint CDF 값을 산출하였다. 총 75개의 모델조합 중 최적 모델을 찾기 위해 CVM(Cramer-von-Mises) 적합도 검정을 시행하였다. CVM의 통계량 Sn 값이 가장 작은 모델조합을 해당 지점의 최적 모델조합으로 선정하였다.

  • PDF

자동차 Door용 박판 알루미늄합금의 MIG 용접공정변수 최적화에 관한 연구 (A Study on Optimization of Welding Process Variables in MIG Welding of Aluminum Alloy Sheets for automotive door)

  • 이영기;한현욱;김재성;이보영;김철희
    • 대한용접접합학회:학술대회논문집
    • /
    • 대한용접접합학회 2009년 추계학술발표대회
    • /
    • pp.28-28
    • /
    • 2009
  • 최근 전세계적으로 유가 상승 및 배기가스 배출 저감과 관련된 각종 환경규제에 대응하기 위하여 선진 자동차회사들은 $CO_2$ 배출 저감 기술과 기존 내연기관 차량의 연비향상을 위해 엔진성능 개선, 구동시스템의 최적화, 차량 경량화, 공기저항 감소 등에 초점을 맞춰 차량의 연비향상과 배기가스 규제에 대응하고 있다. 특히, 자동차 중량의 30%를 차지하는 차체의 경량화는 엔진효율을 높여 자동차의 성능향상을 극대화시키고, 그로 인해 연비향상을 도모할 수 있으므로 환경오염 방지와 연료절감에 가장 적합하고 효과적인 방법이다. 이에 기존의 강재에 비해 비중이 낮으면서 유사한 강도와 내식성이 뛰어난 알루미늄 합금의 차체 적용에 대한 연구가 진행되고 있다. 본 연구에서는 자동차 Door에 알루미늄 합금(Al 5052)의 적용 가능성을 판단하기 위해 반응표면분석법(Response surface methodology)을 이용하여 저입열 Pulse MIG 용접 공정변수를 최적화하였다. 첫째, 저입열 Pulse MIG 용접에서 용접 공정 변수(용접전압, 용접속도, Gap)의 변화가 비드 형상에 미치는 영향에 대해 평가하였다. 요인분석법을 이용하여 용접 공정 변수와 비드 형상 변수와의 주효과와 교호작용효과를 분석하였고, 이를 통해 비드 형상 변수에 영향을 크게 미치는 용접 공정변수를 선별하여 다중회귀분석을 통해 용접 공정 변수 변화에 따른 비드형상 예측 회귀모델을 제안하였다. 둘째, 자동차 Door 생산 현장에서 박판 알루미늄 합금 겹치기 용접 이음부의 0~1 mm 갭 발생에 대해 강건한 용접조건을 제시하기 위해 반응표면법(Response surface methodology)을 이용하여 저입열 Pulse MIG 용접 공정 변수를 최적화하였고, 그 적용 가능성을 확인하였다.

  • PDF

수면무호흡증 예측을 위한 선별검사 개발 (Development of Screening Test for Prediction of Sleep Apnea Syndrome)

  • 이성훈;이희상;이정권;김경수
    • 수면정신생리
    • /
    • 제2권1호
    • /
    • pp.73-81
    • /
    • 1995
  • 연구목적 : 수면무호흡증 환자들은 수면다원검사를 통해 진단이 가능한데, 수면무호흡증이 의심되는 모든 환자를 검사의뢰하기에는 현실적으로 어려움이 많다. 따라서 저자들은 수면다원검사와 치료가 필요한 수면무호흡증 환자를 선별할 수 있는 간단한 검사 방법을 찾고자 본 연구를 시행하였다. 연구방법 : 코골기와 수면무호흡증으로 인해 수면 다원검사가 의뢰된 140명의 환자를 대상으로 하루 밤 동안 1회 수면다원검사를 실시하였다. 수면무호흡증의 증상은 18개의 문항으로 된 설문지로 평가하였고, 우울증은 Zung's 척도, 졸리움증은 Stanford Sleepiness Scale(SSS), 불면증은 이성훈 등(14)이 개발한 불면증척도 등을 이용하였다. 그외 혈압, 키, 체중, 목둘레 등을 측정하였고, 코골기의 가족력, 얼마나 오랫동안 코골기가 있었는지, 술, 담배를 어느 정도 하는지를 조사하였으며, digit symbol test, trail making B test 등의 인지기능검사를 시행하였다. 그리고 이 변수들과 호흡장애지수 간의 상관관계를 SPSS-PC 의 Pearson's correlation 으로 조사하였고, 통계적으로 유의하게 나온 변수들을 가지고 판별분석을 이용하여 호흡장애지수에 대한 이 변수들의 판별계 수를 구하고, 그것으로 판별식을 만들었다. 또한 판별분석상 호흡장애지수에 영향을 미치는 것으로 밝혀진 변수들에 대해 각각 기준점을 정하고, 호흡장애지수 20을 기준으로 하여 선별검사의 민감도를 조사하였다. 연구결과 : 판별분석결과 호흡장애지수에 영향을 미치는 것으로 나타난 6가지 변수 즉, 목둘레, 수면전 수축기혈압, 음주정도, 자다가 숨을 멈추는 정도, 잠잘 때 입안이 마르는 정도, 수면무호흡 설문지 점수를 가지고 판별식을 만들어 보았을 때, 호홉장애지수 20이상인 환자를 92.8%의 민감도로 찾아낼 수 있었다. 또한, 목둘레 40cm이상, 수축기 혈압 125mmHg 이상, 잦은 음주, 수면중 잦은 숨멈춤, 수면중 잦은 구갈증, 코골기 및 수면무호흡증 설문지 총점수 35점 이상 중 3개 이상 해당시 호홉장애지수 20이상인 환자를 87.6%의 민감도로 찾을 수 있었다. 그리고, 목둘레 40cm이상, 수축기 혈압 125mmHg이상, 잦은 음주, 체중 80kg이상 중 2가지 이상 해당 시 호흡장애지수 20 이상인 환자를 83.5%의 민감도로 찾을 수 있었다. 결론 : 외래에서 간단히 시행할 수 있는 설문지조사와 이학적검사를 이용한 위의 방법으로 호흡장애 지수 20이상인 환자를 높은 민감도로 구별해 낼 수 있었다.

  • PDF