• 제목/요약/키워드: 유의수준 왜곡

검색결과 34건 처리시간 0.017초

Quantile 회귀분석을 이용한 극대강수량 자료의 경향성 분석 (Trend Analysis of Extreme Precipitation Using Quantile Regression)

  • 소병진;권현한;안정희
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.815-826
    • /
    • 2012
  • 기존 Ordinary Regression (OR) 방법을 이용한 경향성 분석은 경향성을 과소평가하는 문제점을 나타낸다. 이러한 점에서 본 연구에서는 자료의 정규분포 가정과 평균을 중심으로 경향성 평가가 이루어지는 기존 Ordinary Regression (OR) 방법을 개선한 Quantile Regression (QR) 방법을 제안하였다. 본 연구에서는 64개 강우 관측지점의 연 최대 극대강수량 자료에 대하여 QR 방법과 OR 방법에 대하여 통계적 성능을 평가하였다. QR 방법의경향성 분석결과 47개 지점에서 5% 오차수준 내에서 t-검정을 통과한 반면 OR 방법에서는 13개 지점 만이 통계적 유의성을 가지는 것으로 나타났다. 이는 OR 방법이 자료의 평균을 중심으로 경향성을 평가하는 기법인데 반해 QR은 자료의 다양한 분위에서 경향성을 평가함으로써 극대 및 극소 부분에서의 경향성을 보다 유연하게 감지하는 이유로 판단된다. QR 방법을 통한 경향성 평가는 평균 중심의 해석문제점을 개선할 수 있으며 자료가 정규분포를 따르지 않거나 왜곡된 분포형태를 갖는 자료의 수문학적 경향성 평가에 유용하게 사용될 수 있을 것으로 판단된다.

효과적인 기업부도 예측모형을 위한 ROSE 표본추출기법의 적용 (Application of Random Over Sampling Examples(ROSE) for an Effective Bankruptcy Prediction Model)

  • 안철휘;안현철
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.525-535
    • /
    • 2018
  • 분류 문제에서 특정 범주의 빈도가 다른 범주에 비해 과도하게 높은 경우, 왜곡된 기계 학습을 유발할 수 있는 데이터 불균형(imbalanced data) 문제가 발생한다. 기업부도 예측 문제도 그 중 하나인데, 일반적으로 금융기관과 거래하는 기업들의 부도율은 대단히 낮아서, 부도 사례보다 정상 사례의 빈도가 월등히 높은 데이터 불균형 문제가 발생하고 있다. 이러한 데이터 불균형 문제를 해결하기 위해서는 적절한 표본추출 기법이 적용될 필요가 있으며, 지금껏 소수 범주 데이터를 복원 추출함으로써 다수 범주 데이터와 비율을 맞추어 데이터 불균형을 해결하는 오버 샘플링(oversampling) 기법이 주로 활용되어 왔다. 그러나 전통적인 오버 샘플링은 과적합화(overfitting)가 발생할 위험이 높아질 수 있는 단점이 있다. 이러한 배경에서 본 연구는 효과적인 기업부도 예측 모형 학습을 위한 표본추출 기법으로 2014년에 Menardi와 Torelli가 제안한 ROSE(random over sampling examples) 기법을 제안한다. ROSE 기법은 학습에 사용될 사례를 반복적으로 새롭게 합성하여 생성(synthetic generation)하는 기법으로, 과적합화 문제를 회피하면서도 분류 예측 정확도 개선에 도움을 줄 수 있다. 이에 본 연구에서는 ROSE 기법을 가장 성능이 우수한 이분류기로 알려진 SVM(support vector machine)과 결합하여 국내 한 대형 은행의 기업부도 예측에 적용해 보고, 다른 표본추출 기법들과의 비교연구를 수행하였다. 실험 결과, ROSE 기법이 다른 기법에 비해 통계적으로 유의한 수준으로 SVM의 예측정확도 개선에 기여할 수 있음을 확인하였다. 이러한 본 연구의 결과는 부도예측 외에 다른 사회과학 분야 예측문제의 데이터 불균형 문제 해결에도 ROSE가 우수한 대안이 될 수 있다는 사실을 시사한다.

유전적 다양성이 고려되지 않은 어미 관리에 의한 양식 넙치(Paralichthys olivaceus)의 유전적 다양성의 변화 (Genetic Variability of Farmed Olive Flounder (Paralichthys olivaceus) Populations Managed with no Consideration of Genetic Diversity)

  • 노재구;김현철;박철지;이정호;김종현;이미숙;김우진;김경길;명정인
    • 한국어류학회지
    • /
    • 제20권4호
    • /
    • pp.248-254
    • /
    • 2008
  • 우리나라의 주요 양식 대상종인 넙치에 있어 유전적 조성에 대한 고려없이 구성된 양식 넙치 어미 집단에서 세대의 경과에 따른 집단의 유전적 다양성의 변화를 알아보기 위하여 총 8개의 microsatellite DNA markers를 이용하여 분석하였다. 동일한 수정란 생산업체에서 2003년에 생산된 양식 넙치와, 동일한 집단내에서 생산된 넙치로 어미 그룹이 완전히 교체된 2006년 및 2007년에 생산된 넙치 집단을 비교한 결과, 대립유전자 수와 이형접합기대치의 비교에서 2003년산 집단의 경우 9.75개와 0.796에서 2006년 7.78개와 0.785로 유전적 다양성이 다소 감소되는 경향이었다. 또한 대립유전자의 빈도에 있어서도 몇몇 대립유전자의 경우 소실되거나 빈도에 변화를 보이는 등 왜곡되어 나타났다. 그러나 여러 가지 다양성 지표들에서 수치상 감소를 나타내고 있는 이러한 결과들은 비록 유의적인 수준에서 유전적 다양성의 축소라고는 판단되지 않지만 양식 넙치 집단이 HWE에 어긋나 있어 세대가 진행될수록 집단의 유전적 다양성은 감소될 것으로 예상되었다.

원주지역 중학생들의 성별에 따른 식행동과 신체만족도 및 체중조절 관심도에 영향을 미치는 변인 (Dietary Behaviors, Body Satisfaction and Factors Affecting the Weight Control Interest According to Gender of Middle School Students in Wonju Area)

  • 김복란;김윤선
    • 한국식품영양과학회지
    • /
    • 제39권9호
    • /
    • pp.1295-1304
    • /
    • 2010
  • 본 연구는 원주지역 중학생 446명을 대상으로 성별에 따른 비만도, 식행동 및 신체만족도, 그리고 체중조절 관심도에 영향을 미치는 변인을 조사하였으며 그 결과는 다음과 같다. 남학생의 평균 신장과 체중은 각각 $164.8{\pm}8.3\;cm$$55.5{\pm}12.3\;kg$이었고, 여학생은 $158.8{\pm}5.0\;cm$$48.7{\pm}7.4\;kg$으로 나타났으며, 평균 BMI는 남학생과 여학생이 각각 20.3과 19.3으로 나타났다. 하루 식사 중 세 끼를 다 먹는 경우는 남녀학생 모두 69.7%로 나타났으며, 식사를 거르는 경우는 남녀학생 모두 아침결식율(43%)이 가장 높은 것으로 나타났다(p<0.01). 간식은 거의 대부분이 하루에 1번 이상 섭취(95.5%)하고 있었는데, 가공식품 구매 및 선택 시 영양표시를 읽는 지의 여부에 관해 '읽지 않는다'가 73.1%로 나타나 거의 대부분의 학생들이 영양표시를 읽지 않고 가공식품을 선택하는 것으로 나타났다(p<0.05). 식이섭취태도 전체점수는 여학생이 $35.08{\pm}5.91$점, 남학생이 $33.81{\pm}5.45$점으로 여학생이 남학생보다 높게 나타났는데(p<0.01), 이는 남학생이 여학생보다 고열량 및 지방이 많이 함유된 식품을 선호하였기 때문인 것으로 생각된다. 식이자기효능감의 전체점수는 여학생이 남학생보다 높게 나타났으나 유의적인 차이는 없었다. 식이장애증상 전체점수는 여학생이 남학생보다 높은 것으로 나타났으며(p<0.01), 조사대상자의 87.2%가 정상군으로, 12.8%가 식이장애가 있는 것으로 나타났으나 성별에 따른 유의적인 차이는 없었다. 그러나 남학생의 식이장애 위험군은 다른 연구에 비해 매우 높은 수준을 나타내었다. 신체만족도는 여학생이 $28.00{\pm}5.52$점, 남학생이 $30.16{\pm}5.08$점으로 여학생이 남학생보다 신체만족도가 낮은 것으로 나타났다(p<0.001). 각 변인들 간의 상호관련성을 알아본 결과, 식이자기효능감은 식이섭취태도와 양의 상관관계(r=0.398, p<0.01)를 나타내었으며, 신체만족도는 식이섭취태도와 양의 상관관계(r=0.117, p<0.05)를, 식이장애증상(r=-0.104, p<0.05)과는 음의 상관관계를 나타내었다. 또한 성별, BMI, 식이섭취태도 및 식이자기효능감, 식이장애증상 그리고 신체만족도와 같은 변인들이 체중조절 관심도에 미치는 영향을 알아보기 위하여 다중회귀분석을 실시한 결과, 여러 독립변인들은 체중조절 관심도를 33.3% 설명해 주고 있으며, 신체만족도($\beta=-0.387$, p<0.001)가 체중조절 관심도에 영향을 미치는 가장 중요한 변인으로 작용하였다. 이상의 결과에서 청소년들이 영양적으로 균형 잡힌 식사방법과 자신의 신체에 대한 올바른 인식을 형성할 수 있는 체계적인 영양교육 프로그램이 청소년들의 식행동 및 신체만족도를 높일 수 있도록 개발된다면 청소년들의 건강한 식사패턴과 이상체형에 대한 왜곡된 인식을 개선해 나가는데 큰 도움이 될 것으로 생각된다.