• 제목/요약/키워드: 확률변수 간 상관성

검색결과 47건 처리시간 0.025초

다변량 분석 기법을 활용한 강우 지역빈도해석 (Regional Rainfall Frequency Analysis by Multivariate Techniques)

  • 남우성;김태순;신주영;허준행
    • 한국수자원학회논문집
    • /
    • 제41권5호
    • /
    • pp.517-525
    • /
    • 2008
  • 지역빈도해석을 통한 확률강우량 산정 결과는 수문학적으로 동질한 지역의 구분 결과에 따라 달라진다. 지역을 구분할 때에는 강우에 영향을 미치는 다양한 변수들이 사용될 수 있다. 변수의 유형과 개수가 지역 구분의 효율성을 좌우하기 때문에 활용 가능한 모든 변수들의 정보를 요약할 수 있는 변수들을 선택하는 것이 지역 구분의 효율성 면에서 유리하다고 할 수 있다. 이런 면에서 지역 구분의 효율성을 증대시킬 목적으로 다변량 분석 기법이 활용될 수 있다. 본 연구에서는 변수들 간의 상관관계를 바탕으로 모든 변수가 표현하는 정보를 대표할 수 있는 더 적은 수의 변수를 선정하는 기법으로 Procrustes analysis를 활용하였다. 이 기법을 활용하여 42개의 강우 관련 변수들을 21개로 줄일 수 있었다. 선정된 변수들을 바탕으로 요인분석을 수행하여 5개의 요인을 추출하였고, 이를 근거로 군집해석 기법인 fuzzy-c means 기법을 활용하여 지역을 구분하였다. 68개 강우 관측 지점을 대상으로 지역을 구분한 결과 6개의 지역으로 구분되었다. 6개의 지역에서 GEV 분포가 적합한 것으로 나타났고, 3변수 대수정규 분포와 generalized logistic 분포가 5개 지역에서 적합한 것으로 나타났다. 기존 연구 결과와의 비교를 위해 generalized logistic 분포를 바탕으로 지점빈도해석, 홍수지수법, 지역형상추정법을 적용하여 확률강우량을 산정하였다.

마케팅 지향성이 중소기업 경영성과에 미치는 영향: 충남지역을 중심으로 (Effects of Marketing Orientation on Management Performance of Small and Medium-sized Enterprises: Focusing on the Chungnam Area)

  • 배상목
    • 산업진흥연구
    • /
    • 제8권3호
    • /
    • pp.1-7
    • /
    • 2023
  • 본 연구는 마케팅 지향성이 중소기업 경영성과에 미치는 영향에 관한 실증적 연구로 충남지역을 대상으로 설문지 총 94부를 연구 분석 자료로 활용하였다. 분석결과, 첫째, 마케팅 지향성 중 기업 지향성은 성장성(β=.405)과 고객만 족(β=.330)에 유의한 영향을 미치는 것으로 나타났다. 기업 지향성의 고객만족은 낮은 수치를 보이고 있어 개선의 필요성이 있다. 둘째, 고객만족과 성장성은 .746으로 높은 상관계수의 수치로 나타났고, p<.01 이상의 유의한 상관관계를 보이고 있어 변수들 간의 상관관계는 적합한 것으로 확인되었다. 셋째, 조사대상자의 연령과 근무경력은 고객만족에 집단 간 유의한 차이가 있는 것으로 확인하였다. 유의확률은 .006으로 통계적으로 유의한 결과를 보였다. 본 연구는 마케팅 지향성과 경영성과 연구로 중소기업의 경영 전략과 실제적인 성과 향상을 위한 기초자료를 제공하는데 의미가 있다.

미국 대통령 예비선거에 적용한 시공간 의존성을 고려한 자기로지스틱 회귀모형 연구 (Autologistic models with an application to US presidential primaries considering spatial and temporal dependence)

  • 염호정;이원경;손소영
    • 응용통계연구
    • /
    • 제30권2호
    • /
    • pp.215-231
    • /
    • 2017
  • 미국 대통령 예선은 선거인단이 시차를 두고 여러 회에 걸쳐 진행되는 특징이 있음에도 많은 연구가 진행되지 않았다. 본 연구에서는 다양한 자기로지스틱 모형을 통해 미국 대통령 예비선거 결과와 사회경제적 변수간의 시공간 의존성의 관계를 파악하고자 한다. 2016년 데이터에 적용한 분석결과 각 카운티의 노년층, 흑인, 여성 그리고 히스패닉 인구 비율이 높은 지역일수록 힐러리 클린턴을 지지할 확률이 높은 것으로 나타났다. 또한, 주변 카운티에서 많은 지지를 받은 후보가 이웃 지역에서도 많이 지지를 받을 확률이 높고 이전 선거에서 많은 지지를 받는 것과 다음 선거 지역의 결과 간의 상관관계도 확인되었다. 시공간 의존성을 알아보기 위한 모형 중에서 슈퍼화요일의 선거 결과가 이후 선거와 관련이 있다고 가정한 모형의 설명력이 가장 높은 것으로 판명되었다.

확률적 reduced K-means 군집분석 (Probabilistic reduced K-means cluster analysis)

  • 이승훈;송주원
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.905-922
    • /
    • 2021
  • 라벨 없이 진행되는 비지도 학습 중 하나인 군집분석은 자료에 어떤 그룹이 내포되어 있는지 사전 지식이 없을 경우에 군집을 발굴하고, 군집 간의 특성 차이와 군집 안에서의 유사성을 분석하고자 할 때 유용한 방법이다. 기본적인 군집분석 중 하나인 K-means 방법은 변수의 개수가 많아질 때 잘 동작하지 않을 수 있으며, 군집에 대한 해석도 쉽지 않은 문제가 있다. 따라서 고차원 자료의 경우 주성분 분석과 같은 차원 축소 방법을 사용하여 변수의 개수를 줄인 후에 K-means 군집분석을 행하는 Tandem 군집분석이 제안되었다. 하지만 차원 축소 방법을 이용해서 찾아낸 축소 차원이 반드시 군집에 대한 구조를 잘 반영할 것이라는 보장은 없다. 특히 군집의 구조와는 상관없는 변수들의 분산 또는 공분산이 클 때, 주성분 분석을 통한 차원 축소는 오히려 군집의 구조를 가릴 수 있다. 이에 따라 군집분석과 차원 축소를 동시에 진행하는 방법들이 제안되어 왔다. 그 중에서도 본 연구에서는 De Soete와 Carroll (1994)이 제안한 방법론을 확률적인 모형으로 바꿔 군집분석을 진행하는 확률적 reduced K-means를 제안한다. 모의실험 결과 차원 축소를 배제한 군집분석과 Tandem 군집분석보다 더 좋은 군집을 형성함을 알 수 있었고 군집 당 표본 크기에 비해 변수의 개수가 많은 자료에서 기존의 비 확률적 reduced K-means 군집분석에 비해 우수한 성능을 확인했다. 보스턴 자료에서는 다른 군집분석 방법론보다 명확한 군집이 형성됨을 확인했다.

기능성 베이커리 구매동기가 소비자태도 및 구매의도에 미치는 영향 - 부산지역을 중심으로 - (Functional Bakery Impact on the Degree of Motivation to Purchase Consumer Attitudes and Buying Intention - Focused on Busan -)

  • 한상훈;김보성
    • 한국조리학회지
    • /
    • 제21권6호
    • /
    • pp.331-340
    • /
    • 2015
  • 본 연구에서는 기능성 베이커리 구매동기가 소비자태도와 구매의도에 미치는 영향요인들과 그 요인을 이용한 앞으로의 활용방안을 제시하고자 한다. 총 230부의 설문지를 배포하여 불성실하게 응답한 20부의 설문지를 제외한 나머지 210부의 유효한 설문지를 실증연구에 사용되었다. 조사 연구의 목적을 달성하기 위하여 통계프로그램 SPSS 18.0을 활용하여 빈도분석, 요인분석 및 신뢰도분석, 상관관계분석, 회귀분석을 실시하였다. 분석결과를 보면 구매동기에 대한 측정항목의 탐색적 요인분석 결과, 3개 요인으로 KMO 값은 0.735, 총분산비율 65,759%, 소비자태도에 대한 요인분석은 총분산비율 72.421%, KMO 값은 0.684로 나타났다. 구매의도에 대한 요인분석은 총분산설명력 67.139%, KMO 값은 0.683으로 나타났다. 변수들 간의 상관관계가 다른 변수에 의해 설명되는 정도가 좋게 분석되었고, 유의확률이 0.000으로 나타나 전반적으로 변수들 간의 상관관계는 유의적이다. 따라서 구매동기에 따른 소비자태도와 구매의도에 미치는 영향에 관한 가설은 부분 채택되었다.

ATP와 APC 간의 관련성 규명을 위한 최적의 변수변환법에 관한 연구 (A study on the optimal variable transformation method to identify the correlation between ATP and APC)

  • 문혜경;신재경;김양숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1465-1475
    • /
    • 2016
  • 안전한 급식을 위해서는 식중독사고와 연관성이 있는 미생물의 위해요소들이 실시간적으로 모니터링 되고 통제되어야 한다. 선진국에서는 실시간 위생 모니터링 도구로 ATP (adenosine triphosphate) Luminometer를 활용한 사례가 여러 건 보고되었다. ATP analyser는 ATP bioluminescence (생물발광성)의 원리를 이용하여 RLU (relatively light unit) 값으로 위생수준을 간접적으로 측정할 수 있게 해준다고 알려져 있다. 이에 국내 급식산업에서도 이를 활용할 수 있도록 조리도구들을 대상으로 일반세균수 (aerobic plate count; APC)와 RLU 간에 상관성이 존재하는지를 확인 할 필요성이 제기 되었다. 본 연구는 급식소의 조리도구 표면에 사전 처리없이 ATP (RLU)와 APC (CFU)를 측정하여 상관관계 존재 여부 파악 및 이들 관계의 최적인 모델을 찾아보고자 하였다. 이들에 대한 분석 결과를 조리도구별로 요약하면 다음과 같다. 도마, 칼, 국그릇 (스텐), 식판 (카보) 자료는 1차 변환의 로그변환이, 컵 자료는 2차 변환의 제곱근-역변환 (혹은 역-제곱근변환)이, 국그릇 (카보) 자료는 2차 변환의 제곱근-제곱근변환이 표준화 회귀계수 및 결정계수 $R^2$가 가장 좋게 나타났으나 식판 (스텐) 자료는 원자료, 1차 변환 및 2차 변환 모든 경우에서 정규성을 만족하지 못하여 이번 자료에서는 최적인 경우를 찾을 수가 없었다.

난류 거동이 점착성 부유사의 입도분포에 미치는 영향 (Effect of turbulent motion on size distribution of suspended flocs)

  • 변지선;손민우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.25-25
    • /
    • 2021
  • 점착성 유사는 비점착성 유사에 비해 1차입자의 크기가 작아 1차입자간의 점착력이 중요한 역할을 하는 유사를 말한다. 점착성 유사는 비점착성 유사에 비해 크기가 작아 입자의 전자기적 점착력의 영향을 무시할 수 없으므로 점착력으로 인해 입자들은 서로 응집하는 동시에 입자들 간의 충돌에 의하여 파괴되는 과정을 거친다. 이러한 응집과 파괴가 지속되는 일련의 과정을 응집현상이라 한다. 점착성 유사는 응집과정을 통해 일차입자보다 크기가 크며 수십 개에서 수천 개의 일차입자와 물의 덩어리인 플럭을 형성하게 된다. 흐름 내 존재하는 플럭의 응집현상에 가장 지배적인 영향을 미치는 인자로 난류 거동이 알려진 바 있다. 본 연구에서는 난류 거동에 따른 점착성 플럭의 입도분포 변화를 살펴보고자 하였으며, 점착성 유사 입도분포 모형을 개발하였다. 수치모형의 개발은 확률과정(또는 추계과정)의 개념을 바탕으로 한다. 점착성 유사의 응집현상을 구성하는 응집과정은 다양한 연구를 통해 메커니즘들이 규명된 것과 달리 파괴과정은 난류로 인해 발생하며 무작위한 것으로 여겨진다. 무작위한 플럭의 파괴과정을 확률과정으로 가정하고 매개변수 중 하나를 대수정규분포를 따르는 난수로 고려하였다. 개발된 모형의 검증은 연안지역에서 점착성 플럭의 거동을 측정한 연구결과와의 비교를 통해 수행하였으며, 흐름 유속의 연직분포와 유사 농도의 연직분포, 응집현상 이후 플럭의 평형크기와 입도분포가 모두 합리적으로 계산되는 것이 확인되었다. 더불어 모의 결과에서는 대수정규분포를 따르는 동일한 난수를 적용하였음에도 불구하고 하상으로부터 거리가 가까워짐에 따라 플럭입도분포가 단봉분포(Unimodal Distribution)와 이봉분포(Bimodal Distribution)가 모두 계산되는 것으로 나타났다. 이는 모형의 개발과정에서 플럭의 가능 최대 크기를 콜모고로브 길이규모로 제한한 것과 관련이 있다. 난류 흐름 내 존재하는 플럭의 크기가 응집현상을 통해 난류의 콜모고로브 길이규모까지 성장하는 경우, 난류의 전단응력이 급격하게 증가하여 파괴과정이 활발해지고 응집과정이 저하된다는 것은 널리 알려진 사실이다. 이러한 사실을 바탕으로 플럭의 가능최대 크기를 콜모고로브 길이규모로 제한하였으며, 하상으로부터의 거리에 따라 콜모고로브 길이규모의 변화로 인해 콜모고로브 길이규모 부근에서 하나의 최빈값이 추가로 나타나는 것으로 이해된다. 수치모의 결과로부터 얻어진 콜모고로브 길이규모와 입도분포 형태의 상관관계를 보다 정확하게 이해하기 위해 실측 자료들을 검토해 본 결과, 균질한 재료를 이용한 실험실 실험결과에서 플럭 이봉분포의 최빈값이 콜모고로브 길이규모와 일치하는 것이 확인되었다. 연안지역에서 측정을 수행한 자료들에서도 이봉분포 또는 다봉분포와 콜모고로브 길이 규모와의 상관성을 찾아볼 수 있었다.

  • PDF

도시숲 평가를 위한 경관생태학적 모형 개발 (A Landscape Ecological Model for Assessing the Korean Urban Forests)

  • 오정학;권진오;유주한;김경태
    • 한국환경생태학회지
    • /
    • 제24권2호
    • /
    • pp.178-185
    • /
    • 2010
  • 본 연구는 도시숲을 경관생태학적으로 해석하고 평가하기 위한 모형 개발과 적용을 통해 평가의 실효성을 검증하는 것을 목적으로 한다. 연구결과를 요약하면 다음과 같다. 평가지표는 층위구조, 입지상태, 활엽수구성비율, 식생구성종수 등 17개이다. 평가지표 간 상관관계분석 결과, 높은 관계성을 가진 것은 임령(X8)과 공간형성기간(X10)으로 상관계수가 0.684로 나타났으며, 부(-)의 상관성을 가진 지표들은 층위구조(X1)와 위험성(X13)으로 상관계수가 -0.412로 분석되었다. 평가모형구축을 위한 다중회귀분석 결과, 10개의 모형이 도출되었으며, 총 17개 변수 중 층위구조(X1), 식생구성종수(X4) 등을 제외한 입지상태(X2), 활엽수구성비율(X3) 등 10개의 변수만이 유의확률 95%에서 통계적으로 유의하였다. 모형의 회귀식과 합산평가 매트릭스법과 비교분석 결과, 모형 3의 회귀식이 정확도 91.7%로써 전체 10개 모형 중 가장 정확한 결과를 나타내는 것으로 분석되었다. 향후 지속적인 모니터링을 통해 평가모형에 대한 정확도 증진기법에 대한 연구도 함께 수행되어야 할 것이다.

이변량 가뭄빈도해석을 위한 Bayesian Copula 모델 개발 (A development of Bayesian Copula model for a bivariate drought frequency analysis)

  • 김진영;김진국;조영현;권현한
    • 한국수자원학회논문집
    • /
    • 제50권11호
    • /
    • pp.745-758
    • /
    • 2017
  • Copula 함수 기반의 모형들은 가뭄빈도해석 및 수문시계열분석 등 수문학적 모델링을 위해 다각적으로 활용되고 있다. 그러나 기존 연구에서는 Copula 함수 및 주변확률분포 매개변수에 대한 불확실성을 정량적으로 평가할 수 있는 모형의 개발 사례는 국내외적으로 미진한 실정이다. 이러한 점에서 본 연구에서는 기존 Copula 모형에 Bayesian 기법을 도입하여 매개변수의 불확실성을 평가할 수 있는 이변량 가뭄빈도해석 기법을 개발하였다. 본 연구에서는 우선적으로 모의자료를 대상으로 모형의 적합성을 평가하였으며, 모형 적용결과 가정한 매개변수를 정확하게 재추정하는 것을 확인할 수 있다. 최종적으로 기 개발된 Bayesian Copula 함수 기반의 이변량 가뭄빈도해석 모형을 한강유역에 적용하여 최근 2013~2015년에 가뭄 사상을 평가하였다. 서울, 경기 및 강원 지역에서 특히 가뭄이 심한 것으로 나타났으며, 대부분의 지역에서 결합재현기간이 100년을 상회하는 것으로 평가되었다. 본 연구를 통해 제안된 모형의 검증과정과 도출된 결과를 기준으로 판단해보면 가뭄자료의 분포특성 및 자료간의 상관성을 효과적으로 재현하는데 유리할 뿐만 아니라 매개변수의 불확실성을 평가할 수 있는 장점을 확인할 수 있었다.

일부 60~64세 농촌 인구에서 사회조직망과 고혈압 (Social Networks and hypertension in Some rural residents Aged 60-64)

  • 이충원;조희영;이미영;김귀연;박종원;강미정;서석권
    • 농촌의학ㆍ지역보건
    • /
    • 제23권2호
    • /
    • pp.229-242
    • /
    • 1998
  • 농촌의 전통적인 사회조직망을 반영해주는 변수들과 고혈압과의 관련성을 규명하기 위해 달성군 60-64세 노인을 대상으로 1996년 4월부터 9월까지 일대일 면담방법으로 조사를 실시하였다. 사회조직망을 반영해주는 변수로 결혼, 규칙적인 종교행사 참석, 친한 친구 및 친척 수, 구성원으로 있는 모임 수, 자식 및 손주 수 그리고 형제 수 등이 선정되었다. 고혈압은 고혈압력을 가진 자, 수축기 혈압이 100 mmHg 이상 또는 이완기 혈압이 95 mmHg 이상의 기준 중 최소한 하나의 기준을 만족하는 자로 정의하였다. 최종 자료 분석에 이용된 대상자는 총 958명으로 남자 440명, 여자 518명이었다. 남자의 당일지수 분석에서 친구가 없는 자에 비해 1-4명 가진 자가 0.43배 (95% 신뢰구간 0.19-0.96) 더 고혈압일 확률이 더 낮았으며, 자식이 0-1명인 자에 비해 2-3명, 4명, 5명 이상에 따라 비차비가 각각 0.21 (95% 신뢰구간 0.06-0.72), 0.14 (95% 신뢰구간 0.04-0.49), 0.24(95% 신뢰구간 0.07-0.82)로 고혈압일 확률이 더 낮았다. 반면에 여자에서는 통계적으로 유의한 사회조직망 구성 변수는 없었으며 손주가 없는 자에 비해 5-9명 가진 자의 비차비가 0.42 (95% 신뢰구간 0.17-1.02)로 경계성 유의성을 나타내었다. 연령, 교육수준, 비만도, 흡연 및 음주를 다중지수회귀분석으로 통제를 한 후 비차비의 변화를 관찰하였다. 남자에서 단일변수 분석에서처럼 친구 수와 자식 수가 통계적으로 유의한 비차비를 나타내었으며 단일연수 분석의 결과에 비해 상관의 강도가 더 높아졌다. 특히 친척 수는 통계적인 유의성을 획득하였으며 친척이 없는 자에 비해 가진 자는 0.44-0.50의 비차비를 나타내었다. 여자에서 대체로 단일변수 분석에서와 같은 결과를 나타내었으나 손주 수는 없는 자에 비해 5-9명을 가진 자의 비차비자 0.42에서 0.37 (95% 신뢰구간 0.14-0.95)로 상관성이 더 높아졌으며 통계적인 유의성 역시 경계선에서 유의성을 획득하였다. 이러한 결과는 사회조직망 중 일부 특정한 구성요소가 고혈압과 관련이 있으며 남녀간에 관련 구성 요소가 서로 차이가 남을 시사한다.

  • PDF