• 제목/요약/키워드: 확률표본

검색결과 469건 처리시간 0.036초

횡단조사자료 종단화의 가치와 한계: 경제활동인구조사와 도시가계조사 (A Longitudinal Look at Economically Active Population Survey and Household Income and Expenditure Survey: Potential and Limitation)

  • 이지연;김진
    • 한국인구학
    • /
    • 제29권3호
    • /
    • pp.159-188
    • /
    • 2006
  • 본 연구의 목적은 통계청에서 생산하고 있는 가구단위 조사 중 반복횡단조사로 설계된 경제 활동인구조사와 도시가계조사의 표본가구관리명부 자료를 이용하여 1998년에서 2002년까지 패널자료를 구축하고, 패널의 생존기간과 패널무응답 집단의 사회인구학적인 특성을 분석하는 것이다. 경활의 표본가구관리명부 자료를 월별 패널로 구축한 결과, 모두 응답한 가구는 46%였다. 반면에 분기별 패널로 구축된 도시가계에서 모두 응답한 가구는 34.%로 경활보다는 낮았다. 콕스비례위험모형을 통해 가구와 가구원의 사회경제적 특성이 패널의 생존기간에 미친 영향을 분석한 결과 개인차원에서는 연령, 가구차원에서는 주택소유형태에 따라 체계적인 표본소실이 발생하고 있었다. 개인의 특성별로는 여자보다는 남자가, 장년층보다는 젊은층의 패널소실 위험율이 높았다. 학력이 높을수록 패널소실확률도 함께 증가했으며, 취업자보다는 실업자의 패널소실 확률이 높았다.

확률신경회로망에 의한 냉연 강판 표면결함의 분류 (Classification of Surface Defects on Cold Rolled Strips by Probabilistic Neural Networks)

  • 송성진;김학준;최세호;이종학
    • 비파괴검사학회지
    • /
    • 제17권3호
    • /
    • pp.162-173
    • /
    • 1997
  • 최근 산업 발전에 따라 철강 제품의 수요 증가와 함께 품질의 고급화에 대한 요구도 점차 증가하고 있는데, 이러한 수요자의 요구에 부응하기 위해 철강업계는 냉연 강판 표면결함검출기(surface defect detector; SDD)를 도입 운용하고 있다. 그러나 현재 국내 철강 제조업체들이 보유하고 있는 상용 SDD는 결함의 검출에는 매우 효율적이지만 결함의 분류에는 아직 만족할만한 성능을 보여주지 못하고 있다. 그 이유는 SDD가 결함 분류를 위해 채택한 분류표분류기(classification table; CT)는 시험 표본의 모든 특징값들이 분류표의 범위 내에 있을 때만 결함의 분류를 정확히 수행하기 때문에 결함 분류 정확도가 낮을 뿐 아니라, 분류 법칙의 설정을 작업자의 수작업에 의존하고 있어 현장 적용을 더욱 어렵게 하고 있다. 이러한 단점을 극복하기 위해 본 연구에서 학습 표본으로부터 확률밀도함수를 추정하고 여기에서 분류 법칙을 자동적으로 결정하는 방법을 제시하였고, 강화분류표분류기(enhanced classification table; ECT)와 확률신경회로망분류기(probabilistic neural network; PNN)를 새롭게 제안하여 이들 분류기를 실제적인 문제에 적용하였다. 그 결과 ECT와 PNN 모두 결함 분류 성능을 획기적으로 높일 수 있는 좋은 방법이며, 특히 PNN은 아주 구별하기 어려운 결함도 구별해내는 능력이 있을 뿐 아니라, 병렬 처리 능력을 가지고 있기 때문에 다량의 데이터를 실시간으로 처리해야 하는 경우에 적용할 수 있는 매우 효율적인 분류기임을 확인하였다.

  • PDF

광양 - 묘도 지역의 통계학적인 풍속 추정 (Statistical Estimation of Wind Speed in the Gwangyang-Myodo Region)

  • 배용귀;한관문;이성로
    • 대한토목학회논문집
    • /
    • 제28권2A호
    • /
    • pp.197-205
    • /
    • 2008
  • 본 연구에서는 광양-묘도 지역의 평균풍속을 추정하기 위하여, 일별 최대 풍속과 해당 방향에 대한 결합분포확률의 통계학적 해석에 극한값 확률분포 모델이 사용되었다. 이를 위하여, 교량 가설지점 인근의 기상관측소에 대한 일별 최대풍속 및 해당풍향의 데이터로부터 각각의 관측소에 대한 일별 최대기록의 빈도를 조사하였으며, 16방위 및 전방위에 대한 년 최대풍속의 표본을 추출하였다. 이러한 풍속기록은 Gumbel 및 Weibull 분포모델에 적용하였으며, 모멘트방법 및 최소제곱법 등을 통해 모수를 추정하였다. 또한, PPCC 검사를 통해 분포모델 및 모수의 적합 여부를 검사하였다. 적합 여부가 판단된 모수로부터, 해당 관측소별로 데이터의 표본 크기 및 교량 가설지점으로부터의 거리에 대한 요소를 고려하여 16방위 및 전방위에 대한 년 최대풍속을 추정하였다.

Meta-Heuristic Algorithms를 이용한 확률분포의 매개변수 추정 (Parameters Estimation of Probability Distributions Using Meta-Heuristic Algorithms)

  • 윤석민;이태삼;강명국;정창삼
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.464-464
    • /
    • 2012
  • 수문분야에 있어서 빈도해석의 목적은 특정 재현기간에 대한 발생 가능한 수문량의 규모를 파악하는데 있으며, 빈도해석의 정확도는 적합한 확률분포모형의 선택과 매개변수 추정방법에 의존하게 된다. 일반적으로 각 확률분포모형의 특성을 대표하는 매개변수를 추정하기 위해서는 모멘트 방법, 확률가중 모멘트 방법, 최대우도법 등을 이용하게 된다. 모멘트 방법에 의한 매개변수 추정은 해를 구하기 위한 과정이 단순한 반면, 비대칭형의 왜곡된 분포를 갖는 자료들에 대해서는 부정확한 결과를 나타내게 된다. 확률가중 모멘트 방법은 표본의 크기가 작거나 왜곡된 자료일 경우에도 비교적 안정적인 결과를 제공하는 반면, 확률 가중치가 정수로만 제한되는 단점을 갖고 있다. 그리고 대수 우도함수를 이용하여 매개변수를 추정하게 되는 최우도법은 가장 효율적인 매개변수 추정치를 얻을 수 있는 것으로 알려져 있으나, 비선형 연립방정식으로 표현되는 해를 구하기 위해서는 Newton-Raphson 방법을 사용하는 등 절차가 복잡하며, 때로는 수렴이 되지 않아 해룰 구하지 못하는 경우가 발생되게 된다. 이에 반해, 최근의 Genetic Algorithm, Ant Colony Optimization 및 Simulated Annealing과 같은 Meta-Heuristic Algorithm들은 복잡합 공학적 최적화 문제 있어서 효율적인 대안으로 주목받고 있으며, Hassanzadeh et al.(2011)에 의해 수문학적 빈도해석을 위한 매개변수 추정에 있어서도 그 적용성이 검증된바 있다. 본 연구의 목적은 연 최대강수 자료의 빈도해석에 적용되는 확률분포모형들의 매개변수 추정을 위해 Meta-Heuristic Algorithm을 적용하고자 함에 있다. 따라서 본 연구에서는 매개변수 추정을 위한 방법으로 Genetic Algorithm 및 Harmony Search를 적용하였고, 그 결과를 최우도법에 의한 결과와 비교하였다. GEV 분포를 이용하여 Simulation Test를 수행한 결과 Genetic Algorithm을 이용하여 추정된 매개변수들은 최우도법에 의한 결과들과 비교적 유사한 분포를 나타내었으나 과도한 계산시간이 요구되는 것으로 나타났다. 하지만 Harmony Search를 이용하여 추정된 매개변수들은 최우도법에 의한 결과들과 유사한 분포를 나타내었을 뿐만 아니라 계산시간 또한 매우 짧은 것으로 나타났다. 또한 국내 74개소의 강우관측소 자료와 Gamma, Log-normal, GEV 및 Gumbel 분포를 이용한 실증연구에 있어서도 Harmony Search를 이용한 매개변수 추정은 효율적인 매개 변수 추정치를 제공하는 것으로 나타났다.

  • PDF

비 가우시안 잡음이 존재하는 무선 센서 네트워크에서 Robust Statistics를 활용하는 수신신호세기기반의 위치 추정 기법 (A RSS-Based Localization Method Utilizing Robust Statistics for Wireless Sensor Networks under Non-Gaussian Noise)

  • 안태준;구인수
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.23-30
    • /
    • 2011
  • 무선 센서 네트워크에서, 각 센서 노드들로부터 수집된 정보를 효율적으로 활용하기 위해 센서 노드의 정확한 위치 정보는 필수적이다. 센서 노드의 위치를 추정하는 다양한 기법들 중, 일반적으로 많이 사용되는 수신신호세기(RSS)기법은 추가적인 하드웨어 자원 없이 쉽게 구현될 수 있으나 채널 환경에 따라 다양한 표본 데이터들이 수집 될 수 있고, 특히 이상점(outlier)이 포함 될 수 있다. 이러한 이상점들은, 수집된 표본들로부터 통계적 분석(statistical analysis)에 상당한 요인을 미치며 위치 추정 오차를 발생시키는 주요한 원인이 된다. 따라서 본 논문에서는, 이상점이 포함 된 표본들로부터 정확한 위치 추정을 위해 Robust Statistics를 적용한 가우시안 필터 알고리즘을 제안한다. 제안한 알고리즘은 이상점이 포함된 표본들로부터 이상점을 제거하고, 낮은 확률값의 표본들을 배제함으로써 위치 추정의 정확도를 향상시킨다. 시뮬레이션 결과로부터, 이상점이 포함 된 표본들로부터 비 가우시안적 환경에서 제안된 방법의 위치 추정의 정확성 향상과 강인성을 확인하였다.

층화 및 층화 이표본 조건부 무관질문모형 (A Stratified and Two Sample Stratified Conditional Unrelated Question Model)

  • 이기성
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2883-2893
    • /
    • 2018
  • 본 논문에서는 모집단이 층으로 구성되어 있고 얻고자 하는 속성이 민감할 때, 덜 민감한 속성 B와 강요응답으로 구성되어 있는 확률장치를 통해 "예"라고 응답한 사람들에게만 민감한 속성 A 와 무관한 속성 Y를 포함하고 있는 Greenberg et al.(1969)의 무관질문모형을 사용하도록 하여 모집단이 층화된 경우 층화추정을 위한 층화 조건부 무관질문모형을 제안하였다. 그리고 제안한 층화 조건부 무관질문모형에서 각 층에 표본을 배분할 때 비례배분과 최적배분 문제를 다루었다. 또한 층화 조건부 무관질문모형을 무관한 속성이 미지인 경우 두 개의 독립표본을 이용하는 층화 이표본 조건부 무관질문모형으로 확장하였으며, 제안한 층화 이표본 조건부 무관질문모형의 두 번째 단계에서 사용되는 h층의 표본의 크기에 대한 최적값을 도출하여 최소분산을 구하였다. 마지막으로 층화 조건부 무관질문모형이 층화 무관질문모형과 층화 Carr et al.(1982)의 모형보다 효율적이 되는 조건을 제시하여 일정한 조건하에서 제안한 모형이 기존 모형들보다 효율적임을 보였으며, 제안한 층화 조건부 무관질문모형이 ${\pi}_{h2}$ 값이 작고 ${\pi}_{hy}$ 값이 작을수록 층화 Carr et al.(1982)의 모형보다 효율적임을 수치적으로 보였다.

기술혁신활동이 부도위험에 미치는 영향 : 한국 유가증권시장 및 코스닥시장 상장기업을 중심으로 (Technology Innovation Activity and Default Risk)

  • 김진수
    • 기술혁신연구
    • /
    • 제17권2호
    • /
    • pp.55-80
    • /
    • 2009
  • 기술혁신활동은 타 기업에 대한 진입장벽 구축, 공정개선 및 신제품 개발을 가능하게 함으로써 이익의 증대, 안정적 수익원의 확보 및 매출액의 증대를 가능하게 한다. 또한 기존 기업에게 신기술에 대한 대응력과 내재되어 있는 역량의 증대를 가능하게 함으로써 생존의 기회를 부여한다. 따라서 기술혁신활동은 부도위험을 줄일 수 있다. 그러나 기술혁신활동은 많은 자원의 투입을 필요로 함과 동시에 이에 내재된 성공의 불확실성으로 말미암아 오히려 기업의 부도위험을 증가시킬 수 있다. 이에 본 연구는 기업의 기술혁신활동이 부도위험에 미치는 영향을 분석하고자 한다. 기술혁신활동이 부도위험에 미치는 영향의 분석을 위해 본 연구는 2000년부터 2008년 까지 한국거래소 유가증권시장과 포스닥시장에 계속 상장된 기업으로 산업분류 상 제조업을 영위하는 기업을 대상으로 하였다. 기술혁신활동의 대용변수는 기존 연구에서 밭이 이용되고 있는 연구개발집약도를, 부도위험의 대용변수는 Black & Scholes(1973)의 유럽형 콜옵션 가격결정모형에 기반한 Merton(1974)의 타인자볼자격결정모형을 이용하여 측정된 부도확률을 각각 사용하였다. 추가적으로 부도위험의 대용변수로써 KIS 신용평점을 이용하여 강건성 검정을 실시하였으며, 주요 실증분석 결과는 다음과 같다. 첫째, 전체표본과 이를 유가증권시장표본 및 코스닥시장표본으로 나누어 분석한 결과 모든 표본에 있어 기술혁신활동의 대용변수인 연구개발집약도는 1% 수준에서 유의한 음(-)의 회귀계수를 보였다. 기업의 소속 시장 여부와 관계없이 기술혁신활동이 부도위험을 낮추는 중요한 변수임을 알 수 있었다. 둘째, 전체표본을 기업규모(대기업표본 및 중소기업표본), 기업연령(상위 50% 표본 및 하위 50% 표본) 및 신용평점(10~6점 표본 및 5~1점 표본)에 따라 분류하여 분석한 결과 모든 표본에 있어 연구개발집약도의 회귀계수는 유의수준에서 다소 차이를 보일 뿐 음(-)의 유의한 값을 보였다. 기업규모, 기업연령 및 신용평점의 정도와 관계없이 기술혁신활동이 증가할수록 부도위험이 감소함을 확인하였다. 셋째, 연구개발비는 자산과 비용으로 처리되는 그 여부와 관계없이 모두 부도위험과 음(-)의 유의한 관계를 가짐을 확인하였다. 또한 KIS 신용평점을 이용하여 분석한 강건성 검정 결과 기업의 소속 시장 여부와 관계없이 기술혁신활동이 부도위험을 낮추는 중요한 변수임을 거듭 확인할 수 있었다. 실증분석결과 본 연구는 기술혁신활동이 부도위험을 감소시키는 중요한 변수임을 확인하였다. 기업의 부도위험을 낮추기 위해 경영자는 기술혁신활동에 대한 지속적인 관심과 투자가 필요하겠으며, 국가의 기업지원 방향 역시 기업의 기술혁신활동을 촉진할 수 있도록 설계 되어야 하겠다.

  • PDF

몬테칼로법과 생애함수를 이용한 교량의 파괴확률예측 (The Prediction of Failure Probability of Bridges using Monte Carlo Simulation and Lifetime Functions)

  • Seung-Ie Yang
    • 한국안전학회지
    • /
    • 제18권1호
    • /
    • pp.116-122
    • /
    • 2003
  • 몬테칼로법은 복잡한 특히 비선형문제를 푸는데 강력한 공학도구중의 하나이다. 이 방법은 컴퓨터에서의 통계적인 표본추출방법을 이용하여 각종 공학적인 문제에 근사적인 해를 준다. 교량 하나의 요소나 전체교량의 시간 의존적 파괴확률을 예측하는 방법중의 하나로 생애함수가 있다. 이 논문에서는 교량의 요소나 전체 교량의 파괴확률을 예측하기 위하여, 시스템 신뢰성과 생애함수를 이용하여 포트란 프로그램을 개발하였다. 몬테칼로법은 생애함수의 매개변수를 생성하는데 이용되었다. 적용례로서, 개발된 프로그램은 콘크리트-강 합성 교량에 적용되어, 파괴확률을 예측하는데 이용되었다.

GLO분포를 대상으로 왜곡도 계수를 고려한 확률도시 상관계수 검정통계량 추정 (A Study on Estimation of Probability Plot Correlation Coefficient Considering the Skewness for GLO distribution)

  • 안현준;신홍준;김수영;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.39-39
    • /
    • 2015
  • 극치 수문(Hydrologic extremes)분야에서는 수문자료의 분포에 따라 Gumbel, GEV, 그리고 GLO 분포와 같은 다양한 확률통계 분포형이 존재한다. GEV와 GLO 분포형의 경우 Gumbel 분포형과 달리 형상매개변수가 포함된 3변수 분포형으로써 이상 기후 현상으로 인한 잦은 극치 수문사상을 표현하는데 좀 더 유연한 것으로 알려져 있다. 특히 GLO 분포형의 경우 영국에서 홍수빈도해석 시 적정분포형으로 선정된바 있다(Institute of Hydrology, 1999). 다양한 분포형 중에서 표본 자료를 대표할 수 있는 분포형을 선정하는 통계적 기법이 적합도 검정이다. 적합도 검정에는 $x^2$-검정, Cramer von-Mises 검정, Kolmogorov-Smirnov 검정, PPCC(probability plot correlation coefficient, 확률도시 상관계수)검정 등이 있으며 그 중 PPCC 검정은 이용방법이 간편하면서도 뛰어난 기각능력을 보이는 것으로 알려져 있다. 본 연구에서는 극치 수문분야에서 널리 이용되고 있는 GLO 분포형을 대상으로 자료의 왜곡도 영향을 고려할 수 있는 확률도시 상관계수 검정의 검정통계량을 추정하여 보았다.

  • PDF

유한모집단에서 가중평균에 포함된 가중치의 효과 (Weighting Effect on the Weighted Mean in Finite Population)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제7권2호
    • /
    • pp.53-69
    • /
    • 2006
  • 표본조사에서 가중치는 설계 단계와 분석 단계에서 만들어지고 부여될 수 있다. 설계 단계의 가중치는 추출확률이나 응답률 등과 같은 표본 데이터 획득 지표에 관련되어 있고 분석 단계의 가중치는 모집단 수치나 다른 보조 변수정보 등과 같은 외적인 정보와 관련되어 있다. 그리고 최종가중치는 설계 단계의 가중치와 분석 단계의 가중치의 곱으로 만들어진다. 이 논문에서는 분석 단계에서 부여되는 가중치에 초점을 맞추어 가중평균으로 모평균을 추정할 때 가중평균에 포함된 가중치가 모평균 추론에 미치는 영향을 고찰하였다. 유한모집단에서 각 조사단위에 조사변수와 가중치가 쌍으로 있고 표본추출확률이 균등한 경우를 가정하였다. 이러한 조건에서 가중평균의 편향과 평균제곱오차를 구하여 가중평균은 모평균의 편향 추정량임을 보였고, 편향의 방향과 크기는 조사변수와 가중치의 상관관계로 설명할 수 있음을 보였다. 즉, 만일 가중치와 조사변수가 양의 상관관계가 있으면 가중평균은 모평균을 과대 추정하게 되고, 만일 음의 상관관계가 있으면 모평균을 과소 추정하게 된다. 그리고 두 변수의 상관계수가 크면 편향은 증가한다. 가중평균에 대한 이론적인 수식 유도와 함께 편향의 크기와 평균제곱오차의 크기를 수치적으로 검토하기 위하여 모의실험을 실시하였다. 모의실험에서는 상관계수가 -0.2과 0.6사이에 있는 9개의 가중치를 생성하였고, 표본수는 100부터 400까지 고려하여 편향의 크기와 평균제곱오차의 크기를 수치적으로 구하였다. 하나의 결과로써 상관계수가 0.55이고 표본수가 400인 경우에 가중평균의 편향의 제곱이 평균제곱오차에서 차지하는 비율은 무려 82%에 이르는 것으로 나타났는데, 이는 가중평균의 편향이 어떤 경우에는 매우 심각할 수도 있음을 보여주는 것이다.

  • PDF