• 제목/요약/키워드: statistical estimator

검색결과 797건 처리시간 0.024초

에지 방향의 누적분포함수에 기반한 차선인식 (Lane Detection Based on a Cumulative Distribution function of Edge Direction)

  • 이운근;백광렬;이준웅
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.2814-2818
    • /
    • 2000
  • This paper describes an image processing algorithm capable of recognizing the road lane using a CDF (Cumulative Distribution Function). which is designed for the model function of the road lane. The CDF has distinctive peak points at the vicinity of the lane direction because of the directional and positional continuities of the lane. We construct a scatter diagram by collecting the edge pixels with the direction corresponding to the peak point of the CDF and carry out the principal axis-based line fitting for the scatter diagram to obtain the lane information. As noises play the role of making a lot of similar features to the lane appear and disappear in the image we introduce a recursive estimator of the function to reduce the noise effect and a scene understanding index (SUI) formulated by statistical parameters of the CDF to prevent a false alarm or miss detection. The proposed algorithm has been implemented in a real time on the video data obtained from a test vehicle driven in a typical highway.

  • PDF

Road-Lane Detection Based on a Cumulative Distribution Function of Edge Direction

  • Yi, Un-Kun;Lee, Joon-Woong;Baek, Kwang-Ryul
    • Journal of KIEE
    • /
    • 제11권1호
    • /
    • pp.69-77
    • /
    • 2001
  • This paper describes an image processing algorithm capable of recognizing road lanes by using a CDF(cumulative distribution function). The CDF is designed for the model function of road lanes. Based on the assumptions that there are no abrupt changes in the direction and location of road lanes and that the intensity of lane boundaries differs from that of the background, we formulated the CDF, which accumulates the edge magnitude for edge directions. The CDF has distinctive peak points at the vicinity of lane directions due to the directional and the positional continuities of a lane. To obtain lane-related information a scatter diagram was constructed by collecting edge pixels, of which the direction corresponds to the peak point of the CDF, then the principal axis-based line fitting was performed for the scatter diagram. Noises can cause many similar features to appear and to disappear in an image. Therefore, to reduce the noise effect a recursive estimator of the CDF was introduced, and also to prevent false alarms or miss detection a scene understanding index (DUI) was formulated by the statistical parameters of the CDF. The proposed algorithm has been implemented in real time on video data obtained from a test vehicle driven on a typical highway.

  • PDF

Trend analysis of aridity index for southeast of Korea

  • Ghafouri-Azar, Mona;Bae, Deg-Hyo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.193-193
    • /
    • 2017
  • Trend analysis can enhance our knowledge of the dominant processes in the area and contribute to the analysis of future climate projections. The results of previous studies in South Korea showed that southeast regions of Korea had the highest value of evapotranspiration. Thereby, it is of interest to determine the trend analysis in hydrological variables in this area. In this study, the recent 35 year trends of precipitation, reference evapotranspiration, and aridity index in monthly and annual time scale will be analyzed over three stations (Pohang, Daegu, and Pusan) of southeast Korea. After removing the significant Lag-1 serial correlation effect by pre-whitening, non-parametric statistical Mann-Kendall test was used to detect the trends. Also, the slope of trend of the Mann-Kendall test was determined by using Theil-Sen's estimator. The results of the trend analysis of reference evapotranspiration on the annual scale showed the increasing trend for the three mentioned stations, with significant increasing trend for Pusan station. The results obtained from this research can guide development if water management practices and cropping systems in the area that rely on this weather stations. The approaches use and the models fitted in this study can serve as a demonstration of how a time series trend can be analyzed.

  • PDF

Cox 비례위험모형을 따르는 중도절단자료 생성 (Generating censored data from Cox proportional hazards models)

  • 김지현;김봉성
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.761-769
    • /
    • 2018
  • 통계학 연구에 모의실험이 중요하게 쓰이며 중도절단자료를 다루는 생존분석에서도 마찬가지다. 생존분석에서 Cox 모형이 널리 쓰이는데, Cox 모형을 따르는 중도절단자료를 생성하는 방법에 대해 살펴보았다. Bender 등 (Statistics in Medicine, 24, 1713-1723, 2005)은 생존시간을 생성하는 모수적 방법을 제시하였으나 생존시간뿐만 아니라 중도절단시간도 생성해야 중도절단자료를 얻게 된다. 중도절단자료를 생성하기 위한 모수적 방법과 함께 비모수적 방법도 제시하였으며 실제 자료에도 적용해 보았다.

비선형 혼합효과모형에서의 로버스트 능형회귀 방법과 정량적 고속 대량 스크리닝 자료에의 응용 (Robust ridge regression for nonlinear mixed effects models with applications to quantitative high throughput screening assay data)

  • 유지선;임창원
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.123-137
    • /
    • 2018
  • 비선형 혼합효과 모형은 다양한 분야에서 반복 측정 자료를 분석할 때 주로 사용된다. 비선형 혼합효과 모형은 개체 내 변동(intra-individual variation)에 대해 고려하는 제 1단계 개별수준모델(individual-level model)과 개체간 변동(inter-individual variation)에 대해 고려하는 제 2단계 개체군모델(population model)의 두 단계로 구성되어 있다. 비선형 혼합효과 모형의 첫 번째 단계인 개별수준모델은 비선형 회귀모형의 모수를 추정하는 것으로 일반적인 비선형 회귀모형과 같고, 주로 보통최소제곱추정 방법을 사용하여 모수를 추정한다. 그러나 최소제곱추정방법은 가정된 비선형 함수가 자료에 의해 명시적으로 드러나지 않는 경우 모수의 추정값과 그 표준오차가 극단적으로 커지는 문제가 발생할 수 있다. 본 논문에서는 최근에 비선형 회귀모형에서 제안된 능형회귀(ridge regression) 방법을 비선형 혼합효과 모형의 제 1단계 개별수준모델에 도입함으로써 이러한 문제를 해결할 수 있는 새로운 추정방법을 제안하였다. 제안된 추정량은 모의실험 연구를 통하여 기존의 표준적인 추정량과 그 성능을 비교하였다. 또한 미국의 National Toxicology Program으로부터 얻어진 정량적 대량고속 스크리닝(quantitative high throughput screening) 실제 자료를 사용하여 추정 방법들을 비교하였다.

유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로 (Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction)

  • 홍승현;신경식
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.227-249
    • /
    • 2003
  • 부도예측모형의 구축은 은행 등 금융기관이 신용평가시스템 혹은 심사역 의사결정지원시스템을 구축하는데 중요한 기반이 된다. 많은 선행연구들에서는 기업의 부도예측을 위하여 전통적으로 다변량 판별분석이나 로짓분석과 같은 통계기법이 많이 사용되었으나, 최근에는 많은 연구들에 의해 그 우수성이 보고되고 있는 인공신경망, 귀납적 학습방법 등 인공지능 기법이 부도예측분야에 많이 응용되고 있다. 일반적으로 인공신경망 기법을 응용한 부도예측모형에서는 기업의 재무정보 및 비재무 정보를 입력변수로 주고 기업의 부도여부를 출력변수로 설정하여 학습을 통해 이들의 관계를 추출하고 있다. 그러므로 입력변수의 선정은 모형의 정확도에 커다란 영향을 미치며, 입력변수가 잘못 선정된 경우 예측 정확도는 현저히 낮아진다. 그러나 최적의 입력변수군을 선정하는 문제는 매우 어려운 과제 중 하나로, 선행 연구들에서는 주로 전문가의 의견을 반영하거나, 문헌을 통해 도출, 혹은 통계적 기법을 활용하여 입력변수를 선정하는 것이 일반적이었다. 본 연구에서는 많은 선행 연구에서 모형구축에의 한계점으로 명시하고 있는 입력변수 선정의 문제에 대해 유전자 알고리즘을 이용한 최적화를 통하여 입력 변수군을 도출하는 방법론을 제시하였고, 이 방법론이 다른 통계기법이나 전문가에 의한 변수 선택 방법론에 비해 우수함을 인공신경망 모형에 적용한 결과를 비교함으로 보여 주었으며, 이들간의 예측력의 차이가 유의함을 통계적 검증하였다. 모형의 실험을 위하여 총 528개사의 재무정보를 활용하였는데, 이는 1995년부터 1997년까지 3년간 부도가 발생한 일반법인 제조업체 중 외감법인 이상 264개사와 동수의 건전기업의 재무 데이터로 구성하였다. 기업이 도산에 이르기까지 많은 변인들이 다양하게 작용하게 된다. 그러나 이러한 변인들을 모두 모형에 적용하는 것은 비효율적이며, 인공신경망 모형에서 과다 입력변수를 사용하는 경우 수렴과 일반화 모두에 바람직하지 않은 결과가 나타난다. 따라서 적절한 입력변수군의 선택은 인공신경망 모형의 효율성과 성능을 향상시키게 되고, 이는 부도 예측율의 향상으로 이어질 수 있다. 이에 인공신경망 모형을 위한 최적의 입력변수군을 선정하고자 한 본 연구는 결국 기업의 부도 예측율을 높이기 위한 방법론을 제시했다는 점에 그 의의가 있다.

  • PDF

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

소지역 추정법을 이용한 효율적인 지역 실업률 추정 (An Efficient Estimation of Local Area Unemployment Rate Based on Small Area Estimation)

  • 김수택
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1129-1138
    • /
    • 2011
  • 지방자치제가 정착되면서 시군구와 같은 소지역 단위의 실업률에 대한 통계는 실업대책이나 고용지원 사업을 위한 예산 편성과 같은 지역 노동시장정책의 수립은 물론 정책 집행 후 그에 대한 사후평가를 하는데 있어서도 중요한 기준을 제공해주기 때문에 지자체 기관장들의 관심의 대상이 되고 있는 실정이다. 그러나 경제적, 시간적으로 많은 제약이 따르는 기초자치단체에서 지속적으로 실업률 통계를 생산하는 데에는 자료의 신뢰성, 연속성및 시의성 면에서 많은 문제를 노정하고 있다. 본 연구에서는 소지역 실업률 추정치에 대한 신뢰성(변동계수 25% 이하)을 확보하면서 통계생산에 소요되는 조사비용을 최소화할 수 있는 효율적인 추정법 및 최소 표본조사구 수를 모의실험을 통하여 제시하고자 한다.

붓스트랩에 기초하여 조정한 관리한계를 사용하는 CCC-r 관리도의 성능 (Performance of CCC-r charts with bootstrap adjusted control limits)

  • 김민지;이재헌
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.451-466
    • /
    • 2020
  • CCC-r 관리도는 불량률이 매우 낮은 고품질 공정을 관리하는 데 효율적이라고 알려져 있다. 대부분의 공정에서 공정 모수의 값은 알려져 있지 않기 때문에 제1국면에서 이를 추정해야 하는데, 표본의 크기가 충분히 크지 않은 경우 추정 오차가 발생하여 원하는 관리상태에서의 성능을 만족하지 못하는 경우가 발생한다. 뿐만 아니라 제1국면에서 추출하는 표본에 따른 산포로 인하여 관리상태일 때의 성능의 산포 또한 커지게 된다. 이러한 문제를 해결하기 위해 이 논문에서는 관리상태일 때 신호까지의 평균관측개수가 사전에 정한 확률로 목표하는 값보다 큰 값을 갖도록, 붓스트랩 알고리즘을 사용하여 CCC-r 관리도의 관리한계를 조정하는 절차를 제안하였다. 이때 고품질 공정에 적용하기 위하여 최대우도추정량 대신 베이즈추정량을 사용하여 불량률을 추정하였다. 다양한 상황에 대해 모의실험을 수행한 결과, 제안된 절차는 CCC-r 관리도의 관리상태 성능을 크게 향상시킴을 알 수 있었다.

이단계 집락추출에서의 표본크기에 대한 연구 (A Study of Sample Size for Two-Stage Cluster Sampling)

  • 송종호;제해성;박민규
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.393-400
    • /
    • 2011
  • 조사비용과 시간과 같은 현실적인 제약하에서 관측단위 (observation unit)의 집합인 집락(cluster)율 추출하는 집락추출법은 대부분의 대형조사(large scale survey) 에서 흔히 사용된다. 특별히 집락내의 관측단위가 매우 유사한 경우, 집락 내의 모든 관측치를 조사하는 대신 일부를 추출하여 조사하는 이단계 집락 추출법이 선호된다. 이단계 집락추출법의 적용시 집락인 1차추출단위 (Primary Sampling Unit; PSU)와 관측단위인 2차추출단위(Secondary Sampling Unit; SSU)의 표본수 결정은 주어진 비용과 표본으로부터 계산되어지는 통계량의 정도에 의존한다. 본 연구에서는 기존의 1차추출단위의 크기가 동일하다는 가정하에서 유도된 최적 PSU와 SSU 표본크기 산출과정을 일반화하여 1차추출단위의 크기가 같지 않을 경우의 최적 표본크기를 유도하고 그 결과를 제 4차 퇴원환자조사를 위한 표본추출 방안에 적용하여 기존방법과 비교하였으며 이를 바탕으로 제 7차 퇴원환자조사를 위한 표본크기를 제안하였다.