• 제목/요약/키워드: 다변량정규분포

검색결과 57건 처리시간 0.019초

레이저유도 플라즈마 분광법을 이용한 폐금속 분류를 위한 추정 연성정보 기반의 최빈 분류 기술 (Estimated Soft Information based Most Probable Classification Scheme for Sorting Metal Scraps with Laser-induced Breakdown Spectroscopy)

  • 김에덴;장혜민;신성호;정성호;황의석
    • 자원리싸이클링
    • /
    • 제27권1호
    • /
    • pp.84-91
    • /
    • 2018
  • 본 연구에서는 레이저유도 플라즈마 분광법(Laser induced breakdown spectroscopy, LIBS) 기반의 금속 종류별 스펙트럼 데이터를 이용하여 연성정보(soft information)를 추정하고 최빈 클래스로 분류하는(most probable classification) 금속 분류 방법을 제안한다. 폐금속 자원과 같이 사전 정보가 없는 금속을 분류하는 경우 몇 가지 핵심 구성성분에 대한 정량 분석을 통해서 클래스를 추정하는 방법이 효율적이다. 이에 따라 부분 집합 기반의 부분최소제곱회귀법(Partial Least Square Regression, PLSR)을 이용하여 LIBS 검출 스펙트럼으로부터 각 성분의 농도를 독립적으로 신뢰성 있게 추정하고, 인증 표준물질(CRM) 등 알려진 모집합의 농도정보에 기반하여 최고 확률을 갖도록 분류하는 기술을 제안한다. 샘플 스펙트럼들의 다변량 분석을 통해서 여러 성분의 추정 농도를 다변량 정규 분포를 갖는 것으로 가정하고 통합(Joint) 추정 연성정보를 구할 수 있으며, 이를 활용한 최빈 확률 검출이나 추가적인 사전 정보의 결합 등을 통해서 분류 성능을 향상시킬 수 있다. 제안된 기술의 평가를 위해서 9가지 종류의 CRM 금속시료의 LIBS 스펙트럼 데이터를 사용하며, 부분 집합 기반의 PLSR 농도 추정 기술을 기반으로 단변량 혹은 다변량 정규 분포 연성 정보추정을 통해 미지 금속의 검출과 연성 정보의 검출 등을 테스트 하였다. 또한 방사형 차트(Radar chart)를 이용하여 추정된 농도와 획득한 연성정보를 효과적으로 시각화함으로써 기존 라이브러리에 포함된 부분 집합의 금속과 비교하여 해당 금속과의 유사성을 그래프를 통해 추정할 수 있다.

비동차 이차형식의 분포함수에 대한 안장점근사 (Saddlepoint Approximations to the Distribution Function of Non-homogeneous Quadratic Forms)

  • 나종화;김정숙
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.183-196
    • /
    • 2005
  • 본 논문에서는 다변량 정규분포하에서 비동차(non-homogeneous) 이차형식의 분포 함수에 대한 안장점근사법을 다루었다. 이는 Kuonen (1999)의 동차(homogeneous) 이차형식에 대한 안장점근사를 비동차의 경우로 확장한 것이다. 안장점근사의 적용을 위해 비동차 이차형식의 누율생성함수 및 관련 성질들을 유도하였다. 모의실험을 통해 안장점근사의 정도가 매우 뛰어남을 확인하였다.

모델의 사전 확률 추정을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using Model Prior Estimation)

  • 하진영;박미나
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.325-327
    • /
    • 2001
  • 본 논문은 온라인 문자 인식을 연속 밀도 HMM의 구조의 최적화 문제를 다룬다. 최적이란 최소한의 모델 파라미터를 사용하여 최소한의 오류를 허용하는 것이라고 정의할 수 있다. 본 연구에서는 HMM 구조의 최적화를 위해 Bayesian 모델 선택 방법론을 사용한다. 먼저 잘 알려진 BIC(Bayesian Information Criterion)을 적용해보고, 그것을 HMM의 복잡한 구조에 적합하도록 본 논문에서 제안한 HBIC(HMM-Oriented BIC)와 비교해본다. BIC는 모델의 사전 확률 분포를 추정하지 않고 다변량 정규분포라고 가정하는데 비해 HBIC는 모델의 각 파라미터로부터 사전 확률을 추정한 후 그것들을 사용함으로써 더 좋은 결과를 얻도록 한다. 실험 결과 BIC와 HBIC 둘 다 기존 방법보다 모델의 파라미터 수를 현저히 감소시킴을 확인했고, HBIC가 BIC에 비해 더 적은 수의 파라미터를 사용해도 비슷한 인식률을 얻을 수 있었다.

  • PDF

이변량 지수 공정 하에서 위험함수와 공정능력지수에 대한 통계적 추정 (Statistical Estimation for Hazard Function and Process Capability Index under Bivariate Exponential Process)

  • 조중재;강수묵;박병선
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.449-461
    • /
    • 2009
  • 최근의 생산 공정은 공정의 자동화, 고객 요구의 다양화 등으로 많은 품질 특성치들을 갖는 다변량 공정의 형태가 일반적이며, 벡터 공정능력지수는 이러한 다변량 공정의 능력을 평가하기 위한 대표적인 측도라 할 수 있다. 한편 공정의 분포에 대한 정보를 정확히 파악하기 어려운 실제 현장의 상황에서 보다 정확한 공정능력을 평가할 수 있는 통계적 추정 문제는 현실적으로 중요한 문제라고 할 수 있다. 본 논문에서는 특정한 이변량 지수 공정 하에서 이변량 벡터 공정능력지수 $C_{pkl}$에 대한 신뢰영역의 추정 문제에 관하여 연구하였다. 먼저 지수분포의 특성을 고려하여 실제 현장에서 널리 사용되고 있는 가장 기본적인 일변량 공정능력지수들 중에서 규격 하한만을 고려한 형태인 $C_{pkl}$에 관하여 이변량 벡터 공정능력지수 $C_{pkl}=(C_{pklx},\;C_{pkly})$로 확장 정의하고, 이 지수의 플러그-인 추정량 및 관련 극한 확률분포를 유도하였다. 또한 이 지수에 대해 Marshall과 Olkin (1967)의 이변량 지수분포 모형을 기초로 근사 신뢰영역을 제시하였으며, 모의실험을 통하여 이변량 벡터 공정능력지수 $C_{pkl}$에 대한 95% 정규 근사(Asymptotic Normality: AN) 신뢰영역에 대한 이용가능성 및 효율성을 비교 분석하였다.

코플라함수를 이용한 극단치 강풍과 강수 분석 (Analysis of extreme wind speed and precipitation using copula)

  • 권태용;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.797-810
    • /
    • 2017
  • 한반도는 매년 태풍의 위험에 노출되어 있다. 태풍은 강풍과 강우가 동반되는 열대성 저기압으로 사회 경제적으로 막대한 피해를 유발한다. 현재의 자연재해 경고 시스템은 풍속과 강우를 구분하여 위험을 감지토록 설계되어 강풍과 폭우를 동반한 태풍의 위험을 경고하는데 한계점이 존재한다. 코플라모형은 확률변수들 사이의 복잡한 의존성 구조를 파악하기 위해 단변량분포의 집합을 다변량분포로 연결하는 모형으로 강우, 홍수, 가뭄 등의 분야에서 활발하게 연구되고 있다. 본 연구에서는 한반도에서 태풍에 가장 많이 노출된 도시인 부산과 제주도의 기상 관측소 (ASOS)에서 수집된 1904년 4월 9일부터 2015년 12월 31일까지 일강수량 (precipitation), 일최대풍속 (maximum wind speed) 자료를 이용하였다. 각 변수의 주변부확률을 추정하기 위해 두꺼운 꼬리 분포인 로그정규분포, 감마분포, 와이블분포를 고려하였다. 주변부 확률분포의 적합성검정은 Kolmogorov-Smirnov와 Cramervon-Mises, Anderson-Darling 검정통계량을 이용하였다. 코플라모형을 위해 순위를 기반으로 한 유사자료 (pseudo observation)를 생성하여 두 변수 간 의존성을 추정하였다. 강풍과 폭우의 의존성을 설명하기 위한 코플라모형으로 타원형, 나선형, 극단치 코플라모형이 고려되었다. 코플라모형의 적합성은 Cramer-von-Mises로 검정하였고, 교차검증을 통해 최적모형을 선택하였다. 연구결과 일강우량과 풍속의 주변부 확률분포로 대부분 로그정규분포가 적합하였다. 부산의 일평균풍속에 따른 일강우량은 t 코플라, 일최대풍속에 따른 일강우량은 Clayton 코플라가 최적모형으로 선정되었다. 제주도의 일최대풍속에 따른 일강우량은 정규코플라, 일강우량에 따른 일평균풍속은 Frank 코플라, 일강우량에 따른 일최대풍속은 Husler-Reiss 코플라가 최적모형으로 선택되었다.

평균변화율 및 유일성을 통한 진화 프로그래밍에서 레비 돌연변이 연산 분석 (Analysis of the Levy Mutation Operations in the Evolutionary prograamming using Mean Square Displacement and distinctness)

  • 이창용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.833-841
    • /
    • 2001
  • 본 논문에서는 진화프로그래밍에서 레비 확률분포(Levy probability distribution)를 사용한 돌연변이 연산의 유용성을 레비 돌연변이 연산 후의 변수의 평균변화율(mean square displacement) 및 유일성(distinctness) 등을 통하여 분석하였다. 레비 확률분포는 무한의 분산(infinite second moment을 가지는 확률분포로 쪽거리(fractal)와 연계되어 최근 연구가 활발히 진행되고 있는 확률분포이다. 레비 확률분포를 사용한 레비 돌연변이 연산은 변화가 작은 자손(offspring)뿐만 아니라 기존의 정규분포를 사용한 돌연변이 연산에 비하여 상대적으로 변화가 큰 자손을 생성할 수 있다. 이러한 사실에 기초하여 레비 돌연변이 연산은 보다 넓은 탐색 공간을 효율적으로 조사할 수 있음을 평균변화율 및 유일성 등의 조사를 통하여 수학적으로 증명하였다. 이를 통하여 진화 프로그래밍에서 레비 확률분포에 기초한 돌연변이 연산이 정규분포를 사용한 돌연변이 연산보다 다변량 함수의 최적화의 경우 일반적으로 효율적인 연산임을 알 수 있었다.

  • PDF

다변량 정규분포 모의모형을 이용한 물자운반작업을 수행하는 작업자의 인체 치수 및 관절염력의 예측에 관한 연구 (Estimation of anthropometric body dimensions and joint strengths of a worker performing manual materials handling tasks using a multivariate normal simulation model)

  • 변승남
    • 대한인간공학회지
    • /
    • 제12권2호
    • /
    • pp.63-83
    • /
    • 1993
  • The primary objective of the research is to develop a mathematical method to incorporate the variability of anthropometric body dimensions and joint strengths of individuals in a biomechanical analysis. A multivariate normal simulation model estimated anthropometric body dimensions and joint strengths of the random link-person, based on the assumptions that the vari- ables of body dimensions and joint strengths are correlated and follow normal distributions. Statistical comparative analysis demonstrated that the random link-person represented a more realistic human-like form in an anthropometric sense than the proportional link-person whose body dimensions were estimated proportionally. Estimated joint strengths for the random link-person, however, did not match the measured joint strengths as closely as the estimated body dimensions. The random link-person will allow biomechanical analysis of manual materials handling tasks to be individualized with respect to the anthropometry and a static strength.

  • PDF

반복측정의 분할구 자료에 대한 혼합모형 (A mixed model for repeated split-plot data)

  • 최재성
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.1-9
    • /
    • 2010
  • 본 논문은 분할구 실험에서 반복측정 요인이 처치의 한 요인으로 고려될 때, 실험자료의 분석을 위한 혼합모형과 모형내 미지모수의 추론을 위한 방법을 논의한다. 반복측정 요인으로 공간요인을 고려하고 공간요인의 수준은 분할구에 할당되나 연구자가 임의로 배정할 수 없는 실험환경이 가정된다. 이러한 실험의 특성을 갖는 자료벡터의 확률분포로 복합대칭의 공분산 구조를 갖는 다변량 정규분포를 논의하고 있다. 또한, 가정된 실험환경에 부합하는 적합한 자료의 예를 통하여 제시된 모형의 타당성과 관련모수들의 추론방법을 다루고 있다.

혼합설계의 교호작용에 대한 여러 검정법들과 결사평균을 이용하여 변형한 검정법들의 강인성 비교

  • 김현철
    • Communications for Statistical Applications and Methods
    • /
    • 제5권3호
    • /
    • pp.633-644
    • /
    • 1998
  • 혼합설계의 교호작용에 대한 F 검정이 유효하려면 다표본 구형성(multisample sphericity) 가정과 다변량 정규분포 가정이 만족되어야 한다. F 검정을 실시하기 위한 가정들이 위반된 조건하에서 혼합설계의 교호작용에 대한 검정법들의 1종오류가 비교되었다. 비교된 검정법들은 (1) F 검정(F), (2) 절사평균을 사용한 F 검정($F_T$)(3)$\varepsilon$-수정 F 검정($\varepsilon)$(4) 절사평균을 사용한 $\varepsilon$-수정 F 검정$(\varepsilon_T$) (5) CIGA검정(CIGA), (6) 절사평균을 사용한 CIGA검정($CIGA_T$)이었다. 결과는 CIGA와 $CIGA_T$는 1종오류를 대체로 잘 관리하나, F검정들과 ($\varepsilon$)검정들은 일부 조건에서 아주 작은 1종오류나 아주 큰 1종오류를 갖는 것으로 나타났다.

  • PDF

유전자 알고리즘을 이용한 트레이닝 최적화 기법 연구 - 정규분포를 고려한 통계적 영상분류의 경우 - (A Study on the Training Optimization Using Genetic Algorithm -In case of Statistical Classification considering Normal Distribution-)

  • 어양담;조봉환;이용웅;김용일
    • 대한원격탐사학회지
    • /
    • 제15권3호
    • /
    • pp.195-208
    • /
    • 1999
  • 위성영상 분류작업에서 분류클래스에 대한 샘플화소의 대표성은 분류 정확도에 많은 영향을 미친다. 따라서, 통계적 영상분류방법에서는 분류 기법 자체보다 분류 확률을 결정하는 트레이닝 단계, 즉 샘플화소의 최적화가 필요하다. 본 연구에서는 SPOT XS, LANDSAT TM을 이용한 위성영상 화소분류작업에서 분류 이전단계, 즉 샘플화소의 정규성을 계산하여, 정규성에 악영향을 미치는 화소를 객관적 기준으로 조정하였다. 정규화과정을 위한 유전자 알고리즘 적용의 생존확률 평가함수로 다변량 Q-Q plot의 상관계수와 트레이닝의 분산값을 고려하였으며, 5% 유의수준을 적용하였다. 연구결과, 실험대상지역의 경우, 유전자 알고리즘을 이용한 트레이닝 정규화 결과가 대부분의 클래스에 대하여 그 평균과 분산을 모집단에 근사시키고 있다는 것을 입증하였고, 해당 클래스의 모집단 분포를 예측할 수 있는 가능성을 제시하였다.