• 제목/요약/키워드: 통계기법

검색결과 2,510건 처리시간 0.03초

국부통계근거 적응처리에 의한 금석문영상 향상 (Image Enhancement for Epigraphic Image Using Adaptive Process Based on Local Statistics)

  • 황재호
    • 대한전자공학회논문지SP
    • /
    • 제44권2호
    • /
    • pp.37-45
    • /
    • 2007
  • 국부통계처리에 근거한 금석문영상의 적응영상향상 기법을 제안한다. 영상의 국부통계처리 값들을 영상향상을 위한 적응실현으로 활용하여 평활화와 상세화의 경로를 조정한다. 미세부분에서는 영상이 향상되고 평활영역에서는 잡음이 억제된다 금석 문영상의 모델링을 위해 한지밀착본(韓紙密着本)디지털영상(HSDI, Hanzi squeezed digital image)의 전처리 과정을 수행하였다. HSDI 분석을 통해 국부통계처리 값들을 산출하고 영상을 모델링한다. 본 기법을 HSDI에 적용하여 에지부분의 미세한 변화를 향상시키고 배경영역을 평활시킴으로 결국 문자영역의 시각적 효과를 증대하였다 실험결과들은 제시한 알고리즘이 기존의 영상향상기법보다 우수함을 보여준다.

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Integrated Clustering Method based on Syntactic Structure and Word Similarity for Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-49
    • /
    • 2009
  • 통계기계번역에서 도메인에 특화된 번역을 시도하여 성능향상을 얻는 방법이 있다. 이를 위하여 문장의 유형이나 장르에 따라 클러스터링을 수행한다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 문장 사이의 문법적 구조 유사성으로 문장을 유형별로 분류하는 새로운 기법을 제시하였고, 단어 유사도 정보로 문서의 장르를 구분하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조의 유사성과 단어 유사도 계산을 위하여 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정은 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

  • PDF

통계오차를 고려한 사면안정 신뢰성 해석 (Reliability Analysis of Slope Stability with Sampling Related Uncertainty)

  • 김진만
    • 한국지반공학회논문집
    • /
    • 제23권3호
    • /
    • pp.51-59
    • /
    • 2007
  • 다양한 불확실성을 체계적으로 반영하는 신뢰성 기반 해석기법을 사면안정 해석의 한 형식으로 제시한다. 통계오차, 공간 변동성, 그리고 공간 평균의 효과를 고려할 수 있는 지반특성 표현식이 사용되었다. 여러 가지 형식의 지반특성 표현식을 이용하여 사면안정 신뢰성 해석을 수행한 결과 통계오차, 공간적 상관성, 그리고 조건부 해석기법을 사용할 경우가 기존의 단순 확률변수 기법에 비해 상당히 작은 파괴확률을 제시한다는 사실이 밝혀졌다. 이 결과는 사면안정 해석에서 공간적 변동성과 통계오차가 합리적으로 고려되어야 한다는 점을 제시한다.

자질 중요도 계산 기법에 의한 자동문서 범주화 (Automatic Document Categorization by the Importance of Features)

  • 이경찬;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.537-539
    • /
    • 2003
  • 문서 범주화를 위해 자질을 선별하는 기법으로는 자질의 출현 빈도에 따라 범주를 대표하는 자질들을 선별하는 것이 일반적이다. 출현 빈도에 의한 자질을 선별하는 통계적인 기법은 문서의 내용을 대표하는 용어들의 중요도를 간과하는 문제가 발생한다. 본 논문에서는 학습 문서 및 실험 문서에서 자질의 중요도에 의해 범주 대표어를 선별하는 문서 범주화 기법을 제안하였으며, 역범주 빈도 및 카이제곱 통계량에 의해 자질을 선별하는 방법과 비교-실험을 하였다. 문서 범주화 모델로는 나이브 베이지언 확률 모델을 이용하였으며, 성능 평가를 위해서 웹 디렉토리에서 수집된 데이터를 이용하여 실험하였다. 본 논문에서 제안한 자질 중요도에 의한 자질 선별 기법은 용어의 출현 빈도 및 카이제곱 통계량에 의해 자질을 선별한 방법보다 더 나은 성능을 보였다.

  • PDF

KPA rating 데이터 보정을 통한 성숙도 설문서(MQ) 선정 모델의 신뢰성 평가 (Reliability Test of Maturity Questionnaire Selection Model Through KPA Rating Data Calibration)

  • 김우송;이은서;이경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2003
  • 소프트웨어 공학이 소프트웨어 시스템에 관한 방법론, 기술 및 툴 등의 유지보수와 개발에 중점을 두어 왔는데 최근에는 프로세스 개선과 프로세스 능력수준의 향상에 초점을 두는 방향으로 발전하면서 CMM 및 SPICE 활동이 증가하고 있다. 이와 같은 심사기법은 대규모의 회사에서 주로 시행되고 있어서 중소규모의 조직을 위한 간략한 심사기법의 도입이 요구되는 있는 상황이다. 본 논문에서 제시하는 심사기법은 CMM 심사를 위한 KPA 설문서의 rating 방법을 응용한 것으로서 SPICE 심사를 받은 국내 기업 중 일부 회사를 대상으로 하였다. 이 방법론에 대한 신뢰성의 평가는 아직 미흡한 상황이다. 이를 위해서 통계학적 접근방법을 도입하였는데 사용된 통계 기법은 상환계수를 통한 가설검정이다. 그 결과 성숙도 설문서(MQ) 선정모델의 적합성을 통계적 기법을 통해서 검증하였다.

  • PDF

베이지안 통계 추론 (On the Bayesian Statistical Inference)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.263-266
    • /
    • 2007
  • 본 논문은 베이지안 통계 추론에 대하여 논의한다. 논문은 베이지안 추론, Markov Chain과 Monte Carlo 적분, MCMC(Markov Chain Monte Carlo) 기법, Metropolis-Hastings 알고리즘, Gibbs 샘플링, Maximum Likelihood Estimation, EM 알고리즘, 상실된 데이터 보완 기법, BMA(Bayesian Model Averaging) 순서로 논의를 진행한다. 이러한 통계적 기법들은 대용량의 데이터를 처리하는 생물학, 의학, 생명 공학, 과학과 공학, 그리고 일반 데이터 조사와 처리 등에 사용되고 있으며, 최적의 추론 결과를 이끌어 내는데 중요한 방법을 제공하고 있다. 그리고 마지막으로 PC(Principal Component) 분석 기법에 대하여 논의한다. PC 분석 기법도 데이터 분석과 연구에 많이 활용된다.

  • PDF

확률화 응답기법의 실용화 방안 (A practical plan of randomized response technique)

  • 류제복;이계오;이기성
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.9-26
    • /
    • 1995
  • 응답자들이 응답을 꺼려하는 민감한 사항에 대한 조사에 거짓응답을 하거나 응답을 회피함으로써 응답편의(response bias)가 발생한다. Warner(1965)는 이러한 응답편의를 줄여주기 위하여 확률장치를 사용하는 확률화응답기법을 제안하였다. 그러나 이 기법은 이론적으로 우수함에도 불구하고 실제 사용하려고 할 때에 여러가지 문제점을 갖고 있다. 따라서 본 연구에서는 확률화응답기법의 실용화를 위하여 이 기법들이 적용된 사례들을 비교분석하고 특징과 문제점등을 찾아 이를 보완하여 실용화를 위한 단계적 방안을 제시하였다. 또한 이들을 실제조사에 적용하였다.

  • PDF

데이터마이닝 기법을 이용한 주가자료 분석

  • 손인석;황창하;조길호;김태윤
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.99-104
    • /
    • 2001
  • 본 연구의 주된 목표는 1997년 주가자료를 데이터마이닝 기법인 로지스틱모형, 의사결정트리, 신경망, SVM(support vector machine), 뉴로퍼지모형을 사용하여 분석한 후 우리나라 경제상황을 진단하고 예측하는데 가장 적합한 모형을 찾고 그 모형을 해석하는데 있다. 1997년 주가자료를 훈련자료로 간주하여 그 당시 경제 상황에 따라 적절한 구간으로 나누고 훈련시킨 결과 중요한 변수로는 주가지수, 등락률 10일 이동분산, 10일 이동분산의 변동비로 나타났으며 적절한 기법으로는 의사결정트리, 신경망, SVM임을 알 수 있다. 1997년 이외의 주가자료를 데이터마이닝 기법(신경망, 의사결정트리, SVM)에 적용한 결과, 우리나라 경제상황을 고려해 볼 때 신경망이 가장 정확도가 좋은 기법으로 보여진다.

  • PDF

마이크로데이터 제공과 통계적 노출조절기법 (Release of Microdata and Statistical Disclosure Control Techniques)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.1-11
    • /
    • 2009
  • 마이크로데이터를 이용자에게 제공하면 레코드 단위의 데이터가 노출되고 응답자의 정보 노출위험이 불가피하다. 통계적 노출조절기법은 통계데이터 제공시 노출위험을 줄이면서 데이터 유용성을 높이기 위한 통계적 기법이다. 본 논문에서는 노출과 노출위험, 그리고 통계적 노출조절기법을 고찰하였고 데이터 유용성과 연관하여 노출조절기법 선택 전략을 살펴보았으며, '위험-유용성 경계 지도' 방법의 예를 알아보았다. 마지막으로 마이크로데이터를 이용자에게 제공할 때 단계별로 검토할 사항을 알아보았다.

우포늪 수위 자료의 시계열 모형화 및 잔차 분석 (Modelling and Residual Analysis for Water Level Series of Upo Wetland)

  • 김경훈;한대건;김정욱;임종훈;이종소;김형수
    • 한국습지학회지
    • /
    • 제21권1호
    • /
    • pp.66-76
    • /
    • 2019
  • 기후변화로 인해 홍수나 가뭄과 같은 자연재난이 빈번하게 발생하고 있고, 이로 인한 피해 또한 커지고 있다. 습지는 이러한 피해를 저감하고 최소화하는데 중요한 역할을 하고 있는 것으로 알려져 있다. 특히, 자연재난으로 인한 피해 저감 뿐만 아니라 습지의 다양한 기능을 이해하기 위해서는 수위의 변동성을 분석할 필요가 있다. 따라서 본 연구에서는 경상남도 창녕군에 위치한 우포늪의 수위 자료에 적합한 시계열 모형을 도출하고 모형의 적절성을 확인하기 위해 잔차 분석을 수행하였다. 즉, ARIMA 모형을 구축하였고, 잔차 분석을 위해 기존의 비모수 통계기법, BDS 통계기법 및 CRH(Close Returns Histogram)를 통한 결과들을 비교 분석하였다. 특히, 본 연구에서는 시계열 모형의 잔차 분석을 위해 CRH의 적용 가능성을 제시하고자 하였다. 분석 결과, CRH는 정확한 무작위성 검정 결과를 도출하였을 뿐만 아니라 다른 방법들에 비해서 단순한 계산과정을 통해 쉽게 결과를 얻을 수 있었다. 따라서 시계열 모형의 잔차 분석을 위해 BDS 통계기법 뿐만 아니라 CRH를 이용한다면 보다 효과적인 분석을 할 수 있을 것으로 판단된다.