• 제목/요약/키워드: 로그 우도 비

검색결과 32건 처리시간 0.022초

두 개의 맥스웰분포의 모수비에 대한 우도함수 추론 (Likelihood based inference for the ratio of parameters in two Maxwell distributions)

  • 강상길;이정희;이우동
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.89-98
    • /
    • 2012
  • 이 논문에서는 두 개의 Maxwell분포의 모수들의 동질성을 모수비에 근거하여 검정하는 근사통계량을 제안한다. Maxwell분포의 모수비에 대한 추정량이 복잡하여 정확한 분포를 유도하기는 매우 어렵다. 이러한 문제를 해결하기 위한 하나의 대안으로 표준정규분포로 근사적으로 수렴하는 통계량을 고려해야 한다. 이 논문에서 제안된 통계량은 표준정규분포로 수렴하며, 표본의 수가 작은 경우에도 사용할 수 있다. 특히, 본 논문에서는 부호화 로그 우도비 통계량과 수정된 부호화 로그 우도비 통계량을 개발한다. 일반적으로, 수정된 부호화 로그 우도비 통계량은 로그 우도비 통계량에 비해 표준정규분포로 수렴하는 속도가 매우 빠르다. 부호화 로그 우도비 통계량은 작은 표본으로도 표준정규분포로 매우 빨리 수렴한다. 제안된 통계량들의 성질들을 모의실험을 통하여 알아보고, 제안된 통계량을 예제를 통하여 연구한다.

효모 마이크로어레이 유전자 발현데이터에 대한 가우시안 과정 회귀를 이용한 유전자 선별 및 군집화 (Screening and Clustering for Time-course Yeast Microarray Gene Expression Data using Gaussian Process Regression)

  • 김재희;김태훈
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.389-399
    • /
    • 2013
  • 본 연구에서는 가우시안 과정회귀방법을 소개하고 시계열 마이크로어레이 유전자 발현데이터에 대해 가우시안 과정회귀를 적용한 사례를 보이고자한다. 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용한 유전자를 선별방법에 대한 모의실험을 통해 민감도, 특이도, 위발견율 등을 계산하여 선별방법으로의 활용성을 보였다. 실제 효모세포주기 데이터에 대해 제곱지수공분산함수를 고려한 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용하여 차변화된 유전자를 선별한 후, 선별된 유전자들에 대해 가우시안 모형기반 군집화를 하고 실루엣 값으로 군집유효성을 보였다.

SVM을 이용하여 HMM과 심잡음 점수를 결합한 심음 기반 심장질환 분류기 (Heart Sound-Based Cardiac Disorder Classifiers Using an SVM to Combine HMM and Murmur Scores)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 논문은 support vector machine (SVM)을 사용하여 은닉 마코프 모델 (HMM)과 심잡음 존재 정보를 결합한 새로운 심장질환 분류 방법을 제안한다. 켑스트럼 특징과 HMM 비터비 (Viterbi) 알고리듬을 이용하여 입력 신호를 모든 심장질환 모델에 대하여 상태 단위로 분할하여 상태별로 로그우도 (점수)를 계산한다. 심잡음 신호의 시간적 위치 특성을 이용하기 위하여 입력신호를 두 개의 부대역으로 나누고 부대역별로 프레임 단위의 심잡음 점수를 계산한 다음, 비터비 알고리듬으로부터 구한 상태 분할 정보를 이용하여 상태단위의 심잡음 점수를 구한다. SVM은 모든 심장질환 종류에 대한 상태 단위의 HMM과 심잡음 점수를 입력으로 하여 최종적으로 심장질환을 판정한다. 심장질환 분류 실험결과, 제안한 방법은 기존의 켑스트럼 특징과 HMM 분류기를 이용한 방법에 비하여 20.4 %의 상대적 개선율을 보여준다.

플래시 메모리 기반의 DBMS를 위한 동적 블록 할당에 기반한 효율적인 로깅 방법 (An Efficient Logging Scheme based on Dynamic Block Allocation for Flash Memory-based DBMS)

  • 하지훈;이기용;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권5호
    • /
    • pp.374-385
    • /
    • 2009
  • 플래시 메모리는 비휘발성이면서도 작고 가벼우며, 전력 소모가 적고 충격에 강하다는 장점 등으로 인해 휴대 기기를 포함한 다양한 기기의 저장매체로 사용되고 있다. 그러나 플래시 메모리는 하드디스크와는 달리 제자리 갱신이 불가능하고, 읽기 연산에 비해 쓰기 및 지우기 연산이 매우 느리기 때문에, 기존의 하드 디스크를 기반으로 설계된 데이터베이스 시스템은 플래시 메모리 상에서 최적의 성능을 내기 어렵다. 플래시 메모리 상에서 데이터베이스의 성능을 극대화하기 위해, 어떤 데이터에 변경이 발생하면 원래 위치의 데이터를 덮어쓰는 대신, 해당 데이터의 변경 사항에 대한 로그만을 다른 위치에 기록하는 방식들이 제안되었다. 본 논문에서는 플래시 메모리 기반의 데이터베이스 시스템을 위한 효율적인 로깅 방법을 제안한다. 제안하는 방법은 기존 방법들과 달리, 로그만을 저장하는 로그 블록들을 별도로 두고 데이터의 변경에 따라 발생하는 로그를 로그 블록들에 고르게 분포시킨다. 이를 통해 제안하는 방법은 페이지 쓰기 및 블록 지우기 연산의 횟수를 크게 감소시킬 수 있다. 합성 데이터와 TPC-C 벤치마크 데이터를 사용한 실험을 통해, 제안하는 방법은 기존의 방법에 비해 좋은 성능을 나타냄을 보였다.

로그-정규분포와 파레토 합성 분포의 임계점 추정 (Threshold estimation for the composite lognormal-GPD models)

  • 김보배;노지숙;백창룡
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.807-822
    • /
    • 2016
  • LN-GPD 합성 분포는 몸통부분은 로그-정규분포를 두터운 꼬리에 대해서는 GPD분포를 따르도록 합성한 분포로 두터운 몸통과 꼬리를 동시에 가지는 자료를 절삭없이 효율적으로 다룰 수 있는 분포이다. 하지만 임계점을 포함하고 있기에 최대우도추정량은 매우 불안정함이 잘 알려져 있어 본 논문이서는 이를 극복하기 위해서 임계점을 먼저 추정하고 나머지 모수들에 대해서 따로 추정하는 2단계 추정 방법들에 대해서 살펴보고 그 성능을 비교해 보았다. 그 결과 동시 추정하는 최대우도추정량의 경우 불안정한 추정이 GPD 분포의 꼬리 지수에서 두드러 졌으며 임계점에 대해서는 비교적 잘 추정함을 알 수 있었다. 이와 반대로 여러 비모수적인 방법들은 꼬리 지수는 만족스럽게 잘 추정하였으나 임계점의 경우 편의가 있음을 관찰할 수 있었다. 실증자료 분석을 위해 2단계 추정법을 이스라엘 은행의 콜센터에서 수집한 서비스 시간에 대한 자료에 적합해 보았으며 그 결과 LN-GPD 합성 분포를 사용하는 것이 로그-정규분포 혹은 GPD 분포 단독으로 사용하는 것보다 자료의 손실도 없이 더 좋은 적합도를 보임을 알 수 있었다.

통합 이벤트 로그 기반 웹 공격 탐지 시스템 설계 및 구현 (Design and Implementation of Web Attack Detection System Based on Integrated Web Audit Data)

  • 이형우
    • 인터넷정보학회논문지
    • /
    • 제11권6호
    • /
    • pp.73-86
    • /
    • 2010
  • 최근 웹 공격 기술의 발달로 인하여 기존 웹 로그 분석에 통한 공격 탐지 기술뿐만 아니라 웹 방화벽 로그, 웹 IDS 및 시스템 이벤트 로그 등과 같이 다수의 웹 관련 감사 자료를 이용하여 웹 시스템에 대한 공격 이벤트를 분석하고 비정상 행위를 탐지할 필요가 있다. 따라서 본 연구에서는 웹 서버에서 생성되는 IIS 웹 로그 정보와 웹 방화벽 및 웹 IDS 시스템에서 생성되는 이벤트 로그 정보 등을 이용하여 일차적으로 통합 로그를 생성하고 이를 이용하여 웹 공격을 탐지할 수 있는 시스템을 설계 및 구현하였다. 본 연구에서 제안한 시스템은 다중 웹 세션에 대한 분석 과정을 수행하고 웹 시스템 공격과 관련된 연관성을 분석하여 대용량의 웹 로그 및 웹 IDS/방화벽 정보를 대상으로 효율적 공격 탐지 기능을 제공하도록 하였다. 본 연구에서 제시한 시스템을 사용할 경우 능동적이고 효율적인 웹 로그 공격 이벤트 분석 및 웹 공격을 탐지할 수 있는 장점이 있다.

제1형 우측중도절단된 로그정규 수명 자료를 모니터링하는 누적합 관리도 (CUSUM charts for monitoring type I right-censored lognormal lifetime data)

  • 최민재;이재헌
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.735-744
    • /
    • 2021
  • 제품의 수명을 유지시키는 것은 품질관리의 주요 목표 중 하나이다. 실제 공정에서는 시간 및 비용의 문제로 인해 모든 표본의 수명을 측정할 수 없는 경우가 많이 발생하기 때문에, 대부분 중도절단된 자료를 포함시켜 표본을 구성한다. 이 논문에서는 제1형의 우측중도절단된 수명 자료가 로그정규분포를 따르는 경우, 제품 수명의 평균을 모니터링하는 두 가지 누적합 관리도 절차를 제안한다. 하나는 우도비에 기초한 누적합 관리도이고, 다른 하나는 이항분포에 기초한 누적합 관리도 절차이다. 모의실험을 통해 평균런길이를 비교하는 방법으로 제안된 두 관리도 절차의 성능을 비교하였다. 모의실험 결과, 중도절단율이 낮은 경우, 형상모수값이 작은 경우, 평균의 감소 변화량이 큰 경우에는 우도비 누적합 관리도가 더 효율적이며, 반대로 중도절단율이 높은 경우, 형상모수값이 큰 경우, 평균의 감소 변화량이 적은 경우에는 이항 누적합 관리도가 더 효율적인 것으로 나타났다.

사용자 행동 패턴 분석을 이용한 규칙 기반의 컨텐츠 사이트 관리 모델 (A Content Site Management Model by Analyzing User Behavior Patterns)

  • 김정민;김영자;옥수호;문현정;우용태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.539-541
    • /
    • 2003
  • 본 논문에서는 컨텐츠 사이트에서 디지털 컨텐츠를 보호하기 위하여 사용자 행동 패턴을 분석을 이용해 특이한 성향을 보이는 사용자를 탐지하기 위한 모델을 제시하였다. 사용자의 행동 패턴을 분석하기 위한 탐지 규칙(detection rule)으로 Syntactic Rule과 Semantic Rule을 정의하였다. 사용자 로그 분석 결과 탐지 규칙에 대한 위반 정도가 일정 범위를 벗어나는 사용자를 비정상적인 사용자로 추정하였다. 또한 제안 모델은 eCRM 시스템에서 이탈 가능성이 있는 고객 집단을 사전에 탐지하여 고객으로 유지하기 위한 promotion 전략 수립에 응용될 수 있다.

  • PDF

다중 안테나를 사용한 직교 부호 도약 다중화 시스템에서 로그 우도비 기반 성능 분석 (Performance Analysis Based On Log-Likelihood Ratio in Orthogonal Code Hopping Multiplexing Systems Using Multiple Antennas)

  • 정방철;성길영;신원용
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2534-2542
    • /
    • 2011
  • 본 논문에서는 CDMA (Code Division Multiple Access) 기반 통신 시스템에서의 가용한 직교 부호의 수보다 많은 수의 사용자 수용을 위해 제안된 하향링크 통계적 다중화 기법인 기존 OCHM (Orthogonal Code Hopping Multiplexing) 기술에 다중 안테나를 사용함으로써 성능이 향상될 수 있음을 보인다. 먼저 직교 부호 할당 방식에 따른 두 가지 다른 OCHM 시스템을 소개하고, 이를 LLR (Log-Likelihood Ratio) 값 계산법에 적용 시 나타내어지는 수식 표현을 유도한다. 다음으로, 유도된 LLR 값에 기반을 두어 터보 부호기를 사용할 때, 언급한 OCHM 시스템의 FER (Frame Error Rate) 성능을 검증한다. 또한 비교를 위해 기존 3GPP 표준에서 사용되는 다중 안테나 심벌 매핑 방식의 성능도 분석한다. 결과적으로, 제안된 직교 부호 할당 방식을 적용한 다중 안테나 기반 OCHM 시스템이 기존 시스템 대비 목표 FER을 만족하는데 있어서 에너지 감소 측면에서 상당한 이득이 있음을 확인한다.

의사우도추정법에 의한 분산함수를 고려한 수위-유량 관계 곡선 산정법 개선 (Improvement of Rating Curve Fitting Considering Variance Function with Pseudo-likelihood Estimation)

  • 이우석;김상욱;정은성;이길성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1770-1773
    • /
    • 2008
  • 수위-유량 관계 곡선식에 포함되어져 있는 매개변수를 추정하기 위해 많이 사용되는 로그선형 회귀분석은 잔차의 비등분산성(heterocesdascity)을 고려하지 못하므로 본 연구에서는 의사우도추정법(Pseudo-likelihood Estimation, P-LE)에 의해 분산함수를 추정하고 이와 함께 회귀계수를 추정할 수 있는 방법을 제시하였다. 이 과정에서 제시된 회귀잔차를 최소화하기 위하여 SA(simulated annealing)이라는 전역 최적화 알고리즘을 적용하였다. 또한 수위-유량 관계 곡선식은 단면 등의 영향으로 인해 구간에 따라 각각 다르게 구축되어져야 하므로 이를 보다 객관적으로 판단하고 분리 위치를 정확히 추정하기 위하여 Heaviside 함수를 의사우도함수에 포함시켜 결과를 추정하도록 하였으며, 2개의 구간을 가지는 유량자료를 이용하여 제시된 방법의 합리성을 통계적으로 실험하였다. 이와 같이 통계적 실험을 통해 제시된 방법들이 기존 방법과 비교하여 가질 수 있는 장점을 파악하였으며, 제시된 방법들을 금강유역 5개 지점에서 대해 수행하여 효율성을 검증하였다.

  • PDF