• 제목/요약/키워드: false-positive error

검색결과 72건 처리시간 0.021초

Likelihood Based Confidence Intervals for the Difference of Proportions in Two Doubly Sampled Data with a Common False-Positive Error Rate

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제17권5호
    • /
    • pp.679-688
    • /
    • 2010
  • Lee (2010) developed a confidence interval for the difference of binomial proportions in two doubly sampled data subject to false-positive errors. The confidence interval seems to be adequate for a general double sampling model subject to false-positive misclassification. However, in many applications, the false-positive error rates could be the same. On this note, the construction of asymptotic confidence interval is considered when the false-positive error rates are common. The coverage behaviors of nine likelihood based confidence intervals are examined. It is shown that the confidence interval based Rao score with the expected information has good performance in terms of coverage probability and expected width.

카이제곱 통계량을 이용한 개선된 베이지안 스팸메일 필터 (An Improved Bayesian Spam Mail Filter based on Ch-square Statistics)

  • 김진상;최상열
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.403-414
    • /
    • 2005
  • 현재까지 개발된 스팸 메일 필터는 주로 베이지안 학습을 이용한 문서분류에 바탕을 두고 있지만, 정확률 향상의 한계라는 문제점과 더불어 일반 메일을 스팸 메일로 오분류하는 치명적인 오류를 극복하지 못하는 문제점을 안고 있다. 본 논문은 카이제곱 통계량을 바탕으로 베이지안 필터의 false positive 에러를 해결하고. 더불어 정확률과 재현율 향상을 동시에기할 수 있는 스팸 메일 필터링 방법을 기술한다. 또한 본 논문에서 사용된 방법은 사용자의 배경 지식을 기계학습 단계에서 파라미터로 반영하여 시스템의 유연성을 높이고 나아가 개인화된 시스템으로 확장시킬 수 있다는 장점도 있다.

  • PDF

Privacy 속성 기반의 오인된 메일 복구 알고리즘 개발 (Development of A Recovery-algorithm of False-Positive Mail based on the Property of the Privacy)

  • 서상진;박노경;진현준
    • 전기전자학회논문지
    • /
    • 제9권2호
    • /
    • pp.108-114
    • /
    • 2005
  • 현재 전자우편은 정보통신 사회의 중요한 의사소통 수단이 되고 있으나, 스팸 메일의 증가로 인해 각종 사회 문제를 발생시키고 있다. 스팸 차단을 위해 관련 기관 및 기업이 다양한 형태의 스팸 차단 기술을 개발하고 있으나, 다양한 스팸 유형에 따른 대응이 각각 이루어져야 하므로 많은 처리 비용과 시스템의 복잡도가 가중되고 있다. 그리고 스팸 차단 기술 적용 시, 스팸 방지 필터의 적용 순서에 따라 차단 오인율(False-Positive Error)이 달라져 이용 신뢰도에 큰 영향을 끼친다. 본 논문에서는 스팸 차단 필터의 이용 신뢰도를 향상시키기 위해, Privacy 정보 기반의 False-Positive 메일 복구 기법을 제안 및 구현하였다. 구현된 프로토 타입을 통해 False-Positive 메일 복구 과정을 검증하고, 처리 결과를 분석 및 요약한다.

  • PDF

The Role of Artificial Observations in Misclassified Binary Data with Common False-Positive Error

  • Lee, Seung-Chun
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.697-706
    • /
    • 2012
  • An Agresti-Coull type test is considered for the difference of binomial proportions in two doubly sampled data subject to common false-positive error. The performance of the test is compared with likelihood-based tests. The Agresti-Coull test has many desirable properties in that it can approximate the nominal significance level well, and has comparable power performance with a computational advantage.

블룸필터의 오류 확률에 대한 분석 (An Analysis on the Error Probability of A Bloom Filter)

  • 김성용;김지홍
    • 정보보호학회논문지
    • /
    • 제24권5호
    • /
    • pp.809-815
    • /
    • 2014
  • 최근 정보통신 기술의 발달로 인하여 데이터의 양이 점차 증가하고 있으며, 이에 대한 처리와 관련된 연구가 활발히 진행되고 있다. 주어진 집합 내에 특정 개체의 존재여부를 알기위해 사용되고 있는 블룸필터는 데이터의 공간 활용에 매우 유용한 구조이다. 본 논문에서는 블룸필터에서 발생될 수 있는 오류 확률을 소개한다. 특히 실험실적 분석방법에 의하여 수정된 긍정오류 확률에 대한 일반식을 유도한다. 마지막으로 지금까지 사용되고 있는 블룸필터에 대한 긍정오류확률식과 이에 대한 관련논문을 이용하여 비교, 분석한다.

이중표본에서 모비율의 구간추정 (Interval Estimation of Population Proportion in a Double Sampling Scheme)

  • 이승천;최병수
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1289-1300
    • /
    • 2009
  • 표본추출 비용의 절감을 위해 흔히 사용되는 이중표본추출방법은 대부분의 표본들이 2종류의 오류에 의해 오염이 되어 있어 통계적 분석이 상대적으로 용이하지 않다. 특히, 비율의 추론을 위한 중요한 분석 도구인 구간추정은 현재까지 우도추정량의 정규근사에 의존하는 Wald 방법만이 알려져 있으나 Wald 신뢰구간은 포함확률의 근사성 등에서 많은 문제가 있다는 것이 여러 연구에서 확인되고 있다. 본 연구에서는 이중표본추출에서 Wald 신뢰구간의 문제점을 파악하고 이에 대한 대안으로 Agresti-Coull 유형의 신뢰구간을 제시한다.

화재감지 오보 감소를 위한 다중정보기반 시스템의 Test Bed 설계 (Test Bed Design of Fire Detection System Based on Multi-Sensor Information for Reduction of False Alarms)

  • 이기준;김형권;이봉우;김태옥;신동일
    • 한국가스학회지
    • /
    • 제16권6호
    • /
    • pp.107-114
    • /
    • 2012
  • 화재감지 시스템은 화재발생 시 위험 감지 및 전파를 위해 사용되고 있는데, 현재 사용 중인 대부분의 화재감지 시스템은 실보와 비화재보의 가능성으로부터 오동작이 빈번하게 발생한다. 본 연구에서는 화재감지의 신뢰성 개선을 위해 열 감지기, 연기 감지기 및 일산화탄소 농도 감지기의 3가지 독립정보를 통합적으로 이용하여 화재를 감지하는 알고리즘을 제안하고, LabVIEW를 이용하여 test bed를 구축하여 검증하였다. 즉, NIST의 Fire Research Division에서 제공하는 상황별 센서 측정 데이터를 이용하여 시뮬레이션을 진행하였으며, 실보와 비화재보의 가능성을 저감시키는 것을 확인할 수 있었다.

Design of Hybrid Network Probe Intrusion Detector using FCM

  • Kim, Chang-Su;Lee, Se-Yul
    • Journal of information and communication convergence engineering
    • /
    • 제7권1호
    • /
    • pp.7-12
    • /
    • 2009
  • The advanced computer network and Internet technology enables connectivity of computers through an open network environment. Despite the growing numbers of security threats to networks, most intrusion detection identifies security attacks mainly by detecting misuse using a set of rules based on past hacking patterns. This pattern matching has a high rate of false positives and can not detect new hacking patterns, making it vulnerable to previously unidentified attack patterns and variations in attack and increasing false negatives. Intrusion detection and prevention technologies are thus required. We proposed a network based hybrid Probe Intrusion Detection model using Fuzzy cognitive maps (PIDuF) that detects intrusion by DoS (DDoS and PDoS) attack detection using packet analysis. A DoS attack typically appears as a probe and SYN flooding attack. SYN flooding using FCM model captures and analyzes packet information to detect SYN flooding attacks. Using the result of decision module analysis, which used FCM, the decision module measures the degree of danger of the DoS and trains the response module to deal with attacks. For the performance evaluation, the "IDS Evaluation Data Set" created by MIT was used. From the simulation we obtained the max-average true positive rate of 97.064% and the max-average false negative rate of 2.936%. The true positive error rate of the PIDuF is similar to that of Bernhard's true positive error rate.

오디오 워터마크를 이용한 실시간 방송동기화시스템의 구현 (The Implemetation of Real-time Broadcast Synchronizing System Using Audio Watermark)

  • 신동환;김종원
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권12호
    • /
    • pp.716-722
    • /
    • 2005
  • In this paper, we propose the audio watermarking algorithm based on the critical band of HAS(human auditory system) without audibly affecting the quality of the watermarked audio and implement the detecting algorithm on the BSS(broadcast synchronizing system) for testing the proposed algorithm. According to the audio quality test, the SNR(signal to noise ratio) of the watermarked audio objectively is 66dB above. In the robustness test, the proposed algorithm can detect the watermark more than $90\%$ from various compression(MP3, AAC), A/D and D/A conversions, sampling rate conversions and especially asynchronizing attacks. The BSS automatically switches the programs between the key station and the local station in broadcasting system. The result of reliability test of implemented system by using the real broadcasting audio has no false positive error during 30 days. Because of detecting once processing per 0.5 second, we can judge that the false positive error does not occur.

딥러닝과 전이학습을 이용한 콘크리트 균열 인식 및 시각화 (Recognition and Visualization of Crack on Concrete Wall using Deep Learning and Transfer Learning)

  • 이상익;양경모;이제명;이종혁;정영준;이준구;최원
    • 한국농공학회논문집
    • /
    • 제61권3호
    • /
    • pp.55-65
    • /
    • 2019
  • Although crack on concrete exists from its early formation, crack requires attention as it affects stiffness of structure and can lead demolition of structure as it grows. Detecting cracks on concrete is needed to take action prior to performance degradation of structure, and deep learning can be utilized for it. In this study, transfer learning, one of the deep learning techniques, was used to detect the crack, as the amount of crack's image data was limited. Pre-trained Inception-v3 was applied as a base model for the transfer learning. Web scrapping was utilized to fetch images of concrete wall with or without crack from web. In the recognition of crack, image post-process including changing size or removing color were applied. In the visualization of crack, source images divided into 30px, 50px or 100px size were used as input data, and different numbers of input data per category were applied for each case. With the results of visualized crack image, false positive and false negative errors were examined. Highest accuracy for the recognizing crack was achieved when the source images were adjusted into 224px size under gray-scale. In visualization, the result using 50 data per category under 100px interval size showed the smallest error. With regard to the false positive error, the best result was obtained using 400 data per category, and regarding to the false negative error, the case using 50 data per category showed the best result.