• 제목/요약/키워드: misuse of statistical method

검색결과 17건 처리시간 0.022초

침입탐지 알고리즘 성능 최적화 및 평가 방법론 개발 (Optimizing of Intrusion Detection Algorithm Performance and The development of Evaluation Methodology)

  • 신대철;김홍윤
    • 디지털산업정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.125-137
    • /
    • 2012
  • As the Internet use explodes recently, the malicious attacks and hacking for a system connected to network occur frequently. For such reason, lots of intrusion detection system has been developed. Intrusion detection system has abilities to detect abnormal behavior and unknown intrusions also it can detect intrusions by using patterns studied from various penetration methods. Various algorithms are studying now such as the statistical method for detecting abnormal behavior, extracting abnormal behavior, and developing patterns that can be expected. Etc. This study using clustering of data mining and association rule analyzes detecting areas based on two models and helps design detection system which detecting abnormal behavior, unknown attack, misuse attack in a large network.

대한치과보철학회지에 게재된 논문의 통계적 오류: 국문논문과 영문논문의 비교 (An assessment of statistical errors of articles in the Journal of Korean Academy of Prosthodontics: Comparison between Korean version and English version)

  • 박동규;최용근;김영수;신상완
    • 대한치과보철학회지
    • /
    • 제47권3호
    • /
    • pp.273-285
    • /
    • 2009
  • 연구목적: 대한치과보철학회지에 사용된 통계적 방법의 통계적 오류현황을 파악하여 통계적 방법의 잘못된 활용으로 인한 치의학 연구논문에서의 문제를 검토하고, 또한 통계적 오류의 유형과 빈도를 파악하여 동일문제의 재발 방지 및 효율적 대처의 기회로 삼고자 함이다. 연구 재료 및 방법: 2000년부터 2006년까지의 대한치과보철학회지에 게재된 총 399편의 논문 중 통계적 방법이 사용된 292편의 논문을 조사했고, 이를 위해 1997년 국제의학학술지 편집위원회의 "생의학 학술지에 투고하는 원고의 통일양식의 통계학적 방법론에 관한 서술지침" 15개항을 기초로 하여 1) 통계 프로그램의 불명시, 2) 통계 방법의 부적절한 기술, 3) 통계용어의 오용 등으로 크게 3가지 범주로 구성된 점검표를 사용하여 통계적 방법의 종류 및 통계적 오류부분을 확인하고 이를 한글판과 영문판으로 비교해 보았다. 그 결과는 다음과 같다. 결과 및 결론: 1. 통계 프로그램 명시 오류는 한글판에선 54%가, 영문판에선 59%가 있었으나 통계적으로 유의한 차이를 보이진 않았다 (P = .66). 2. 통계 방법의 부적절한 기술에 관한 오류는 한글판에선 49%가, 영문판에선 33%가 있었으나 통계적으로 유의한 차이를 보이진 않았다 (P = .09). 3. 통계용어의 오용오류는 한글판에선 54%가, 영문판에선 24%가 있었으며 통계적으로도 유의한 차이가 있었다 (P = .01). 상기 결과로 볼 때 통계용어의 오용 오류 이외엔 통계적 유의성을 보이진 않아서 한글판과 영문판의 통계적 오류의 비율은 유사하게 나타난 걸로 추정되며, 전체적으로 대한치과보철학회지의 통계적 타당성은 다소 부족하게 나타났다. 따라서 향후 치의학 연구자는 통계적 방법을 기술하고 적용할 때 통계적 오류를 피하기 위해 주의를 기울여야 할 것이며, 아울러 치의학 논문에서의 통계학적 방법론에 대한 인식의 제고가 필요하다고 보인다.

검사법의 일치도 평가를 위한 분석기법 (Statistical Test of Agreement between Measurements in Method-comparison Study)

  • 박선일;오태호
    • 한국임상수의학회지
    • /
    • 제28권1호
    • /
    • pp.108-112
    • /
    • 2011
  • In clinical settings, researchers often want to assess agreement between two measurements (or tests) of the same continuous variable. For example, when new point-of-care analyzer for testing blood glucose level were introduced clinicians need to compare results from standard or established laboratory method of measurement to those of new or point-of-care analyzer. The question in a method-comparison study would either of two different methods be used to measure the same variable equivalently. In this paper common misuse of statistical methodologies seen in the medical literatures such as correlation coefficient and paired t-test are discussed. The Bland-Altman technique has been widely used for this purpose and provides a graphic in presentation of the findings from a method-comparison study, with a mean value of measurement, this bias and the limits of agreement. For ease of application and interpretation of this technique we discussed the analysis procedure and illustrated with two worked examples. Finally, a number of alternative ways in which data can be analysed and reported in such studies were reviewed.

한방재활의학과학회지의 통계적 오류에 관한 고찰(I) (Statistical Errors of Articles Published in the Journal of Oriental Rehabilitation Medicine(I))

  • 박태용;허태영;신병철
    • 한방재활의학과학회지
    • /
    • 제20권4호
    • /
    • pp.105-130
    • /
    • 2010
  • Objectives : The purpose of this study was to assess the statistical methods errors used in the journal of Oriental Rehabilitation Medicine(JORM) and to identify the types of errors in statistical analysis. Methods : We reviewed quantitative articles that were published in the JORM from January 2005 through October 2009. Those were not used by statistical analysis such as literature studies, case study, review articles were not included in this analysis. A total of 296 articles was reviewed. We evaluated the adequacy and the validity of the statistical techniques with our checklist established be modified Lee's checklist, and three statistical evaluators assessed together to minimize bias. Results : Of the 222 articles, 213 were used in inferential and descriptive statistics. Of those 80% of articles adopting descriptive and inferential statistics were detected having statistical errors. One articles used 1.7 statistical method unit generally. Most frequently employed statistics were student t-test, one way ANOVA. pearson correlation analysis, Mann-whitney U test, paired t-test, and chi-square test in their order. However, most frequent statistics having errors were similar in order. The most common statistic errors were as follow: 1. absence of normality test, 2. misuse between paired test and unpaired test, 3. wrong choice of repeated measures analysis without consideration of time variables, 4, increase of Type I error by using inappropriate multiple test, 5. inappropriate application of discrete or categorical data instead of continuous data in correlation analysis, 6. poor consideration of basic consumption in chi-square test, 7. confusion between frequency comparison and average comparison, 8. mentioning the statistical technique without using it. Conclusions : We found various mistake or misuses in the applications of statistical methodologies in the articles published in the JORM. Careful consideration of statistical use and review from the specialist of statistics are warranted for improving the quality of JORM.

분산분석 (The Application of Analysis of Variance (ANOVA))

  • 박선일;오태호
    • 한국임상수의학회지
    • /
    • 제27권1호
    • /
    • pp.71-78
    • /
    • 2010
  • Analysis of variance (ANOVA) is a method to analyze the data from the experimental designs comparing two or more groups or treatments at the same time, and is the most effective tool of analyzing more complex data sets with different source of variations. This article describes the logic of ANOVA, the application of the method to the analysis of a simple data set, and the methods available for performing planned or post hoc multiple comparisons between the treatments means. In addition, the common misuse of the techniques is also discussed to emphasize that an inappropriate statistical analysis is potentially far more harmful than poorly conducted research. Lastly, an example is given for illustration purposes.

연관 마이닝 기법을 이용한 침입 시나리오 자동생성 알고리즘 (Automated Generation Algorithm of the Penetration Scenarios using Association Mining Technique)

  • 정경훈;주정은;황현숙;김창수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.203-207
    • /
    • 1999
  • 본 논문에서는 연관 마이닝 기법을 이용한 침입 시나리오 자동생성 알고리즘을 제안한다. 현재 알려진 침입 탐지는 크게 비정상 탐지(Anomaly Detection)와 오용 탐지(Misuse Detection)로 분류되는데, 침입 판정을 위해 전자는 통계적 방법, 특징 추출, 신경망 기법 둥을 사용하며, 후자는 조건부 확률, 전문가 시스템, 상태 전이 분석, 패턴 매칭 둥을 사용한다. 기존에 제안된 침입 탐지 알고리즘들의 경우 알려지지 않은 침입은 보안 전문가에 의해 수동적으로 시나리오를 생성ㆍ갱신한다. 본 알고리즘은 기존의 데이터 내에 있는 알려지지 않은 유효하고 잠재적으로 유용한 정보를 발견하는데 사용되는 연관 마이닝 알고리즘을 상태전이 기법에 적용하여 침입 시나리오를 자동으로 생성한다. 본 논문에서 제안한 알고리즘은 보안 전문가에 의해 수동적으로 생성되던 침입 시나리오를 자동적으로 생성할 수 있으며, 기존 알고리즘에 비해서 새로운 침입에 대응하는 것이 용이하고 시스템 유지 보수비용이 적다는 이점이 있다.

  • PDF

초등학생들이 사용하는 채팅 언어의 분석 (Analysis on the Chatting Language of Elementary School Students)

  • 정희택;정영순
    • 정보교육학회논문지
    • /
    • 제9권1호
    • /
    • pp.99-112
    • /
    • 2005
  • 본 연구에서는 초등학생들이 사용하는 채팅 언어를 분석하고 이를 통해 발견된 특성을 제시하며, 나아가 이를 해결할 수 있는 방안을 제안한다. 채팅언어의 분석은 문장들 간의 유기적 관계를 고려하여 형식상, 내용상, 통계상의 특성으로 구분하여 분석한다. 분석 결과로 유아발음으로 변형되어 쓰기, 음절의 앞 뒤 바꾸어 쓰기, 상대방이 불분명한 대화와 같은 새로운 특성이 발견되었다. 분석 결과를 통하여 언어의 오용을 최소화하고, 아동의 정서발달에 긍정적인 채팅 문화를 정착시키기 위해 채팅 관련 컴퓨터 시스템적 방안을 제안한다.

  • PDF

다중척도 모델의 결합을 이용한 효과적 인 침입탐지 ((Effective Intrusion Detection Integrating Multiple Measure Models))

  • 한상준;조성배
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권3호
    • /
    • pp.397-406
    • /
    • 2003
  • 정보통신기술이 발전함에 따라 내부자의 불법적인 시스템 사용이나 외부 침입자에 의한 중요 정보의 유출 및 조작을 알아내는 침입탐지시스템에 대한 연구가 활발히 이루어지고 있다. 이제까지는 네트워크 패킷, 시스템 호출 감사자료 등의 척도에 은닉 마르코프 모델, 인공 신경망, 통계적 방법 등의 모델링 방법을 적용하는 연구가 이루어졌다. 그러나 사용하는 척도와 모델링 방법에 따라 취약점이 있어 탐지하지 못하는 침입이 많은데 이는 침입의 형태에 따라 흔적을 남기는 척도가 다르기 때문이다. 본 논문에서는 이러한 단일척도 침입탐지시스템의 단점을 보완하기 위해 시스템 호출, 프로세스의 자원점유율, 파일 접근이벤트 등의 세 가지 척도에 대하여 은닉 마르코프 모델, 통계적 방법, 규칙기반 방법을 사용하여 모델링한 후, 그 결과를 규칙기반 방법으로 결합하는 침입탐지 방법을 제안한다. 실험결과 다양한 침입 패턴에 대하여 다중척도 결합방법이 매우 낮은 false-positive 오류율을 보여 그 가능성을 확인할 수 있었다.

Overestimation of Radioactivity Concentration of Difficult-To-Measure Radionuclides in Scaling Factor Methodology

  • Park, Junghwan;Kim, Tae-Hyeong;Lee, Jeongmook;Kim, Junhyuck;Kim, Jong-Yun;Lim, Sang Ho
    • 방사성폐기물학회지
    • /
    • 제19권3호
    • /
    • pp.367-386
    • /
    • 2021
  • The overestimation and underestimation of the radioactivity concentration of difficult-to-measure radionuclides can occur during the implementation of the scaling factor (SF) method because of the uncertainties associated with sampling, radiochemical analysis, and application of SFs. Strict regulations ensure that the SF method as an indirect method does not underestimate the radioactivity of nuclear wastes; however, there are no clear regulatory guidelines regarding the overestimation. This has been leading to the misuse of the SF methodology by stakeholders such as waste disposal licensees and regulatory bodies. Previous studies have reported instances of overestimation in statistical implementation of the SF methodology. The analysis of the two most popular linear models of the SF methodology showed that severe overestimation may occur and radioactivity concentration data must be dealt with care. Since one major source of overestimation is the use of minimum detectable activity (MDA) values as true activity values, a comparative study of instrumental techniques that could reduce the MDAs was also conducted. Thermal ionization mass spectrometry was recommended as a suitable candidate for the trace level analysis of long-lived beta-emitters such as iodine-129. Additionally, the current status of the United States and Korea was reviewed from the perspective of overestimation.

연관마이닝 기법을 이용한 침입 시나리오 자동 탐지 알고리즘 연구 (The Study on the Automated Detection Algorithm for Penetration Scenarios using Association Mining Technique)

  • 김창수;황현숙
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.371-384
    • /
    • 2001
  • 최근 인터넷 환경에서 시스템 불법 침입은 계속적으로 증가하고 있다. 이러한 침입을 탐지하기 위한 기법들은 크게 비정상 탐지와 오용 탐지로 분류할 수 있다. 전자는 통계적 방법, 특징 추출 등을 이용하며, 후자는 조건부 확률, 전문가 시스템, 상태 전이 분석, 패턴 매칭 둥을 적용한다. 현재 연구된 침입탐지 시스템들은 결합된 방법을 사용하고 있다. 본 연구에서는 상태전이 기법과 연관 마이닝 기법을 결합한 새로운 침입 탐지 알고리즘을 제안한다. 이를 위해 첫 번째 단계는 네트워크를 통해서 입력된 명령어에 대해서 상태 테이블을 작성하는데, 이는 기존의 상태전이 분석 방법과 유사하다. 다음 단계는 연관 마이닝 기법을 이용하여 침입의 유형을 판정한다. 이러한 처리 과정에 따라 본 연구에서는 자동화된 침입 시나리오 생성 알고리즘을 제안한다.

  • PDF