• 제목/요약/키워드: False Errors

검색결과 123건 처리시간 0.019초

Comparative Evaluation of Intron Prediction Methods and Detection of Plant Genome Annotation Using Intron Length Distributions

  • Yang, Long;Cho, Hwan-Gue
    • Genomics & Informatics
    • /
    • 제10권1호
    • /
    • pp.58-64
    • /
    • 2012
  • Intron prediction is an important problem of the constantly updated genome annotation. Using two model plant (rice and $Arabidopsis$) genomes, we compared two well-known intron prediction tools: the Blast-Like Alignment Tool (BLAT) and Sim4cc. The results showed that each of the tools had its own advantages and disadvantages. BLAT predicted more than 99% introns of whole genomic introns with a small number of false-positive introns. Sim4cc was successful at finding the correct introns with a false-negative rate of 1.02% to 4.85%, and it needed a longer run time than BLAT. Further, we evaluated the intron information of 10 complete plant genomes. As non-coding sequences, intron lengths are not limited by a triplet codon frame; so, intron lengths have three phases: a multiple of three bases (3n), a multiple of three bases plus one (3n + 1), and a multiple of three bases plus two (3n + 2). It was widely accepted that the percentages of the 3n, 3n + 1, and 3n + 2 introns were quite similar in genomes. Our studies showed that 80% (8/10) of species were similar in terms of the number of three phases. The percentages of 3n introns in $Ostreococcus$ $lucimarinus$ was excessive (47.7%), while in $Ostreococcus$ $tauri$, it was deficient (29.1%). This discrepancy could have been the result of errors in intron prediction. It is suggested that a three-phase evaluation is a fast and effective method of detecting intron annotation problems.

적응형 변형 인식부를 이용한 침입 탐지 학습알고리즘 (Intrusion Detection Learning Algorithm using Adaptive Anomaly Detector)

  • 심귀보;양재원;김용수;이세열
    • 한국지능시스템학회논문지
    • /
    • 제14권4호
    • /
    • pp.451-456
    • /
    • 2004
  • 징후 기반의 침입 탐지 시스템은 일정한 침입 탐지 규칙을 구성하여 라이브러리에 저장한 후 새로운 입력에 대해 규칙과 패턴 매칭을 하여 침입 여부를 판정한다. 그러나 징후(규칙)를 기반으로 하는 침입 탐지 시스템은 통상적으로 크게 2가지의 제약을 갖는다. 첫 번째는 침입에 대한 규칙을 구성하지 못할 경우 그에 따른 FN 오류(false negative error)가 발생할 수 있으며, 두 번째는 규칙의 다양성을 확보하기 위해서 많은 규칙을 구성하게 되었을 경우 그에 소요되는 자원의 규모가 커진다는 점이다. 이에 본 논문에서는 생체 면역 세포의 생성 과정인 부정 선택을 공학적으로 모델링하여 변형 인식부를 구성하고 이를 후보 개체군으로 하여 유전자 알고리즘을 이용해 진화시킴으로서 변이적인 침입에 대해 탐지 가능한 변형 인식부의 학습 알고리즘을 제안한다. 제안한 알고리즘은 컴퓨터 시뮬레이션을 통하여 그 유효성을 입증한다.

위험지반 터널 굴진면의 실시간 변위 감시를 위한 계측시스템 개발 (Developments of real-time monitoring system to measure displacements on face of tunnel in weak rock)

  • 윤현석;송규진;김영배;김창용;서용석
    • 한국터널지하공간학회 논문집
    • /
    • 제17권4호
    • /
    • pp.441-455
    • /
    • 2015
  • 본 연구에서는 터널 시공 중 굴진면에서의 붕괴 위험을 판단하여 작업자의 안전을 확보할 수 있는 굴진면 안전감시시스템을 개발하였다. 이 시스템은 실시간으로 측정되는 굴진면 변위를 x-MR 관리도기법으로 실시간 분석함으로써 굴진면의 이상 거동을 감시할 수 있다. 또한 관리 기준을 초과하는 측정치의 개수와 이동 범위 k를 비교하여 굴진면의 이상 거동과 작업 과정에서 발생하는 오류를 구분할 수 있도록 오경보 판단 알고리듬을 개발하였다. 본 연구결과는 위험지반 구간에서의 굴진면의 실시간 거동 감시에 적용되어 작업자의 피해를 최소화 할 수 있을 것으로 판단된다.

Frequency of Unnecessarily Biopsies among Patients with Suspicion of Prostate Cancer in Syrian Men

  • Bachour, Dala-Maria;Chahin, Emil;Al-Fahoum, Sahar
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권14호
    • /
    • pp.5967-5970
    • /
    • 2015
  • Background: The prevalence of prostate cancer is considered high in many countries, and screening tests are very important in order to detect prostate cancer in its early stages; however false positivity with these screening tests means that a lot of patients undergo unnecessary biopsy, which is an invasive procedure, for the confirmatory test. The purpose of this study was to estimate the frequency of unnecessary biopsy cases in patients referred for prostate biopsy in one of the most important and overload cancer centers in Syria. Materials and Methods: Retrospective data for a period of four years between January 2009 and December 2012 were collected in Al-Bayrouni University Medical hospital in Damascus, Syria. The patients from whom data were collected were referred to our histopathological department because of elevated prostate specific antigen (PSA) serum or an abnormal digital rectal examination (DRE). All patients underwent prostatic TRUS-guided biopsies. Diagnosis of prostate cancer (PCa) or benign prostatic hyperplasia (BPH) was based on histopathological examination and prostate cancers cases were graded and scored according to the Gleason score system. Results: For the 406 patients referred to biopsy, the $mean{\pm}SD$ age was $58.4{\pm}23.3$ years. The $mean{\pm}SD$ PSA level was $49.2{\pm}21.5ng/ml$. Of the total we found 237 patients diagnosed with PCa (58. 4%), 166 patients with BPH (40.9%) and 3 cases were unable to be diagnosed (0.7%) because of biopsy collection errors. Conclusions: Our study shows that a high percentage of patients are undergoing unnecessary biopsy, which suggests that the performed screening tests had a high level of false positive and may need re-evaluation.

학습 알고리즘 기반의 적응형 침입 탐지 알고리즘 (Adaptive Intrusion Detection Algorithm based on Learning Algorithm)

  • 심귀보;양재원;이동욱;서동일;최양서
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.75-81
    • /
    • 2004
  • 징후 기반의 침입 탐지 시스템은 일정한 침입 탐지 규칙을 구성하여 라이브러리에 저장한 후 새로운 입력에 대해 규칙과 패턴 매칭을 하여 침입 여부를 판정한다. 그러나 징후(규칙)를 기반으로 하는 침입 탐지 시스템은 통상적으로 크게 2가지의 제약을 갖는다. 첫 번째는 침입에 대한 규칙을 구성하지 못할 경우 그에 따른 FN 오류(false negative error)가 발생할 수 있으며, 두 번째는 규칙의 다양성을 확보하기 위해서 많은 규칙을 구성하게 되었을 경우 그에 소요되는 자원의 규모가 커진다는 점이다. 이에 본 논문에서는 생체 면역 세포의 생성 과정인 부정 선택을 공학적으로 모델링하여 변형 인식부를 구성하고 이를 후보 개체군으로 하여 유전자 알고리즘을 이용해 진화시킴으로서 변이적인 침입에 대해 탐지 가능한 변형 인식부의 학습 알고리즘을 제안한다. 제안한 알고리즘은 컴퓨터 시뮬레이션을 통하여 그 유효성을 입증한다.

한국 인구동태통계 작성에 대한 평가 (An Evaluation of The Vital Registration System in Korea)

  • 김남일
    • 한국인구학
    • /
    • 제20권1호
    • /
    • pp.47-63
    • /
    • 1997
  • 인구동태 신고조직과 관리에 관련된 문제, 신고행태와 이에서 발생되는 통계의 오차. 그리고 이들 오차의 수정방법 등이 검토되었다. 주요결과를 보면 1994년 현재 출생과 사망의 당년신고율이 모두 통계청 출생, 사망 추정건수의 95%를 웃도는 것으로 나타났고, 1970년대 후반부터 신고율이 높은 증가율을 보였다. 이와 같이 신고율이 급성장한 것은 1) 신고서 양식의 간소화, 2) 신고의 편의-현거주지 읍,면,동 신고 3) 신고 불이행에 대한 과태료율의 강화, 4) 사회보장제도 등 개선활동이 크게 작용하였다. 그러나 출생,사망신고는 대중과 담당공무원에게 충분한 동기가 부여되어 있지 않은 업무임으로 완전한 법정기한내 신고를 달성하기 위해서는 반드시 지속적인 경계장치가 있어야 한다. 1980년대에 와서 당년신고의 급격한 증가와 함께 크게 개선되었을 것으로 생각되지만 아직 자료의 질적인 측면에 대한 구체적 조사연구가 없으므로 국민의 신고행태에 관한 조사연구가 필요하다. 아직 상당한 사망년월일의 착오신고가 있을 것으로 유추되고, 심각한 문제는 연구논문들이 발생년월일 착오신고 등의 오차에 대한 검토와 수정이 전혀 없이 자료를 분석하고 있다는 점이다. 사건 발생의 착오신고는 연도별 동태율에 큰 영향을 미치고, 특히 사망의 경우, 신고율이 급격한 증가추세를 보일 때 사망률이 낮은 저연령층의 사망률을 크게 왜곡시킨다. 1970년대 사망신고 자료를 분석한 것을 보면 3세에서 19세 사이의 각 연령별 사망자 신고가 추정된 사망자수보다 크게는 67%까지 과대신고된 것으로 나타났다.

  • PDF

Evaluation of Source Identification Method Based on Energy-Weighting Level with Portal Monitoring System Using Plastic Scintillator

  • Lee, Hyun Cheol;Koo, Bon Tack;Choi, Chang Il;Park, Chang Su;Kwon, Jeongwan;Kim, Hong-Suk;Chung, Heejun;Min, Chul Hee
    • Journal of Radiation Protection and Research
    • /
    • 제45권3호
    • /
    • pp.117-129
    • /
    • 2020
  • Background: Radiation portal monitors (RPMs) involving plastic scintillators installed at the border inspection sites can detect illicit trafficking of radioactive sources in cargo containers within seconds. However, RPMs may generate false alarms because of the naturally occurring radioactive materials. To manage these false alarms, we previously suggested an energy-weighted algorithm that emphasizes the Compton-edge area as an outstanding peak. This study intends to evaluate the identification of radioactive sources using an improved energy-weighted algorithm. Materials and Methods: The algorithm was modified by increasing the energy weighting factor, and different peak combinations of the energy-weighted spectra were tested for source identification. A commercialized RPM system was used to measure the energy-weighted spectra. The RPM comprised two large plastic scintillators with dimensions of 174 × 29 × 7 ㎤ facing each other at a distance of 4.6 m. In addition, the in-house-fabricated signal processing boards were connected to collect the signal converted into a spectrum. Further, the spectra from eight radioactive sources, including special nuclear materials (SNMs), which were set in motion using a linear motion system (LMS) and a cargo truck, were estimated to identify the source identification rate. Results and Discussion: Each energy-weighted spectrum exhibited a specific peak location, although high statistical fluctuation errors could be observed in the spectrum with the increasing source speed. In particular, 137Cs and 60Co in motion were identified completely (100%) at speeds of 5 and 10 km/hr. Further, SNMs, which trigger the RPM alarm, were identified approximately 80% of the time at both the aforementioned speeds. Conclusion: Using the modified energy-weighted algorithm, several characteristics of the energy weighted spectra could be observed when the used sources were in motion and when the geometric efficiency was low. In particular, the discrimination between 60Co and 40K, which triggers false alarms at the primary inspection sites, can be improved using the proposed algorithm.

Evaluation of a Solar Flare Forecast Model with Cost/Loss Ratio

  • Park, Jongyeob;Moon, Yong-Jae;Lee, Kangjin;Lee, Jaejin
    • 천문학회보
    • /
    • 제40권1호
    • /
    • pp.84.2-84.2
    • /
    • 2015
  • There are probabilistic forecast models for solar flare occurrence, which can be evaluated by various skill scores (e.g. accuracy, critical success index, heidek skill score, true skill score). Since these skill scores assume that two types of forecast errors (i.e. false alarm and miss) are equal or constant, which does not take into account different situations of users, they may be unrealistic. In this study, we make an evaluation of a probabilistic flare forecast model (Lee et al. 2012) which use sunspot groups and its area changes as a proxy of flux emergence. We calculate daily solar flare probabilities from 1996 to 2014 using this model. Overall frequencies are 61.08% (C), 22.83% (M), and 5.44% (X). The maximum probabilities computed by the model are 99.9% (C), 89.39% (M), and 25.45% (X), respectively. The skill scores are computed through contingency tables as a function of forecast probability, which corresponds to the maximum skill score depending on flare class and type of a skill score. For the critical success index widely used, the probability threshold values for contingency tables are 25% (C), 20% (M), and 4% (X). We use a value score with cost/loss ratio, relative importance between the two types of forecast errors. We find that the forecast model has an effective range of cost/loss ratio for each class flare: 0.15-0.83(C), 0.11-0.51(M), and 0.04-0.17(X), also depending on a lifetime of satellite. We expect that this study would provide a guideline to determine the probability threshold for space weather forecast.

  • PDF

ATSC DTV 수신기를 위한 이중 후방필터 구조의 결정 궤환 등화기 (An Equalization Technique of Dual-Feedback Structure in ATSC DTV Receivers)

  • 오영호;김대진
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.540-547
    • /
    • 2005
  • ATSC DTV 수신기의 결정 궤환 등화기는 양자화기나 지연시간이 없는 트렐리스 복호기에서 에러가 발생하면, 발생된 에러는 후방 필터의 입력으로 사용되어 에러 전파 현상을 야기한다. 에러 전파 현상은 잔류 에러의 증가와 수렴 속도 저하라는 등화기의 성능 열화를 가져온다. 따라서 본 논문에서는 에러 전파 현상을 해결하기 위하여 이중 후방 필터 구조의 결정 궤환 등화기를 제안한다. 제안된 등화기의 후방 필터는 지연 시간이 없는 트렐리스 복호기의 출력을 입력으로 사용하는 결정 후방 필터와 등화기의 출력을 입력으로 사용하는 비결정 후방 필터로 구성되어 있다. 부가적으로 사용된 비결정 후방 필터는 에러 전파 현상이 발생하지 않고, 또한 결정 후방 필터에서 발생되는 에러 전파 현상을 보상한다. 따라서 제안된 등화기는 기존의 등화기에 비해서 수렴 속도는 빨라지고 잔류에러는 감소한다. 전산 모의 실험을 통하여 제안된 이중 후방필터 구조의 등화기의 성능 향상을 분석하였다.

교정사전과 신문기사 말뭉치를 이용한 한국어 철자 오류 교정 모델 (A Spelling Error Correction Model in Korean Using a Correction Dictionary and a Newspaper Corpus)

  • 이세희;김학수
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.427-434
    • /
    • 2009
  • 인터넷 및 모바일 환경의 빠른 발전과 함께 신조어나 줄임말과 같은 철자 오류들을 포함하는 텍스트들이 활발히 통용되고 있다. 이러한 철자 오류들은 텍스트의 가독성을 떨어뜨림으로써 자연어처리 응용들을 개발하는데 걸림돌이 된다. 이러한 문제를 해결하기 위해서 본 논문에서는 철자오류 교정사전과 신문기사 말뭉치를 이용한 철자 오류 교정 모델을 제안한다. 제안 모델은 구하기 쉬운 신문기사 말뭉치를 학습 말뭉치로 사용하기 때문에 데이터 구축비용이 크지 않다는 장점이 있다. 또한 교정사전 기반의 단순 매칭 방법을 사용하기 때문에 띄어쓰기 교정 시스템이나 형태소 분석기와 같은 별도의 외부 모듈이 필요 없다는 장점이 있다. 신문기사 말뭉치와 실제 휴대폰에서 수집한 문자 메시지 말뭉치를 이용한 실험 결과, 제안 모델은 다양한 평가 척도에서 비교적 높은 성능(오교정률 7.3%, F1-척도 97.3%, 위양성율 1.1%)을 보였다.