• 제목/요약/키워드: Data Fragment Classification

검색결과 5건 처리시간 0.019초

Evaluation of the classification method using ancestry SNP markers for ethnic group

  • Lee, Hyo Jung;Hong, Sun Pyo;Lee, Soong Deok;Rhee, Hwan seok;Lee, Ji Hyun;Jeong, Su Jin;Lee, Jae Won
    • Communications for Statistical Applications and Methods
    • /
    • 제26권1호
    • /
    • pp.1-9
    • /
    • 2019
  • Various probabilistic methods have been proposed for using interpopulation allele frequency differences to infer the ethnic group of a DNA specimen. The selection of the statistical method is critical because the accuracy of the statistical classification results vary. For the ancestry classification, we proposed a new ancestry evaluation method that estimate the combined ethnicity index as well as compared its performance with various classical classification methods using two real data sets. We selected 13 SNPs that are useful for the inference of ethnic origin. These single nucleotide polymorphisms (SNPs) were analyzed by restriction fragment mass polymorphism assay and followed by classification among ethnic groups. We genotyped 400 individuals from four ethnic groups (100 African-American, 100 Caucasian, 100 Korean, and 100 Mexican-American) for 13 SNPs and allele frequencies that differed among the four ethnic groups. Additionally, we applied our new method to HapMap SNP genotypes for 1,011 samples from 4 populations (African, European, East Asian, and Central-South Asian). Our proposed method yielded the highest accuracy among statistical classification methods. Our ethnic group classification system based on the analysis of ancestry informative SNP markers can provide a useful statistical tool to identify ethnic groups.

The Concept and Application Methods of Intelligent Content

  • Yoon Yong-Bae;Chae Song-Hwa;Kim Won-Il
    • International Journal of Contents
    • /
    • 제2권3호
    • /
    • pp.1-5
    • /
    • 2006
  • Intelligent Content is defined as detailed information or fragment of content which contains a semantic data structure. This semantic structure makes possible to do various intelligent operations. There are wide range of content-oriented applications such as classification, retrieval, extraction, translation, presentation and question-answering. The concept of Intelligent Content is applied to various fields like MPEG and Semantic Web. In this paper, we discuss the several important researches of Intelligent Content and how to apply this conception to these fields.

  • PDF

Comparison of RAPD, AFLP, and EF -1 α Sequences for the Phylogenetic Analysis of Fusarium oxysporum and Its formae speciales in Korea

  • Park, Jae-Min;Kim, Gi-Young;Lee, Song-Jin;Kim, Mun-Ok;Huh, Man-Kyu;Lee, Tae-Ho;Lee, Jae-Dong
    • Mycobiology
    • /
    • 제34권2호
    • /
    • pp.45-55
    • /
    • 2006
  • Although Fursarium oxysporum causes diseases in economically important plant hosts, identification of F. oxysporum formae speciales has been difficult due to confusing phenotypic classification systems. To resolve these complexity, we evaluated genetic relationship of nine formae speciales of F. oxysporum with random amplified polymorphic DNA (RAPD), amplified fragment length polymorphism (AFLP), and translation elongation factor-l alpha ($EF-1{\alpha}$) gene. In addition, the correlation between mycotoxin content of fusaric acid and isolates based on molecular marker data was evaluated using the modified Mantel's test. According to these result, these fusaric acid-producing strains could not identify clearly, and independent of geographic locations and host specificities. However, in the identification of F. oxysporum formae speciales, especially, AFLP analysis showed a higher discriminatory power than that of a the RAPD and $EF-1{\alpha}$ analyses, all three techniques were able to detect genetic variability among F. oxysporum formae speciales in this study.

바이트 평균의 Gray-Scale화를 통한 Signature가 존재하지 않는 멀티미디어 데이터 조각 파일 타입 분류 연구 (Classification of Non-Signature Multimedia Data Fragment File Types With Byte Averaging Gray-Scale)

  • 윤현호;김재헌;조현수;원종은;김견우;조재현
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.189-196
    • /
    • 2020
  • 일반적으로 시그니처와 파일 메타정보가 없는 파편화된 파일은 복구가 어렵다. 특히 멀티미디어 파일은 파편화 가능성이 크고 높은 엔트로피를 가지고 있으므로 현재 시그니처 기반의 카빙으로는 복구하는 것이 거의 불가능하다. 이러한 문제를 해결하기 위해 파편화된 파일에 대한 연구가 진행되고 있지만 멀티미디어 파일에 대한 연구는 부족한 실정이다. 본 논문은 시그니처(Signature)와 파일 메타정보가 없는 파편화된 멀티미디어 파일의 타입을 분류하는 연구이다. 파일 타입에 따라 특정 바이트 값의 빈도 차이를 통해 각 파일 타입의 특징값을 추출하며, 그에 맞는 Gray-Scale 테이블을 설계하고 CNN(Convolutional Neural Networks) 모델을 이용하여 JPG, PNG, H.264, WAV 총 4가지 멀티미디어의 파일 타입을 분류하는 방법을 제시한다. 본 논문을 통해 시그니처와 파일 메타정보가 없는 파편화된 파일 타입의 분류 연구를 촉진하여 다양한 파일의 복구 가능성을 높일 수 있을 것으로 기대된다.

RAPD, ISSR과 PCR-RFLP를 이용한 한국산 제비꽃속(Viola)의 종간 유연관계 (Interspecific relationships of Korean Viola based on RAPD, ISSR and PCR-RFLP analyses)

  • 유기억;이우철;권오근
    • 식물분류학회지
    • /
    • 제34권1호
    • /
    • pp.43-61
    • /
    • 2004
  • 한국산 제비꽃속 32분류군과 일본산 2집단 등 총 34집단에 대한 유연관계를 알아보기 위하여 RAPD(randomly amplified polymorphic DNA), ISSR(inter simple sequence repeat) 및 PCR-RFLP(restriction fragment length polymorphism) 분석을 실시하였다. RAPD 분석에서는 40개의 primer 중 6개가 분류군 전체에서 반응을 보였고 이로부터 총 70개(98.6%)의 다형화 밴드를 얻었으며, ISSR 분석에서는 4개의 primer로 부터 28개(96.6%)의 다형화밴드를 얻었다. 엽록체 DNA의 non-coding부분을 이용한 PCR-RFLP 분석에서는 반응이 일어난 4지역에서 증폭된 약 6.78 kb의 DNA 각각에 대하여 15가지 제한효소를 처리한 결과 총 80개의 restriction site를 얻었으며 그중 16 site는 polymorphic하게 나타나 20%의 다형화를 보였다. 본 연구에서 다룬 3가지 형질에 의한 유집분석 결과 각각의 형질에 의해서는 서로 일치하지 않는 유집형태를 보였지만 3가지 형질을 통합한 결과는 진정제비꽃절(sect. Nomimium)내 아절과 계열간 구분이 명확하게 나타났으며 무경종과 유경종도 구별이 가능하여 외부형태형질에 의한 기존의 분류체계와 일치하였다. 그러나 노랑제비꽃절(sect. Chamaemelanium)은 진정제비꽃절과 독립적인 군을 형성하지 않고 진정제비꽃절 내 무경종그룹인 Patellares아절과 Vaginatae아절 사이에 위치하여 나타났다. 형태적인 변이가 매우 심한 분류군으로 알려진 태백제비꽃군(V. albida complex)은 Patellares아절 내에서 하나의 군으로 유집되어 Pinnatae계열로 처리하는 것이 타당할 것으로 생각된다. 본 연구에서 사용한 3가지 형질 중 RAPD 분석방법은 ISSR과 PCR-RFLP 분석보다 제비꽃속의 종간 유연관계를 밝히는데 더 유용한 것으로 판단된다.