• 제목/요약/키워드: Distributed Clustering

검색결과 222건 처리시간 0.022초

RAPD Polymorphism and Genetic Distance among Phenotypic Variants of Tamarindus indica

  • Mayavel, A;Vikashini, B;Bhuvanam, S;Shanthi, A;Kamalakannan, R;Kim, Ki-Won;Kang, Kyu-Suk
    • 한국산림과학회지
    • /
    • 제109권4호
    • /
    • pp.421-428
    • /
    • 2020
  • Tamarind (Tamarindus indica L.) is one of the multipurpose tree species distributed in the tropical and sub-tropical climates. It is an important fruit yielding tree that supports the livelihood and has high social and cultural values for rural communities. The vegetative, reproductive, qualitative, and quantitative traits of tamarind vary widely. Characterization of phenotypic and genetic structure is essential for the selection of suitable accessions for sustainable cultivation and conservation. This study aimedto examine the genetic relationship among the collected accessions of sweet, red, and sour tamarind by using Random Amplified Polymorphic DNA (RAPD) primers. Nine accessions were collected from germplasm gene banks and subjected to marker analysis. Fifteen highly polymorphic primers generated a total of 169 fragments, out of which 138 bands were polymorphic. The polymorphic information content of RAPD markers varied from 0.10 to 0.44, and the Jaccard's similarity coefficient values ranged from 0.37 to 0.70. The genetic clustering showed a sizable genetic variation in the tamarind accessions at the molecular level. The molecular and biochemical variations in the selected accessions are very important for developing varieties with high sugar, anthocyanin, and acidity traits in the ongoing tamarind improvement program.

Cluster of Parasite Infections by the Spatial Scan Analysis in Korea

  • Bae, Kyoung-Eun;Chang, Yoon Kyung;Kim, Tong-Soo;Hong, Sung-Jong;Ahn, Hye-Jin;Nam, Ho-Woo;Kim, Dongjae
    • Parasites, Hosts and Diseases
    • /
    • 제58권6호
    • /
    • pp.603-608
    • /
    • 2020
  • This study was performed to find out the clusters with high parasite infection risk to discuss the geographical pattern. Clusters were detected using SatScan software, which is a statistical spatial scan program using Kulldorff's scan statistic. Information on the parasitic infection cases in Korea 2011-2019 were collected from the Korea Centers for Disease Control and Prevention. Clusters of Ascaris lumbricoides infection were detected in Jeollabuk-do, and T. trichiura in Ulsan, Busan, and Gyeongsangnam-do. C. sinensis clusters were detected in Ulsan, Daegu, Busan, Gyeongsangnamdo, and Gyeongsangbuk-do. Clusters of intestinal trematodes were detected in Ulsan, Busan, and Gyeongsangnam-do. P. westermani cluster was found in Jeollabuk-do. E. vermicularis clusters were distributed in Gangwon-do, Jeju-do, Daegu, Daejeon, and Gwangju. This clustering information can be referred for surveillance and control on the parasitic infection outbreak in the infection-prone areas.

Efficient Illegal Contents Detection and Attacker Profiling in Real Environments

  • Kim, Jin-gang;Lim, Sueng-bum;Lee, Tae-jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권6호
    • /
    • pp.2115-2130
    • /
    • 2022
  • With the development of over-the-top (OTT) services, the demand for content is increasing, and you can easily and conveniently acquire various content in the online environment. As a result, copyrighted content can be easily copied and distributed, resulting in serious copyright infringement. Some special forms of online service providers (OSP) use filtering-based technologies to protect copyrights, but illegal uploaders use methods that bypass traditional filters. Uploading with a title that bypasses the filter cannot use a similar search method to detect illegal content. In this paper, we propose a technique for profiling the Heavy Uploader by normalizing the bypassed content title and efficiently detecting illegal content. First, the word is extracted from the normalized title and converted into a bit-array to detect illegal works. This Bloom Filter method has a characteristic that there are false positives but no false negatives. The false positive rate has a trade-off relationship with processing performance. As the false positive rate increases, the processing performance increases, and when the false positive rate decreases, the processing performance increases. We increased the detection rate by directly comparing the word to the result of increasing the false positive rate of the Bloom Filter. The processing time was also as fast as when the false positive rate was increased. Afterwards, we create a function that includes information about overall piracy and identify clustering-based heavy uploaders. Analyze the behavior of heavy uploaders to find the first uploader and detect the source site.

Analysis of the genetic diversity and population structure of Lindera obtusiloba (Lauraceae), a dioecious tree in Korea

  • Ho Bang Kim;Hye-Young Lee;Mi Sun Lee;Yi Lee;Youngtae Choi;Sung-Yeol Kim;Jaeyong Choi
    • Journal of Plant Biotechnology
    • /
    • 제50권
    • /
    • pp.207-214
    • /
    • 2023
  • Lindera obtusiloba (Lauraceae) is a dioecious tree that is widely distributed in the low-altitude montane forests of East Asia, including Korea. Despite its various pharmacological properties and ornamental value, the genetic diversity and population structure of this species in Korea have not been explored. In this study, we selected 6 nuclear and 6 chloroplast microsatellite markers with polymorphism or clean cross-amplification and used these markers to perform genetic diversity and population structure analyses of L. obtusiloba samples collected from 20 geographical regions. Using these 12 markers, we identified a total of 44 alleles, ranging from 1 to 8 per locus, and the average observed and expected heterozygosity values were 0.11 and 0.44, respectively. The average polymorphism information content was 0.39. Genetic relationship and population structure analyses revealed that the natural L. obtusiloba population in Korea is composed of 2 clusters, possibly due to two different plastid genotypes. The same clustering patterns have also been observed in Lindera species in mainland China and Japan.

Anomalous Pattern Analysis of Large-Scale Logs with Spark Cluster Environment

  • Sion Min;Youyang Kim;Byungchul Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.127-136
    • /
    • 2024
  • 본 연구는 Spark 클러스터 환경에서 대용량 로그를 분석하여 시스템 이상과의 연관성을 탐색한다. 로그를 활용한 이상 감지 연구는 증가하고 있으나, 클러스터의 다양한 컴포넌트의 로그를 충분히 활용하지 못하고 이상과 시스템의 연관성을 고려하지 않는다는 한계가 있다. 따라서 본 논문에서는 정상과 비정상 로그의 분포를 분석하고, 로그 템플릿의 출현 여부를 통해 이상 감지 가능성을 탐색한다. Hadoop과 Spark를 활용하여 정상과 비정상 로그 데이터를 생성하고, t-SNE와 K-means 클러스터링을 통해 비정상 상황에서의 로그 템플릿을 찾아 이상 현상을 파악한다. 결과적으로, 비정상 상황에서만 발생하는 고유한 로그 템플릿을 확인하며 이를 통해 이상 현상 감지의 가능성을 제시한다.

퍼지 클러스터링을 이용한 다중 스펙트럼 자기공명영상의 분할 (Segmentation of Multispectral MRI Using Fuzzy Clustering)

  • 윤옥경;김현순;곽동민;김범수;김동휘;변우목;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 본 논문에서는 T1 강조영상, T2 강조 영상 그리고 PD의 영상의 특징을 상호 보완적으로 이용한 자동적인 영상 분할법을 제안한다. 제안한 분할 알고리듬은 3단계로 이루어지는데, 첫 단계에서는 PD 영상으로부터 대뇌 마스크를 획득한 후, T1과 T2, PD의 입력 영상에 대뇌 마스크를 씌워 각각의 대뇌 영상을 추출하고, 둘째 단계에서는 대뇌 내부 조직에 해당하는 두드러진 클러스터(outstanding cluster)를 3차원 클러스터들 중에서 선택한다. 3차원 클러스터는 최적스케일 영상(optimal scale image)으로 이루어지는 3차원 공간상에서 화소가 밀집된 봉우리들을 교집합해서 생성되는 클러스터로 결정한다. 최적스케일 영상은 각 2타원 히스토그램에 스케일 스페이스 필터링을 적용시키고 그래프(graph) 구조를 검색하여 2차원 히스토그램의 모양을 가장 잘 나타내는 봉우리(peak) 영상을 최적 스케일 영상으로 선택한다. 마지막 단계에서는 앞에서 찾은 두드러진 클러스터의 중심값을 FCM 알고리듬의 초기중심 값으로 두고, FCM 알고리듬을 이용하여 대뇌 영상을 분할한다. 제안한 분할 알고리듬은 정확한 클러스터의 중심값을 계산함으로 초기 값을 영향을 많이 받는 FCM 알고리듬의 단점을 보완하였고 다중 스펙트럼 영상의 특성을 조합하여 분할에 이용함으로 단일 스펙트럼 영상만을 이용하는 방법보다 향상된 결과를 얻을 수 있었다.

  • PDF

제주지역 감귤가격의 시계열적 특성 및 가격변동성에 관한 연구 (A Study on Price Volatility and Properties of Time-series for the Tangerine Price in Jeju)

  • 고봉현
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.212-217
    • /
    • 2020
  • 본 연구의 목적은 Bollerslev(1986)의 GARCH 모형을 이용하여 제주지역 감귤가격의 시계열적 특성과 가격변동성(price volatility)에 대한 실증분석을 수행하는 것이다. 본 연구의 주요결과는 다음과 같이 요약된다. 첫째, 감귤 가격 변화율의 시계열이 정규분포가 아닌 꼬리가 두터운 분포를 지니고 있는 것으로 나타났다. 이는 Jarque-Bera 통계량이 1%의 유의수준에서 감귤 가격변화율의 시계열의 분포가 정규분포라는 귀무가설을 기각함으로써 검증되었다. 둘째, Ljung-Box Q 통계량을 통해 감귤 가격변화율 시계열 간 상관관계가 높은 것으로 분석되었으며, 이는 ARCH-LM 검정을 통해 통계적으로 검증되었다. 셋째 GARCH(1,1) 모형 추정결과, 평균방정식의 상수항을 제외하고는 모든 계수의 추정 값이 1%의 유의수준에서 통계적으로 유의한 결과를 보였다. 그리고 분산방정식의 지속성 모수(λ=α11) 값이 1에 근접한 것으로 추정되었다. 이는 현재와 유사한 변동성 수준이 장래에도 지속될 가능성이 매우 높은 것으로 해석된다. 그리고 이러한 결과는 제주감귤 가격변화율 시계열에서도 기존의 선행연구에서처럼 '변동성 군집(volatility clustering)' 현상이 나타나고 있음을 밝혀낸 것이다. 끝으로, 본 연구의 결과는 정부의 감귤 수급조절정책을 수립하는데 유용한 기초 자료로 활용될 수 있을 것으로 기대된다.

수도권 삶의 질 지수 변동에 관한 연구 (The Changes in the Quality of Life Measure of the Seoul Metropolitan Area)

  • 이세형;장훈;노진아
    • 한국측량학회지
    • /
    • 제29권1호
    • /
    • pp.29-37
    • /
    • 2011
  • 본 논문에서는 요인분석과 주성분분석을 이용해 수도권 지자체별 삶의 질 지수 측정하고 공간통계 및 지리적 탐색 기법을 이용하여 공간연관성 관점에서 수도권 삶의 질의 공간적 연관성을 분석하고자 하였다. 이를 위하여 2002년, 2005년, 2009년 수도권 삶의 질 지수 대상으로 전역적 Moran's I를 이용한 분석을 실시하였다. 또한 공간 연관성의 유형을 파악하고 실제 높은 삶의 질 지수를 나타내는 지역을 판별하기위해 모란산점도와 국지적 Moran's I 지수를 이용한 국지적 분석을 시행하였다. 삶의 질 지수의 분석 결과 서울시를 중심으로 높은 삶의 질 지수를 나타내었고 경기도 지역의 신도시를 중심으로 삶의 질 지수가 높은 양상을 보였다. 특히 서울강남3구(강남구, 서초구, 송파구)와 경기도 성남시에서 높은 삶의 질 지수를 나타내었는데, 이는 지방세 징수 상위지역으로 공공재 공급의 원천인 지역별 재정력의 차이가 삶의 질의 차이와 격차에 중요한 요인이 됨을 알 수 있다. 또한 수도권의 삶의 질 분포는 정적(+)공간연관성을 나타내며 국지적 규모의 분석결과, 서울시를 중심으로 H-H 클러스터가 경기도, 인천시를 중심으로 L-H 클러스터가, 그리고 경기도 외곽지역으로 L-L 클러스터가 형성되었고 그 패턴에 시간상의 큰 변화는 없었다. 하지만 대규모 인구유입이 있는 신도시를 중심으로 H-H 및 L-H 군집의 확산을 볼 수 있었다.

수박 엘리트 계통의 GBS를 통한 마커이용 육종용 SNP 마커 개발 (Development of an SNP set for marker-assisted breeding based on the genotyping-by-sequencing of elite inbred lines in watermelon)

  • 이준우;손병구;최영환;강점순;이용재;제병일;박영훈
    • Journal of Plant Biotechnology
    • /
    • 제45권3호
    • /
    • pp.242-249
    • /
    • 2018
  • 본 연구는 국내 육종 회사에서 개발된 수박(Citrullus lanatus L.) 우량 육성계통 20종을 대상으로 Genotyping-by-sequencing(GBS) 분석을 통해 품종식별, 순도검정, 그리고 마커이용여교잡(Marker-assisted backcross, MABC)용 SNP 세트를 개발하고자 수행되었다. GBS 분석 결과 총 1,100,000천개 raw read 중 77%가 수박 유전체에 mapping되었으며 평균 mapping region은 약 4,000 Kb로 2.3%의 genome coverage를 보였다. Filtering을 통해 평균 depth 31.57의 SNP 총 2,670개를 얻었으며, 20개 계통에 대한 이들의 Polymorphic information content(PIC) 값의 범위는 0.1 ~ 0.38 였다. 이 중 PIC 값이0.3이상이며 각 염색체 별로 5개씩 균등히 분포된 SNP 총 55개를 최종 선발하였다. 사용된 20개 계통의 유연관계분석을 위해 선발된 55개 SNP를 기반으로 한 주성분 분석(Principle component analysis, PCA) 결과 주성분 1 (52%)과 주성분 2 (11%)를 기준으로 4개의 그룹으로 분류 되었으며 각 계통 간 유전자형에 따른 뚜렷한 식별이 가능하였다. 계층적 군집화(Hierarchical clustering) 분석에서도PCA에서와 유사한 분류양상을 관찰할 수 있었다. 따라서 본 연구에서 개발된 SNP 세트는 적용 가능성이 검증된 20개 계통뿐 만 아니라 향후 다양한 수박 육종소재 및 품종에 대한 품종식별, F1 순도검정 및 MABC에 활용될 수 있으리라 기대된다.

빅 데이터 기반의 네트워크 패킷 분석 모델 (The Model of Network Packet Analysis based on Big Data)

  • 최보민;공종환;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.392-399
    • /
    • 2013
  • IT 기술 발달 및 정보화 시대로 인해 우리 사회 전반에 걸쳐 많은 부분이 네트워크에 대한 의존도가 상당히 커지고 있다. 이는 다양한 정보 및 서비스 획득의 용이성을 제공해 주는 이점이 있는 반면에, 네트워크 침입자들로 하여금 더 많은 취약성의 루트를 제공할 수 있는 부정적 효과도 따르고 있다. 이는 네트워크 이용과 함께 증가한 패킷의 다양한 루트를 악용하여 네트워크의 연결된 시스템에 서비스 장애나 마비를 일으키는 악의적인 위협 및 공격 또한 함께 증가하고 있음을 의미하며 이러한 문제에 대한 해결책이 시급히 필요하다. 이에 보안 분야에서는 네트워크 패킷이나 시스템 로그 등을 수집하여 이를 분석하고 이러한 위협에 대응할 수 있는 다양한 보안 솔루션을 개발하고 있으나, 기존의 분석 방식들로는 점차 방대해져가고 있는 보안 데이터들을 처리하는데 데이터 저장 공간 부족 및 이에 따른 성능 저하와 같은 여러 문제점들이 발생하고 있다. 따라서 본 논문에서는 보안 영역 분야에서도 최근 이슈가 되고 있는 빅 데이터 기술을 적용하여 이러한 문제점들을 개선하는 모델을 제안한다. 즉, 대용량 데이터 저장 기술인 NoSQL을 통해 점차 방대해져 가는 패킷데이터를 수집하고, 분산 프로그래밍모델인 맵리듀스 기반의 K-means 클러스터링을 설계하여 네트워크 침입에 대한 특징 및 패턴을 추출 할 수 있는 분석모델을 제안하고 실험을 통하여 이에 대한 우수성을 입증하였다.