• 제목/요약/키워드: Cluster Tree

검색결과 339건 처리시간 0.022초

피에이치피와 웨카를 이용한 데이터마이닝 도구의 설계 및 구현 (Design and implementation of data mining tool using PHP and WEKA)

  • 유영재;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.425-433
    • /
    • 2009
  • 데이터마이닝은 방대한 양의 데이터 속에서 유용한 정보를 찾아내는 과정이며, 이를 위해 데이터마이닝 도구가 필요하다. 데이터마이닝 도구 또는 솔루션은 E-Miner, Clementine, WEKA, R 등 상당히 많은 종류가 있으나 대부분의 데이터마이닝 도구는 다양성과 범용성에 초점을 맞추어 개발되어 사용 편의성과 분석 자동화에 대해서는 소홀한 실정이어서 비전문가가 사용하기 어려운 경우가 대부분이다. 본 논문에서는 피에이치피와 웨카를 이용하여 인터넷 환경에서 데이터마이닝 기법을 실행하고, 생성된 분석결과를 보다 쉽게 해석할 수 있도록 개선하여 일반 사용자도 쉽게 사용할 수 있는 시스템을 설계하고 구현하고자 한다. 본 논문에서 구현하는 데이터마이닝 기법은 가장 많이이용되고 있는 연관성 규칙의 Apriori 알고리즘, 군집분석의 K-평균 알고리즘, 의사결정나무의 J48 알고리즘 등이다.

  • PDF

Inferring the Molecular Phylogeny of Chroococcalian Strains (Blue-green algae/Cyanophyta) from the Geumgang River, Based on Partial Sequences of 16S rRNA Gene

  • Lee, Wook-Jae;Bae, Kyung-Sook
    • Journal of Microbiology
    • /
    • 제40권4호
    • /
    • pp.335-339
    • /
    • 2002
  • Partial sequences of 16S rRNA gene of five chroococcalian blue-green algal strains, Aphanothece nidulans KCTC AG10041, Aphanothece naegelii KCTC AG10042, Microcystis aeruginosa KCTC AG10159, Microcystis ichthyoblabe KCTC AG10160, and Microcystis viridis KCTC AG10198, which were isolated from water from the Geumgang River, were determined and were inferred their phylogenetic and taxonomic positions among taxa of order Chroococcales. Most taxa of Chroococcales whose partial 16S rRNA gene sequences were aligned in this study, are clustered with other related taxa. Aphanothece nidulans KCTC AG10041 and Aphanothece naegelii KCTC AG10042 made a cluster with other European species of these genera, which supported 100% of the bootstrap trees with a very high sequence similarity (97.4-99.4%) in this study. Three strains, Microcystis aeruginosa KCTC AG10159, M. ichthyoblabe KCTC AG10160, and M. viridis KCTC AG10198, formed a cluster with other Microcystis spp. supported 100 % of the bootstrap trees with a similarity of 97.0-99.9% except for two strains. However, this phylogentic tree made no resolution among the species of Microcystis spp. The topology of the tree reconfirmed the taxonomic status of three species of Microcystis, identified in this study based on the morphology, as three colonial types of Microcystis aeruginosa com. nov. Otsuka et al. (1999c). The genera of chroococcalian cyanophytes are heterogeneously clustered in these sequence analyses. We suggest that more molecular studies on the genera of Chroococcales with reference strains, widely collected from restricted geographic or environmental ranges, get accurate taxonomic or phylogenetic determinations.

주왕산지역 계곡부의 해발고와 사면부위에 따른 산림구조 (Forest Structure in Relation to Altitude and Part of Slope in a Valley Forest at Chuwangsan Area)

  • 박인협;문광선;류석봉
    • 한국환경생태학회지
    • /
    • 제8권2호
    • /
    • pp.154-159
    • /
    • 1995
  • 주왕산지역 금은광이-주왕계곡에 이르는 계곡부(해발 470~780m)의 해발고와 사면부위에 따른 산림구조를 조사하기 위하여 해발고와 사면부위에 따라 48개 조사구를 설치조사하였다. 해발고가 높아질수록 교목층 밀도와 흉고단면적이 감소하는 경향을 보였다. 해발고가 높아짐에 따라 중요치가 증가하는 경향을 보이는 수종은 신갈나무, 물푸레나무 등이었으며 감소하는 수종은 소나무, 생강나무 등이었다. 사면하부에서 상부로 갈수록 중요치가 증가하는 수종은 굴참나무, 생강나무 둥이었으며 감소하는 수종은 물푸레나무, 고로쇠나무 등이었다. 종다양도는 계곡상부와 사면하부에서 높게 나타났다. 계곡정부를 제외한 해발고대간 유사도지수는 74.4~84.2%, 사면부위별 유사도지수는 68.0~96.3%로써 해발고보다 사면부위에 따른 종구성 상태의 차이가 심한 것으로 나타났다. 수종별 중요치에 의하여 cluster 분석한 결과 사면하부의 소나무-낙엽활엽수군집, 사면중, 상부의 소나무-굴참나무군집, 계곡정부의 소나무군집으로 구분되었다.

  • PDF

이행적 폐쇄트리를 기반으로 한 점증적 웹 문서 클러스터링 (An Incremental Web Document Clustering Based on the Transitive Closure Tree)

  • 윤성대;고석범
    • 한국멀티미디어학회논문지
    • /
    • 제9권1호
    • /
    • pp.1-10
    • /
    • 2006
  • 기존의 문서 클러스터링 기법에는 k-means와 같이 수행속도가 우수한 기법과, 분류의 정확률이 우수한 계층적 집괴 클러스터링 기법이 있다. 두 기법은 각각 분류의 정확률 저하와 저속의 수행속도로서 상호 단점을 가지며, 새로운 문서를 삽입 할 때마다 문서 유사도를 재계산해야 하는 문제가 있다. 웹 정보의 특성은 잦은 문서의 추가를 통해 정보를 축적하는 것이다. 따라서 본 논문에서는 정확률이 우수한 계층적 집괴 클러스터링 기법을 기반으로 수행속도를 향상 시킬 수 있는 이행적 폐쇄 트리 기법을 제안하고, 또한 새로운 문서의 삽입과 삭제에 우수한 점증적인 클러스터링이 가능한 기법을 제안한다. 제안된 기법의 효율성을 검증하기 위하여 기존의 알고리즘과 정확률, 재현율, F-Measure, 수행속도에 대해 비교 평가 및 분석한다.

  • PDF

Phylogenetic Analysis of Phellinus linteus and Related Species Comparing the Sequences of rDNA Internal Transcribed Spacers

  • Lee, Jae-Dong;Kim, Gi-Young;Park, Joung-Eon;Park, Hyung-Sik;Nam, Byung-Hyouk;An, Won-Gun;Lee, Tae-Ho
    • Journal of Life Science
    • /
    • 제11권2호
    • /
    • pp.126-134
    • /
    • 2001
  • The phylogenetic tree displayed the presence of five groups in the Phellinus genus, which were distinguished based on their morphology. Most of the p. linteus appeared a cluster which was highly significant with the exception of P. linteus KACC 500122 and KACC 500411. They formed the sister taxa of P 1inteus where P. baumii, Phellinus sp. MPNU 7003, MPNU 7007, and MPNU 7010 had similar morphological characteristics. Also, P. nigricans IMSNU 32024 and P. pini var, carniformans IMSNU 32031 were grouped in the same cluster with P. igniarius KCTC 6227, KCTC 6228, and P. chrysoloma KCTC 6225 extracted from the Gen-Bank database. P. torulosus IMSNU 32028 and Phellinus sp. MPNU 7011 formed a closed group, however, these species had a distant taxa when compared with the other Phellinus species. The nucleotide sequences of the internal transcribed spacer (ITS) regions of ribosomal DNA (rDNA) including the 5.85 rDNA were determined from 24 strains of the Phellinus genus in order to analyze their phylogenetic relationship. These fungi were divided into two basic groups based on their ITS length, however, this grouping was different from that based on their morphological characteristics. Although various ITS sequences were ambiguously aligned, conserved sites were also identified. Accordingly, a neighbor-joining tree was constructed using the nucleotide sequence data of the conserved sites of the ITS regions and the 5.8S rDNA.

  • PDF

빅데이터 분류 기법에 따른 벤처 기업의 성장 단계별 차이 분석 (The Difference Analysis between Maturity Stages of Venture Firms by Classification Techniques of Big Data)

  • 정병호
    • 디지털산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.197-212
    • /
    • 2019
  • The purpose of this study is to identify the maturity stages of venture firms through classification analysis, which is widely used as a big data technique. Venture companies should develop a competitive advantage in the market. And the maturity stage of a company can be classified into five stages. I will analyze a difference in the growth stage of venture firms between the survey response and the statistical classification methods. The firm growth level distinguished five stages and was divided into the period of start-up and declines. A classification method of big data uses popularly k-mean cluster analysis, hierarchical cluster analysis, artificial neural network, and decision tree analysis. I used variables that asset increase, capital increase, sales increase, operating profit increase, R&D investment increase, operation period and retirement number. The research results, each big data analysis technique showed a large difference of samples sized in the group. In particular, the decision tree and neural networks' methods were classified as three groups rather than five groups. The groups size of all classification analysis was all different by the big data analysis methods. Furthermore, according to the variables' selection and the sample size may be dissimilar results. Also, each classed group showed a number of competitive differences. The research implication is that an analysts need to interpret statistics through management theory in order to interpret classification of big data results correctly. In addition, the choice of classification analysis should be determined by considering not only management theory but also practical experience. Finally, the growth of venture firms needs to be examined by time-series analysis and closely monitored by individual firms. And, future research will need to include significant variables of the company's maturity stages.

그래프 이론 기반의 클러스터링을 이용한 영상 감시 시스템 시야 내의 출입 영역 검출 (Detection of Entry/Exit Zones for Visual Surveillance System using Graph Theoretic Clustering)

  • 우하용;김경환
    • 전자공학회논문지SC
    • /
    • 제46권6호
    • /
    • pp.1-8
    • /
    • 2009
  • 여러 대의 카메라를 이용한 감시 시스템이 정확하고 효율적으로 동작하기 위하여 카메라 시야 간의 연결 관계를 아는 것이 필수적이다. 카메라들의 연결 관계를 파악하기 위하여 카메라 시야 내의 출입 영역을 검출하는 일이 선행되어야 한다. 본 논문에서는 카메라 시야에서 객체의 등장 및 퇴장으로부터 얻은 데이터에 그래프 이론 기반의 클러스터링(clustering)을 적용하여 시야 내의 출입 영역을 검출하는 방법을 제안한다. 데이터 포인트들 사이의 관계를 조사하여 최소신장트리를 구성하고, 트리의 에지들 중 일관성을 갖지 않는 것들을 삭제하여 well-formed 클러스터를 얻는다. 본 논문에서는 클러스터의 형태를 설명하는 두 가지 특징을 정의하고 이를 클러스터의 분할 조건으로 사용하였다. 실험결과를 통하여 데이터 포인트의 분포가 조밀하지 않은 경우 expectation maximization(EM)에 기반을 둔 방법에 비하여 치안하는 방법이 보다 효과적으로 클러스터링을 수행함을 확인하였다. 또한 EM 기반 방법들에 비하여 안정적인 결과를 얻기 위해 필요한 데이터 포인트의 개수가 적으므로 출입영역에 대한 학습시간을 단축할 수 있다.

월악산국립공원 만수골 계곡부의 해발고와 사면부위에 따른 산림구조 (Forest Structure in Relation to Altitude and Part of Slope in the Mansugol Valley at Woraksan National Park)

  • 박인협;장정재;김계선
    • 한국환경생태학회지
    • /
    • 제19권2호
    • /
    • pp.99-105
    • /
    • 2005
  • 월악산국립공원 만수골 계곡부(해발 $380\~915m$)의 해발고와 사면부위에 따른 산림군집 구조를 파악하기 위하여 해발고와 사면부위에 따라 48개 조사구를 설정하여 교목층과 아교목층을 대상으로 조사하였다. 계곡 하부에서 상부로 갈수록 교목층의 밀도, 수고와 흉고단면적 은 감소하였다. 이것은 해발고가 증가함에 따라 환경 조건 중 특히 토양수분이 감소하기 때 문으로 추정되었다. 아교목층은 흉고단면적이 계곡 하부에서 상부로 갈수록 증가하였는데, 이것은 교목층의 흉고단면적이 적을수록 하층의 광조건이 좋아지기 때문으로 판단되었다. 계곡 하부에서 상부로 감에 따라 상대중요치가 증가하는 경향을 보이는 수종은 신갈나무, 물푸레나무, 생강나무, 고로쇠나무 등이었으며, 감소하는 경향을 보이는 수종은 소나무, 굴참나무, 졸참나무, 쪽동백나무 등이었다. 계곡정부를 포함한 해발고대별 종다양도의 범위는 $0.351\~0.903$이었으며, 계곡 정부는 출현종수, 종다양도, 균재도가 모두 낮았다. 사면부위별 종다양도는 $0.780\~1.064$이었으며, 사면 하부에서 중, 상부로 갈수록 종수와 종다양도가 감소하는 경향을 보였다. 환경 조건이 상이한 계곡 정부를 제외한 해발고대간 유사도지수는 $36.0\~67.3\%$, 사면부위간 유사도지 수는 $66.8\~75.1\%$로써 사면부위보다는 해발고에 따른 종구성상태의 차이가 심한 것으로 나타났다. 수종별 상대중요치에 의한 Cluster분석 결과 계곡하부의 사면 상, 중, 하부와 계곡 중부의 사면 중부에 위치하는 소나무-참나무류 군집, 계곡상부의 사면 상, 중, 하부와 계곡중부의 사면 상, 하부에 위치하는 신갈나무-낙엽 활엽수 군집, 계곡정부의 신갈나무 군집으로 구분되었다. 상대중요치에 의한 종상관관계를 분석한 결과 신갈나무는 소나무, 졸참나무와 유의적인 부의 상관을 보였으며, 소나무, 졸참나무, 개옻나무는 3개 수종간 유의적인 정의 상관을 보였다.

함백산지역 계곡부의 사면방향과 해발고에 따른 산림구조 (Forest Structure in Relation to Slope Aspect and Altitude in valley Forests at Hambaeksan Area)

  • 박인협;최윤호;이석면;최영철;유석봉
    • 한국환경생태학회지
    • /
    • 제15권4호
    • /
    • pp.361-368
    • /
    • 2002
  • 남북으로 뻗어 있는 태백산맥의 함백산지역 사거리재(해발 1,275m)를 중심으로 동향사면인 세곡계곡과 서향사면인 정암사계곡을 대상으로 사면방향과 해발고에 따른 산림구조를 조사분석하였다. 상층임관을 이루는 교목층의 밀도, 평균흉고직경, 흉고단면적은 동향사면과 서향사면간에 별 차이가 없었다. 서향사면은 동향사면에 비하여 피나무, 거제수나무 등의 상대중요치는 높은 반면, 신갈나무, 물푸레나무 등의 상대중요치가 낮았다. 식생층 전체의 종다양도는 서향사면이 1.415로서 동향사면의 1.328보다 높았으며, 이것은 서향사면인 정암사계곡의 경우 천연기념물인 열목어 서식지로서 비교적 보존이 잘 되었기 때문이라고 판단되었다. 해발고에 따른 분석 결과 해발고가 높아짐에 따라 동, 서향사면 모두 교목층의 흉고단면적과 평균수고가 감소하였으며, 식생층 전체의 종수, 종다양도, 균재도가 감소하는 경 향이었다. 해발고가 높아짐에 따라 상대중요치가 증가하는 수종은 신갈나무이었으며, 감소하는 수종은 거제수나무, 다릅나무 등이었다. Cluster분석 결과 서향사면 전체와 동향사면 중, 하부의 활엽수혼효림군집, 동향사면 상부의 신갈나무군집으로 구분되었으며, 활엽수혼효림군집의 경우 동향사면 중, 하부와 서향사면 상부의 신갈나무가 준우점종인 활엽수혼효림군집, 서향사면 중 하부의 신갈나무가 거의 출현하지 않는 활엽수혼효림군집으로 재구분되었다. 신갈나무는 노린재나무, 시닥나무, 물참대와 유의적인 정의 상관이 있었으며 활엽수혼효림군집의 주요 우점종인 거제수나무는 신갈나무 당단풍과 유의적인 부의 상관이 있었다.적이며 신속하고 유연한 프로세스는 기존의 시스템적 어프로치, 계획성 마케팅의 통제적인 과정을 극복하는 대안적 프로세스의 가능성을 가지고 있다. 넷째, 유소년놀이문화의 버내큐러 디자인산물은 과거 순수형태에서 테크노 변형 놀이산물 문화로 변형되어왔는데, 이는 기성적 디자인이 갖지 못한 다양함을 보완하는 대안적 산물이며, 독립적 문화로서 지속성을 가져야 하는 디자인문화이다.성적 : 대상환자 142명중 임상적 효과판정을 평가할 수 있는 환자는 138명이었으며, 이중 116예(84.1%)에서 환치, 8예(5.8%)에서 효험, 14예(10.1%)에서 실패를 보였다. 약리적 부작용 총 14예중 간효소치가 6예 발생하였으며, 피부발진 4예, 어지러움증 3예, 오한 1예가 나타났다. 결론 : 본 다기관 연구에서, teicoplanin은 주요 그람 양성구균에 대해 광범위한 항균력을 갖고 있으며 특히 methicillin에 내성을 가진 포도상구균에 대하여 vancomycin 다음으로 우수한 항균력을 보여 그 임상적 효용성 및 안전성이 높은 것으로 나타났다. 또한, vancomycin에 비하여 부작용이 경미하여 임상의가 항균제를 선택하는데 많은 도움이 될 것으로 사료된다. EV, HEV, etc.) can be considered as ′clean′. Another basic approach is considering as ′clean′ all vehicles satisfying a stringent omission regulation like EURO IV or EEV. Such approaches

표본점 설계방법과 적용 단목재적식 변경에 따른 임목축적 차이의 구명 (Analysis of Difference in Growing Stock Volume Estimates by the Changes of Cluster Plot Design and Volume Equation)

  • 한원성;김성호;김종찬;신만용
    • 한국산림과학회지
    • /
    • 제99권3호
    • /
    • pp.304-311
    • /
    • 2010
  • 본 연구는 2006년부터 시작된 국가산림자원조사부터 표본점 설계방법과 적용 단목재적식을 변경하여 적용함으로써 과거와는 다른 임목축적 추정치의 경향을 보이고 있어 그 원인을 구명하기 위해 수행하였다. 이를 위해 본 연구에서는 20개 집락의 80개 표본점을 대상으로 제4차 및 제5차 국가산림자원조사의 표본점 설계방법에 따라 자료를 수집한 후, 현재 사용하고 있는 수종별 단목재적식과 과거에 사용하였던 단목재적식을 적용하여 임목축적을 추정한 후 표본점 설계 방법 및 적용 단목재적식의 변경에 따른 임목축적 추정치의 차이가 있는지를 평가하였다. 임목축적 차이의 원인을 구명하기 위해 t-검정을 실시한 결과 표본점 설계방법의 변경에 따른 임목축적의 차이는 인정되지 않았으며, 사용된 단목재적식의 변경에 의해서 통계적으로 인정할 수 있는 임목축적의 차이가 발생하는 것으로 분석되었다. 결과적으로 제5차 국가산림자원조사를 통해 얻어지는 임목축적은 적용 단목재적식의 변경에 의해 차이가 발생하기 때문에, 국제기구에 보고하기 위해서는 재계산을 통해 2006년 이전의 임목축적 추정치의 보정이 필요할 것으로 평가되었다.