• Title/Summary/Keyword: K-평균 군집분석법

검색결과 52건 처리시간 0.027초

순열검정과 부스트랩 방법에 의한 한우 6번 염색체의 ILSTS035에 대한 우수 DNA Marker 선별

  • 이용원;이제영;김문정;한초희
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.325-329
    • /
    • 2003
  • 한우 6번 염색체 유전자 지도에서 QTL (quantitative trait loci) 분석을 실시하여 선별된Locus 값을 순열검정(Permutation Test)을 이용하여 유의성 검정을 실시하였다. 한편, 우수경제형질 DNA marker들을 K-평균 군집법을 실시 파악하였다. 이들 QTL과 K-평균법에 의해 한우의 염색체 6번 ILSTS035의 우수 DNA marker 235번을 선별하였다. 선별된 DNA Marker 235번을 출품우에 적용하여 Bootstrap 방법을 이용하여 신뢰구간을 구하여 검정하였다.

  • PDF

마이크로어레이 유전자 발현 자료에 대한 군집 방법 비교 (Comparison of clustering methods of microarray gene expression data)

  • 임진수;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.39-51
    • /
    • 2012
  • 군집분석은 마이크로어레이 발현자료에서 유전자 혹은 표본들의 유사한 특성을 갖는 연관구조를 조사하는데 중요한 도구이다. 본 논문에서는 마이크로어레이 자료에서 계층적 군집방법, K-평균법, PAM (partitioning around medoids), SOM (self-organizing maps) 그리고 모형기반 군집방법 들의 성능을 3가지 군집 타당성 측도인 내적 측도, 안정적 측도 그리고 생물학적 측도를 가지고 비교분석하고자 한다. 모의실험을 통해 생성된 자료와 실제 SRBCT (small round blue cell tumor) 자료를 가지고 여러 가지 군집방법들의 성능을 비교하였으며 그 결과 모의실험 자료에서는 거의 모든 방법들이 3가지 군집측도에서 원래 자료와 일치하는 좋은 군집 결과를 나타내었고 SRBCT 자료에서는 모의실험 자료처럼 명확한 군집화 결과를 보여주지는 않으나 내적측도의 실루엣 너비 (Silhouette width) 관점에서는 PAM 방법, SOM, 모형기반 군집방법 그리고 생물학적 측도에서는 PAM 방법과 모형기반 군집방법이 모의실험 결과와 비슷한 결과를 얻었고 안정적 측도에서 모형기반 군집방법이 다른 방법들보다 좋은 군집결과를 보여주었다.

스케일 성질을 이용한 군집 지역에서의 스케일 인자에 대한 연구 (Study on Scaling Exponent for Classification of Regions using Scaling Property)

  • 정영훈;김성훈;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.504-504
    • /
    • 2015
  • 수공구조물을 설계하기 위해서는 설계수문량을 빈도해석을 통해 산정할 수 있다. 빈도해석 중 지점빈도해석을 보완한 지역빈도해석을 적용하기 위해서는 군집분석을 통한 지역구분이 무엇보다 중요하다. 또한 스케일 성질(scaling property)은 강우의 시 공간적 특성을 지속기간별 관측된 강우자료를 이용하여 재현기간에 대한 지속기간의 함수로 강우의 IDF곡선을 제시할 수 있는 방법이다. 따라서 스케일 성질을 통해 군집된 지역에서의 강우자료에 적용하여 스케일 인자(scaling exponent)를 추정한 후 수문학적 동질성을 통계적 특성으로 설명하고자 한다. 본 연구를 수행하기에 앞서 군집 분석은 4개의 군집방법(평균연결법, Ward방법, Two-Step방법, K-means방법)을 적용하였고, 한강유역에 위치한 104개의 강우지점은 4개의 지역으로 구분하는 것이 적절하다고 판단되어 비계층적 방법인 k-means방법을 이용하여 지역을 구분하였다. 본 연구에서는 군집된 결과를 바탕으로 4개의 지역으로 구분된 지역에 포함된 강우지점을 대상으로 스케일 인자를 추정하고 수문학적 동질성을 통계적 방법으로 제시하고자 한다.

  • PDF

행렬도를 이용한 유전자발현자료의 탐색적 분석 (Exploratory Analysis of Gene Expression Data Using Biplot)

  • 박미라
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.355-369
    • /
    • 2005
  • 마이크로어레이 실험에서는 유전자의 기능과 상호작용의 이해를 돕기 위한 방안으로 유전자발현자료의 시각화방법이 많이 사용되고 있다. 행렬도는 유전자와 샘플들을 동시에 그려볼 수 있어서, 유전자 또는 샘플의 군집이나 유전자-샘플간 연관작용을 알아보는데 더욱 유용하게 쓰일 수 있다. 본고에서는 마이크로어레이실험에서 행렬도를 이용하여 유전자의 군집 및 연관성을 알아보는 방법을 소개하고, 추가점기법을 이용하여 새로운 샘플을 분류하는 방법을 제안하였다. Golub et al.(1999)의 백혈병 데이터와 Alizadeh et al. (2000)의 림프구데이터, Ross et al.(2000)의 NCI60 종양조직데이터를 이용하여 유용성을 살펴보았으며, 계층적 군집분석 및 k-평균 군집분석 등 다른 기법을 이용한 결과와 비교하고 이러한 기법을 행렬도와 연계하는 방안을 살펴보았다.

한우 6번 염색체의 Bootstrap기법을 이용한 우수 DNA 탐색

  • 이제영;여정수;김재우;이용원;김문정
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 춘계학술대회
    • /
    • pp.41-47
    • /
    • 2003
  • 한우 6번 염색체 유전자 지도에서 한우의 질을 높이기 위한 QTL(quantitative trait loci)분석을 실시하여 선별된 Loci 값을 Permutation Test를 이용하여 계산하였다. 한편, 경제적으로 주요한 한우의 특성부위(질적부위와 육량등)에 따른, 우수 경제형질 DNA marker를 K-평균 군집법을 실시 파악하였다. 이들 QTL과 K-평균법에 의해 한우의 염색체 6번, ILST035의 주요 경제 형질별 DNA marker들을 선별하여, Bootstrap BCa방법을 이용하여 각 DNA marker들의 신뢰구간을 구했다.

  • PDF

극치강수량의 시공간적 특성을 이용한 지역빈도분석 (Regionalization of Extreme Rainfall with Spatio-Temporal Pattern)

  • 이정주;권현한;김병식;윤석영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1429-1433
    • /
    • 2010
  • 수공구조물의 설계, 수자원 관리계획의 수립, 재해영향 검토 등을 수행할 때, 재현기간에 따른 확률개념의 강우량, 홍수량, 저수량 등을 산정하여 사용하게 되며, 보통 대상지역의 장기 수문관측 자료를 이용하여 수문사상의 확률분포를 산정한 후 재현기간을 연장하여 원하는 설계빈도에 해당하는 양을 추정하게 된다. 미계측지역 또는 관측자료의 보유기간이 짧은 지역의 경우는 지역빈도 분석 결과를 이용하게 된다. 지역빈도해석을 위해서는 강우자료들의 동질성을 파악하는 것이 가장 기본적인 과정이 되며 이를 위해 통계학적인 범주화분석이 선행되어야 한다. 지점 빈도분석의 수문학적 동질성 판별을 위해 L-moment 방법, K-means 방법에 의한 군집분석 등이 주로 사용되며 관측소 위치좌표를 이용한 공간보간법을 적용하여 시각화하고 있다. 강수량은 시공간적으로 변하는 수문변량으로서 강수량의 시간적인 특성 또한 강수량의 특성을 정의하는데 매우 중요한 요소이다. 이러한 점에서 본 연구를 통해 강수지점의 공간적인 좌표 및 강수량의 양적인 범주화에 초점을 맞춘 기존 지역빈도분석의 범주화 과정에 덧붙여 시간적인 영향을 고려할 수 있는 요소들을 결정하고 이를 활용할 수 있는 범주화 과정을 제시하고자 한다. 즉, 극치강수량의 발생 시기에 대한 정량적인 분석이 가능한 순환통계기법을 이용하여 관측 지점별 시간 통계량을 산정하고, 이를 극치강수량과 결합하여 시 공간적인 특성자료를 생성한 후 이를 이용한 군집화 해석 모형을 개발하는데 연구의 목적이 있다. 분석 과정에 있어서 시간속성의 정량화 및 일반화는 순환통계기법을 사용하였으며, 극치강수량과 발생시점의 속성자료는 각각의 평균과 표준편차를 이용하였다. K-means 알고리즘을 이용해 결합자료를 군집화 하고, L-moment 방법으로 지역화 결과에 대한 검증을 수행하였다. 속성 결합 자료의 군집화 효과는 모의데이터 실험을 통해 확인하였으며, 우리 나라의 58개 기상관측소 자료를 이용하여 분석을 수행하였다. 예비해석 단계에서 100회의 군집분석을 통해 평균적인 centroid를 산정하고, 해당 값을 본 해석의 초기 centroid로 지정하여, 변동적인 클러스터링 경향을 안정화시켜 해석이 반복됨에 따라 군집화 결과가 달라지는 오류를 방지하였다. 또한 K-means 방법으로 계산된 군집별 공간거리 합의 크기에 따라 군집번호를 부여함으로써 군집의 번호순서대로 물리적인 연관성이 인접하도록 설정하였으며, 군집간의 경계선을 추출할 때 발생할 수 있는 오류를 방지하였다. 지역빈도분석 결과는 3차원 Spline 기법으로 도시하였다.

  • PDF

K-Means 군집모형과 계층적 군집(교차효율성 메트릭스에 의한 평균연결법, Ward법)모형 및 혼합모형을 이용한 컨테이너항만의 클러스터링 측정에 대한 실증적 비교 및 검증에 관한 연구 (An Empirical Comparison and Verification Study on the Containerports Clustering Measurement Using K-Means and Hierarchical Clustering(Average Linkage Method Using Cross-Efficiency Metrics, and Ward Method) and Mixed Models)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제34권3호
    • /
    • pp.17-52
    • /
    • 2018
  • 본 논문에서는 K-Means 군집모형과 계층적 군집모형, 혼합모형으로, 아시아 38개 컨테이너항만 들의 2006년부터 2015년까지의 자료와 선석길이, 수심, 총면적, 크레인 수를 투입물, 컨테이너화물처리량을 산출물로 하여 국내대표 컨테이너항만 들(부산, 인천, 광양항)이 클러스터링 해야만 하는 항만들을 적출해 내는 측정방법을 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 10년간의 자료를 이용한 분석에서 클러스터링 후의 효율성 증가폭이 큰 순서대로 살펴보면 평균연결법[average linkage(AL)]은 42.04% 상승, Mixed Ward는 35.01% 상승, 경험법칙[rule of thumb(RT)]&Elbow는 30.47% 상승, Ward는23.65% 상승, Mixed AL는 23.25% 상승의 순서였다. 둘째, RT와 Elbow모형에 의한 국내항만들의 클러스터링을 살펴보면 (1)부산항은 두바이, 홍콩, 광저우, 칭타오, 포트 클랑, 싱가포르, 림찬방 (2)인천항은 하이파, 포트슐탄 카부스, 담만, 크호르 파칸, 탄중프리옥, 탄중퍼락, 동경, 나고야, 오사카, 카라치, 오아심, 마닐라, 다바오, 콜롬보, 킬롱, 방콕, (3)광양항은 아카바, 크호르 파칸, 광정우, 닝보, 칭타오, 포트 클랑, 카오슝, 림찬방 항과 클러스터링 해야만 하는 것으로 나타났다. 셋째, 최적 군집 수를 살펴보면 AL(6개), Mixed Ward(5개), RT&ELBOW (4개), Ward(5개), Mixed AL(6개)가 최적 군집 수인 것으로 나타났다. 넷째, 전문가 그룹에 의해서 선호되는 항만들과 본 실증분석결과에 의해서 도출된 국내항만들의 클러스터링 되는 항만들과의 일치성 여부는 부산항은 80%, 인천항은 17%, 광양항은 50%수준에서 일치하는 것으로 검증되었다. 본 논문이 제안하고 있는 정책적인 측면의 의미는 첫째, 항만정책입안자, 항만운영관리자들이 본 연구에서 사용한 모형들을 항만의 클러스터링에 도입하여 벤치마킹항만들을 선정해야만 한다. 둘째, 실증분석의 결과로서 도출된, 국내항만들의 참조항만, 클러스터링항만들에 대하여, 그들 항만들의 항만개발, 운영방안 등에 대한 내용을 비교 분석하고 벤치마킹이 필요한 부분은 신속하게 도입하여 실시하는 것이 필요하다는 점이다.

원주천의 어류군집 분석 (Fish Community Analysis in the Wonju-stream)

  • 최준길;신현선;최재석
    • 한국환경생태학회지
    • /
    • 제19권1호
    • /
    • pp.46-54
    • /
    • 2005
  • 2004년 5월부터 11월까지 원주천 어류군집의 변화를 조사한 결과는 다음과 같다. 조사된 어종은 총 6과 24종이었으며 이들 중 한국고유종은 가는돌고기(Pseudopungtungia tenuicorpa), 쉬리(Coreoleuciscus splendidus), 긴몰개(Squalidus gracitis majimae), 몰개(Squalidus japonicus coreanus), 돌마자(Microphysogobio yaluensis), 배가사리(Microphysogobio longidorsalis), 참종개(Iksookimia koreensis), 새코미꾸리(Koreocobitis rotundicaudata), 퉁가리(Liobagus andersoni) 및 얼룩동사리(Odontobutis interrupta) 등 10종$(41.7\%)$이었다. 본 조사에서 피라미(Zacco platypus)가 $54.7\%$로 우점하였고 버들치(Rhynthocypris oxycephalus)가 $16.7\%$로 아우점하였다. 또한 우세종은 붕어(Carassius auratus)가 $5.4\%$, 참종개(I. koreensis) $3.4\%$, 종개(Orthrias toni) $3.3\%$, 돌고기(Pungtungia herzi) $3.0\%$ 등의 순으로 확인되었다. 어류의 분포에 따라, 원주천은 비가중치 평균연결법(UPGMA)에 의해 2개의 군집으로 나누어졌다. 생활형에 따른 어류군집의 변화를 보면 저서성 어종의 수가 감소하였고 하상변화와 오염에 대한 내성이 강한 부유성 어종이 증가하는 것으로 나타났다.

한반도 주변 1000-hPa 고도장의 군집분석 (Cluster Analysis of the 1000-hPa Height Field around the Korean Peninsula)

  • 정영근
    • 한국지구과학회지
    • /
    • 제33권4호
    • /
    • pp.337-349
    • /
    • 2012
  • 본 연구에서는 1000 hPa면 고도 자료 및 K-평균 군집분석법을 활용하여 한반도 주변 기압배치를 분류하고, 각 유형의 특성을 조사하였다. 군집의 기준으로 기압배치 공간 형태의 유사성을 나타내는 패턴 상관계수를 사용하고, 유사성의 경계치로 0.8을 적용하여 대표적 기압배치 유형 11개를 얻었다. 이들은 시베리아 기단이 한반도 주변으로 장출하는 경로에 따라 3개, 북태평양 고기압의 중심 위치에 따라 3개, 시베리아 및 북태평양 기단의 영향권에서 기압골이 나타나는 유형 2개, 그리고 봄가을에 주로 나타나는 이동성 고기압형으로 고기압의 장축방향에 따라 3개 등이다. 각 기압 배치 유형의 출현빈도로부터 추정한 한반도에 영향을 주는 기단의 출현비율은 시베리아 기단 55.4%, 북태평양 기단 29.3%, 양쯔강 기단 12.8%, 오호츠크해 기단 2.5% 순이며, 한반도는 대륙에서 기원한 기단의 영향이 68.2%로 지배적이다. 한반도 주변 기압계는 겨울 기압배치 유형과 여름 기압배치 유형이 각기 대륙과 해양에 발달하는 정체성 기단으로부터 확장되는 고기압을 중심으로 하여 대조적으로 출현하고, 봄가을의 이동성 고기압형은 이들의 변환 과정에서 나타난다. 근래 여름 북태평양 고기압의 한반도 출현빈도가 감소하고 있다. 그리고 겨울 기압배치 유형의 출현이 봄가을에 자주 나타나면서 기압골을 갖는 기압배치 유형의 출현빈도가 증가하고, 이동성 고기압형은 거의 모든 계절에 나타나는 경향이 있다.

기온과 강수특성을 고려한 남한의 기후지역구분 (Classification of Climate Zones in South Korea Considering both Air Temperature and Rainfall)

  • 박창용;최영은;문자연;윤원태
    • 대한지리학회지
    • /
    • 제44권1호
    • /
    • pp.1-16
    • /
    • 2009
  • 본 연구에서는 기온과 강수특성을 함께 고려하여 남한의 기후지역을 구분하였다. 먼저 계절별 기온 및 강수량 분포를 살펴보았는데, 기온은 모든 계절에서 지형 및 위도에 의해 영향을 받았다. 강수량은 여름철에 집중되고 지역적으로는 강원 영동, 남해안, 제주에서 많았고 경북 중부지역에서 적은 분포를 보였다. 기온 및 강수량의 경험적 직교함수(Empirical Orthogonal Function)분석을 통해서 산출된 주성분점수를 입력변수로 하여 평균연결법과 Ward법을 이용한 군집분석을 수행하였다. Ward법은 지형, 위도, 해양의 효과와 기압계 이동 방향에 따른 특성을 잘 반영하였으며 행정구역에도 잘 맞게 구분되어 가장 좋은 군집결과를 보여주었다.