• 제목/요약/키워드: 유사군집

검색결과 1,055건 처리시간 0.025초

댐예정지를 중심으로 한 웅천천 수계의 어류군집에 관하여 (The Fish community of the Ungchon Stream Around the New Dam Intended Area)

  • 홍영표;장민호;강호;최신석
    • 환경생물
    • /
    • 제17권1호
    • /
    • pp.79-88
    • /
    • 1999
  • 1994년부터 1996년도까지 계류성 독립하천인 웅천천 수계의 보령댐 수몰예정지역을 중심으로 하여 6개지점에서 어류상, 주목할만한 어종 및 어류군집에 대하여 조사하였다. 본 조사지역에서 94년에서 96년 사이에 채집을 통하여 서식이 확인된 종은 11과 25속으로 총 29종이었으며 이중 9종은 한국특산어종이었다. 이 중 멸종위기종인 감돌고기와 퉁사리, 특산어종인 꺽지는 본 지역에서 확인되지 않아 절멸된 것으로 생각된다. 우세어종은 갈겨니, 피라미, 긴몰개가 우세한 그룹의 어종으로 나타났다. 지점별 평균풍부도는 0.68개체/$m^2$, 평균체적밀도는 1.45개체/㎥로 나타났으며, 종의 다양도는 상류와 하류보다는 중류가 가장 높게 나타났다. 군집간 유사도는 1군집과 4군집, 5군집과 6군집이 유사하였으나 유의한 차이는 나타내지 않아 전체가 유사한 군집으로 나타났다.

  • PDF

HMM 기반의 TTS를 위한 상호유사도 비율을 이용한 결정트리 기반의 문맥 군집화 (Decision Tree Based Context Clustering with Cross Likelihood Ratio for HMM-based TTS)

  • 정치상;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.174-180
    • /
    • 2013
  • 본 논문은 HMM 기반의 TTS 시스템을 위하여 상호유사도 비율을 이용한 결정트리 기반의 문맥 군집화 알고리즘을 제안한다. 기존의 알고리즘들은 유사한 통계적 특성을 가지는 문맥종속 HMM을 하나로 묶고 있다. 그러나 기존의 알고리즘들은 결정트리의 나누어진 노드간의 통계적 유사도를 고려하지 않음으로 인하여 최종 노드 사이의 통계적인 차이를 보장하지 못한다. 제안한 알고리즘은 분리된 노드들 간의 통계적 유사도를 최소화하여 모델 파라미터의 신뢰도를 향상시킨다. 실험 결과를 통해 제안한 알고리즘이 기존의 알고리즘들에 비해 우수한 성능을 나타낸다는 것을 확인할 수 있다.

지리산국립공원 대원사계곡의 삼림군집구조 분석 (Analysis on the forest Community Structure of Daewon Valley in Chirisan national Park)

  • 권전오
    • 한국환경생태학회지
    • /
    • 제13권4호
    • /
    • pp.354-366
    • /
    • 2000
  • 지리산국립공원 대원계곡의 삼림군집구조를 분석하여 국립공원관리의 기초자료를 제공하기 위하여 기조사지역(이경재 등, 1991)이외의 지역에 대해 39개 조사지(100m2)를 설정하고 식생조사를 실시하였다 Classification의 한 기법인 TWINSPAN을 사용하여 군집을 분리하였으며 그 결과 느릅나무-굴참나무군집(군집 I) 졸참나무-굴참나무군집(군집II) 졸참나무군집(군집III-V) 신갈나무군집(군집VI) 그리고 서어나무-노각나무군집(군집VII)의 7개 군집으로 나뉘었다 각 군집에 대해 우점도 종다양도 유사도 종수 및 개체수 그리고 흉고직경 등의 분석을 통해 군집의 종조서을 살펴본 결과 지리산 대원계곡의 삼림은 졸참나무 굴참나무 신갈나무 등의 참나무가 주류를 이루고 있었으며 점차 서어나무와 노각나무등으로 천이가 진행되어갈 것으로 판단되었다.

  • PDF

저자역할용어사전 구축 및 저작군집화에 관한 연구 (Designing a FRBR Work Grouping Algorithm of Bibliographic Records using a Role Term Dictionary of Authors)

  • 윤재혁;도슬기;오삼균
    • 정보관리학회지
    • /
    • 제37권2호
    • /
    • pp.197-223
    • /
    • 2020
  • 본 연구는 통합서지용 한국문헌자동화목록(KORMARC)으로 작성된 서지레코드를 FRBR의 저작(Work) 단위로 군집화하는 과정에서 나타난 이슈사항들을 분석하고, 이에 대한 해결방안을 고안하였다. 특히 기존의 연구에서는 대표저작자를 식별하고 처리하는 기준이 명확하게 드러나지 않거나 파생저작 레코드의 대표저작자를 선정하는 방법에 대한 논의가 충분히 이루어지지 않았다. 따라서 본 연구는 저작을 창작하는 데 기여한 사람이 다수일 때 대표저작자를 명확하게 식별하기 위한 방법을 고안하는 데 초점을 맞추었다. 이를 위해 책임표시사항(245) 필드의 책임표시 태그(▼d, ▼e)에서 추출한 역할용어를 토대로 표준화된 저자역할용어사전을 개발하여 대표저작자 판별에 활용하는 방안을 마련하였다. 또한 저자명의 유사도와 표제의 유사도를 각각 계산하여 유사도가 일정 수준 이상인 경우 동일한 저작으로 군집화 하는 방법을 채택하였다. 각각의 유사도를 계산하여 동일 저작을 판단하므로 공백, 관제처리, 괄호제거와 같은 데이터 정제 조건을 조정하여 6가지 패턴에 따른 군집화의 정확도를 비교하였고, 저자명과 표제의 유사도가 모두 80퍼센트 이상일 때의 정확도가 가장 높게 나타났다. 본 연구는 대표저작자 선정을 위한 역할용어사전 개발, 대표저작자와 표제의 유사도를 별도로 측정하여 저작군집화를 시도한 실험연구이며 후속 연구에서는 표제 간 유사도 측정의 정확도를 향상시키는 방안과 FRBR 1그룹의 다른 개체(표현형, 구현형, 개별자료) 수준으로 확대하여 활용하는 방안, 국내에서 사용하고 있는 다른 형태의 MARC 데이터에 적용하는 방안을 고안할 예정이다.

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.263-266
    • /
    • 2002
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.

밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병 (Cluster Merging Using Density based Fuzzy C-Means algorithm)

  • 한진우;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.235-238
    • /
    • 2003
  • Fuzzy C-Means(FCM) 알고리즘은 초기 군집 중심의 개수와 위치에 따라 군집 결과의 성능차이가 많이 나타난다. 하지만 일반적인 경우에 군집 중심의 개수는 분석가의 주관에 의해 결정되고, 임의적으로 결정되기 때문에 원래 데이터의 구조와는 무관하게 수행되어 최적화된 군집화 수행을 실행하지 못하는 경우가 발생하게 된다. 따라서 본 논문에서는 원래의 데이터의 구조에 좀더 근접한 퍼지 군집화를 수행하기 위하여 격자를 바탕으로 한 데이터의 밀도를 이용한 FCM을 제안하고, 이러한 밀도 기반 FCM에 의해 결정된 군집의 합병 기법을 제안하였다. N-차원의 데이터 공간을 N-차원의 격자로 나누고, 초기 군집 중심의 개수와 위치는 각 격자의 밀도를 바탕으로 결정된다. 초기화 이후에 각 격자 내부에서 FCM을 이용하여 군집화를 수행하고, 계속해서 이웃 격자의 군집결과에 대하여 군집간의 유사도 측도를 이용하여 군집 합병을 수행함으로써 데이터의 자연적인 구조에 근접한 군집화를 수행하였다. 제안된 군집화 합병 기법의 향상된 성능은 UCI Machine Learning Repository 데이터를 이용하여 확인하였다.

  • PDF

자율 군집 네트워크에서 군집 탐지 기법 (A Technique of Cluster Detection to Self-Organized Network)

  • 김바울;김경덕;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.115-118
    • /
    • 2012
  • 다양한 네트워크에서 군집을 분석하고 그 구조를 발견하는 것은 그 네트워크의 복잡도를 낮추어 전체 시스템을 이해하고 관리하는데 중요하다. 특히 기본적인 컴퓨팅이 가능한 여러 기기들이 자율적으로 서로 통신하여 군집을 이루는 자율 군집 네트워크에서 군집을 정확하게 발견하는 것은 집단행동 서비스를 실현하는데 있어서 중요한 기술이다. 따라서 본 연구에서는 자율 군집 네트워크에서 군집 탐지 기법을 제안한다. 제안하는 기법은 군집을 발견하고 그 군집을 식별하기 위해 해당 네트워크에서 한 노드를 공유하는 두 개의 간선 쌍에 대해 계층 군집화를 수행하고 계층 간에 간선 유사도를 계산하여 비교한다. 계층 군집화를 통한 간선들은 트리 구조로 표현할 수 있으며 최적의 분할 밀도를 이용하여 노드들을 클러스터링한 후 최종 군집으로 분리 한다.

엔트로피 가중치 및 SVD를 이용한 군집 특징 선택 (Cluster Feature Selection using Entropy Weighting and SVD)

  • 이영석;이수원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.248-257
    • /
    • 2002
  • 군집화는 객체들의 특성을 분석하여 유사한 성질을 갖고 있는 객체들을 동일한 집단으로 분류하는 방법이다. 전자 상거래 자료처럼 차원 수가 많고 누락 값이 많은 자료의 경우 입력 자료의 차원축약, 잡음제거를 목적으로 SVD를 사용하여 군집화를 수행하는 것이 효과적이지만, SVD를 통해 변환된 자료는 원래의 속성 정보를 상실하기 때문에 군집 결과분석에서 원본 속성의 가치 해석이 어렵다. 따라서 본 연구는 군집화 수행 후 엔트로피 가중치 및 SVD를 이용하여 군집의 중요한 속성을 발견하기 위한 군집 특징 선택 기법 ENTROPY-SVD를 제안한다. ENTROPY-SVD는 자료의 속성들과 유사객체 군과의 묵시적인 은닉 구조를 활용하기 위하여 SVD를 이용하고 유사객체 군에 포함된 응집도가 높은 속성들을 발견하기 위하여 엔트로피 가중치를 사용한다. 또한 ENTROPY-SVD를 적용한 모델 기반의 협력적 여과기법의 추천 시스템 CFS-CF를 제안하고 그 효용성 및 효과를 평가한다.

인과관계 문맥정보를 사용한 용어 군집화 연구 (Term Clustering based on Causal Context Information)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.