• 제목/요약/키워드: agglomerative clustering

검색결과 59건 처리시간 0.022초

멀티채널 비음수 행렬분해와 정규화된 공간 공분산 행렬을 이용한 미결정 블라인드 소스 분리 (Underdetermined blind source separation using normalized spatial covariance matrix and multichannel nonnegative matrix factorization)

  • 오순묵;김정한
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.120-130
    • /
    • 2020
  • 본 논문은 블라인드 소스 분리 분야에서 널리 사용되는 멀티채널 비음수 행렬 분해 기법의 단점을 개선하여 미결정 복잡한 혼합 환경에서 문제를 해결한다. 공간 공분산 행렬에 기반을 둔 기존의 연구들에서, 단일 채널의 파워게인 및 상관관계와 같은 값으로 구성된 행렬의 각 요소는 높은 분산으로 인해 분리된 소스의 품질을 저하시키는 경향이 있다. 이 논문에서는 추정된 소스들을 효과적으로 클러스터링하기 위해 레벨 및 주파수 정규화를 수행한다. 따라서 새로운 공간 공분산 행렬 및 효과적인 클러스터 쌍별 거리함수를 제안한다. 본 논문에서는 제안된 행렬을 공간 모델의 초기화에 활용하여 공간 모델의 향상된 추정과 이를 바탕으로 상향식 접근법에서의 계층적 응집 클러스터링에 활용함으로써 분리된 음원의 품질을 향상시켰다. 제안된 알고리즘은 'Signal Separation Evaluation Campaign 2008 development dataset'을 활용하여 실험을 하였다. 그 결과 객관적인 소스 분리 품질 검증 도구인 'Blind Source Separation Eval toolbox'를 활용하여 대부분의 성능향상지표에서의 향상을 확인하였으며, 특히 대표적인 수치인 SDR의 1 dB ~ 3.5 dB 정도의 성능우위를 검증하였다.

중복을 허용한 계층적 클러스터링에 의한 복합 개념 탐지 방법 (Hierarchical Overlapping Clustering to Detect Complex Concepts)

  • 홍수정;최중민
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.111-125
    • /
    • 2011
  • 클러스터링(Clustering)은 유사한 문서나 데이터를 묶어 군집화해주는 프로세스이다. 클러스터링은 문서들을 대표하는 개념별로 그룹화함으로써 사용자가 자신이 원하는 주제의 문서를 찾기 위해 모든 문서를 검사할 필요가 없도록 도와준다. 이를 위해 유사한 문서를 찾아 그룹화하고, 이 그룹의 대표되는 개념을 도출하여 표현해주는 기법이 요구된다. 이 상황에서 문제점으로 대두되는 것이 복합 개념(Complex Concept)의 탐지이다. 복합 개념은 서로 다른 개념의 여러 클러스터에 속하는 중복 개념이다. 기존의 클러스터링 방법으로는 문서를 클러스터링할 때 동일한 레벨에 있는 서로 다른 개념의 클러스터에 속하는 중복된 복합 개념의 클러스터를 찾아서 표현할 수가 없었고, 또한 복합 개념과 각 단순 개념(Simple Concept) 사이의 의미적 계층 관계를 제대로 검증하기가 어려웠다. 본 논문에서는 기존 클러스터링 방법의 문제점을 해결하여 복합 개념을 쉽게 찾아 표현하는 방법을 제안한다. 기존의 계층적 클러스터링 알고리즘을 변형하여 동일 레벨에서 중복을 허용하는 계층적 클러스터링(Hierarchical Overlapping Clustering, HOC) 알고리즘을 개발하였다. HOC 알고리즘은 문서를 클러스터링하여 그 결과를 트리가 아닌 개념 중복이 가능한 Lattice 계층 구조로 표현함으로써 이를 통해 여러 개념이 중복된 복합 개념을 탐지할 수 있었다. HOC 알고리즘을 이용해 생성된 각 클러스터의 개념이 제대로 된 의미적인 계층 관계로 표현되었는지는 특징 선택(Feature Selection) 방법을 적용하여 검증하였다.

Underdetermined Blind Source Separation from Time-delayed Mixtures Based on Prior Information Exploitation

  • Zhang, Liangjun;Yang, Jie;Guo, Zhiqiang;Zhou, Yanwei
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권5호
    • /
    • pp.2179-2188
    • /
    • 2015
  • Recently, many researches have been done to solve the challenging problem of Blind Source Separation (BSS) problems in the underdetermined cases, and the “Two-step” method is widely used, which estimates the mixing matrix first and then extracts the sources. To estimate the mixing matrix, conventional algorithms such as Single-Source-Points (SSPs) detection only exploits the sparsity of original signals. This paper proposes a new underdetermined mixing matrix estimation method for time-delayed mixtures based on the receiver prior exploitation. The prior information is extracted from the specific structure of the complex-valued mixing matrix, which is used to derive a special criterion to determine the SSPs. Moreover, after selecting the SSPs, Agglomerative Hierarchical Clustering (AHC) is used to automaticly cluster, suppress, and estimate all the elements of mixing matrix. Finally, a convex-model based subspace method is applied for signal separation. Simulation results show that the proposed algorithm can estimate the mixing matrix and extract the original source signals with higher accuracy especially in low SNR environments, and does not need the number of sources before hand, which is more reliable in the real non-cooperative environment.

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

A detailed analysis of nearby young stellar moving groups

  • Lee, Jinhee
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.63.3-63.3
    • /
    • 2019
  • Nearby young moving groups (NYMGs hereafter) are gravitationally unbound loose young stellar associations located within 100 pc of the Sun. Since NYMGs are crucial laboratories for studying low-mass stars and planets, intensive searches for NYMG members have been performed. For identification of NYMG members, various strategies and methods have been applied. As a result, the reliability of the members in terms of membership is not uniform, which means that a careful membership re-assessment is required. In this study, I developed a NYMG membership probability calculation tool based on Bayesian inference (Bayesian Assessment of Moving Groups: BAMG). For the development of the BAMG tool, I constructed ellipsoidal models for nine NYMGs via iterative and self-consistent processes. Using BAMG, memberships of claimed members in the literature (N~2000) were evaluated, and 35 per cent of members were confirmed as bona fide members of NYMGs. Based on the deficiency of low-mass members appeared in mass function using these bona fide members, low mass members from Gaia DR2 are identified. About 2000 new M dwarf and brown dwarf candidate members were identified. Memberships of ~70 members with RV from Gaia were confirmed, and the additional ~20 members were confirmed via spectroscopic observation. Not relying on previous knowledge about the existence of nine NYMGs, unsupervised machine learning analyses were applied to NYMG members. K-means and Agglomerative Clustering algorithms result in similar trends of grouping. As a result, six previously known groups (TWA, beta-Pic, Carina, Argus, AB Doradus, and Volans-Carina) were rediscovered. Three the other known groups are recognized as well; however, they are combined into two new separate groups (ThOr+Columba and TucHor+Columba).

  • PDF

기기적 측정조건을 달리하여 측정한 쌀밥의 조직감 특성 변화 (Variations in the texture properties of cooked rice as a function of instrumental parameter conditions)

  • 최원석;서한석
    • 한국식품과학회지
    • /
    • 제48권5호
    • /
    • pp.521-524
    • /
    • 2016
  • 쌀밥의 조직감 측정시 가장 보편적으로 사용되는 텍스처 프로파일 분석(TPA)에 있어서, 모방적기기인 texture analyser를 사용하여 측정조건, 즉 압착율과 탐침이동속도를 달리하면서 4종류의 즉석쌀밥 시료들에 대한 경도, 점착성, 응집성, 씹힘성 및 탄성을 측정하였다. 4종류의 즉석쌀밥 시료들은 압착율과 탐침이동속도가 달라짐에 따라, 각각의 조직감 특성에 있어서 시료들 사이에 유의적인 차이를 보이거나 보이지 않는 변화를 보였다. 또한, 다섯가지 조직감 특성을 모두 고려하여 군집분석을 수행했을 경우에도 측정조건에 따라서 4종류 시료들이 서로 다르게 그룹화되는 것을 볼 수 있었다. 더불어, 쌀밥의 조직감 평가시 사용되는 '점착성/경도'값도 측정조건에 따라 4종류 시료들이 서로 다른 값을 보여주었다. 이들 결과를 토대로, 쌀밥의 조직감 측정시 쌀밥의 관능적 조직감 특성을 객관적으로 언급할 목적으로 기기적 측정을 수행한다면, 여러 분석을 통해 관능검사 결과와 가장 부합하는 측정 조건을 선택하는 것이 필요하며, 특정한 기기적 측정조건을 설정할 경우 실험목적에 따라 여러 특성을 고려하여 적합한 측정조건을 설정하는 것이 매우 중요하다 하겠다.

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

고객정보와 상품네트워크 유사도를 이용한 시장세분화 기법 (A Market Segmentation Scheme Based on Customer Information and QAP Correlation between Product Networks)

  • 정석봉;신용호;구서룡;윤협상
    • 한국시뮬레이션학회논문지
    • /
    • 제24권4호
    • /
    • pp.97-106
    • /
    • 2015
  • 시장세분화를 위해 일반변수와 트랜잭션 기반 변수를 동시에 사용하는 하이브리드 방법이 널리 사용되고 있지만, 하이브리드 방법에는 일반변수의 기준에 따라 정확하게 세분화가 되지 않는 문제점이 존재한다. 본 연구에서는 이러한 문제점을 해결함과 동시에 상품 정보를 이용한 네트워크 분석을 활용하는 새로운 시장세분화 방법을 개발하는 것을 목표로 한다. QAP 상관관계분석을 이용하여 상품네트워크의 유사도를 계산하는 새로운 시장세분화 방법은 일반 변수 기준으로 시장을 명확하게 세분화하고, 상품 정보를 기반으로 하여 세분화된 집단 간의 구매패턴을 효과적으로 비교할 수 있도록 하는 장점을 갖고 있다. 본 연구를 통해 개발된 상품구매정보를 활용한 네트워크 기반 시장세분화 방법의 활용 가능성과 성과를 입증하기 위해 실제 운영중인 온라인 쇼핑몰의 고객정보와 상품구매정보를 수집하여 시장세분화 방법의 절차를 설명하고 결과를 제시한다. 본 연구에서 제안된 시장세분화방법은 기본적인 고객정보 및 상품구매정보를 이용하여 상품구매패턴이 유사한 고객 집단을 인구통계학적인 일반변수 기준으로 세분화할 수 있기 때문에 대다수의 온 오프라인 유통업체에서 폭넓은 활용이 가능할 것으로 기대된다.

Composition of Federal R&D Spending, and Regional Economy : The Case of the U.S.A

  • Lee, Si-Kyoung
    • 지역연구
    • /
    • 제9권1호
    • /
    • pp.65-78
    • /
    • 1993
  • In this study, the significant and enduring concentration of federal R&D spending in metro-scale clusters across the nation is treated as evidence of the operation of a distinct industrial infrastructure defined by the ability of R&D performers to attract external funding and pursue the sophisticated project work demanded. It follows, then, that the agglomerative potential of these R&D concentrations -- performers and their support infrastructures -- requires a search for economic impacts guided by a different stimulative effects attributable to federal R&D spending may be that substantial subnational economic impacts are routinely obscured and diluted by research designs that seek to discover impacts either at the level of nation-scale economic aggregates or on firms or specific industries organized spatially. Therefore, this study proceeds by seeking to link the locational clustering of federal contract R&D spending to more localized economic impacts. It tests a series of models(X-IV) designed to trace federal contract R&D spending flows to economic impacts registered at the level of metro-regional economies. By shifting the focus from funding sources to recipient types and then to sector-specific impacts, the patterns of consistent results become increasingly compelling. In general, these results indicated that federal R&D spending does indeed nurture the development of an important nation-spanning advanced industrial production and R&D infrastructure anchored primarily by two dozed or so metro-regions. However, dominated as it is by a strong defense-industrial orientation, federal contract R&D spending would appear to constitute a relatively inefficient national economic development policy, at least as registered on conventional indicators. Federal contract R&D destined for the support of nondefense/civilian(Model I), nonprofit(Model II), and educational/research(Mode III) R&D agendas is associated with substantially greater regional employment and income impacts than is R&D funding disbursed by the Department of Defense. While federal R&D support from DOD(Model I) and for-profit(Model II) and industrial performer(Model III) contract R&D agendas are associated with positive regional economic impacts, they are substantially smaller than those associated with performers operating outside the defense industrial base. Moreover, evidence that the large-business sector mediates a small business sector(Model VI) justifies closer scrutiny of the relative contribution to economic growth and development made by these two sectors, as well as of the primacy typically accorded employment change as a conventional economic performance indicator. Ultimately, those regions receiving federal R&D spending have experienced measurable employment and income gains as a result. However, whether or not those gains could be improved by changing the composition -- and therefore the primary missions -- of federal R&D spending cannot be decided by merely citing evidence of its economic impacts of the kind reported here. Rather, that decision turns on a prior public choice relating to the trade-offs deemed acceptable between conventional employment and income gains, the strength of a nation's industrial base not reflected in such indicators, and the reigning conception of what constitutes national security -- military might or a competitive civilian economy.

  • PDF