• 제목/요약/키워드: Agglomerative

검색결과 68건 처리시간 0.021초

얼굴 특징 추출 및 클러스터링을 활용한 얼굴 검색 기법 (Face Search Method Based on Face Feature Extraction and Clustering)

  • 신준호;김종환;조숙희;김정학;고영준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.95-96
    • /
    • 2021
  • 최근 미디어의 발전으로 빠른 속도로 많은 양의 사람들의 얼굴이 포함된 사진, 동영상들이 인터넷에 업로드 되고 있다. 이러한 현상에 맞춰 인공지능을 활용한 얼굴 인식 기술의 놀라운 발전이 있었으나, 대규모 데이터셋에서 임의의 인물을 검색하는 경우에서는 연산량과 저장공간의 부담이 존재한다. 특히, 인터넷에 존재하는 수많은 불법 촬영물에서 피해자를 정확하고 신속하게 검색하기 위해서는 효율적인 얼굴 검색 시스템이 필요하다. 따라서, 본 논문은 얼굴 특징 추출과 클러스터링을 활용하여 방대한 양의 불법 촬영물 셋에서 피해자 동영상을 효율적으로 검색할 수 있는 기법을 제안한다. 불법 촬영물 동영상 검색 실험 환경을 만들기 위해 YouTube Faces [1] 데이터셋으로 유사 동영상 셋을 만들고 이 환경에서 실험을 진행한다. 얼굴 특징 추출 모델은 ResNet100 네트워크를 CosFace 손실함수와 Glint360K 데이터셋으로 학습시킨 모델 [2]을 사용한다. 추출된 얼굴 특징들을 HAC(Hierarchical Agglomerative Clustering) 알고리즘으로 클러스터링 한 후, 클러스터 대푯값을 통해 얼굴 검색 실험을 했을 때의 실험 결과를 분석한다.

  • PDF

A detailed analysis of nearby young stellar moving groups

  • Lee, Jinhee
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.63.3-63.3
    • /
    • 2019
  • Nearby young moving groups (NYMGs hereafter) are gravitationally unbound loose young stellar associations located within 100 pc of the Sun. Since NYMGs are crucial laboratories for studying low-mass stars and planets, intensive searches for NYMG members have been performed. For identification of NYMG members, various strategies and methods have been applied. As a result, the reliability of the members in terms of membership is not uniform, which means that a careful membership re-assessment is required. In this study, I developed a NYMG membership probability calculation tool based on Bayesian inference (Bayesian Assessment of Moving Groups: BAMG). For the development of the BAMG tool, I constructed ellipsoidal models for nine NYMGs via iterative and self-consistent processes. Using BAMG, memberships of claimed members in the literature (N~2000) were evaluated, and 35 per cent of members were confirmed as bona fide members of NYMGs. Based on the deficiency of low-mass members appeared in mass function using these bona fide members, low mass members from Gaia DR2 are identified. About 2000 new M dwarf and brown dwarf candidate members were identified. Memberships of ~70 members with RV from Gaia were confirmed, and the additional ~20 members were confirmed via spectroscopic observation. Not relying on previous knowledge about the existence of nine NYMGs, unsupervised machine learning analyses were applied to NYMG members. K-means and Agglomerative Clustering algorithms result in similar trends of grouping. As a result, six previously known groups (TWA, beta-Pic, Carina, Argus, AB Doradus, and Volans-Carina) were rediscovered. Three the other known groups are recognized as well; however, they are combined into two new separate groups (ThOr+Columba and TucHor+Columba).

  • PDF

우리나라 산업집적의 공간적 패턴과 구조 분석 -한국형 지역혁신체제 구축의 시사점 - (The Spatial Pattern and Structure of Industrial Agglomerations in Korea : Towards a Regional Innovation System)

  • 정준호;김선배
    • 한국경제지리학회지
    • /
    • 제8권1호
    • /
    • pp.17-29
    • /
    • 2005
  • 본 연구는 공간적 자기상관(spatial autocorrelation) 정도를 측정하는 공간통계 기법인 MORAN I를 사용하여 산업집적의 공간적 패턴과 구조를 분석하였다. 분석결과 우리나라는 수도권 이외 지역의 혁신환경이 열악한 가운데 주요 산업집적지가 수도권 일대와 동남권 일대를 중심으로 분포하고 있는 다핵형 공간구조를 형성하고 있다. 그리고 일부 산업의 경우 산업집적지는 광역 시 $\cdot$ 도 단위의 행정구역을 넘어서는 집적패턴이 나타나고 있다. 이에 따라 본 연구는 한국경제발전을 위한 최우선 과제의 하나가 산업집적과 혁신환경의 공간적 불일치라는 경제 공간구조를 조정하는 것이어야 하며, 이를 위해서는 16개 광역 시 $\cdot$ 도 보다는 인접한 2$\∼$3개 광역 시 $\cdot$ 도를 포괄하는 경제권역을 단위로 산업클러스터 기반의 지역혁신체제 구축이 필요함을 제시하였다.

  • PDF

위치 기반 서비스를 위한 계층 클러스터 기반 Cloaking 알고리즘 (Hierarchical Clustering-Based Cloaking Algorithm for Location-Based Services)

  • 이재흥
    • 한국전자통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1155-1160
    • /
    • 2013
  • 최근 스마트 폰 이용자 수가 증가하면서 다양한 위치 기반 서비스들이 주목을 받고 있다. 위치 기반 서비스는 사용자의 위치와 시스템이 가지고 있는 다양한 정보를 결합하여 사용자에게 유용한 정보를 전달해 주기도 하지만 이로 인한 개인 정보의 침해 가능성 역시 높은 것이 사실이다. 최근의 위치 기반 서비스에서의 프라이버시 관련 연구는 K-anonymity를 만족하는 Cloaking 영역 생성에 중점을 두고 있다. 본 논문에서는 위치 기반 서비스를 위한 계층 클러스터 기반 Cloaking 알고리즘을 제안한다. 제안 기법은 약간 변형된 응집 계층 클러스터링 기법을 사용해서 트리를 생성한 뒤, Reciprocity 성질을 만족시키는 Cloaking 영역을 생성한다. 제안 기법은 Reciprocity 성질을 만족시키며, Hilbert Cloak보다 작고 RC-AR과 비슷한 크기의 영역을 생성하며, 생성 속도는 Hilbert Cloak과 비슷하며 RC-AR보다는 훨씬 빠르다.

Selection and Classification of Bacterial Strains Using Standardization and Cluster Analysis

  • Lee, Sang Moo;Kim, Kyoung Hoon;Kim, Eun Joong
    • Journal of Animal Science and Technology
    • /
    • 제54권6호
    • /
    • pp.463-469
    • /
    • 2012
  • This study utilized a standardization and cluster analysis technique for the selection and classification of beneficial bacteria. A set of synthetic data consisting of 100 individual variables with three characteristics was created for analysis. The three characteristics assigned to each independent variable were designated to have different numeric scales, averages, and standard deviations. The variables were bacterial isolates at random, and the three characteristics were fermentation products, including cell yield, antioxidant activity of culture, and enzyme production. A standardization method utilizing a standard normal distribution equation to record fermentation yields of each isolate was employed to weight their different numeric scales and deviations. Following transformation, the data set was analyzed by cluster analysis. The Manhattan method for dissimilarity matrix construction along with complete linkage technique, an agglomerative method for hierarchical cluster analysis, was employed using statistical computing program R. A total of 100 isolates were classified into groups A, B, and C. In a comparison of the characteristics of each group, all characteristics in groups A and C were higher than those of group B. Isolates displaying higher cell yield were classified as group A, whereas those isolates showing high antioxidant activity and enzyme production were assigned to group C. The results of the cluster analysis can be useful for the classification of numerous isolates and the preparation of an isolation pool using numerical or statistical tools. The present study suggests that a simple technique can be applied to screen and select beneficial microbes using the freely downloadable statistical computing program R.

Underdetermined Blind Source Separation from Time-delayed Mixtures Based on Prior Information Exploitation

  • Zhang, Liangjun;Yang, Jie;Guo, Zhiqiang;Zhou, Yanwei
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권5호
    • /
    • pp.2179-2188
    • /
    • 2015
  • Recently, many researches have been done to solve the challenging problem of Blind Source Separation (BSS) problems in the underdetermined cases, and the “Two-step” method is widely used, which estimates the mixing matrix first and then extracts the sources. To estimate the mixing matrix, conventional algorithms such as Single-Source-Points (SSPs) detection only exploits the sparsity of original signals. This paper proposes a new underdetermined mixing matrix estimation method for time-delayed mixtures based on the receiver prior exploitation. The prior information is extracted from the specific structure of the complex-valued mixing matrix, which is used to derive a special criterion to determine the SSPs. Moreover, after selecting the SSPs, Agglomerative Hierarchical Clustering (AHC) is used to automaticly cluster, suppress, and estimate all the elements of mixing matrix. Finally, a convex-model based subspace method is applied for signal separation. Simulation results show that the proposed algorithm can estimate the mixing matrix and extract the original source signals with higher accuracy especially in low SNR environments, and does not need the number of sources before hand, which is more reliable in the real non-cooperative environment.

비구조화 P2P 시스템에서 이동에이전트를 이용한 Peer의 속성기반 계층적 클러스터링 (Property-based Hierarchical Clustering of Peers using Mobile Agent for Unstructured P2P Systems)

  • 마이클 안젤로 살보;마테오 로미오;이재완
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.189-198
    • /
    • 2009
  • 비구조화 P2P 시스템은 오늘날 인터넷에서 가장 널리 사용되지만, 파일의 배치는 임의로 이루어지며, Peer와 컨텐츠간에는 어떤 상관관계도 존재하지 않는다. 또한 보낸 모든 질의가 원하는 데이터를 찾았는지에 대한 보장도 없다. 본 논문에서는 비구조화된 P2P시스템에서 군집형 계층 클러스터링을 사용하여 노드들을 클러스터화함으로써 검색을 향상시키는 방법을 제시한다. 제안한 기법과 k-means를 사용한 기법간에 노드 클러스터링을 위한 지연시간을 비교하였다. 또한 제안한 알고리즘, k-means 클러스터링, 클러스터링을 사용하지 않은 방법간에 한 네트워크 토폴로지에서 데이터를 찾기 위한 지연시간에 대해 시뮬레이션을 수행하였다. 시뮬레이션 결과 제안한 기법의 지연시간이 다른 방법들보다 짧았음을 알 수 있었다.

  • PDF

고객정보와 상품네트워크 유사도를 이용한 시장세분화 기법 (A Market Segmentation Scheme Based on Customer Information and QAP Correlation between Product Networks)

  • 정석봉;신용호;구서룡;윤협상
    • 한국시뮬레이션학회논문지
    • /
    • 제24권4호
    • /
    • pp.97-106
    • /
    • 2015
  • 시장세분화를 위해 일반변수와 트랜잭션 기반 변수를 동시에 사용하는 하이브리드 방법이 널리 사용되고 있지만, 하이브리드 방법에는 일반변수의 기준에 따라 정확하게 세분화가 되지 않는 문제점이 존재한다. 본 연구에서는 이러한 문제점을 해결함과 동시에 상품 정보를 이용한 네트워크 분석을 활용하는 새로운 시장세분화 방법을 개발하는 것을 목표로 한다. QAP 상관관계분석을 이용하여 상품네트워크의 유사도를 계산하는 새로운 시장세분화 방법은 일반 변수 기준으로 시장을 명확하게 세분화하고, 상품 정보를 기반으로 하여 세분화된 집단 간의 구매패턴을 효과적으로 비교할 수 있도록 하는 장점을 갖고 있다. 본 연구를 통해 개발된 상품구매정보를 활용한 네트워크 기반 시장세분화 방법의 활용 가능성과 성과를 입증하기 위해 실제 운영중인 온라인 쇼핑몰의 고객정보와 상품구매정보를 수집하여 시장세분화 방법의 절차를 설명하고 결과를 제시한다. 본 연구에서 제안된 시장세분화방법은 기본적인 고객정보 및 상품구매정보를 이용하여 상품구매패턴이 유사한 고객 집단을 인구통계학적인 일반변수 기준으로 세분화할 수 있기 때문에 대다수의 온 오프라인 유통업체에서 폭넓은 활용이 가능할 것으로 기대된다.

맵리듀스를 이용한 다중 중심점 집합 기반의 효율적인 클러스터링 방법 (An Efficient Clustering Method based on Multi Centroid Set using MapReduce)

  • 강성민;이석주;민준기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.494-499
    • /
    • 2015
  • 데이터 사이즈가 증가함에 따라서 대용량 데이터를 분석하여 데이터의 특성을 파악하는 것이 매우 중요해졌다. 본 논문에서는 분산 병렬 처리 프레임워크인 맵리듀스를 활용한 k-Means 클러스터링 기반의 효과적인 클러스터링 기법인 MCSK-Means (Multi centroid set k-Means)알고리즘을 제안한다. k-Means 알고리즘은 임의로 정해지는 k개의 초기 중심점들의 위치에 따라서 클러스터링 결과의 정확도가 많은 영향을 받는 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여, 본 논문에서 제안하는 MCSK-Means 알고리즘은 k개의 중심점들로 이루어진 m개의 중심점 집합을 사용하여 임의로 생성되는 초기 중심점의 의존도를 줄였다. 또한, 클러스터링 단계를 거친 m개의 중심점 집합들에 속한 중심점들에 대하여 직접 계층 클러스터링 알고리즘을 적용하여 k개의 클러스터 중심점들을 생성하였다. 본 논문에서는 MCSK-Means 알고리즘을 맵리듀스 프레임워크 환경에서 개발하여 대용량 데이터를 효율적으로 처리할 수 있도록 하였다.

계층적 군집화를 이용한 능동적 학습 (Active Learning based on Hierarchical Clustering)

  • 우호영;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.705-712
    • /
    • 2013
  • 능동적 학습(active learning)은 소수의 라벨 데이터로 구성된 훈련 집합이 주어진 경우에 분류기 학습에 가장 도움이 될 만한 언라벨드 데이터를 선택하여 전문가에 의한 라벨링을 통해 훈련 집합에 포함시키는 과정을 반복함으로써 분류기의 성능을 향상시키는 것을 목적으로 한다. 본 논문에서는 워드 연결(ward's linkage)을 이용한 계층적 군집화(hierarchical clustering)를 바탕으로 한 능동적 학습 방법을 제안한다. 제안된 방법은 각 군집에서 적어도 하나의 샘플을 포함하도록 초기 훈련 집합을 능동적으로 구성하거나 또는 기존의 훈련 집합을 확장함으로써 전체 데이터 분포를 반영할 수 있게 한다. 기존의 능동적 학습 방법들 중 대부분은 초기 훈련 집합이 주어져 있을 경우를 가정하는 반면에 제안하는 방법은 초기 클래스 정보를 가진 훈련 데이터가 주어지지 않은 경우와 주어진 경우에 모두 적용 가능하다. 실험을 통하여 제안하는 방법이 비교 방법들에 비해 분류기 성능을 크게 향상시킬 수 있는 효과적인 데이터 선택을 수행함을 보인다.