• 제목/요약/키워드: Clustering Problem

검색결과 710건 처리시간 0.028초

멀티채널 비음수 행렬분해와 정규화된 공간 공분산 행렬을 이용한 미결정 블라인드 소스 분리 (Underdetermined blind source separation using normalized spatial covariance matrix and multichannel nonnegative matrix factorization)

  • 오순묵;김정한
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.120-130
    • /
    • 2020
  • 본 논문은 블라인드 소스 분리 분야에서 널리 사용되는 멀티채널 비음수 행렬 분해 기법의 단점을 개선하여 미결정 복잡한 혼합 환경에서 문제를 해결한다. 공간 공분산 행렬에 기반을 둔 기존의 연구들에서, 단일 채널의 파워게인 및 상관관계와 같은 값으로 구성된 행렬의 각 요소는 높은 분산으로 인해 분리된 소스의 품질을 저하시키는 경향이 있다. 이 논문에서는 추정된 소스들을 효과적으로 클러스터링하기 위해 레벨 및 주파수 정규화를 수행한다. 따라서 새로운 공간 공분산 행렬 및 효과적인 클러스터 쌍별 거리함수를 제안한다. 본 논문에서는 제안된 행렬을 공간 모델의 초기화에 활용하여 공간 모델의 향상된 추정과 이를 바탕으로 상향식 접근법에서의 계층적 응집 클러스터링에 활용함으로써 분리된 음원의 품질을 향상시켰다. 제안된 알고리즘은 'Signal Separation Evaluation Campaign 2008 development dataset'을 활용하여 실험을 하였다. 그 결과 객관적인 소스 분리 품질 검증 도구인 'Blind Source Separation Eval toolbox'를 활용하여 대부분의 성능향상지표에서의 향상을 확인하였으며, 특히 대표적인 수치인 SDR의 1 dB ~ 3.5 dB 정도의 성능우위를 검증하였다.

클러스터 환경에서 GeoSensor 스트림 데이터의 집계질의의 정확도 향상을 위한 이중처리 부하제한 기법 (A Dual Processing Load Shedding to Improve The Accuracy of Aggregate Queries on Clustering Environment of GeoSensor Data Stream)

  • 지민섭;이연;김경배;배해영
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.31-40
    • /
    • 2012
  • 인간의 삶을 돕는 유비쿼터스 환경에서 GeoSensor의 다양한 센서 데이터들을 다루는 u-GIS DSMS의 연구가 진행되고 있고 그에 따른 고가용성 서비스를 제공하기 위한 클러스터 시스템이 대두되고 있다. GeoSensor에 의해 수집되는 데이터는 폭발적으로 발생되는 특징을 가지고 있다. 이러한 특징은 서버의 제한된 메모리로 인하여 주어진 메모리를 초과하는 현상과 데이터가 손실되어 질의 정확도가 떨어지는 현상이 발생한다. 이를 해결하기 위해 부하제한 기법들이 활발히 연구되고 있다. 하지만 기존의 기법들은 단일 서버환경에서의 기법들로써 필터링을 통해 부하가 발생한 큐의 튜플들을 특별한 기준에 의해 드롭하는 방식이다. 그렇기 때문에 집계질의와 같은 튜플 삭제에 민감한 질의의 정확도를 만족시키기 어렵다. 본 논문에서는 GeoSensor 스트림 데이터의 클러스터링 환경에서 집계질의의 정확도 향상을 위한 이중처리 부하제한 기법을 제안한다. 본 기법은 두 노드가 고가용성을 위해 이중화 되어있는 스트림 데이터의 환경을 이용한다. 같은 스트림의 데이터를 공유하고 있는 특성을 이용해 두 노드에서 하나의 스트림의 데이터를 나누어 처리한다. 이때 슬라이딩 윈도우 단위로 두 노드 간 스트림 데이터를 동기화한다. 그리고 각 노드에서 처리된 결과를 다시 병합하는 방식이다. 성능평가를 통해 기존 기법들과 달리 튜플의 손실 없이 집계질의의 질의 정확도가 향상된 결과를 얻을 수 있었다.

클거스터 기반 다중 홉 센서 네트워크의 모델링 기법 (Modeling of the Cluster-based Multi-hop Sensor Networks)

  • 최진철;이채우
    • 대한전자공학회논문지TC
    • /
    • 제43권1호
    • /
    • pp.57-70
    • /
    • 2006
  • 센싱, 데이터 가공, 통신이 가능한 소형의 센서 노드로 구성된 무선 센서 네트워크는 다양한 환경 변화를 측정할 수 있는 유용한 수단이다. 센서 노드에서 측정된 데이터는 모든 데이터를 수집, 처리하며 사용자에게 전달하는 기능을 가진 프로세싱 센터에 전송된다. 이러한 과정은 에너지 제약을 가진 센서 노드를 고려하여 설계되어야 한다. 일반적으로 인접한 센서 노드는 유사한 정보를 가지므로, 로컬 클러스터를 형성하고 클러스터 헤드에 의해 집약된 데이터를 프로세싱 센터에 전송하는 클러스터링 기법이 저전력 구동에 효과적이다. 자동 구성능력을 지닌 기존의 다중 홉 클러스터 에너지 소비량 모델링 기법은 개별 센서 노드의 정확한 에너지 소비량을 예측할 수 없는 문제를 가지고 있었다. 따라서 본 논문에서는 이러한 문제를 보완한 새로운 클러스터 에너지 소비량 모델링 기법을 제안한다. 제안된 모델링 기법은 보로노이 배열(Voronoi tessellation)을 이용하여 클러스터 헤드의 수에 따른 에너지 소비량을 모델링한다. 즉, 센서 필드의 면적, 분포된 센서 노드의 수와 통신 범위를 이용하여 전체 네트워크의 에너지 소비량을 클러스터 헤드의 수에 따라 정량적으로 나타낸다. 본 모델링 기법을 통해 전체 네트워크의 에너지 소비량이 최소가 되는 클러스터의 수를 예측함으로써 저전력을 실현할 수 있다. 본 논문에서 제안하는 모델링 기법은 시뮬레이션을 통해 구성한 실제 네트워크의 에너지 소비량과 $90\%$ 이상의 정확도를 가지며, 기존 모델링의 $60\%$대에 비춰볼 때 상당히 우수한 정확도를 지니고 있다. 또한, 센서 노드의 밀도가 증가할수록 에너지 소비량 정확도가 증가하는 효과를 확인하였다.

빅 데이터 기반의 네트워크 패킷 분석 모델 (The Model of Network Packet Analysis based on Big Data)

  • 최보민;공종환;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.392-399
    • /
    • 2013
  • IT 기술 발달 및 정보화 시대로 인해 우리 사회 전반에 걸쳐 많은 부분이 네트워크에 대한 의존도가 상당히 커지고 있다. 이는 다양한 정보 및 서비스 획득의 용이성을 제공해 주는 이점이 있는 반면에, 네트워크 침입자들로 하여금 더 많은 취약성의 루트를 제공할 수 있는 부정적 효과도 따르고 있다. 이는 네트워크 이용과 함께 증가한 패킷의 다양한 루트를 악용하여 네트워크의 연결된 시스템에 서비스 장애나 마비를 일으키는 악의적인 위협 및 공격 또한 함께 증가하고 있음을 의미하며 이러한 문제에 대한 해결책이 시급히 필요하다. 이에 보안 분야에서는 네트워크 패킷이나 시스템 로그 등을 수집하여 이를 분석하고 이러한 위협에 대응할 수 있는 다양한 보안 솔루션을 개발하고 있으나, 기존의 분석 방식들로는 점차 방대해져가고 있는 보안 데이터들을 처리하는데 데이터 저장 공간 부족 및 이에 따른 성능 저하와 같은 여러 문제점들이 발생하고 있다. 따라서 본 논문에서는 보안 영역 분야에서도 최근 이슈가 되고 있는 빅 데이터 기술을 적용하여 이러한 문제점들을 개선하는 모델을 제안한다. 즉, 대용량 데이터 저장 기술인 NoSQL을 통해 점차 방대해져 가는 패킷데이터를 수집하고, 분산 프로그래밍모델인 맵리듀스 기반의 K-means 클러스터링을 설계하여 네트워크 침입에 대한 특징 및 패턴을 추출 할 수 있는 분석모델을 제안하고 실험을 통하여 이에 대한 우수성을 입증하였다.

다중점 적합성 피드백방법을 이용한 영역기반 이미지 유사성 검색 (Region Based Image Similarity Search using Multi-point Relevance Feedback)

  • 김덕환;이주홍;송재원
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.857-866
    • /
    • 2006
  • 질의 이미지의 시각적 특징이 사용자의 상위 수준 개념을 잘 표현하지 못하기 때문에 이미지 검색 시스템의 성능은 보통 매우 낮다. 의미적으로 유사한 이미지들이 매우 다른 시각적 특징을 보일 수도 있으며 따라서 여러 개의 군집에 분산될 수 있다. 본 논문에서는 영역기반 이미지 검색과 군집-합병을 이용한 새로운 적합성 피드백 방법을 결합한 내용기반 이미지 검색 방법을 제안한다. 주요 목표는 의미적 차이를 줄이기 위해 의미적으로 관련된 군집들을 찾는 것이다. 제안된 방법은 영역기반 군집 과정과 군집-합병 과정으로 이루어진다. 적합한 이미지들의 모든 분할된 영역들을 의미적으로 관련된 계층적인 군집으로 구성한다. 잠재된 군집의 개수를 결정하고 근접한 군집들을 합병한 후 최종 군집의 대표점들로 다중 질의를 표현한다. 군집-합병 과정에서 군집의 개수를 찾고 고차원에서 특이점 문제를 해결하기 위하여 호텔링의 $T^2$ 대신에 v개의 주성분을 이용하는 $T_v^2$를 적용하였으며 $T^2$의 성능과 $T_v^2$의 성능의 차이가 없음을 보인다. 실험 결과는 제안된 방법이 내용기반 이미지 검색 시스템의 성능을 개선하는 데 효율적임을 보여준다.

다변량 스트림 데이터 축소 기법 평가 (Evaluation of Multivariate Stream Data Reduction Techniques)

  • 정훈조;서성보;최경주;박정석;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.889-900
    • /
    • 2006
  • 센서 네트워크는 애플리케이션 분야에 따라 데이터 특성과 사용자의 요구사항이 다양함에도 불구하고, 현존하는 스트림 데이터 축소 연구는 데이터의 본질적인 특징보다 특정 축소 기법의 성능 향상 측면에 중점을 두고 있다. 이 논문은 계층/분산형 센서 네트워크 구조와 데이터 모델을 소개하고, 선택적으로 축소 기법을 적용하기 위해 데이터 특성과 사용자의 요구에 적합한 다변량 데이터 축소 기법을 비교 평가한다. 다변량 데이터 축소 기법의 성능을 비교 분석하기 위해, 우리는 웨이블릿, HCL(Hierarchical Clustering), SVD(Singular Value Decomposition), 샘플링과 같은 표준화 된 다변량 축소 기법을 이용한다. 실험 데이터는 다차원 시계열 데이터와 로봇 센서 데이터를 사용한다. 실험 결과 SVD와 샘플링 기법이 상대 에러 비율과 수행 성능 측면에서 웨이블릿과 HCL기법에 비해 우수하였다. 특히 각 데이터 축소 기법의 상대 에러 비율은 입력 데이터 특성에 따라 다르기 때문에 선택적으로 데이터 축소 기법을 적용하는 것이 좋은 성능을 보였다. 이 논문은 다차원 센서 데이터가 수집되는 센서 네트워크를 디자인하고 구축하는 응용 분야에 유용하게 활용될 것이다.

문서 확장을 이용한 표제어 검색시스템 (Headword Finding System Using Document Expansion)

  • 김재훈;김형철
    • 정보관리연구
    • /
    • 제42권4호
    • /
    • pp.137-154
    • /
    • 2011
  • 표제어 검색시스템은 뜻풀이를 질의로 간주하는 정보검색 시스템이다. 이러한 시스템을 구축하기 위한 가장 간단한 방법으로 사전의 표제어 뜻풀이(사전 뜻풀이)를 문서로 간주하는 정보검색 시스템을 구축하는 것이다. 이 문서의 길이가 너무 짧아 사용자 질의(사용자 뜻풀이)에 대한 적절한 표제어를 검색하기 어렵다. 이 문제를 완화하기 위해서 본 논문에서는 정보검색에서 사용되는 질의 확장 개념을 문서 확장에 적용한다. 본 논문에서는 문서 확장 방법으로는 뜻풀이 확장과 유의어 확장을 사용한다. 뜻풀이 확장은 주어진 단어의 사전 뜻풀이에 속하는 단어의 뜻풀이를 문서에 포함시키는 방법이고, 유의어 확장은 무자질 군집화 알고리즘을 통해서 유의어를 찾고, 찾아진 유의어를 문서에 포함시키는 방법이다. 제안된 표제어 검색시스템은 사전 뜻풀이 그 자체를 입력으로 할 때, 16-포함률이 거의 100%에 달하였다. 또한 사용자 뜻풀이를 입력으로 할 때, 20-포함률이 66.9%였다. 사용자 뜻풀이가 단어의 의미를 충분히 전달할 수 없는 것으로 관찰되었으며 앞으로 정확하고 객관적인 평가를 위해서 평가 집합에 대한 연구가 추가적으로 필요한 실정이다.

도서관의 자동 도서 관리를 위한 군집화 기반 다중경유지의 최단 경로 알고리즘 개발 (Development of the Shortest Path Algorithm for Multiple Waypoints Based on Clustering for Automatic Book Management in Libraries)

  • 강효정;전은주;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.541-551
    • /
    • 2021
  • 도서관 사서의 수많은 업무 중 도서 정리 업무는 사서가 일일이 정리해야 하는 일이기 때문에, 투입되는 인적·시간적 비용이 크다. 이러한 문제를 해결하기 위해 최근 인공지능 기술을 접목한 도서 정리 로봇에 관한 관심이 증가하고 있다. 본 연구에서는 도서 정리 로봇에 적용할 수 있는 다중경유지 최단 경로 알고리즘인 K-ACO 알고리즘을 제안한다. 제안하는 K-ACO 알고리즘은 하나의 로봇이 아니라 여러 대의 로봇을 가정하고 있다. 또한, K-ACO는 개미 알고리즘을 개선하여 K개의 군집을 만들고 각 군집 별 최단 경로를 제공해준다. 본 논문에서는 제안한 알고리즘의 성능 분석을 도서 정리 시간의 관점에서 실시하였다. 제안한 알고리즘인 K-ACO 알고리즘을 한 대학교 도서관에 적용하여 현재 도서 정리 알고리즘과 비교해 보았다. 시뮬레이션을 통해 제안하는 알고리즘은 도서 정리 업무를 치우치지 않고 공평하게 배분하여 궁극적으로 전체 일이 끝나는 시간을 확연히 줄일 수 있음을 알 수 있었다. 본 연구 결과를 통하여 제안한 알고리즘의 적용으로 도서 정리에 필요한 인적·시간적 비용을 절감하여 도서관 내 양질의 서비스 향상을 기대한다.

K-평균 군집분석을 활용한 중학생의 군집화 및 특성 분석 (Analysis of Characteristics of Clusters of Middle School Students Using K-Means Cluster Analysis)

  • 이재봉
    • 한국과학교육학회지
    • /
    • 제42권6호
    • /
    • pp.611-619
    • /
    • 2022
  • 최근 교육에서 교육 데이터마이닝에 관한 관심이 높아지고 있는 시점에 과학교육에서 평가 결과를 활용하여 학생들에게 적합한 피드백을 제공하기 위해 빅데이터 분석의 적용 가능성을 탐색해 보고자 하였다. 연구에서는 국가수준 학업성취도 평가의 24문항에 응시한 2,576명의 평가 자료를 활용하여 비지도 기계학습의 한 가지 방법인 K-평균 군집분석을 이용하여 학생들을 군집화하였다. 학업성취도 평가 자료를 활용한 군집화 결과, 학생들을 6개의 군집으로 나누어 볼수 있었다. 상위권이나 하위권에 비해 중위권 학생들이 다양하게 다른 군집으로 구분됨을 알 수 있다. 군집분석의 결과를 보면, 군집화에서 가장 중요하게 영향을 주는 요인은 학업 성취였으며, 군집별로는 교육과정의 내용 영역별, 교과 역량별, 정의적 특성 면에서 서로 다른 특성을 보이고 있었다. 하위 군집에서는 정의적 영역 중에서 학습의욕이 중요하게 영향을 주고, 교과 역량 면에서는 과학적 탐구 및 문제 해결력과 과학적 의사소통 능력이 중요하게 영향을 주고 있었다. 내용 영역 면에서는 운동과 에너지와 물질 영역에 대한 성취가 군집의 특성을 구분하는 중요한 요인으로 작용하고 있었다. 따라서 평가 자료를 활용해 학생을 군집화한 후, 이러한 군집별 특성을 바탕으로 학생들에게 학습을 위한 맞춤형 피드백을 제공할 수 있을 것으로 판단된다. 본 연구에서는 이러한 연구 결과를 바탕으로 군집분석 연구 결과 활용의 가능성, 내용 영역별 균형 있는 학습, 교과 역량 증진, 과학적 태도의 향상 등 과학교육의 시사점을 제안하였다.

불법주정차 단속을 위한 지역(장소) 분류 및 활용 방안: 경기도를 중심으로 (Location Classification and Its Utilization for Illegal Parking Enforcement: Focusing on the Case of Gyeonggi)

  • 한현;최소연;이소현
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.113-130
    • /
    • 2023
  • 경제발전과 국민소득 증가로 자동차 수는 계속 증가하고 있으며 이는 한정된 도로 여건과 주차 시설 부족으로 불법주정차 문제가 심각한 상황이다. 불법주정차는 사람들에게 많은 불편과 불쾌감을 주며, 또한 사고로 인한 인명 피해로까지 이어지게 한다. 수도권을 중심으로 늘어나는 차량과 불법주정차로 인해 관련 사고 및 그 피해의 심각성은 날로 커지고 있다. 이는 사회문제 발생의 원인이 되면서 불법주정차를 줄이기 위한 대책 마련에 힘쓰고 있다. 특히, 국내에서는 수도권에 거주하는 사람들의 민원 절반이 불법주정차 문제이고, 이로 인한 물리적 피해와 인명 피해가 가장 많은 곳은 경기도이다. 그리하여, 본 연구에서는 경기도 수원시의 불법주정차 관련 데이터를 기반으로 머신러닝 기법을 이용하여 지역 특성을 새롭게 분류하고, 이를 기반으로 효과적인 불법주정차 단속 방안을 제안한다. 더불어, 수도권 지역의 불법주정차 문제를 감소하기 위한 실무적·사회적·정책 및 법률적 방안을 제시한다. 본 연구는 사회문제 중 하나로 언급되고 있는 도시의 교통체증을 증가시키는 불법주정차 문제에 머신러닝 알고리즘인 K-prototype을 이용하여 지역 특성을 새롭게 분류한 것에 학술적 의의가 있다. 또한, 본 연구의 결과는 수도권 지역의 불법주정차 문제를 감소하기 위한 방안을 제시함으로써 실무적 및 사회적 측면에 기여한다.