• 제목/요약/키워드: 지도 군집화

검색결과 592건 처리시간 0.026초

텍스트 데이터 분석을 위한 근접성 데이터의 생성과 군집화 (Creation and clustering of proximity data for text data analysis)

  • 정민지;신상민;최용석
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.451-462
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝 분야에서 보편적으로 사용되는 데이터의 한 유형으로, 여러 개체들이 제공하는 문서를 기반으로 만들어진다. 그러나 대다수의 연구자들은 개체 정보에 무게를 두지 않고 여러 문서에서 공통적으로 등장하는 공통용어 중 핵심적인 용어를 효과적으로 찾아내는 방법에 집중하는 경향을 보인다. 공통용어에서 핵심어를 선별할 경우 특정 문서에서만 등장하는 중요한 용어들이 공통용어 선정단계에서부터 배제될 뿐만 아니라 개별 문서들이 갖는 고유한 정보가 누락되는 등의 문제가 야기된다. 본 연구에서는 이러한 문제를 극복할 수 있는 데이터를 근접성 데이터라 정의한다. 그리고 근접성 데이터를 생성할 수 있는 12가지 방법 중 개체 군집화의 관점에서 가장 최적화된 방법을 제안한다. 개체 특성 파악을 위한 군집화 알고리즘으로는 다차원척도법과 K-평균 군집분석을 활용한다.

형태 군집화를 이용한 입술 형태 모델과 입술 추출 (Lip Shape Model and Lip Localization using Shape Clustering)

  • 장경식
    • 한국멀티미디어학회논문지
    • /
    • 제6권6호
    • /
    • pp.1000-1007
    • /
    • 2003
  • 이 논문은 입술의 모양을 효과적으로 추출하는 방법을 제안하였다. 입술은 Point Distribution Model에 근거하여 점들의 집합으로 표현하였다. Isodata군집 알고리듬을 이용하여 전체 학습 영상을 입술 형태별로 군집화 하고 주성분 분석법을 사용하여 각 군집에 대한 입술의 형태 모델을 구하였다 추출 결과가 입력 영상의 실제 입술 위치를 올바르게 찾았는지 판정하기 위하여 입술 경계선 주변의 화소값들을 이용한 입술의 경계선 모델을 구하고 이를 반영하는 평가함수를 구성하였다. 형태 차이를 반영하여 얻은 입술 형태 모델을 사용하여 입술을 추출하기 때문에 전체 학습 영상의 평균 모양과 많은 차이를 보이는 입술을 정확하게 추출할 수 있었다. 여러 영상을 대상으로 실험하여 약 92%의 성공률을 얻었다.

  • PDF

4D 이미징 레이더의 저밀도 PCD 데이터 군집화와 각 군집에 복셀 특징 추출 기법을 적용한 3D 객체 인식 기법 (3D Object Detection with Low-Density 4D Imaging Radar PCD Data Clustering and Voxel Feature Extraction for Each Cluster)

  • 오차영;권순재;정현정;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권6호
    • /
    • pp.471-476
    • /
    • 2022
  • 본 논문은 악천후에 약한 카메라와 라이다(LiDAR)의 문제점을 해결하기 위해 개발된 4D 이미징 레이더를 활용한 객체 인식 기법을 제안한다. 4D 이미징 레이더를 통해 데이터를 측정 및 수집하는 경우 라이다 데이터보다 포인트 클라우드 데이터의 밀도가 낮다는 단점이 있다. 밀도가 낮아 객체 사이의 거리가 넓은 특성을 이용하여, 객체를 군집화하고 해당 군집에서 voxel을 통해 객체의 특징을 추출하는 기법을 제안한다. 또한, 추출된 특징을 이용한 객체 인식 기법을 제안한다.

계층 군집을 이용한 효율적인 이동 집단의 소요 이동 시간 알고리즘 설계 및 구현 (Design and Implementation Algorithm of Efficient Travel Time for Mobility Groups Using Hierarchy Clusters)

  • 송예지;전태현;안진현;임동혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.777-780
    • /
    • 2020
  • 본 논문은 동일 목적지를 가진 다수의 사람들이 동일 이동 수단을 탑승하여 이동할 경우 발생하는 소요 시간의 감소를 위한 거점 군집에 대해 다루려 한다. 실제 도로망에서는 노드에 해당하는 사람들의 위치가 유동적으로 변화 하고 사람 간의 거리 값 또한 변화하게 된다. 따라서 동일한 목적지를 가진 다수의 사람들이 한 대의 차량을 탑승하여 이동한다고 가정할 때 차량의 최단 경로 및 소요 시간 감소를 목적을 기반으로 설계하였다. 차량의 최단 경로를 감소시키 위해서 사람들을 군집화 하는 방법을 사용하였고 그 결과 경유지가 감소 되어 차량의 이동 경로 값은 감소되었다. 또한, 전체 이동 소요 시간 역시 군집을 통해 감소시킬 수 있다. 본 논문에서는 이와 같이 군집을 이용한 최단 경로의 감소와 전체 이동시간 감소에 대한 알고리즘을 설계하고 구현하였다.

K-means 알고리즘을 활용한 수도권 도심항공 모빌리티(UAM) 수직이착륙장 위치 선정 및 평가 (Selection and Evaluation of Vertiports of Urban Air Mobility (UAM) in the Seoul Metropolitan Area using the K-means Algorithm)

  • 정준영;황호연
    • 한국항행학회논문지
    • /
    • 제25권1호
    • /
    • pp.8-16
    • /
    • 2021
  • 본 논문에서는 도심항공 모빌리티(UAM)를 우리나라 수도권에서 운용하기 위해 필요한 수직이착륙장의 위치를 선정하고 평가하였다. 통근통학 인구수 조사 데이터를 이용해 수요 데이터를 분석하였으며, MATLAB을 이용해 지도상에 표현하였다. 또한 데이터들을 군집화하기 위해 MATLAB에 내장되어있는 K 평균 알고리즘 함수를 이용해 수직이착륙장의 위치로 선정할 군집의 중심을 파악하였으며, 실루엣 기법을 이용해 군집화의 정확도와 신뢰도를 평가하였다. 또한 선정된 수직이착륙장의 위치가 실제 수직이착륙장 설치에 적합한지 위성 지도를 이용해 확인하였으며, 그 위치가 설치 불가능한 위치에 있는 경우 위치 조정 과정을 통해 최종 수직이착륙장의 위치를 선정하였다.

침입 탐지를 위한 효율적인 퍼지 분류 규칙 생성 (Generation of Efficient Fuzzy Classification Rules for Intrusion Detection)

  • 김성은;길아라;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권6호
    • /
    • pp.519-529
    • /
    • 2007
  • 본 논문에서는 효율적인 침입 탐지를 위해 퍼지 규칙을 이용하는 방법을 제안한다. 제안한 방법은 퍼지 의사결정 트리의 생성을 통해 침입 탐지를 위한 퍼지 규칙을 생성하고 진화 알고리즘을 사용하여 최적화한다. 진화 알고리즘의 효율적인 수행을 위해 지도 군집화를 사용하여 퍼지 규칙을 위한 초기 소속함수를 생성한다. 제안한 방법의 진화 알고리즘은 적합도 평가시 퍼지 규칙(퍼지 의사결정 트리)의 성능과 복잡성을 고려하여 평가한다. 또한 데이타 분할을 이용한 평가와 퍼지 의사결정 트리의 생성과 평가 시간을 줄이는 방법으로 소속정도 캐싱과 zero-pruning을 사용한다. 제안한 방법의 성능 평가를 위해 KDD'99 Cup의 침입 탐지 데이타로 실험하여 기존 방법보다 성능이 향상된 것을 확인하였다. 특히, KDD'99 Cup 우승자에 비해 정확도가 1.54% 향상되고 탐지 비용은 20.8% 절감되었다.

계층적 군집화를 이용한 능동적 학습 (Active Learning based on Hierarchical Clustering)

  • 우호영;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.705-712
    • /
    • 2013
  • 능동적 학습(active learning)은 소수의 라벨 데이터로 구성된 훈련 집합이 주어진 경우에 분류기 학습에 가장 도움이 될 만한 언라벨드 데이터를 선택하여 전문가에 의한 라벨링을 통해 훈련 집합에 포함시키는 과정을 반복함으로써 분류기의 성능을 향상시키는 것을 목적으로 한다. 본 논문에서는 워드 연결(ward's linkage)을 이용한 계층적 군집화(hierarchical clustering)를 바탕으로 한 능동적 학습 방법을 제안한다. 제안된 방법은 각 군집에서 적어도 하나의 샘플을 포함하도록 초기 훈련 집합을 능동적으로 구성하거나 또는 기존의 훈련 집합을 확장함으로써 전체 데이터 분포를 반영할 수 있게 한다. 기존의 능동적 학습 방법들 중 대부분은 초기 훈련 집합이 주어져 있을 경우를 가정하는 반면에 제안하는 방법은 초기 클래스 정보를 가진 훈련 데이터가 주어지지 않은 경우와 주어진 경우에 모두 적용 가능하다. 실험을 통하여 제안하는 방법이 비교 방법들에 비해 분류기 성능을 크게 향상시킬 수 있는 효과적인 데이터 선택을 수행함을 보인다.

로그 데이터를 이용한 기업 정보 시스템의 사용 패턴 분석 (Utilization Pattern Analysis of an Enterprise Information System using Event Log Data)

  • 한관희
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.723-732
    • /
    • 2022
  • 최근 들어 기업정보 시스템의 성공적인 활용은 기업의 효과적인 전략 수행과 기업 경영 목적 달성에 핵심적인 역할을 하고 있다. 기업정보 시스템의 도입 성공 여부를 결정하는 인자 중의 하나가 시스템 활용도로서, 정보시스템 활용도를 측정하는 효과적인 방안을 마련하는 것은 기업 경영에서 매우 중요하다. 본 연구에서는 프로세스 마이닝 기법을 이용한 로그 데이터 분석을 통해 정보 시스템 활용도를 평가한다. 즉, 기본적인 접속 로그 통계뿐만 아니라 정보시스템을 실제로 사용하는 순서를 패턴화하고 유사 사용 기능을 군집화하여, 정보시스템 설계시에 예상하였던 시스템 사용 순서/기능과 실제 현황을 비교함으로써 기존 정보시스템을 개선하거나 확장하는데 피드백을 제공하고자 한다.

커피전문점 생존 및 폐업 분포의 군집 유형별 생멸 특성 (Locational Characteristics of Survived and Closed Coffee Shops by Spatial Cluster Type)

  • 박소현;어정민;이금숙
    • 한국경제지리학회지
    • /
    • 제23권4호
    • /
    • pp.408-424
    • /
    • 2020
  • 본 연구는 커피전문점 소재지별 지가 속성을 토대로 생존하여 영업 중인 커피전문점과 폐업한 커피전문점을 대상으로 공간 군집화를 시도하고, 군집 유형별 토지 특성(지가 및 필지 정보), 교통 요인(물리적 접근성)과 점포 속성(프랜차이즈 정보, 소재지별 동종업종의 개·폐업 경험), 공간 밀집도(커널 밀도 추정) 등 다양한 입지 특성을 통해 커피전문점의 생멸 분포에서 나타나는 특징을 파악한다. 이를 위해 영업 중 및 폐업한 커피전문점의 공간 군집은 일반적 입지분포형, 주거지역의 상업화형, 상업중심지 입지형 등으로 유형 구분하고, 군집 유형별 입지 특성을 비교 분석한다. 군집 결과, 영업 중 및 폐업한 커피전문점의 입지는 같은 유형으로 분류되더라도 서로 다른 공간 분포 양상을 나타내고, 입지 유형이 달라도 특정 핫스폿에서는 모두 높은 밀집도를 나타낸다. 본 연구의 분석 결과는 커피전문점 창업을 비롯해 지역별 상권정보를 파악하는데 기초자료로 제공될 수 있다.

산양삼 생육특성과 재배지 토양세균군집 간의 상관관계 연구 (Study on the Correlation between the Growth Characteristics of Wild-simulated Ginseng (Panax ginseng C.A. Meyer) and Soil Bacterial Community of Cultivation Area)

  • 김기윤;엄유리;정대희;김현준;김만조;전권석
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2019년도 추계학술대회
    • /
    • pp.84-84
    • /
    • 2019
  • 본 연구는 전국 임의의 산양삼 재배지를 선정하여 재배지 내의 토양 특성 및 토양세균군집을 분석하고, 토양 특성, 세균군집 및 산양삼 생육특성 간의 상관관계를 구명하기 위하여 수행되었다. 토양 이화학성 분석은 농촌진흥청의 종합분석실 매뉴얼에 따라 분석하였고, 토양세균군집 분석은 pyrosequencing analysis (Illumina platform)를 이용하였다. 토양세균군집과 생육특성 간의 상관관계는 Spearman's rank correlation을 이용하여 분석하였다. 전국 8개 산양삼 재배지로부터 분리한 토양세균군집은 2개의 cluster로 군집화를 이루는 것을 확인하였다. 모든 토양 샘플에서 Proteobacteria와 Alphaproteobacteria가 각각 평균 상대적 빈도수가 35.4%, 24.4%로 우점종으로 나타났다. 나타났다. 두 개의 cluster 간 토양세균군집의 상대적 빈도수를 비교 분석한 결과, 먼저 Proteobacteria (p = 0.03), Actinobacteria (p = 0.02), Ahlpaproteobacteria (p = 0.029), Betaproteobacteria (p = 0.021)는 cluster 1에서 cluster 2에 비해 상대적 빈도수가 유의적으로 높았고, Fimicutes (p = 0.004), Cyanobacteria (p = 0.004), Acidobacteriia (p = 0.041), Ktedonobacteria (p = 0.019), Gammaproteobacteria (p = 0.034), Bacilli (p = 0.009)은 cluster 2에서 유의적으로 상대적 빈도수가 높은 것으로 나타났다. 토양세균군집 cluster 간 산양삼의 생육특성을 비교 분석한 결과, cluster 2 재배지에서 수집한 산양삼 시료의 지하부 생중량은 cluster 1 재배지에서 수집한 산양삼 시료에 비해 cluster 2에서 유의적 (p = 0.04)으로 높았다. 산양삼 생육특성과 토양세균군집 간의 상관관계를 분석한 결과, 산양삼의 생육은 토양 pH가 낮고 Acidobacteria의 상대적 빈도수가 높은 토양에서 증가하였으며, Acidobacteriia와 Koribacteraceae의 상대적 빈도수는 산양삼의 생육과 유의적인 정의 상관관계를 보이는 것으로 나타났다. 본 연구 결과는 토양미생물군집과 산양삼 생육 간의 상관관계를 구명하는 중요한 자료가 될 것으로 생각되고, 나아가 산양삼 재배적지를 선정하는데 있어 보다 명확한 정보를 제공할 수 있을 것으로 사료된다.

  • PDF