• 제목/요약/키워드: 군집형

검색결과 676건 처리시간 0.031초

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

식생활 라이프스타일에 따른 비만도와 외식선택속성에 관한 연구 - 부산지역 대학생을 중심으로 - (A Study on Obesity Index and Attributes of Selecting Places to Eat Out by Food-Related Lifestyle Types - Focusing on Pusan University Students -)

  • 이종호
    • 한국조리학회지
    • /
    • 제18권4호
    • /
    • pp.47-58
    • /
    • 2012
  • 본 연구는 부산지역 K대학교 학생들을 대상으로 식생활 라이프스타일유형에 따른 군집을 도출하고 각 집단과 외식선택속성과 비만도와의 차이를 고찰하고자 연구를 진행하였다. 연구의 목적을 달성하기 위하여 통계프로그램 PASW Statistic 18.0(Predictive Analytics Software)을 이용하여 빈도분석, 요인분석 및 신뢰도분석, t-test, ${\chi}^2$-test, 비 계층적 군집분석과 ANOVA을 실시하였다. 남자 대학생들의 평균키는 175.59 cm, 체중은 69.53kg이고, 여자 대학생들의 평균키는 162.81 cm, 체중은 53.42kg으로 나타내었다. 남학생 체질량지수를 저체중이 1.7%, 정상체중은 64.6%, 과체중 19.7%이고, 비만은 14.0%로 나타났다. 여학생 체질량지수는 저체중이 22.9%. 정상체중은 62.7%, 과체중이 8.5%, 비만은 5.9%를 나타내었다. 식생활라이프스타일 항목은 건강추구, 안전성추구, 분위기추구, 미각추구, 서양음식추구요인으로 추출되었고, 외식선택속성은 음식의 질과 서비스, 합리적인가격, 접근성과 분위기, 먹어본 경험 요인으로 추출되었다. 식생활라이프스타일은 군집1은 [식생활 무관심형 집단] 군집2는 [건강지향형 집단] 군집3은 [건강무관심형 집단]으로 군집 명을 부여하였다. 식생활라이프스타일 군집과 외식선택속성 요인간의 차이분석에서 군집1은 먹어본 경험에서 높은 평균값을 나타내었고, 군집2는 음식과 서비스의 질에서 높은 평균값을 나타내었고, 군집3은 접근선과 이미지에서 높은 평균값을 나타내었다.

  • PDF

무선 인지 네트워크에서 군집형 데이터 슬롯의 미검출 확률 추정에 기반한 최적 스펙트럼 센싱 구조 (Optimal Spectrum Sensing Framework based on Estimated Miss Detection Probability for Aggregated Data Slots in Cognitive Radio Networks)

  • 우혁;이동준
    • 한국항행학회논문지
    • /
    • 제17권5호
    • /
    • pp.506-515
    • /
    • 2013
  • 무선 인지 네트워크의 많은 연구는 한 번의 스펙트럼 센싱 수행으로 한 개의 데이터 슬롯을 전송하는 프레임 구조에 대하여 연구하였다. 프레임 길이가 짧은 경우, 데이터 전송률이 낮아지는 문제가 있다. 본 논문에서는 한 번의 스펙트럼 센싱 수행으로 다수의 데이터 슬롯을 전송하는 군집형 데이터 슬롯 구조에 대해서 연구한다. 이를 위해서 Chapman-Kolmogorov 방정식을 이용하여 선순위 사용자의 전송 확률을 모델링하고 이를 이용하여 후순위 사용자의 전송률을 최대화하기 위한 최적화 문제를 제시한다. 최적화 문제의 해를 구하여 최적의 스펙트럼 센싱 시간과 데이터 슬롯의 길이와 군집할 데이터 슬롯의 수를 도출한다.

잔디-애기자운군집(신칭): 애기자운 최남단 분포 개체군의 군락분류와 군락지리 (A New Association of Gueldenstaedtio-Zoysietum japonicae: A Syntaxonomical and Syngeographical Description of the Southernmost Population of Gueldenstaedtia verna in South Korea)

  • 이정아;김종원
    • Weed & Turfgrass Science
    • /
    • 제6권1호
    • /
    • pp.40-54
    • /
    • 2017
  • 전통 장례 문화의 봉분 무덤은 적절한 관리에서 지속되는 잔디(Zoysia japonica) 뗏장을 바탕으로 하는 독특한 서식처이다. 본 연구는 지리적으로 최남단 분포의 애기자운이 출현하는 잔디 우점 이차초원식생에 대한 군락분류학적 기재이다. 현지 식생조사와 식생조사표 모둠화를 통한 단위식생의 추출은 Z.-M.학파의 식물사회 분류법을 따랐다. 유형화된 단위식생은 생태식물상 형질 분석과 선행 기재 단위식생과의 종조성적 비교가 성취되었다. 잔디-애기자운군집(신칭)이 처음으로 기재되었고, 김의털아군집, 전형아군집, 토끼풀아군집의 하위단위를 포함한다. 이들 아군집은 접근성과 관리양식에 대응한 종조성의 차이에서 구분되었다. 본 군집은 <지역생물기후구-대구형> 속에서 강한 대륙성 환경조건을 갖춘 미세 서식처에서만 분포하는 지역(regional) 식생형이면서 국지(local) 식생형으로 규정되었다. 잔디-애기자운군집은 대륙형 이차초원식생 가운데 한국인의 봉분 문화에 잇닿은 '뗏장초원식생'이고, 해양형의 잔디군단(억새군강, 양지사초군목)과 전혀 다른 식생형인 것으로 밝혀졌다. 잔디 우점의 이차초원식생일지라도 초지의 식물종다양성과 잔디-애기자운군집의 현지내 보존을 위하여 봉분을 포함한 뗏장에 대한 서식처로서의 이해와 적절한 생태적 관리가 요구되었다.

커피전문점 생존 및 폐업 분포의 군집 유형별 생멸 특성 (Locational Characteristics of Survived and Closed Coffee Shops by Spatial Cluster Type)

  • 박소현;어정민;이금숙
    • 한국경제지리학회지
    • /
    • 제23권4호
    • /
    • pp.408-424
    • /
    • 2020
  • 본 연구는 커피전문점 소재지별 지가 속성을 토대로 생존하여 영업 중인 커피전문점과 폐업한 커피전문점을 대상으로 공간 군집화를 시도하고, 군집 유형별 토지 특성(지가 및 필지 정보), 교통 요인(물리적 접근성)과 점포 속성(프랜차이즈 정보, 소재지별 동종업종의 개·폐업 경험), 공간 밀집도(커널 밀도 추정) 등 다양한 입지 특성을 통해 커피전문점의 생멸 분포에서 나타나는 특징을 파악한다. 이를 위해 영업 중 및 폐업한 커피전문점의 공간 군집은 일반적 입지분포형, 주거지역의 상업화형, 상업중심지 입지형 등으로 유형 구분하고, 군집 유형별 입지 특성을 비교 분석한다. 군집 결과, 영업 중 및 폐업한 커피전문점의 입지는 같은 유형으로 분류되더라도 서로 다른 공간 분포 양상을 나타내고, 입지 유형이 달라도 특정 핫스폿에서는 모두 높은 밀집도를 나타낸다. 본 연구의 분석 결과는 커피전문점 창업을 비롯해 지역별 상권정보를 파악하는데 기초자료로 제공될 수 있다.

적응형 정점 군집화를 이용한 메쉬 분할 (A Mesh Partitioning Using Adaptive Vertex Clustering)

  • 김대영;김종원;이혜영
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제15권3호
    • /
    • pp.19-26
    • /
    • 2009
  • 본 논문에서는 분할 축과 평면의 위치를 동적으로 결정하는 적응형 KD 트리 구조를 이용한 정점 군집화(Adaptive Vertex Clustering) 알고리즘과 이를 이용한 새로운 메쉬 분할 방법을 소개하고자 한다. 정점 군집화는 주로 한 개의 거대한 3차원 메쉬를 여러 개의 파티션(Partition)으로 분할하여 효율적으로 처리하고자 할 때 사용되는 기법으로, 옥트리 구조를 이용한 공간 분할 기법과 K-평균 군집화(K-Means Clustering) 방법 등이 있다. 그러나 옥트리 방식은 공간 분할 축과 이에 따른 분할된 공간의 크기가 고정되어 있어서 파티션 메쉬 면의 정렬 상태가 고르지 못하고 포함된 정점의 개수가 균등하지 못한 단점이 있다. 또한, K-평균군집화는 균등한 파티션을 얻을 수 있는 반면 반복처리와 최적화를 위해 많은 시간이 소요된다는 단점이 있다. 본 논문에서는 적응형 정점 군집화를 통해 빠른 시간에 균등한 메쉬 분할을 생성하는 알고리즘을 제안하고자 한다. 본 적응형 KD 트리는 메쉬가 포함된 경계상자(Bounding Box) 공간을 정점의 개수와 분할 축의 크기를 기준으로 계층적으로 분할한다. 그 결과 각 파티션 메쉬는 컴팩트성(compactness)의 특성을 유지하며 균등한 수의 정점을 포함하게 되어 각 파티션의 균등한 처리시간 및 메모리 소요량 등의 장점을 살려 향후 메쉬 간소화 및 압축 등의 다양한 메쉬 처리에 활용될 수 있기를 기대한다. 본 방법을 적용한 3차원 모델의 실험 통계와 분할된 파티션 메쉬의 시각적인 결과도 함께 제시하였다.

  • PDF

시간 가중치와 가변형 K-means 기법을 이용한 개인화된 음악 추천 시스템 (A Personalized Music Recommendation System with a Time-weighted Clustering)

  • 김재광;윤태복;김동문;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.504-510
    • /
    • 2009
  • 근래 들어 개인 적응형 서비스에 대한 관심이 높아지고 있으나 아직 음악에 관련된 서비스는 보편화되어 있지 않다. 그 이유는 음악의 관련 정보를 분석하는 것이 텍스트 기반의 자료에 비해 어렵기 때문이다. 이에 본 논문은 사용자가 선택했던 음악을 분석해서 사용자의 성향을 파악하고 그와 유사한 음악을 추천해주는 시스템을 제안한다. 음악의 속성을 추출하는 방법으로 음파 분석 기법을 사용한다. 음파에서 세 가지의 수치화된 속성을 추출하여 이를 특성 공간에 나타낸다. 이 때 사용자가 선택한 음악이 많이 모여 있는 군집을 분석한다면, 사용자의 취향을 파악할 수 있다. 하지만 몇 개의 군집이 형성될 것인지를 예측하기란 쉽지 않다. 이를 해결하기 위하여 군집의 수를 상황에 따라 유동적으로 변경할 수 있는 가변형 K-means 기법을 제시한다. 이 기법은 군집의 직경 크기를 제한하여, 일정치 이상일 때 군집의 수를 늘리는 방법으로 데이터의 범위를 알고 있을 때 매우 효율적으로 적용할 수 있다. 이 방법을 이용하여 군집의 중심을 찾고 이와 가까운 음악을 추천한다. 또한 사용자의 성향은 꾸준하게 변화하므로 본 논문은 사용자가 근래에 선택한 음악의 반영 비율을 높이고자 무게의 개념을 이용한 시간 가중치 기법을 적용하였다. 그리고 음악의 발매 시기도 고려하여 음악을 추천하는 시스템을 제안한다. 제안 방법의 검증을 위하여 100개의 음악 조각을 통한 실험적 검증을 하였으며 그 결과 제안 방법이 효과적인 것을 보인다.

점봉산 일대 천연활엽수림의 군집 유형별 천이지수 추정 (The Estimation of Succession Index by Community Types in the Natural Deciduous Forest of Mt. Jumbong)

  • 김광택;김지홍
    • 한국산림과학회지
    • /
    • 제95권6호
    • /
    • pp.723-728
    • /
    • 2006
  • 산림천이는 비교적 장기간에 걸쳐서 진행되는 산림 구조와 기능의 변화 과정이므로 그 진행 과정에 대하여 모델 개발 혹은 통계적 방법을 통하여 객관성을 높일 수 있다. 본 연구는 점봉산 일대 천연활엽수림의 천이 진행 과정을 정량적으로 파악하기 위하여 수종의 극성상지수와 구성 비율로 산출되는 천이지수를 추정하였고, 천이의 진행에 따른 군집의 생활형 구성 비율의 차이와 종다양성의 차이에 대하여 검토하였다. 그 결과, 신갈나무-피나무군집의 천이지수가 67.5로 가장 높은 값을 보였고, 전나무-틀메나무군집이 67.4로 그 다음 순이었으며, 가래나무-층층나무군집이 60.5로 가장 낮은 값을 보였다. 신갈나무-피나무군집을 제외한 대부분 군집에서 미래의 안정상태의 상층 임관천이지수는 현재보다 증가하는 것으로 나타나 이 지역의 상층의 수종 구성은 현재 진행천이가 일어나고 있었고, 중층에서는 매체로 천이의 진행과 함께 천이지수가 증가하는 것으로 나타났으나 그 변화폭이 미미하여 중층과 하층의 천이 진척은 거의 동일 단계에 와 있음을 알 수 있었다. 천이지수의 값은 생활형 중 풍수산포형과는 유의수준 5%에서 부의 상관관계가 인정되었고, 동물산포형과는 정의 상관관계가 인정되었다. 천이지수와 교목, 관목, 초본 및 전체 종의 종풍부성 그러고 Shannon의 종다양성지수와는 상관관계가 인정되지 않았다.

포텐셜 함수와 슬라이딩 모드 제어기법을 이용한 무인기 군집비행 제어기 설계 (UAV Swarm Flight Control System Design Using Potential Functions and Sliding Mode Control)

  • 한기훈;김유단
    • 한국항공우주학회지
    • /
    • 제36권5호
    • /
    • pp.448-454
    • /
    • 2008
  • 본 논문에서는 포텐셜 함수와 슬라이딩 모드 제어기법을 이용한 행동양식 기반의 분산형 군집비행 제어구조를 제안하였다. 군집비행 행동양식을 위해 각 개체의 상호작용을 포텐셜 함수로 표현하였으며, 군집형태를 유지하며 기준궤적을 추종하기 위해 군집중심점 제어기법을 제안하였다. 시스템의 불확실성과 임무환경에 의한 포텐셜 함수 변화에 대해 강건한 성능을 유지하기 위해 슬라이딩 모드 제어기법을 적용하여 제어기를 구성하고 안정성을 평가하였다. 또한 예상하지 못한 장애물에 대한 군집 회피기동을 위해 비행경로 수정기법을 제시하였다. 수치 시뮬레이션을 통해 제안한 군집비행 제어기법의 성능을 평가하였다.

항목 유사도를 고려한 트랜잭션 클러스터링 (Transactions Clustering based on Item Similarity)

  • 이상욱;김재련
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.179-193
    • /
    • 2003
  • 군집화(clustering)는 주어진 객체들 중에서 유사한 것들을 몇몇의 집단으로 그룹화 하여 각 집단의 성격을 파악하는데, 실제적으로 각 객체가 유사한지 그렇지 않은지를 측정할 수 있는 도구가 필요하다. 기존의 군집화에서 객체간에 유사하다는 의미는 각 군집(cluster)안에 있는 객체들이 같은 속성 값이 많으면 많을수록 객체간에 유사성이 높아 유사도가 높은 객체끼리 군집을 이루게 된다는 것을 의미했다. 그 중에서도 범주형 속성을 갖는 군집화는 같은 속성 값이면 1, 서로 다르면 0으로 표현하여 유사성을 측정하는 방법이다. 제안된 알고리듬은 속성 값을 0과1로만 표현하는 것에 대한 문제점을 제시하고 서로 다른 속성이라도 속성간에 친밀한 관계가 있다는 개념을 도입하여 어느 정도 유사한 지를 보여준다. 같은 객체간에 같은 값을 갖는 속성이 하나로 없더라도 구해진 유사도에 의해 유사한 개체끼리는 하나의 군집이 될 수 있는 알고리듬을 만든 후 그 군집에 속해 있는 고객들의 니즈와 구매 선호도에 따라 적절한 타겟 마케팅(Target Marketing)을 할 수 있다.

  • PDF