• 제목/요약/키워드: 지도 군집화

검색결과 592건 처리시간 0.028초

차분진화 기반의 Support Vector Clustering (A Differential Evolution based Support Vector Clustering)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제17권5호
    • /
    • pp.679-683
    • /
    • 2007
  • Vapnik의 통계적 학습이론은 분류, 회귀, 그리고 군집화를 위하여 SVM(support vector machine), SVR(support vector regression), 그리고 SVC(support vector clustering)의 3가지 학습 알고리즘을 포함한다. 이들 중에서 SVC는 가우시안 커널함수에 기반한 지지벡터를 이용하여 비교적 우수한 군집화 결과를 제공하고 있다. 하지만 SVM, SVR과 마찬가지로 SVC도 커널모수와 정규화상수에 대한 최적결정이 요구된다 하지만 대부분의 분석작업에서 사용자의 주관적 경험에 의존하거나 격자탐색과 같이 많은 컴퓨팅 시간을 요구하는 전략에 의존하고 있다. 본 논문에서는 SVC에서 사용되는 커널모수와 정규화상수의 효율적인 결정을 위하여 차분진화를 이용한 DESVC(differential evolution based SVC)를 제안한다 UCI Machine Learning repository의 학습데이터와 시뮬레이션 데이터 집합들을 이용한 실험을 통하여 기존의 기계학습 알고리즘과의 성능평가를 수행한다.

GIS기반 최적공간선정을 위한 시스템론적 접근 (System Theory Approach for Decision Making of GIS-based Optimum Allocation)

  • 오상영
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.121-127
    • /
    • 2006
  • 정보기술 발전과 함께 GIS(geographical information system) 기술이 빠르게 발전하면서 GIS를 이용한 공간분석(spatial analysis)에 관한 수요가 증대되고 있다. 특히 GIS의 일반기술에 관한 연구보다 GIS를 이용한 공간분석연구가 많아지면서 이를 다양하게 응용하여 활용하고 있다. 그러나 대부분의 GIS연구는 밀도기반 군집화 방식인 DBSCAN 또는 개개의 데이터에 가중치를 부여하여 군집화한 DBSCAN-W 등 공간적 현상을 다루고 있으며 시간차원의 합리적 의사결정의 중요성은 간과되고 있다. 본 연구에서는 이와 같이 GIS를 기반으로 한 최적 공간선정을 위해 시간차원의 도입을 위해 시스템 다이내믹스(system dynamics) 이론을 접목하여 접근할 수 있는 방법을 제공하고자 한다.

  • PDF

공동주택 전력 소비 데이터 분석 및 딥러닝을 사용한 전력 소비 예측 (Analysis of Apartment Power Consumption and Forecast of Power Consumption Based on Deep Learning)

  • 유남조;이은애;정범진;김동식
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1373-1380
    • /
    • 2019
  • 에너지의 생산 효율성을 증가시키기 위해 최근 스마트그리드 기술 중 지능형 검침 시스템(AMI, advanced metering infrastructure)의 개발이 활발히 진행되고 있다. 전력 소비 데이터를 분석하고 소비 패턴을 예측하는 일은 AMI에서 핵심적인 부분이다. 본 논문에서는 수집된 전력 소비 데이터를 분석하고 발생할 수 있는 오류들을 정리하였으며 소비 패턴을 월별로 k-means 군집화 알고리즘을 사용하여 분석하였다. 또한 deep neural network를 이용하여 소비 패턴을 예측하였는데, 가구별 하루 전력 사용량 예측의 어려움을 극복하기 위하여 전력 사용량을 100개의 군집으로 분류하여 이 군집의 하루 평균으로 다음날 군집의 평균을 예측하였다. 실제 AMI에서의 전력 데이터를 사용하여 오류들을 분석하였으며 군집화 방법을 도입하여 성공적으로 전력 소비 예측이 가능하였다.

폐수처리장치에서의 아질산염 산화 세균 군집 분석 (Community Analysis of Nitrite-Oxidizing Bacteria in Lab-Scale Wastewater Treatment System)

  • 정순재;이상일;이동훈
    • 미생물학회지
    • /
    • 제44권1호
    • /
    • pp.29-36
    • /
    • 2008
  • 질소는 하수처리과정에서 제거되어야 하는 주요 오염물질 중의 하나이며, 세균 군집을 이용한 고도처리 시스템에서 생물학적 질소제거는 중요한 기술이다. 질산화반응은 생물학적 질소제거 시스템의 첫 단계로 미생물에 의해 진행된다. 암모니아는 암모니아산화세균에 의해 아질산염으로 산화되며, 그 후에 아질산염은 아질산염 산화세균에 의해 질산염으로 산화된다. 실험실 규모의 생물학적 질소제거 시스템인 변형된 eBAF 시스템, Nutrient removal laboratory 시스템과 반추기법을 적용한 rSBR 시스템의 질산화반응조 시료에서 16S rRNA 유전자를 이용한 terminal restriction fragment length polymorphism (T-RFLP) 방법으로 아질산염 산화세균군집을 분석하였다. 제한효소로 형성된 단편의 클러스터분석에서 Nitrobacter 군집은 각각의 폐수처리 시스템에 따라 군집의 차이가 있음이 나타났다. 그러나 Nitrospira 군집의 클러스터분석에서는 액체와 담체의 서식지 환경 차이에 의해 군집이 구분되었다.

삼척시산불지역에서의 나방류에 관한 종다양성 변화 (Changes of Species Diversity on Moth Communities at Forest Fire Region in Samcheok, Korea)

  • 배양섭;채도영;주영돈;배정훈;김종명;안능호;이철민
    • 한국응용곤충학회지
    • /
    • 제50권1호
    • /
    • pp.7-14
    • /
    • 2011
  • 2000년 삼척 동해안산불이 나방군집에 미친 영향을 조사하였다. 조사는 3개의 조사지(지점1: 미피해지역, 지점2: 지표화 피해지역, 지점3: 수관화 피해지역)를 설정하여 2006부터 2009년 까지 1년에 4회 UV 라이트 트랩으로 실시하였다. 그 결과, 3개의 조사지에서 30과 727종 3,804개체를 채집하였다(지점1: 27과 505종 1,727개체, 지점2: 24과 353종 1,193개체, 지점3: 25과 340종 885개체). 밤나방과, 명나방과, 자나방과와 잎말이나방과는 종수와 개체수가 3개의 조사지에서 상위를 점했다. 종수, 개체수, 종다양도(H') 모두 지점1에서 가장 높았다. 유사도(${\alpha}$-Index)는 2006년에는 지점2와 3이 더 높았지만, 2009년에는 지점1과 2가 더 높았다. 나방류를 유충기의 기주로 16개 카테고리로 나누어 군집변화를 분석하였다. 지점3에서 초본식성의 나방류의 개체수는 지속적으로 감소했지만, 목본식성의 개체수의 비율은 지속적으로 증가했다. 이 연구결과, 나방군집은 산불 이후 식생변화와 더불어 회복되었고 지표화 피해지역에서 나방군집의 재생은 수관화 피해지역보다 빠른 것으로 나타났다.

상황 지식을 이용한 비계층적 군집 기반 하이브리드 추천 (Non-hierarchical Clustering based Hybrid Recommendation using Context Knowledge)

  • 백지원;김민정;박찬홍;정호일;정경용
    • 융합신호처리학회논문지
    • /
    • 제20권3호
    • /
    • pp.138-144
    • /
    • 2019
  • 현대 사회에서 사람들은 시간적인 여유, 경제적인 문제 등에 따라 여행지에 대해 심각한 고민을 한다. 따라서 본 논문에서는 상황 지식을 이용한 비계층적 군집 기반 하이브리드 추천을 제안한다. 제안하는 방법은 사용자의 위치, 장소, 날씨 등의 상황에 따라 선호하는 여행지에 대한 지식을 추천받을 수 있는 개인화된 방법이다. 설문조사를 통해 수집된 데이터로부터 14개의 속성을 기반으로 유사한 특성을 가진 사용자들을 비계층적 군집 기반 하이브리드 추천을 이용하여 군집한다. 이는 암묵적 데이터와 명시적 데이터에 가중치를 부여하여 보다 정확한 추천을 한다. 이를 통해 사용자는 불필요한 시간을 소모하지 않고 선호하는 여행지를 추천받을 수 있다. 성능평가는 정확도, 재현율, F-measure를 이용한다. 평가 결과 정확도는 0.636, 재현율은 0.723, F-measure는 0.676으로 평가되었다.

도메인 온톨로지에 의한 문서 군집화 기법 (Document Clustering Technique by Domain Ontology)

  • 김우생;관향동
    • Journal of Information Technology Applications and Management
    • /
    • 제23권2호
    • /
    • pp.143-152
    • /
    • 2016
  • We can organize, manage, search, and process the documents efficiently by a document clustering. In general, the documents are clustered in a high dimensional feature space because the documents consist of many terms. In this paper, we propose a new method to cluster the documents efficiently in a low dimensional feature space by finding the core concepts from a domain ontology corresponding to the particular area documents. The experiment shows that our clustering method has a good performance.

GAP 군집화에 기반한 필기 한글 단어 분리 (Word Segmentation in Handwritten Korean Text Lines based on GAP Clustering)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.660-667
    • /
    • 2000
  • 본 논문에서는 필기 한글 문자열 영상에 대한 단어 분리 방법을 제안한다. 제안된 방법은 gap 의 크기 정보를 사용하여 단어를 분리하는데, 이때 gap은 문자열 영상을 수직방향으로 투영한 후 흰-런 (white-run)을 찾음으로써 구할 수 있다. 문자열 영상으로부터 얻어지는 gap들의 크기를 측정한 후, 각각의 gap을 단어와 단어사이에 존재하는 gap과 문자와 문자사이에 존재하는 gap 중 하나로 분류한다. 본 논문에서는 필기 영문 문자열의 단어 분리를 위해 제안된 기존의 세 가지 거리 척도를 채택하고 군집화에 기반한 세 가지 분류방법을 적용하여 한글 문자열의 단어 분리를 위한 최적의 조합을 선정하였다. 우편봉투 상에 작성된 주소열로부터 수작업으로 추출한 305 개의 문자열 영상을 사용하여 실험한 결과 BB(bounding box) 거리를 사용하여 순차적 군집 방법을 적용하는 경우 3 순위까지의 누적 단어 분리 성공률이 88.52% 로서 가장 우수한 성능을 보여 주었다. 또한 하나의 문자열 영상에 대한 단어 분리 속도는 약 0.05초이다.

  • PDF

효율적인 병렬정보검색을 위한 색인어 군집화 및 분산저장 기법 (Term Clustering and Duplicate Distribution for Efficient Parallel Information Retrieval)

  • 강재호;양재완;정성원;류광렬;권혁철;정상화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.129-139
    • /
    • 2003
  • 인터넷과 같은 대량의 정보에 대응할 수 있는 고성능 정보검색시스템을 구축하기 위해서는 지금까지 고가의 중대형컴퓨터를 주로 활용하여 왔으나. 최근 가격대 성능비가 높은 PC 클러스터 시스템을 활용하는 방안이 경제적인 대안으로 떠오르고 있다. PC 클러스터 상에서의 병렬정보검색시스템을 효율적으로 운영하기 위해서는 사용자가 입력한 질의를 처리하는데 요구되는 개별 PC의 디스크 I/O 및 검색관련 연산을 모든 PC에 가능한 균등하게 분배할 필요가 있다. 본 논문에서는 같은 질의에 동시에 등장할 가능성이 높은 색인어들끼리 군집화하고 생성된 군집을 활용하여 색인어들을 각 PC에 분배함으로써 보다 높은 수준의 병렬화를 달성할 수 있는 방안을 제시한다. 또한 일부 PC의 결함 또는 유지보수 등의 원인에 의한 서비스 중지상황에도 적극적으로 대처하기 위하여 색인어 역파일을 중복되게 분산저장하는 기법을 제안한다. 대용량 말뭉치를 활용한 실험결과 본 논문에서 제시하는 분산 및 중복저장기법이 충분한 효율성과 실용성이 있음을 확인하였다.

센서스 정보 및 전력 부하를 활용한 전력 수요 예측 (Forecasting Electric Power Demand Using Census Information and Electric Power Load)

  • 이헌규;신용호
    • 한국산업정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.35-46
    • /
    • 2013
  • 국내 전력 수요량 예측을 위한 정확한 분석 모델을 개발하기 위하여 고차원 데이터 군집 분석에 적합한 차원 축소 개념의 부분공간 군집 기법과 SMO 분류 기법을 결합한 전력 수요 패턴 예측 방법을 제안하였다. 전력 수요 패턴 예측은 무선부하감시 데이터 뿐 아니라 소지역 단위의 센서스 정보를 통합하여 시간대별 전력 부하 패턴 분석과 인구통계학 및 지리학적 특성 분석이 가능하다. 서울지역 대상의 센서스 정보 및 전력 부하를 이용한 소지역 전력 수요 패턴 예측 결과 총 18개의 특성 군집을 구성하였으며, 전력 수요 패턴 예측 정확도는 약 85%를 보였다.