• 제목/요약/키워드: 링크 기반 클러스터링

검색결과 25건 처리시간 0.034초

단어빈도와 동시링크의 결합을 통한 웹 문서 클러스터링 성능 향상에 관한 연구 (Clustering of Web Document Exploiting with the Union of Term frequency and Co-link in Hypertext)

  • 이교운;이원희;박흠;김영기;권혁철
    • 한국도서관정보학회지
    • /
    • 제34권3호
    • /
    • pp.211-229
    • /
    • 2003
  • 이 연구에서는 웹 문서가 갖고 있는 특성, 특히 웹 문서에 포함된 단어 수가 클러스터링 성능에 결정적인 영향을 미친다는 전제 하에, 웹 문서에 포함된 단어 수와 클러스터링 성능과의 관계를 밝힌 다음, 이 부분을 웹 문서의 동시인용 빈도를 이용해 보완할 수 있는 알고리즘을 제시한다. 이 연구에서는 네이버 디렉터리 중 '자연과학' 법주에 포함된 1,449개의 웹 문서를 대상으로 단어기반 클러스터링과 링크기반 클러스터링, 그리고 단어-링크 혼합 클러스터링 기법으로 클러스터링 해 보았으며, 그 결과를 네이버 디렉터리에 초기 할당된 법주와 비교해 보았다.

  • PDF

블로그 공간에서의 링크 기반 클러스터링 방안 (Link-Based Clustering in Blogosphere)

  • 송석순;윤석호;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.372-374
    • /
    • 2009
  • 본 논문에서는 블로그 공간에 존재하는 블로거와 포스트들을 링크 기반 클러스터링을 통해 클러스터링하고자 한다. 먼저 기존 링크 기반 클러스터링 방안 중에서 블로거와 포스트들을 클러스터링하는데 가장 적합한 LinkClus를 선택한다. LinkClus를 블로그 공간에 적용하기 위해서 블로거와 포스트를 각각 하나의 타입으로, 블로거와 포스트 사이의 액션을 링크로 사상한다. 정확한 클러스터링을 위하여 클러스터의 대상을 여러 주제에 관심을 가지는 블로거 대신 하나의 주제만을 나타내는 폴더로 한다. 또한 노이즈의 발생 가능성을 높이는 링크가 아주 적은 블로거와 포스트를 클러스터링 과정에서 제외 시킨다. 실험을 통하여 제안하는 방안을 이용한 클러스터링 결과가 내용적으로도 유사한지 검증한다.

블로그 공간에서의 링크 기반 클러스터링 방안 (Link-Based Clustering in Blogosphere)

  • 송석순;윤석호;김상욱
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.42-49
    • /
    • 2009
  • 본 논문에서는 블로그 공간에 존재하는 블로거와 포스트들을 클러스터링하고자 한다. 먼저 블로그 공간의 블로거와 포스트들을 각각 하나의 타입으로, 블로거와 포스트 사이의 액션을 링크로 사상한다. 다음으로, 블로그 공간의 클러스터링을 위하여 블로그 환경에 가장 적합하고 효율적인 링크 기반 클러스터링 방법인 LinkClus를 선택한다. 정확한 클러스터링을 위하여 두 가지 방법을 제시한다. 첫 번째는 클러스터의 대상을 여러 주제에 관심을 가지는 블로거 대신 하나의 주제만을 나타내는 폴더로 한다. 두 번째는 노이즈의 발생 가능성을 높이는 링크가 아주 적은 블로거와 포스트를 클러스터링 과정에서 제외시킨다. 실험을 통하여 제안하는 방안을 이용한 클러스터링 결과가 내용적으로도 유사한지 검증한다.

링크기반 클러스터링을 이용한 웹 문서 검색의 성능 향상에 관한 실험적 연구 (An Experimental Study on Enhancing the Retrieval Performance for the Web Documents Using Link-Based Clustering Technique)

  • 김혜진;문성빈
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.247-252
    • /
    • 2002
  • 본 연구에서는 하이퍼텍스트나 웹 문서의 검색에서 링크로 연결된 문서들이 주제적으로 서로 관련되어 있다는 것을 기반으로 하여 링크정보를 참조한 웹 문서 클러스터링 기법을 제안하였고 이것을 이용하여 검색된 결과를 질의 근접 순위화함으로써 웹 문서 검색의 성능을 향상시키는 방안을 연구하였다. 본 연구에서 사용된 웹 문서 집단은 웹(WWW)을 통하여 직접 수집하였으며 웹 문서가 다른 웹 문서를 링크하고 있을 때를 OutLink, 다른 웹 문서로부터 링크를 받고 있을 때를 InLink로 구분하였다. 실험결과 OutLink를 참조하여 클러스터링을 수행하는 기법과 InLink를 참조하여 클러스터링을 수행하는 기법 모두 검색 성능을 향상시켰다.

  • PDF

웹 문서의 단어정보와 링크정보 결합을 이용한 클러스터링 기법 (Clustering Method Using the Union Information of Term Frequency and Link in Hypertext)

  • 이원희;이교운;박흠;김영기;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-107
    • /
    • 2003
  • 최근의 웹 문서는 텍스트 위주의 구성이 아닌 이미지, 사운드, 동영상 등의 다양한 타입으로 구성되는 추세이다. 이에 따라 단순히 웹 문서 내의 단어 정보추출 만으로는 좋은 성능의 클러스터링을 기대하기 어렵다. 본 논문은 전통적인 문서 클러스터링 기법인 단어기반 클러스터링 기법의 취약점을 제시하고, 웹 문서간의 링크구조정보 중 동시인용 정보를 이용하여 웹 문서 클러스터링 성능향상의 가능성을 보이고자 한다. 실험에서는 네이버디렉토리 중 '자연과학' 범주에 포함된 문서를 대상으로 위의 두 가지 방식과 이 두 가지를 혼합한 단어-링크 혼합 클러스터링을 통해 기존의 방식보다 더 낳은 성능을 얻을 수 있었다.

  • PDF

하이퍼링크를 이용한 그래프 기반의 웹 문서 클러스터링 (Web Document Clustering based on Graph using Hyperlinks)

  • 이준;강진범;최중민
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.590-595
    • /
    • 2009
  • 인터넷 상의 웹 문서의 수가 기하급수적으로 늘어남에 따라서, 정보검색에서의 웹 문서 클러스터링은 성능과 속도가 매우 중요하게 되었다. 웹 문서 클러스터링은 의미적으로 관계가 있는 웹 문서들을 같은 클러스터로 군집함으로써 정보 검색을 보다 빠르고, 정보를 정확하게 제공할 수 있다. 그물망 그래프 형태의 클러스터링은 모든 문서간의 유사도를 측정함으로써 재현율을 높일 수 있지만, 높은 계산 비용을 갖는다. 본 논문에서는 그물망 형태의 클러스터링의 재현율과 정확율을 유지하며 계산 비용을 줄이기 위하여, 웹 문서의 구조적 특징인 하이퍼링크(Hyperlinks)를 이용한 클러스터링 방법을 제안한다.

  • PDF

무선 센서 네트워크 기반 국경 감시를 위한 계층적 멀티 홉 클러스터링 기법 (Hierarchical Multi-Hop Clustering Scheme for WSN-Based Border Surveillance)

  • 김재영;김현철;윤재근;안순신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.755-758
    • /
    • 2012
  • 국경 지역을 실시간 모니터링하고, 효율적인 데이터 전달을 위해서는 센서 노드의 에너지 소모를 줄임으로써 전체 네트워크의 수명을 연장시킬 필요가 있다. 그에 따라, 본 논문에서는 네트워크를 클러스터링 기반으로 한 다수의 영역으로 분할하고 각각의 영역 내 특정 노드에 헤드의 역할을 부여하여 라우팅을 수행하는 계층적 클러스터 센서 네트워크를 제안한다. 제안하는 기법에서는 클러스터 헤드에서의 데이터 모음을 통한 통신 메시지 수를 줄임으로써 센서 노드들의 에너지 소모를 최소화시키고, 긴 국경 라인을 커버할 수 있는 충분한 클러스터 확장이 가능하다. 또한 링크의 상태 및 노드의 밀집도를 고려하여 적응적으로 링크의 품질을 측정하는 알고리즘을 제시하여 링크 변화에 대한 빠른 탐색을 통해 네트워크를 관리하는 방안을 제시한다.

VANET 환경을 위한 우선순위 기반 클러스터링 알고리즘 (Priority Based Clustering Algorithm for VANETs)

  • 김인환
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.637-644
    • /
    • 2020
  • VANET (Vehicular Ad Hoc Networks)은 차량 간, 차량과 인프라 간의 네트워크이다. 높은 이동성, 이동 제한, 장애물에 의한 신호 방해와 같은 VANET 고유의 특성은 안정적인 VANET 서비스 제공을 어렵게 한다. 이를 해결하기 위해, 본 논문에서는 기존 버스 기반 클러스터링을 개선한, 차량 종류 기반 우선순위 클러스터 방법을 제시한다. 제안 알고리즘은 차량 종류, 예상 통신 수명, 주변 노드 링크 차수를 바탕으로 우선순위, 링크 품질, 연결성을 평가해 클러스터를 구성한다. 차량의 종류를 바탕으로 미리 결정된 우선순위를 활용함으로써 클러스터 헤드 선택을 단순화하고 클러스터 커버리지를 높이고자 한다. 제안 알고리즘은 커넥티드카 환경에서 안정적인 서비스를 제공하는데 기여함으로써 다양한 서비스 활성화의 기반이 될 것으로 기대된다.

재난·재해 상황을 대비한 클러스터링 분석 기반의 도로링크별 취약성 평가 연구 (Vulnerability Evaluation by Road Link Based on Clustering Analysis for Disaster Situation)

  • 탁지훈;홍정열;박동주
    • 한국ITS학회 논문지
    • /
    • 제22권2호
    • /
    • pp.29-43
    • /
    • 2023
  • 재난 및 재해 상황시 이동관리전략을 신속히 마련하기 위해서는 특정 도로구간을 통행하는 교통류의 특징과 도로의 위상학적 구조 등을 사전에 파악해야 할 필요성이 있다. 이는 도로관리자가 미시적 도로단위별로 취약성을 평가한 후 재난·재해 상황에 대비한 적절한 모니터링과 관리방안을 설정하는데 중요한 근거가 될 수 있기 때문이다. 따라서 본 연구에서는 도시부 도로링크별 취약성 평가를 위하여 공간밀도, 시간점유율, 네트워크 매개중심성 지표를 제시하였으며, 거리 및 밀도기반 클러스터링 분석을 통하여 각 링크그룹별로 가지고 있는 시공간 및 위상학적 취약성을 정의하였다. 본 연구를 통해 제시된 결과는 도로 링크를 집단별로 특성화하여 취약성을 관리하는 것에 활용될 수 있으며, 재난·재해 시 우선 통제지점 선정 및 최적경로 제시를 위한 기초자료로도 활용 가능할 것으로 기대된다.

기상감시 무선 센서 네트워크에 적합한 Threshold-dataset 기반 지역적 클러스터링 기법 (An Adaptive Regional Clustering Scheme Based on Threshold-Dataset in Wireless Sensor Networks for Monitoring of Weather Conditions)

  • 최동민;심검;정일용
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1287-1302
    • /
    • 2011
  • 무선 센서 네트워크에서 사용하는 클러스터링 기법은 전체 네트워크의 수명을 연장시키는 효율적인 방법이다. 그러나 이 방법은 기상감시 네트워크와 같이 센서 노드의 수집 데이터가 중복되기 쉬운 환경에 적용할 경우 노드가 불필요하게 소모하는 에너지가 많다. 문턱값(threshold)을 이용해 동작하는 클러스터링 기법의 경우 네트워크의 수명은 연장되었으나 수집하는 데이터의 정확도가 낮아 신뢰하기 어려운 문제점이 있어 이에 대한 개선이 필요하다. 또한 멀티 홉 전송을 이용하는 클러스터링 기법은 클러스터 헤드 노드 선정이 확률적으로 발생하므로 노드들의 링크가 단절되는 현상이 자주 일어나 데이터의 정상적인 수집이 어렵다. 이에 본 논문은 불필요한 에너지 소모를 줄이고 링크 단절 현상이 완화된 클러스터 형성 알고리즘을 제안하였다. 성능분석 결과에 의하면 제안하는 방법은 기존의 클러스터링 방법에 비해 노드들의 에너지 소모가 줄어들었으며 전송 효율이 증가하였고 수집 데이터의 정확도가 높아졌으며 전체 수명이 30% 정도 향상되었다.