• Title/Summary/Keyword: 사이트 클러스터링

Search Result 30, Processing Time 0.023 seconds

Document Clustering for Web Directory Service (웹 디렉토리 서비스를 위한 문서 클러스터링)

  • 이문기;권오욱;이종혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.351-353
    • /
    • 2000
  • 대부분의 검색 엔진에서의 사용자의 정보 검색 요구에서 나타나는 키워드 장벽의 문제점을 해결하고 사용자의 정보 검색 과정에 도움을 주기 위해 디렉토리 서비스를 제공한다. 하지만 디렉토리 서비스에서 새로운 웹 사이트를 지속적으로 인덱스하여 하나의 주제어에 너무 많은 수의 웹 사이트가 부여되어 있으면 사용자의 검색 편의를 위해서 재분류하여 세분류할 필요가 있다. 따라서 본 논문에서는 한 주제어에 과다하게 부여된 웹 사이트들을 세분류하기 위해 기존의 문서 클러스터링 기법을 사용하여 클러스터링 할 때 생기는 문제점을 보완한 문서 클러스터링 시스템을 소개한다.

  • PDF

A Clustering Method of Web Navigation Pattern Using the Hyperplane (하이퍼플래인을 이용한 웹 방문 패턴에 대한 사용자 클러스터링)

  • 이해각;주영옥
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.608-611
    • /
    • 2004
  • 사용자 웹 방문 패턴 발견으로써의 사용자 클러스터링은 웹 사이트를 이용하는 사용자들의 취향과 행동방식을 얻어내는데 매우 유용하다. 또한 이러한 정보는 웹 개인화나 웹 사이트를 재구성 하는 데 필수적 이 다. 본 논문에서 사용자 웹 방문 패스를 클러스터링 하기 위한 시간적으로 효율적이며, 패스 특성을 보다 정확하게 표현하여 클러스터링 할 수 있는 알고리즘이 제안되며, 제안된 알고리즘은 패스 간의 유사도 측정을 통한 클러스터링, 하이퍼플랜을 이용한 K-평균 클러스터링의 2단계 과정으로 이루어져 있다.

  • PDF

E-Commerce에서의 퍼지 클러스터링 알고리즘을 적용한 추천 시스템

  • Lyou, Hae-Ri;Kim, Moon-Hyun
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2003.05a
    • /
    • pp.410-415
    • /
    • 2003
  • 인터넷의 발전으로 전 세계적으로 다양한 인터넷 서비스들이 점차 확대되고 있으며, 특히 수익을 내는 방법으로서의 인터넷 전자상거래는 큰 비중을 차지하고 있다. 이에 수많은 사이트, 쇼핑몰은 상품과 고객들의 수많은 데이터를 데이터베이스 모듈로 관리하고 있다. 이렇게 고객에게 맞는 상품을 추천하기 위해 효율적으로 클러스터링 하는 방법이 요구된다. 이에 본 논문에서는 여러 클러스터링 방법 중에서 퍼지 이론을 기반으로 개선된 클러스터링 알고리즘을 이용하여 상품을 추천하고자 한다 이 방법은 클러스터의 개수가 한정되어 있는 기존의 방법에 클러스터의 유사도에 따른 유사성을 부여함으로써 더 세밀하고 정확한 클러스터링을 가능케 하여 이에 따른 개인의 성향에 맞게 개인화된 상품을 추천하는 시스템을 설계하고자 한다.

  • PDF

User Perspective Website Clustering for Site Portfolio Construction (사이트 포트폴리오 구성을 위한 사용자 관점의 웹사이트 클러스터링)

  • Kim, Mingyu;Kim, Namgyu
    • Journal of Internet Computing and Services
    • /
    • v.16 no.3
    • /
    • pp.59-69
    • /
    • 2015
  • Many users visit websites every day to perform information retrieval, shopping, and community activities. On the other hand, there is intense competition among sites which attempt to profit from the Internet users. Thus, the owners or marketing officers of each site try to design a variety of marketing strategies including cooperation with other sites. Through such cooperation, a site can share customers' information, mileage points, and hyperlinks with other sites. To create effective cooperation, it is crucial to choose an appropriate partner site that may have many potential customers. Unfortunately, it is exceedingly difficult to identify such an appropriate partner among the vast number of sites. In this paper, therefore, we devise a new methodology for recommending appropriate partner sites to each site. For this purpose, we perform site clustering from the perspective of visitors' similarities, and then identify a group of sites that has a number of common customers. We then analyze the potential for the practical use of the proposed methodology through its application to approximately 140 million actual site browsing histories.

Web Document Clustering Using Statistical Techniques & Tag Information on the Specific-Domain Web site (전문 웹 사이트에서의 통계적 기법과 태그 정보를 이용한 문서 분류)

  • 조은휘;변영태
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.297-302
    • /
    • 2002
  • 특정 영역에 대해 사용자에게 관련 정보를 제공하는 서비스를 위해 정보 에이전트를 개발하고 있다. 이 시스템은 웹 상에서 문서를 수집해 오는데 특정 영역과 관련한 지식베이스를 토대로 하고 있는데, 이들 중 몇몇 전문 사이트 내의 정보가 많이 포함되어 있음을 볼 수 있다. 그러므로 전문 사이트 내의 관련 문서 수집은 중요한 의의가 있다. 본 논문에서는 이들 전문 사이트 내의 전문 문서 수집을 위해 문서간의 유사성을 토대로 클러스터링 한다. 즉, 문서내의 텀(term)과 HTML 태그(tag), 지식베이스의 WordNet 계층구조를 data로 하고 SVD(Singular Value Decomposition)을 사용하여 문서간의 관계를 밝혀내었다.

  • PDF

A Study on Web-User Clustering Algorithm for Web Personalization (웹 개인화를 위한 웹사용자 클러스터링 알고리즘에 관한 연구)

  • Lee, Hae-Kag
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.12 no.5
    • /
    • pp.2375-2382
    • /
    • 2011
  • The user clustering for web navigation pattern discovery is very useful to get preference and behavior pattern of users for web pages. In addition, the information by the user clustering is very essential for web personalization or customer grouping. In this paper, an algorithm for clustering the web navigation path of users is proposed and then some special navigation patterns can be recognized by the algorithm. The proposed algorithm has two clustering phases. In the first phase, all paths are classified into k-groups on the bases of the their similarities. The initial solution obtained in the first phase is not global optimum but it gives a good and feasible initial solution for the second phase. In the second phase, the first phase solution is improved by revising the k-means algorithm. In the revised K-means algorithm, grouping the paths is performed by the hyperplane instead of the distance between a path and a group center. Experimental results show that the proposed method is more efficient.

Similarity Measurement with Interestingness Weight for Improving the Accuracy of Web Transaction Clustering (웹 트랜잭션 클러스터링의 정확성을 높이기 위한 흥미가중치 적용 유사도 비교방법)

  • Kang, Tae-Ho;Min, Young-Soo;Yoo, Jae-Soo
    • The KIPS Transactions:PartD
    • /
    • v.11D no.3
    • /
    • pp.717-730
    • /
    • 2004
  • Recently. many researches on the personalization of a web-site have been actively made. The web personalization predicts the sets of the most interesting URLs for each user through data mining approaches such as clustering techniques. Most existing methods using clustering techniques represented the web transactions as bit vectors that represent whether users visit a certain WRL or not to cluster web transactions. The similarity of the web transactions was decided according to the match degree of bit vectors. However, since the existing methods consider only whether users visit a certain URL or not, users' interestingness on the URL is excluded from clustering web transactions. That is, it is possible that the web transactions with different visit proposes or inclinations are classified into the same group. In this paper. we propose an enhanced transaction modeling with interestingness weight to solve such problems and a new similarity measuring method that exploits the proposed transaction modeling. It is shown through performance evaluation that our similarity measuring method improves the accuracy of the web transaction clustering over the existing method.

Design and Implementation of Tag Clustering System for Efficient Image Retrieval in Web2.0 Environment (Web2.0 환경에서의 효율적인 이미지 검색을 위한 태그 클러스터링 시스템의 설계 및 구현)

  • Lee, Si-Hwa;Lee, Man-Hyoung;Hwang, Dae-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.8
    • /
    • pp.1169-1178
    • /
    • 2008
  • Most of information in Web2.0 is constructed by users and can be classified by tags which are also constructed and added by users. However, as we known, referring by the related works such as automatic tagging techniques and tag cloud's construction techniques, the research to be classified information and resources by tags effectively is to be given users which is still up to the mark. In this paper, we propose and implement a clustering system that does mapping each other according to relationships of the resource's tags collected from Web and then makes the mapping result into clusters to retrieve images. Tn addition, we analyze our system's efficiency by comparing our proposed system's image retrieval result with the image retrieval results searched by Flickr website.

  • PDF

Automatic Extraction and Clustering of Concepts for Domain Ontology Construction (도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링)

  • Jung, Hyun-Ki;Kim, Yu-Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

User Classification Using Cluster of Web Pages (웹 페이지 클러스터를 이용한 사용자 분류 기법)

  • 백옥현;서성보;이준욱;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.201-203
    • /
    • 2000
  • 변화하는 경쟁적 인터넷 환경에서 E-Business의 성공적인 운영은 웹 사이트를 이용하는 고객들의 행위를 얼마나 잘 이해하느냐에 달려있다. 폭발적으로 늘어나는 웹 사이트 중에서 많은 사용자들을 유치하고 유지하기 위해서는 고객 개개인의 특성을 분석해서 특성화된 특성화된 서비스를 제공하는 것이 중요하다. 이 논문에서는 웹 서버에 의해 수집되는 로그파일로부터 사용자들이 빈번하게 함께 접근하는 페이지들을 기반으로 웹 페이지에 대한 클러스터링을 수행하고 이러한 웹 페이지의 클러스터를 이용해서 유사한 행동패턴을 가진 사용자들을 분류함으로써 특성화된 서비스를 제공하기 위한 일련의 기법들을 제안한다. 특히 클러스터링을 수행하는 웹 로그에 시간적인 요소를 고려한 제약조건을 둠으로써 좀더 유용한 지식을 찾아낼 수 있는 방안을 제시한다.

  • PDF