• Title/Summary/Keyword: 사용자 분류

검색결과 2,296건 처리시간 0.214초

Suffix Tree를 이용한 웹 문서 클러스터의 제목 생성 방법 성능 비교 (Performance Comparison of Keyword Extraction Methods for Web Document Cluster using Suffix Tree Clustering)

  • 염기종;권영식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.328-335
    • /
    • 2002
  • 최근 들어 인터넷 기술의 발달로 웹 상에 많은 자료들이 산재해 있습니다. 사용자가 원하는 정보를 검색하기 위해서 키워드 검색을 이용하고 있는데 이러한 키워드 검색은 사용자들이 입력한 단편적인 정보에 바탕하여 검색하고 검색된 결과들을 자체적인 기준으로 순위를 매겨 나열식으로 제시하고 있다. 이러한 경우 사용자들의 생각과는 다르게 결과가 제시될 수 있다. 따라서 사용자들의 검색 시간을 줄이고 편리하게 검색하기 위한 환경의 필요성이 높아지고 있다. 본 논문에서는 Suffix Tree 알고리즘을 사용하여 관련있는 문서들을 분류하고 각각의 분류된 클러스터에 제목을 생성하기 위하여 문서 빈도수, 단어 빈도수와 역문서 빈도수, 카이 검정, 공통 정보, 엔트로피 방법을 비교 평가하여 제목을 생성하는데 어떠한 방법이 가장 효과적인지 알아보기 위해 비교 평가해본 결과 문서빈도수가 TF-IDF보다 약 10%정도 성능이 좋은 결과를 보여주었다.

  • PDF

웹 페이지 클러스터를 이용한 사용자 분류 기법 (User Classification Using Cluster of Web Pages)

  • 백옥현;서성보;이준욱;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.201-203
    • /
    • 2000
  • 변화하는 경쟁적 인터넷 환경에서 E-Business의 성공적인 운영은 웹 사이트를 이용하는 고객들의 행위를 얼마나 잘 이해하느냐에 달려있다. 폭발적으로 늘어나는 웹 사이트 중에서 많은 사용자들을 유치하고 유지하기 위해서는 고객 개개인의 특성을 분석해서 특성화된 특성화된 서비스를 제공하는 것이 중요하다. 이 논문에서는 웹 서버에 의해 수집되는 로그파일로부터 사용자들이 빈번하게 함께 접근하는 페이지들을 기반으로 웹 페이지에 대한 클러스터링을 수행하고 이러한 웹 페이지의 클러스터를 이용해서 유사한 행동패턴을 가진 사용자들을 분류함으로써 특성화된 서비스를 제공하기 위한 일련의 기법들을 제안한다. 특히 클러스터링을 수행하는 웹 로그에 시간적인 요소를 고려한 제약조건을 둠으로써 좀더 유용한 지식을 찾아낼 수 있는 방안을 제시한다.

  • PDF

퍼지관계곱을 이용한 전자메일의 정크도 추출 (Extracting the Degree of Junk from E-mail using Fuzzy Relational Products)

  • 박정선;김창민;김용기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.224-227
    • /
    • 2001
  • 전자메일은 20세기 후반 인터넷의 발전으로 현재의 정보전달 수단 중 대표적인 개인간 인터넷 통신 수단으로 자리잡게 되었다. 그러나 전자메일 사용자들은 전자메일 주소가 노출되므로 해서 많은 정크메일(junk mail) 즉, 자신이 원하지 않는 전자메일을 수신하게 되었다. 이로 인해 일반 전자메일과 정크메일을 분류하기 위한 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 수준에 머무르고 있다. 본 논문에서는 의미적 접근 기반 정크메일 분류 기법의 기초 모델을 제안한다. 퍼지관계곱을 이용한 전자메일의 정크도 추출은 퍼지관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자의 수신함에 있는 전자메일 내의 용어들간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출하는 연구를 제안한다. 제안된 기법을 통해 추출한 정크도는 동일한 전자메일들에 대해 사용자가 느끼는 정크도와 비교하여 효용성을 증명하였다.

  • PDF

WordNet어휘계층구조 기반의 태그/사용자 분류체계 구축지원도구의 개발 (A Development of Tag/User Classification System Based on WordNet Hierarchies)

  • 황석형;최성희;김한수;김정래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.1023-1026
    • /
    • 2013
  • 오늘날 인터넷의 발달과 더불어 스마트기기의 보급이 급성장하면서, 다양한 웹사이트에서 데이터가 기하급수적으로 발생되고 있고, 수 많은 다종다양한 데이터를 효율적으로 저장/관리/분석하기 위한 유용한 어노테이션(Anotation) 기법으로서, 리소스에 대한 사용자의 태깅(Tagging)기능이 널리 활용되고 있다. 본 연구에서는, 사용자들의 공통 태그 데이터를 수집하여, WordNet을 기반으로 다양한 수준의 태그/사용자 분류체계를 구축하기 위한 지원도구개발에 관한 연구결과를 보고한다.

Social Network 기반 Mobbing 지수 산정 알고리즘 및 분류 모델 설계 (Design of Mobbing Value Computation Algorithm and Classification Model based on Social Network)

  • 김국진;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.352-355
    • /
    • 2009
  • 본 논문에서는 Mobbing(집단 따돌림) 현상에 관련된 7개의 요소(Factor)와 그 하위에 포함된 60개의 속성(Attribute)들을 선정한다. 다음으로 선정한 속성들에 대해 나와 사용자들 사이에 관계가 있으면 '1', 관계가 없으면 '0'으로 표현하고, 나와 사용자들간의 유사도 산정을 위해 각 요소안에 포함된 속성들의 합에 유사도 함수를 적용한다. 다음으로 클레멘타인의 인공신경망 알고리즘을 통해 속성들을 포함한 요소들이 취할 최적의 가중치를 산출하고, 이 값들의 총합으로 Mobbing 지수를 산정한다. 마지막으로 Social Network 사용자들의 Mobbing 지수를 본 논문에서 설계한 G2 Mobbing 성향 분류 모델(4개의 그룹; Ideal Group of the Social Network, Bullies, Aggressive victimes, Victimes)에 매핑하여 사용자들의 Mobbing 성향을 알아본다.

사이버 트랜드(2)

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 12호통권79호
    • /
    • pp.59-59
    • /
    • 1999
  • 최근 한국광고단체연합회와 IMReserch가 공동으로 주관한 '99 Fall KNP 인터넷 사용자 조사가 올초에 이어 국내 인터넷 사용자 14,670을 대상으로 이루어졌다. 조사에 참여한 인터넷 기업을 언론사, 검색엔진, ISP, 쇼핑몰, 벤처기업의 5개 카테고리로 분류하여 총 35개 기업 웹사이트에서 띠 광고의 클릭을 통해 이루어졌다. KNP 인터넷 사용자 조사 결과에 대해 살펴봤다.

  • PDF

은닉 변수 모델을 이용한 문서 추천 (Learning Model for Recommendation of Humor Documents)

  • 이종우;장병탁
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.514-519
    • /
    • 2002
  • 우리는 유머문서의 추천을 위해서 문서 정보, 사용자 정보, 공통 등급매김 정보 등을 모두 이용하는 4 개의 관찰 변수와 이들간 관계의 학습을 위한 은닉변수를 사용한 확률모델을 구축하였다. 이 모델은 학습된 은닉 변수와 가시 변수 간의 관계를 통해 누락 관찰 데이터에 대해서도 추정값을 유도해 낼 수 있으므로 등급매김 정보가 부족하거나 새로운 사용자와 문서의 도입시에 안정적인 추천 성능을 보여 줄 수가 있다. 또한 확률 모델의 학습을 위해서 EMl 알고리즘을 이용하였는데 저평가된 데이터의 이용도를 높이기 위해서 추천을 반대하는 확률 모델을 따로 두고 이들간에 분류모델(classification model)을 두어서 추정값을 분류해내는 방식을 취한다.

  • PDF

유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링 (Web Service Information Clustering using Genetic Algorithm and Neural Network)

  • 황중연;유춘식;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.127-129
    • /
    • 2004
  • 오늘날, 웹서비스를 이용한 정보 검색을 하기 위해서는 UDDI 레지스트리의 전문적인 지식이 필요하다. 즉 웹 서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야 한다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하면 웹서비스에 대한 정보 검색을 쉽게 할 수 없다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 점보를 카테고리에 맞게 분류하여 검색을 용이하게 할 수가 있다. 따라서 본 논문에서는 보다 효율적으로 웹서비스 정보를 분류하기 위해서 유전자 알고리즘과 신경망을 이용한 클러스터링 기법을 제안하는데 목적이 있다.

  • PDF

지능형 개인화 EPG를 위한 프로그램 정보 장르 분류 (Classification of Program Information Genre for Intelligent Personalized EPG)

  • 송진석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.435-438
    • /
    • 2007
  • 국내에서 디지털 방송 상용화에 성공하고 전송 모델 또한 다양화됨에 따라 사용자는 다양한 형식으로 다수의 방송 프로그램을 접할 수 있게 되었다. 이에 대한 효율적인 프로그램 관리를 위한 EPG(Electronic Program Guide) 서비스가 현재 제공되거나 개발 중이다. 지능형 개인화 EPG는 디지털 방송 스트림이 수신되는 환경에서 사용자와 방송 수신기의 지능적인 매개체로서 운영되며 본 연구는 기존 프로그램 정보에 대한 장르를 학습하고 새로운 프로그램 정보가 입력될 경우 올바르게 장르를 분류할 수 있도록 기계학습 기법이 사용되었다.

웹 마이닝을 이용한 개인 광고기법에 관한 연구 (A Study on Personalized Advertisement System Using Web Mining)

  • 김은수;송강수;이원돈;송정길
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.92-103
    • /
    • 2003
  • 최근 전자상거래의 발전과 인터넷 사용자의 급증으로 온라인 상에서 수많은 광고들이 서비스되고 있다. 하지만 이러한 광고서비스는 사용자들의 성향 분석을 기초로 하기보다는 해당 광고의 일방적 서비스에 그치고 있다. 따라서 많은 웹사이트들이 해당 광고의 효율적 서비스를 위해 개인화된 광고서비스를 원하고 있고 해당 서버의 로그 분석을 통한 서비스를 연구 및 시행하고 있다. 본 논문에서는 서버측 로그데이터의 분석이 아닌 로컬 시스템의 로그데이터를 이용하여 사용자의 선호도와 성향을 분석한다. 또한 해당 사이트 별 분류 카테고리를 만들어 해당 분류의 가중치를 부여함으로써 개인화된 광고 시스템을 제안하려고 한다. 사용자의 선호도 분석은 웹 개인화 기법 중 협업 필터링의 대상이 되는 사용자 선호도 정보를 방문 사이트 분류에 사용하고 학습에이전트의 대상이 되는 인터넷 사용자의 행동을 해당 사이트의 방문횟수로 가정하여 사용자의 성향분석을 시도하였다. 사용자의 선호도를 벡터로 표현하고, 성향분석 결과를 단순 적용형태가 아닌 연속적 데이터로 간주하였으며 이전 데이터와 이후 데이터의 성향분석 변화를 제안하는 기법을 이용하여 새롭게 분석하고 피드백 시킴으로써 지속적인 갱신과 적용을 할 수 있도록 제안하였다. 이러한 결과를 통해 해당 분류의 광고들을 선정하고 선정된 광고에 사용자 성향분석과 동일한 과정을 적용시킴으로써 차별화된 광고 서비스를 제공할 수 있는 방법을 제시하였다.

  • PDF