• 제목/요약/키워드: query clustering

검색결과 120건 처리시간 0.024초

감정기반 정보 검색시스템에 관한 연구 (A Study on Emotion based Information Retrieval System)

  • 김명관;박영택
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.105-115
    • /
    • 1998
  • 인터넷의 확산과 더불어 엄청난 사용자의 증가는 인터넷을 단순히 정보 검색의 대상으로만 삼는 것이 아니라 일반인들의 여가 문화를 즐기는 장이 되어가고 있다. 이와 같은 요구로 감정기반 문서 검색 및 분류 시스템을 제안한다. 이 시스템을 ECRAS라고 부른다. 감정 성분 추출은 로젯의 시소러스와 워드넷을 통해 이루어졌다. 감정 성분을 추출한 문서는 k-NN 기법을 기반으로 검색을 수행한다.

  • PDF

Prediction of User Preferred Cosmetic Brand Based on Unified Fuzzy Rule Inference

  • 김진성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.271-275
    • /
    • 2005
  • In this research, we propose a Unified Fuzzy rule-based knowledge Inference Systems UFIS) to help the expert in cosmetic brand detection. Users' preferred cosmetic product detection is very important in the level of CRM. To this Purpose, many corporations trying to develop an efficient data mining tool. In this study, we develop a prototype fuzzy rule detection and inference system. The framework used in this development is mainly based on two different mechanisms such as fuzzy rule extraction and RDB (Relational DB)-based fuzzy rule inference. First, fuzzy clustering and fuzzy rule extraction deal with the presence of the knowledge in data base and its value is presented with a value between $0\∼1$. Second, RDB and SQL(Structured Query Language)-based fuzzy rule inference mechanism provide more flexibility in knowledge management than conventional non-fuzzy value-based KMS(Knowledge Management Systems)

  • PDF

Prediction of User's Preference by using Fuzzy Rule & RDB Inference: A Cosmetic Brand Selection

  • Kim, Jin-Sung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제5권4호
    • /
    • pp.353-359
    • /
    • 2005
  • In this research, we propose a Unified Fuzzy rule-based knowledge Inference Systems (UFIS) to help the expert in cosmetic brand detection. Users' preferred cosmetic product detection is very important in the level of CRM. To this purpose, many corporations trying to develop an efficient data mining tool. In this study, we develop a prototype fuzzy rule detection and inference system. The framework used in this development is mainly based on two different mechanisms such as fuzzy rule extraction and RDB (Relational DB)-based fuzzy rule inference. First, fuzzy clustering and fuzzy rule extraction deal with the presence of the knowledge in data base and its value is presented with a value between 0 -1. Second, RDB and SQL (Structured Query Language)-based fuzzy rule inference mechanism provide more flexibility in knowledge management than conventional non-fuzzy value-based KMS (Knowledge Management Systems).

Fuzzy Inference in RDB using Fuzzy Classification and Fuzzy Inference Rules

  • 김진성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.153-156
    • /
    • 2005
  • In this paper, a framework for implementing UFIS (Unified Fuzzy rule-based knowledge Inference System) is presented. First, fuzzy clustering and fuzzy rules deal with the presence of the knowledge in DB (DataBase) and its value is presented with a value between 0 and 1. Second, RDB (Relational DB) and SQL queries provide more flexible functionality fur knowledge management than the conventional non-fuzzy knowledge management systems. Therefore, the obtained fuzzy rules offer the user additional information to be added to the query with the purpose of guiding the search and improving the retrieval in knowledge base and/ or rule base. The framework can be used as DM (Data Mining) and ES (Expert Systems) development and easily integrated with conventional KMS (Knowledge Management Systems) and ES.

  • PDF

센서 네트워크 기반의 홀리스틱 분산 클러스터링 알고리즘 (A holistic distributed clustering algorithm based on sensor network)

  • 진평;임기욱;남지은;이경오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.874-877
    • /
    • 2008
  • Nowadays the existing data processing systems can only support some simple query for sensor network. It is increasingly important to process the vast data streams in sensor network, and achieve effective acknowledges for users. In this paper, we propose a holistic distributed k-means algorithm for sensor network. In order to verify the effectiveness of this method, we compare it with central k-means algorithm to process the data streams in sensor network. From the evaluation experiments, we can verify that the proposed algorithm is highly capable of processing vast data stream with less computation time. This algorithm prefers to cluster the data streams at the distributed nodes, and therefore it largely reduces redundant data communications compared to the central processing algorithm.

이동 컴퓨팅 환경에서 위치 의존 질의에 적합한 선형 클러스터링을 이용한 브로드캐스팅 기법 (Using Linear Clustering for Broadcasting to support Location Dependent Query in Mobile Computing Environment)

  • 정일동;유영호;이중화;신지현;김경석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.241-243
    • /
    • 2001
  • 이동 컴퓨팅 환경에서 이동 호스트의 위치가 변함에 따라 그 의미가 달라지는 위치 의존 질의를 효과적으로 처리하기 위해서는 이동 호스트의 캐시 기법이 중요하지만, 위치 의존 질의를 효과적으로 지원할 수 있는 지구국의 브로드캐스팅 기법도 중요하다. 본 논문에서는 지구국이 담당하는 영역을 격자로 나누어 인덱싱한 데이터를 위치 의존 질의에 적합하도록 공간-채움 곡선을 이용해서 선형 클러스터링하여 구성 시간을 줄이는 브로드캐스팅 기법을 제안하고, 구성 시간을 포함시킨 이동 호스트의 활동 시간을 측정하여 그 성능을 비교한다.

  • PDF

스토리 검색 서비스의 사용자 기록에 나타난 인물 성향 군집화 및 유형 분석 (Clustering Character Tendencies found in the User Log of a Story Database Service and Analysis of Character Types)

  • 김명준
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.383-390
    • /
    • 2016
  • 본 논문은 사용자의 검색에 따라 유사도가 높은 스토리를 보여주는 서비스인 <스토리헬퍼>를 대상으로, 사용자기록에 나타난 인물 성향을 군집화하여 창작과정에서 나타나는 인물의 유형화를 수행한다. 또한 인물 유형이 관련된 장르 및 행위의 분포를 보여주는 가시화 기법을 이용하여 주요 인물 유형의 장르-행위 특성에 대해 살펴본다. 적은 수의 인물의 유형으로 과반수의 인물성향을 대표할 수 있고, 인물 유형이 특정 장르/행위와 관련성을 가지는 경우가 많음을 확인하였다. 이를 이용하여 인물 유형별로 자료를 제공하는 창작 지원 시스템이 가능할 것으로 생각된다.

EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법 (EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System)

  • 이춘근;김정원;김영주;정기동
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2294-2304
    • /
    • 1999
  • 본 논문은 병렬 입출력과 효율적인 디스크 접근을 이용하여 입출력 성능을 높임으로써 지리 정보 시스템의 질의 처리 성능을 향상시키는 것을 목적으로 한다. 동시에 접근할 가능성이 높은 인접한 공간 데이터를 디스크의 논리적 블록 단위로 패킹하여 하나 또는 연속적인 논리적 블록으로 클러스터링 하면 한번의 디스크 접근으로 많은 공간 데이터를 읽을 수 있어 질의 처리에 따른 디스크 접근 횟수와 디스크 접근 오버 헤드를 줄임으로써 입출력 시간을 줄일 수 있다. 본 논문에서는 기존 Parallel R-tree 기법의 병렬 입출력 기법과 패킹 기반 클러스터링 기법을 결합하여 효율적인 입출력을 지원하는 EPR(Enhanced Parallel R-tree) 색인 기법을 제안한다. EPR 기법의 주요 특징은 다음과 같다. 첫째, 공간 데이터를 Hilbert space filling curve를 이용하여 인접도에 따라 정렬하여 패킹함으로써 상향식으로 R-tree를 생성한다. 둘째, 정렬된 공간 데이터를 패킹하여 하나 또는 연속적인 논리적 블록에 저장하는 패킹 기반 클러스터링을 통해 공간 데이터 클러스터를 구성한다. 셋째, 색인 기법 및 공간 데이터 클러스터를 round-robin 스트라이핑 방식을 통해 다중 디스크에 분산 배치한다. EPR 기법과 기존 PR 기법의 성능을 비교한 결과, 공간 질의 처리 속도가 30% 이상 향상되었으며, 특히 논리적 블록의 크기가 클수록, 공간 데이터의 크기가 작을수록 질의 처리 성능이 향상되는 결과를 보였다.

  • PDF

데이터 마이닝에서 비트 트랜잭션 클러스터링을 이용한 빈발항목 생성 (Frequent Itemset Creation using Bit Transaction Clustering in Data Mining)

  • 김의찬;황병연
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.293-298
    • /
    • 2006
  • 데이터베이스에는 많은 데이터들이 저장되어 있다. 무수히 많은 데이터들로부터 어떠한 정보를 얻기 위해서는 질의문을 사용하면 된다. 질의문을 통해 얻는 정보들은 기본적이고 단순한 정보들이다. 데이터 마이닝은 데이터베이스를 통해서 얻을 수 없는 정보를 얻게 해주는 기법이다. 데이터 마이닝 기법에는 여러 가지가 있지만 본 논문에서는 클러스터링과 연관규칙을 찾아내는 기법을 다룬다. 기존의 연관규칙 기법에서의 문제점을 보완하고 더 나은 규칙들을 찾아내기 위한 방법을 제시한다. 여기에 클러스터링 방법을 적용하게 되는데 기존의 거리기반이나 범주 기반 등의 클러스터링이 아닌 연관규칙에 적합한 클러스터링 기법을 제안하여 적용하게 된다. 각 클러스터의 연관규칙들을 찾게 되면 기존의 전체 데이터베이스에서 찾아진 연관규칙 뿐만 아니라 클러스터들의 특징이 될 규칙들도 찾을 수 있게 된다. 본 연구를 통해 대용량 데이터베이스의 많은 트랜잭션 접근을 줄이고 소집단의 연관성도 찾을 수 있다.

클러스터링과 차원축약 기법을 통합한 영상 검색 시스템 (Combined Image Retrieval System using Clustering and Condensation Method)

  • 이세한;조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.53-66
    • /
    • 2006
  • 본 논문에서는 전체 차원으로 데이터베이스 내의 모든 영상에 대해 순차적인 검색을 했을 때의 상세 검색 결과와 동일한 적합성을 유지하면서 검색 속도를 훨씬 더 향상시킬 수 있는 통합 검색 시스템을 제안한다. 통합 검색 시스템은 적합성을 유지하는 서로 다른 두 독립적인 시스템이 병합되어 있다. 하나는 특징 벡터 차원 축약을 이용한 2단계 검색 시스템이고 나머지 하나는 이진 트리 클러스터링을 이용한 2단계 검색 시스템이다. 각각의 방법은 1단계에서 상세 검색에서의 검색 결과를 항상 포함하는 후보 영상들을 추출하고, 추출된 후보 영상들을 대상으로 2단계 검색에서 전체 차원으로 재 검색을 한다 그러므로 각 방법과 통합 검색 방법은 모두 상세 검색을 수행했을 때와 동일한 검색 결과를 얻게 된다. 특징 벡터 차원 축약을 이용한 2단계 검색 방법은 Cauchy- Schwartz 부등식의 성질을 이용하여 특징 벡터를 차원 축약하여 검색에 사용하는 방법이다. 이때 전체 검색 시간을 최소로 하는 최적 차원 축약율이 존재하게 되고, 이를 후보 영상 추출을 위한 1차 검색에 적용하게 된다. 이진 트리 클러스터링을 이용한 2단계 검색 방법은 재귀적인 2-means 클러스터링을 통해 각 클러스터의 반경이 동일하게 동적으로 분할하는 방법이다. 동일한 적합성 유지를 위해 유사도 기준이 보정된 질의를 통해 1단계 검색에서 후보 클러스터를 추출하고, 2단계 검색에서 후보 클러스터 내의 영상을 대상으로 최종 결과 영상들을 얻게 된다. 통합 검색 방법은 위의 두 검색 방법을 통합한 것으로 서로 독립적인 두 방법을 동시에 적용함으로써 검색 시스템의 성능을 훨씬 더 향상시킬 수 있다 제안하는 방법은 상세 검색의 적합성을 유지하면서도 검색 속도를 훨씬 더 향상시킬 수 있음이 실험을 통해 입증되었다.