• 제목/요약/키워드: 퍼지 집합모델

검색결과 92건 처리시간 0.023초

완전 매치와 부분 매치 검색 기법에 관한 연구 ((A Study of an Exact Match and a Partial Match as an Information Retrieval Technique))

  • 김영귀
    • 정보관리학회지
    • /
    • 제7권1호
    • /
    • pp.79-95
    • /
    • 1990
  • 본 연구는 그동안 연구되고 개발된 여러 검색 기법을 검색된 문헌 집합의 특성과 사용된 표현에 의해서 완전 매치 검색과 부분 매치 검색으로 구분하였다. 완전 매치는 부울 논리가 그 대표적이며 현행 대부분의 정보 검색 시스템에서 사용하고 있는 검색 기법이다. 부분 매치는 부울논리가 가지고 있는 문제점과 한계점을 극복하기 위한 대한으로서 많은 연 구가 있었으나 그 본질은 부울 논리 구조안에서 검색을 향상시킨다는 점에서 한계를 가질수 밖에 없다 하겠다. 대표적인 예로 확률 검색, 벡터 공간 모델, 그리고 퍼지 집합을 대상으로 두 검색 기법을 비교하고 앞으로의 검색 기법이 나아가야 할 방향을 제시하였다.

  • PDF

신경망과 k-means 클러스터링을 이용한 사용자의 퍼지값 선호도 학습 방법 (A method for learning users' preference on fuzzy values using neural networks and k-means clustering)

  • 윤태복;나현종;박두경;이지형
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.716-720
    • /
    • 2006
  • 퍼지 이론을 이용하면 여러 정보를 통합 요약하기에 수월하여, 웹 상에서 사용자에게 제공할 정보를 가공하는 방법으로 많이 사용되고 있다. 하지만 퍼지의 애매모호한 특성 때문에 사용자에게 맞게 퍼지 집합으로 표현된 같은 정보라 하여도 사용자마다 자신의 퍼지값 선호도에 따라 다른 선택을 할 수 있다. 따라서 애매한 퍼지값을 선택함에 있어 사용자의 퍼지값에 대한 선호도를 반영할 필요가 있다. 그러나 기존의 방법들은 정해진 기준을 획일적으로 적용하여, 사용자의 개인적인 선택 기준을 반영하지 못하는 문제가 있다. 본 논문에서는 사용자의 선호도를 학습하여, 사용자의 선호도에 맞는 정보를 선택하는 방법을 제안한다. 사용자의 선호도를 학습하기 위해서 학습 데이터가 필요한데, 이 데이터는 사용자에게 직접 물어 사용자의 선호도론 얻는데 사용된다. 이때, 사용자에게 너무 많은 데이터로 질문을 한다면, 사용자에게 부담을 줄 수 있고, 또 너무 적은 데이터를 사용한다면, 학습을 잘 못하는 경향이 생길 수 있다. 이러한 문제에 대처하기 위해서 10개 정도의 데이터를 이용하여 사용자의 선호도를 학습하는 방법을 제안한다. 제안하는 방법은 먼저 두 퍼지값이 서로 겹칠 수 있는 모든 경우의 상대적 위치를 조사한 후 클러스터링을 이용하여 몇 가지 그룹으로 나누고, 나누어진 그룹을 이용하여 학습하였다. 이렇게 학습된 모델은 새로운 애매하게 겹치는 퍼지값에 대해 사용자를 대신해 어느 것을 어느 정도 선호하는지 추론하게 된다.

UNDX연산자를 이용한 계층적 공정 경쟁 유전자 알고리즘을 이용한 퍼지집합 퍼지 모델의 최적화 (Optimization of Fuzzy Set Fuzzy Model by Means of Hierarchical Fair Competition-based Genetic Algorithm using UNDX operator)

  • 김길성;최정내;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.204-206
    • /
    • 2007
  • In this study, we introduce the optimization method of fuzzy inference systems that is based on Hierarchical Fair Competition-based Parallel Genetic Algorithms (HFCGA) and information data granulation, The granulation is realized with the aid of the Hard C-means clustering and HFCGA is a kind of multi-populations of Parallel Genetic Algorithms (PGA), and it is used for structure optimization and parameter identification of fuzzy model. It concerns the fuzzy model-related parameters such as the number of input variables to be used, a collection of specific subset of input variables, the number of membership functions, the order of polynomial, and the apexes of the membership function. In the optimization process, two general optimization mechanisms are explored. The structural optimization is realized via HFCGA and HCM method whereas in case of the parametric optimization we proceed with a standard least square method as well as HFCGA method as well. A comparative analysis demonstrates that the proposed algorithm is superior to the conventional methods. Particularly, in parameter identification, we use the UNDX operator which uses multiple parents and generate offsprings around the geographic center off mass of these parents.

  • PDF

연속 동조 방법을 이용한 퍼지 집합 퍼지 모델의 유전자적 최적화 (Genetic Optimization of Fyzzy Set-Fuzzy Model Using Successive Tuning Method)

  • 박건준;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.207-209
    • /
    • 2007
  • In this paper, we introduce a genetic optimization of fuzzy set-fuzzy model using successive tuning method to carry out the model identification of complex and nonlinear systems. To identity we use genetic alrogithrt1 (GA) sand C-Means clustering. GA is used for determination the number of input, the seleced input variables, the number of membership function, and the conclusion inference type. Information Granules (IG) with the aid of C-Means clustering algorithm help determine the initial paramters of fuzzy model such as the initial apexes of the, membership functions in the premise part and the initial values of polyminial functions in the consequence part of the fuzzy rules. The overall design arises as a hybrid structural and parametric optimization. Genetic algorithms and C-Means clustering are used to generate the structurally as well as parametrically optimized fuzzy model. To identify the structure and estimate parameters of the fuzzy model we introduce the successive tuning method with variant generation-based evolution by means of GA. Numerical example is included to evaluate the performance of the proposed model.

  • PDF

무게중심 복합구간에 의한 정성 추론 기법에 관한 연구 (A Study on the Methodology of Qualitative Reasoning Using Centroid-Oriented Composite Interval)

  • 박천경;김성근
    • 대한기계학회논문집
    • /
    • 제16권7호
    • /
    • pp.1351-1362
    • /
    • 1992
  • 본 연구에서는 단순한 구간대신에 구간내에 제한된 형태의 가능성 분포를 갖 는 복합구간으로 학장하는 것이다. 그리고 이러한 가능성 분포는 퍼지 집합이론에서 사용되는 것처럼 일반적인 분포형태 전체를 사용하는 것이 아니라, 가능성 분포의 무 게중심만 정의하고 이 무게중심과 구간경계만을 사용하여 시스템 변수가 갖는 정성값 을 나타낸다. 이를 바탕으로 새로운 상태변화와 그 규칙을 정의함으로써 정성 모델 링과 시뮬레이션을 할 수 있는 정성 수학을 공식화하였다.이와 같은 방식으로 구한 정성 모델과 추론방법으로 기존의 논문에 나와 있는 시뮬레이션 결과와 비교하여 본 논문에서 제시한 정성해의 논리적 건전성(soundness)을 보였다.

정보검색에서 부울연산자를 연산하는 식의 수학적 특성 (Mathematical Properties of the Formulas Evaluating Boolean Operators in Information Retrieval)

  • 이준호;이기호;조영화
    • 정보관리학회지
    • /
    • 제12권1호
    • /
    • pp.87-97
    • /
    • 1995
  • 부울 검색 시스템은 구현이 용이하고 빠를 검색 시간을 제공하기 때문에, 오늘날 정보 검색 분야에서 가장 널리 사용되고 있다. 그러나 순수한 부울 검색 시스템은 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정도에 따라 정렬 할 수 없다. 부울 검색 시스템에 순위 결정 기능을 부여하기 위하여 퍼지 집합, Waller-Kraft, Paice, P-Norm, Infinite-One과 같은 확장된 부울 모델들이 개발되어 왔다. 이들 모델에서 부울 연산자 AND와 OR에 대한 계산식은 순위 결정의 성능을 결정하는 중요한 요소이다. 본 논문에서는 부울 연산자 계산식의 수학적 특성을 제시하고, 이들이 검색효과에 미치는 영향을 분석한다. 분석 결과는 P-Norm 모델이 높은 검색 효과를 얻기에 가장 적합함을 보여준다.

  • PDF

프로그램 모듈의 품질평가 함수 (Quality estimate function of the program module)

  • 김혜경;최완규;이성주
    • 한국정보통신학회논문지
    • /
    • 제5권3호
    • /
    • pp.605-611
    • /
    • 2001
  • 고수준의 정보 서비스를 제공하기 위해서는 소프트웨어의 고품질화를 추구하여야 한다. 기존에 개발된 품질측정방법들은 모듈내에 포함되어 있는 요인항목들을 서로 다른 관점에서 개별적으로 측정하고있어 통합적인 평가방법이 필요하다. 따라서 본 논문에서는 다수의 측정 방법들을 모두수용 할 수 있는 모델을 제안한다. 제안된 모델은 비율척도들을 선택하고, 러프논리를 이용하여 그들의 중요도를 산출한다. 다음으로 모듈의 품질도를 측정하기 위해서 퍼지적분을 이용하여 척도들의 중요도와 측정값을 종합한다. 마지막으로 척도들과 산출된 품질도의 상관관계를 분석하고, 통계적 방법으로 제안된 모델의 타당성을 보인다.

  • PDF

양방향 순환 신경망 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템 (A Fuzzy-AHP-based Movie Recommendation System with the Bidirectional Recurrent Neural Network Language Model)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제18권12호
    • /
    • pp.525-531
    • /
    • 2020
  • 다양한 정보가 대량으로 유통되는 IT 환경에서 사용자의 요구를 빠르게 파악하여 의사결정을 도와줄 수 있는 추천 시스템이 각광을 받고 있다. 그러나 현재 추천 시스템은 사용자의 취향이나 관심사가 바뀌었을 때 선호도가 즉시 시스템에 반영이 되지 않을 수가 있으며, 광고 유도로 인하여 사용자의 선호도와 무관한 아이템이 추천될 수가 있다는 문제점이 있다. 본 연구에서는 이러한 문제점을 해결하기 위해 양방향 순환 신경망 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템을 제안하였다. 본 시스템은 사용자의 취향이나 관심사를 명확하고 객관적으로 반영하기 위해 Fuzzy-AHP를 적용하였다. 그리고 사용자가 선호하는 영화를 예측하기 위해 양방향 순환 신경망 언어 모델을 이용하여 실시간으로 수집되는 영화 관련 데이터를 분석하였다. 본 시스템의 성능을 평가하기 위해 그리드 서치를 이용하여 전체 단어 집합의 크기에 대한 학습 모델의 적합성을 확인하였다. 그 결과 본 시스템의 학습 모델은 전체 단어 집합의 크기에 따른 평균 교차 검증 지수가 97.9%로 적합하다는 것을 확인할 수 있었다. 그리고 본 모델은 네이버의 영화 평점 대비 평균 제곱근 오차가 0.66, LSTM 언어 모델은 평균 제곱근 오차가 0.805으로, 본 시스템의 영화 평점 예측성이 더 우수함을 알 수 있었다.

시소러스의 연관성 정보를 이용한 문서의 순위 결정 방법 (Document ranking methods using term dependencies from a thesaurus)

  • 이준호
    • 정보관리학회지
    • /
    • 제10권2호
    • /
    • pp.3-22
    • /
    • 1993
  • 최근 시소러스를 기반으로 하는 불리안 검색 시스템에서 문서의 순위 결정에 사용 될 수 있는 Relevance, R-distance, K-distance와 같은 방법들이 개발되었다. 이러한 방법들은 색인어들 사이의 연관성 정보를 이용하여 문서들의 순위를 결정함으로써 많은 경우에 높은 검색 효율을 제공할 지라도, 불리안 연산자 AND, OR, NOT에 대한 연산 방법이 문제점으로 지적되어왔다. 본 논문에서는 개선된 퍼지 집합 모델과 확장된 불리안 모델을 시소러스가 제공하는 색인어들 사이의 연관성 정보를 효율적으로 이용할 수 있도록 확장함으로써, 기존 방법들의 문제점을 극복하는 새로운 순위 결정 방법 KB-FSM과 KB-EBM을 제안한다. 또한 KB-FSM과 KB-EBM이 Relevance, R-distance, K-distance보다 문서들의 순위를 보다 정확하게 결정함을 성능 비교를 통하여 입증한다.

  • PDF

고농도 오존 예측을 위한 향상된 변환 기법과 예측 성능 평가 (Modified Transformation and Evaluation for High Concentration Ozone Predictions)

  • 천성표;김성신;이종범
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.435-442
    • /
    • 2007
  • 대기중의 고농도 오존의 피해를 줄이기 위해서, 고농도 오존 발생 전에 미리 오존 농도를 예측하기 위한 연구가 진행되었다. 하지만, 고농도 오존은 그 발생 빈도가 매우 희소하고, 대기 오존 생성 과정이 매우 비선형적이며 복잡한 특징이 있다. 이러한 특징을 극복하고 보다 정확한 예측 모델을 개발하기 위하여, 본 논문에서는 다양한 데이터 처리 기법을 도입하였다. 데이터 전처리과정에서 FCM(Fuzzy C-mean) 방법을 이용하여 오존 농도별 데이터 클러스터링을 시도하였으며, 결측 또는 비정상 데이터를 처리할 목적으로 Rejection 표본 추출법을 이용하였고, 모델의 입력과 출력의 상관관계를 향상시키기 위해서 로그 변환기법을 응용하였다. 오존 예측을 위한 모델링 기법은 DPNN(Dynamical Polynomial Neural Networks)을 이용하였으며, 최소 바이어스 판별법(Minimum Bias Criterion)으로 최적화된 모델을 선택하였다. 끝으로, 본 논문에서는 로그 변환기법이 예측 모델에 미치는 영향을 보이기 위해서 입력 데이터를 두 개의 집합으로 나누어 다양한 방법으로 예측 결과를 평가했다. 결과적으로 계절적 영향에 의해 특정 분포를 가지는 오존 관련 데이터에 있어서 로그 변환 방법이 모델의 성능을 향상시킬 수 있다는 것을 보였다.