• 제목/요약/키워드: Fuzzy Clustering Algorithm

검색결과 418건 처리시간 0.023초

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

Binary Harmony Search 알고리즘을 이용한 Unsupervised Nonlinear Classifier 구현 (Implementation of Unsupervised Nonlinear Classifier with Binary Harmony Search Algorithm)

  • 이태주;박승민;고광은;성원기;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.354-359
    • /
    • 2013
  • 본 논문을 통해서 우리는 최적화 알고리즘인 binary harmony search (BHS) 알고리즘을 이용하여 unsupervised nonlinear classifier를 구현하는 방안을 제시하였다. 패턴인식을 위한 기계학습이나 뇌파 신호의 분석 과정과 같이 벡터로 표현되는 특징들을 분류하는데 있어 다양한 알고리즘들이 제시되었다. 교사 학습기반의 분류 방식으로는 support vector machine과 같은 기법이 사용되어왔고, 비교사 학습 방법을 통한 분류 기법으로는 fuzzy c-mean (FCM)과 같은 알고리즘들이 사용되어 왔다. 그러나 기존에 사용해 왔던 분류 방법들은 비선형 데이터 분류에 적용하기 힘들거나 교사 학습을 적용하기 위해서 사전정보를 필요로 하는 문제점이 있다. 본 논문에서는 경험적 접근을 통해 공간상에 분포된 벡터 사이의 기하학적 거리를 최소로 만드는 벡터 집합을 선택하고 이를 하나의 클래스로 간주하는 방법을 적용한 분류법을 제시하였다. 비교 대상으로 FCM과 artificial neural network (ANN) 기반의 self-organizing map (SOM)을 제시하였다. 시뮬레이션에는 KEEL machine learing dataset을 사용하였고 그 결과, 제안된 방식이 기존 알고리즘에 비해 더 나은 우수성을 지니고 있음을 확인하였다.

리얼 서버의 실시간 서버 모니터에 의한 최적 로드 밸런싱 알고리즘에 관한 연구 (A Study for an Optimal Load Balancing Algorithm based on the Real-Time Server Monitor of a Real Server)

  • 한일석;김완용;김학배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.201-204
    • /
    • 2003
  • At a consequence of WWW large popularity, the internet has suffered from various performance problems, such as network congestion and overloaded servers. These days, it is not uncommon to find servers refusing connections because they are overloaded. Web server performance has always been a key issue in the design and operation of on-line systems. With regard to Internet, performance is also critical, because users want fast and easy access to all objects (e.g., documents, graphics, audio, and video) available on the net. To solve this problem, a number of companies are exploring the benefits of having multiple geographically or locally distributed Internet sites. This requires a comprehensive scheme for traffic management, which includes the principle of an optimal load balancing of client requests across multiple clusters of real servers. This paper focuses on the performance analysis of Web server and we apply these results to load balancing in clustering web server. It also discusses the mam steps needed to carry out a WWW performance analysis effort and shows relations between the workload characteristics and system resource usage. Also, we will introduce an optimal load balancing algorithm base on the RTSM (Real-Time Server Monitor) and Fuzzy Inference Engine for the local status of a real server, and the benefits is provided with of the suggested method.

  • PDF

시간흐름을 고려한 특징 추출과 군집 분석을 이용한 헬스 리스크 관리 (Health Risk Management using Feature Extraction and Cluster Analysis considering Time Flow)

  • 강지수;정경용;정호일
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.99-104
    • /
    • 2021
  • 본 논문에서는 시간 흐름을 고려한 특징추출과 군집분석을 이용한 헬스 리스크 관리를 제안한다. 제안하는 방법은 세단계로 진행한다. 첫 번째는 전처리 및 특징추출 단계이다. 이는 웨어러블 디바이스를 이용하여 라이프로그를 수집하여 불완전데이터, 에러, 잡음, 모순된 데이터를 제거하며 결측 값을 처리한다. 그 다음 특징추출을 위해 주성분 분석을 통해 중요 변수를 선택하고, 상관계수와 공분산을 통해 데이터 간의 관계와 유사한 데이터들의 분류를 진행한다. 또한 라이프로그에서 추출한 특징을 분석하기 위해 시간의 흐름을 고려하여 K-means 알고리즘을 통해 동적 군집을 진행한다. 새로운 데이터는 오차 제곱합의 증가분을 기반으로 유사성 거리 측정 방법을 통해 군집을 진행하고, 시간의 흐름을 고려하여 군집에 대한 정보를 추출한다. 따라서 특징 군집을 통해 헬스 의사결정 시스템을 이용하여 신체적 특성, 생활습관, 질병여부, 헬스케어 이벤트 발생위험, 예상 정도 등의 요소를 통해 리스크를 관리할 수 있다. 성능평가는 Precision, Recall, F-measure을 사용하여 제안하는 방법과 퍼지방법, 커널기반 방법을 비교한다. 평가결과 제안하는 방법이 우수하게 평가된다. 따라서 제안하는 방법을 통해 유병자와의 유사도를 이용하여 정확한 사용자의 잠재적 건강 위험을 예측 및 적절한 관리가 가능하다.

(2D)2PCA 알고리즘을 이용한 pRBFNNs 패턴분류기 기반 얼굴인식 시스템 설계 (Design of pRBFNNs Pattern Classifier-based Face Recognition System Using 2-Directional 2-Dimensional PCA Algorithm)

  • 오성권;진용탁
    • 전자공학회논문지
    • /
    • 제51권1호
    • /
    • pp.195-201
    • /
    • 2014
  • 본 연구에서는 $(2D)^2PCA$ 알고리즘을 이용한 pRBFNNs 패턴분류기 기반 얼굴인식 시스템을 설계하였다. 기존의 1차원 PCA는 행과 열의 곱으로 표현한 이미지의 차원을 축소한다. 하지만 $(2D)^2PCA$(2-Directional 2-Dimensional Principal Components Analysis)는 이미지의 행과 열에서 각각 차원축소를 수행한다. 그 다음 제안된 지능형 패턴분류기로 축소된 이미지를 사용하여 성능을 평가한다. (pRBFNNs)로 성능 평가를 한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세가지의 기능적 모듈로 구성되어 있고 조건는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 RBFNNs의 연결가중치로 일차 선형식으로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉 입력의 수, 퍼지 클러스터링의 퍼지화 계수를 최적화 한다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다. 실험 평가를 위해 IC&CI 연구실 데이터를 추가하여 실험하였다.

퍼지 클러스터링을 이용한 다중 스펙트럼 자기공명영상의 분할 (Segmentation of Multispectral MRI Using Fuzzy Clustering)

  • 윤옥경;김현순;곽동민;김범수;김동휘;변우목;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 본 논문에서는 T1 강조영상, T2 강조 영상 그리고 PD의 영상의 특징을 상호 보완적으로 이용한 자동적인 영상 분할법을 제안한다. 제안한 분할 알고리듬은 3단계로 이루어지는데, 첫 단계에서는 PD 영상으로부터 대뇌 마스크를 획득한 후, T1과 T2, PD의 입력 영상에 대뇌 마스크를 씌워 각각의 대뇌 영상을 추출하고, 둘째 단계에서는 대뇌 내부 조직에 해당하는 두드러진 클러스터(outstanding cluster)를 3차원 클러스터들 중에서 선택한다. 3차원 클러스터는 최적스케일 영상(optimal scale image)으로 이루어지는 3차원 공간상에서 화소가 밀집된 봉우리들을 교집합해서 생성되는 클러스터로 결정한다. 최적스케일 영상은 각 2타원 히스토그램에 스케일 스페이스 필터링을 적용시키고 그래프(graph) 구조를 검색하여 2차원 히스토그램의 모양을 가장 잘 나타내는 봉우리(peak) 영상을 최적 스케일 영상으로 선택한다. 마지막 단계에서는 앞에서 찾은 두드러진 클러스터의 중심값을 FCM 알고리듬의 초기중심 값으로 두고, FCM 알고리듬을 이용하여 대뇌 영상을 분할한다. 제안한 분할 알고리듬은 정확한 클러스터의 중심값을 계산함으로 초기 값을 영향을 많이 받는 FCM 알고리듬의 단점을 보완하였고 다중 스펙트럼 영상의 특성을 조합하여 분할에 이용함으로 단일 스펙트럼 영상만을 이용하는 방법보다 향상된 결과를 얻을 수 있었다.

  • PDF

Deformable Template과 GA를 이용한 얼굴 인식 및 아바타 자동 생성 (Face Detection for Automatic Avatar Creation by using Deformable Template and GA)

  • 박태영;권민수;강훈
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.110-115
    • /
    • 2005
  • 본 논문에서는 아바타를 자동으로 생성하기 위한 컬러 이미지 상에서의 얼굴, 눈, 입술 윤곽선 검출 기법을 제안하였다. 제안된 기법에서는 먼저 조명의 영향을 최대한 배제하기 위하여 HSI 색상 모델을 사용하였고 I 정보를 제외한 HS 평면상에서 피부색을 정의하고 이를 이용하여 입력된 이미지로부터 피부 영역을 검출하였다. 그리고 변형가능 템플릿과 유전자 알고리즘을 이용하여 얼굴, 눈, 입의 윤곽선을 검출하였다. 여기서 변형가능 템플릿은 B-spline 곡선과 컨트롤 포인트 벡터로 이루어지며, 이것은 다양한 얼굴, 눈, 입술 모양의 표현을 가능하게 한다. 또 유전자 알고리즘은 자연계의 진화와 선택원리를 응용한 매우 효율적인 탐색 알고리즘이다 다음으로, 검출된 얼굴과 각 요소들의 윤곽선과 퍼지 C-평균 군집화를 이용하여 아바타를 생성하게 된다. 퍼지 C-평균 군집화는 얼굴색을 일정한 수로 단순화하는 과정에서 사용하였다. 결과적으로, 이와 같은 기법을 이용하여 기존의 정해진 이미지를 가지고 표현하던 아바타와는 달리 사용자의 특성을 표현할 수 있는 아바타를 자동으로 생성할 수 있다.

LIDAR를 이용한 삼차원 점군 데이터의 삼각망 구성 방법 및 샘플링에 따른 암반 불연속면 방향 검출에 관한 연구 (A Study on the Extraction of Slope Surface Orientation using LIDAR with respect to Triangulation Method and Sampling on the Point Cloud)

  • 이수득;전석원
    • 터널과지하공간
    • /
    • 제26권1호
    • /
    • pp.46-58
    • /
    • 2016
  • 본 연구는 LIDAR라고 불리는 레이져 스캐너를 이용하여 관악산 주변 암반 불연속면을 스캔하여 얻은 삼차원 점군 데이터로부터 삼각망을 구성하고 이로부터 암반 불연속면의 방향을 검출하는 내용을 다루고 있다. 각 불연속면의 방향정보를 획득하는 데 Ball Pivoting, Wrap 알고리즘 두 가지 방법을 사용하고 점군의 샘플링 간격을 원간격, 2, 5, 10 cm로 다운샘플링 하였을 때의 방향 검출 효율성을 확인하였고 각각으로부터 얻어지는 방향정보를 퍼지 K-평균 클러스터링 기법을 이용하여 평사투영망 위에서 비교 분석하였다. 투영방향에 의존적인 Delaunay 삼각망 구성방법보다 Ball Pivoting, Wrap 알고리즘이 암반 불연속면 정보 검출에 더 적합함을 확인하였고, 샘플링 간격이 5 cm일 때 Ball Pivoting, Wrap 알고리즘 모두 가장 많은 패치를 검출해내었고 또한 가장 넓은 패치들의 면적을 검출해냄을 확인하였다.