• 제목/요약/키워드: 유사 측도

검색결과 51건 처리시간 0.021초

상대적 소수 함수에 기반을 둔 새로운 유사성 측도와 언어 근사에의 응용 (A New Similarity Measure based on RMF and It s Application to Linguistic Approximation)

  • 최대영
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.463-468
    • /
    • 2001
  • 상대적 소속 함수(RMF)에 기반을 둔 새로운 유사성 측도를 제안한다. 본 논문에서는 RMF는 퍼지 부분 집합간의 상대성을 쉽게 나타내기 위해 제시되었다. 이러한 RMF의 형태는 매개변수값들에 따라 결정되기 때문에 매개변수 값들만을 조정해 줌으로써 퍼지 부분 집합간의 상대성을 쉽게 나타낼 수 있다. 그러므로 퍼지 부분 집합을 이용해 주관성을 표현할 때 개인이나 문화차이간의 상대성을 쉽게 반영해 줄수 있다. 이 경우이들 매개변수들은 퍼비 부분 집합의 구조를 결정해 주는 특징점들이라고 할수 있다. 결과적으로 퍼지 부분 집합간의 유사성 정도가 RMF의 매개변수들을 이용해서 빠르게 계산될 수 있다. RMF에 의해 퍼지 부분 집합간의 유사성 정도를 계산하기 위해 유클리디안 거리를 사용한다. 한편, 제안된 유사성 측도의 응용 분야로 새로운 언어 근사 방법을 제시하고 수치적인 예를 보여준다.

  • PDF

群集間에 制約條件이 있는 경우의 群集方法에 대한 연구 (A clustering method with some side conditions on the cluster)

  • 김성주
    • 응용통계연구
    • /
    • 제1권1호
    • /
    • pp.45-56
    • /
    • 1987
  • 본 논문은 선거구 劃定을 서로 연관된 전체와 均等比例라는 制約條件이 있는 경우의 群集方法이라는 측면에서 관찰한다. 두 지역의 類似性을 측정할 수 있는 새로운 測度가 개발되며 이는 하나의 선거구가 되기 위해 중요시 되는 몇가지 기준에 대해 두 지역이 일치한 횟수로 정의된다. 이러한 유사성 측도를 기초로 해서 선거구 劃定을 위한 새로운 階層群集方法이 제시된다. 새로운 유사성 측도와 계측군집방법을 경기도내 29개 市 $\cdot$ 郡에 적응하여 얻어진 결과는 경기도의 현행 국회의원 선거구와 비교 설명되어 진다.

소셜 네트워크에서 감정단어의 단계별 코사인 유사도 기법을 이용한 추천시스템 (Personalized Recommendation System using Level of Cosine Similarity of Emotion Word from Social Network)

  • 권응주;김종우;허노정;강상길
    • 정보화연구
    • /
    • 제9권3호
    • /
    • pp.333-344
    • /
    • 2012
  • 본 논문에서는 개인의 취향과 관심이 반영 되어있는 소셜 정보를 활용하여 사용자에게 영화를 추천할 수 있는 시스템을 제안하였다. 시스템에서 데이터 구축은 포털사이트에서 영화 정보를 수집하고 페이스북과 트위터 같은 SNS를 통해 소셜 정보를 수집한다. 본 논문에서는 사용자의 감정에 따른 보다 정교한 처리를 위하여 6단계의 감정단계로 분류한 소셜 정보의 벡터공간 모형의 구축방법을 제안한다. 추천을 위한 유사도 측도 방법은 2단계로 구성되어 있다. 첫 번째는 일반적인 코사인 측도를 통한 영화 목록의 구축 단계이고, 두 번째는 기존의 코사인 측도(Cosine measure)를 활용한 좌표평면에서 감정 단계별 벡터 정보 표현 방법 및 유사도 측도 방법을 통해 추천 영화 목록의 결정 단계이다. 본 논문의 추천 시스템의 성능을 평가하기 위하여 기존의 추천 시스템과 비교 실험을 통하여 본 연구의 추천 시스템의 유용성을 검증하였다.

마이크로어레이 유전자 발현 자료에 대한 군집 방법 비교 (Comparison of clustering methods of microarray gene expression data)

  • 임진수;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.39-51
    • /
    • 2012
  • 군집분석은 마이크로어레이 발현자료에서 유전자 혹은 표본들의 유사한 특성을 갖는 연관구조를 조사하는데 중요한 도구이다. 본 논문에서는 마이크로어레이 자료에서 계층적 군집방법, K-평균법, PAM (partitioning around medoids), SOM (self-organizing maps) 그리고 모형기반 군집방법 들의 성능을 3가지 군집 타당성 측도인 내적 측도, 안정적 측도 그리고 생물학적 측도를 가지고 비교분석하고자 한다. 모의실험을 통해 생성된 자료와 실제 SRBCT (small round blue cell tumor) 자료를 가지고 여러 가지 군집방법들의 성능을 비교하였으며 그 결과 모의실험 자료에서는 거의 모든 방법들이 3가지 군집측도에서 원래 자료와 일치하는 좋은 군집 결과를 나타내었고 SRBCT 자료에서는 모의실험 자료처럼 명확한 군집화 결과를 보여주지는 않으나 내적측도의 실루엣 너비 (Silhouette width) 관점에서는 PAM 방법, SOM, 모형기반 군집방법 그리고 생물학적 측도에서는 PAM 방법과 모형기반 군집방법이 모의실험 결과와 비슷한 결과를 얻었고 안정적 측도에서 모형기반 군집방법이 다른 방법들보다 좋은 군집결과를 보여주었다.

군집화를 위한 베이지안 학습 기반의 퍼지 규칙 추출 (Bayesian Learning based Fuzzy Rule Extraction for Clustering)

  • 한진우;전성해;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.389-391
    • /
    • 2003
  • 컴퓨터 학습의 군집화는 주어진 데이터를 서로 유사한 몇 개의 집단으로 묶는 작업을 수행한다. 군집화를 위한 유사도 결정을 위한 측도는 많은 기법들에서 매우 다양한 측도들이 사용되고 또한 연구되어 왔다. 하지만 군집화의 결과에 대한 성능측정에 대한 객관적인 기준 설정이 어렵기 때문에 군집화 결과에 대한 해석은 매우 주관적이고 애매한 경우가 많다. 퍼지 군집화는 이러한 애매한 군집화 문제에 있어서 융통성 있는 군집 결정 방안을 제시해 준다. 각 개체들이 특정 군집에 속하게 될 퍼지 멤버 함수값을 원소로 하는 유사도 행렬을 통하여 군집화를 수행한다. 본 논문에서는 베이지안 학습을 통하여 군집화를 위한 퍼지 멤버 함수값을 구하였다. 본 연구에서는 최적의 퍼지 군집화 수행을 위하여 베이지안 학습 기반의 퍼지 규칙을 추출하였다. 인공적으로 만든 데이터와 기존의 기계 학습 데이터를 이용한 실험을 통하여 제안 방법의 성능을 확인하였다.

  • PDF

오즈 곡선과 최적분류점 (Odds curve and optimal threshold)

  • 홍종선;오태규;오세현
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.807-822
    • /
    • 2021
  • 오즈 곡선으로 설명이 가능한 정확도 측도들을 살펴보고, 오즈 곡선의 성질을 바탕으로 대안적인 최대 사각형 정확도 측도를 제안한다. 다양한 확률분포함수와 실증예제를 고려하여 정확도 측도들에 대응하는 분류점을 구하고, 분류점을 측정하는 통계량들을 비교하면서 특징을 토론한다. 그러므로 ROC 곡선 등과 유사하게 오즈 곡선으로부터도 최적분류점들을 발견하고 설명할 수 있으며, 최대사각형 측도는 이진 분류모형의 성능을 향상시킬 수 있는 정확도 측도로 활용할 수 있다.

연관 규칙 마이닝에서의 코사인 순수 신뢰도의 제안 (The proposition of cosine net confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.97-106
    • /
    • 2014
  • 빅 데이터 기술의 발전은 다변화된 현대 사회를 보다 정확하게 예측하고 효율적으로 작동하도록 정보를 제공하는 동시에 과거에는 불가능 했던 기술을 가능케 하였다. 이러한 빅 데이터 분석 기법은 국가 차원에서의 사회, 경제, 정치, 문화, 과학 기술 등 여러 분야에 활용될 수 있다. 빅 데이터 분석을 위해서는 먼저 데이터 마이닝 기술로 방대한 양의 데이터 속에서 가치 있는 정보를 찾는 것이 선행 되어야 하는데, 빅 데이터와 관련된 데이터 마이닝 기법으로는 텍스트 마이닝, 평판 분석, 군집 분석, 연관성 규칙 등이 있다. 본 논문에서는 데이터 마이닝 기법 중에서 많이 활용되고 있는 연관성 규칙의 평가 기준으로 코사인 순수 신뢰도를 제안한 후, Piatetsky-Shapiro가 제안한 흥미도 측도의 기준에 대한 충족여부를 점검하는 동시에 여러 가지 특성을 살펴보았다. 또한 예제를 통하여 고찰한 결과, 기존의 신뢰도와 코사인 유사성 측도는 모두 양의 값을 가지므로 연관성의 방향을 알 수 없어서 그 값만으로는 양의 연관성이 있는지 아니면 음의 연관성이 있는지를 알 수 없었다. 그러나 본 논문에서 제안한 코사인 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 알 수 있으므로 신뢰도와 코사인 유사성 측도가 가지고 있는 약점을 보완할 수 있는 측도라는 사실을 확인하였다.

이변량 반복측정자료에서 가중일치상관계수의 추정

  • 강보경;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.261-266
    • /
    • 2000
  • 이변량 반복측정자료에서 Chinchilli 등(1996)이 제안한 가중일치상관계수는 두 변수의 일치성을 나타내는 측도이다. 기존에 제안된 가중일치상관계수 추정법은 변동효과 및 측정오차의 분산성분을 각각 최소제곱법으로 비편향 추정하여 구하는 것이다. 본 연구에서는 반복측정자료의 주변 우도함수를 설정한 후, 우도함수에 기초한 분산성분을 구하여 가중일치상관계수를 추정하는 방법을 제안한다. 이때, 각 분산성분은 유사/의사 우도함수 및 사후 분포에서 반복시행을 통하여 구해진다.

  • PDF

유사측도를 이용한 신뢰성 있는 데이터의 추출 (Reliable Data Selection using Similarity Measure)

  • 류수록;이상혁
    • 한국지능시스템학회논문지
    • /
    • 제18권2호
    • /
    • pp.200-205
    • /
    • 2008
  • 데이터 분석을 위하여 데이터의 불확실성에 대한 측도로서 퍼지 집합에 대한 엔트로피를 소개하였고, 또한 데이터간의 유사도를 나타내는 유사측도를 구성하였다. 퍼지 소속 함수간의 유사측도는 거리측도를 이용하여 구성하였고, 제안한 유사측도를 증명을 통하여 확인하였다. 제안한 유사측도의 유용성을 확인하기 위하여 신뢰성 있는 데이터추출 예제에 적용하였다. 적용결과를 퍼지 엔트로피와 통계적 지식을 통하여 얻어진 이전의 결과와 비교하였다.

국지적 패턴 유사도에 의해 수정된 Hausdorff 거리를 이용한 개선된 객체검출 (An Improved Object Detection Method using Hausdorff Distance Modified by Local Pattern Similarity)

  • 조경식;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.147-152
    • /
    • 2007
  • 디지털 영상에서의 얼굴탐색은 얼굴인식을 위한 기본 단계이면서 인식 성능에 큰 영향을 미치는 중요한 처리 단계이다. 템플릿 정합 방식의 객체 검출방식에서 사용되어 얼굴 인식 등에서 좋은 성능을 보이는 Hausdorff 거리는 주어진 점의 집합들 사이에서 기하학적 유사도만을 고려한 측도이므로 원래의 영상이 포함하고 있는 다른 정보들을 추가적으로 이용함으로 효율을 높일 수 있다. 이러한 점에 착안하여 본 논문에서는 점들 사이에 서로 다른 정도를 측정하기 위해서 거리뿐만 아니라 점들 주위의 국지적 계조패턴 정보까지 포함하는 측도를 정의함으로써 보다 정밀한 템플릿 정합결과를 얻는 방법을 제안한다.

  • PDF