• 제목/요약/키워드: Data similarity

검색결과 2,067건 처리시간 0.024초

퍼지 관계를 활용한 사례기반추론 예측 정확성 향상에 관한 연구 (A Study on Forecasting Accuracy Improvement of Case Based Reasoning Approach Using Fuzzy Relation)

  • 이인호;신경식
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.67-84
    • /
    • 2010
  • 미래에 대한 정확한 예측은 경영자, 또는 기업이 수행하는 경영의사결정에 매우 중요한 역할을 한다. 예측만 정확하다면 경영의사결정의 질은 매우 높아질 수 있을 것이다. 하지만 점점 가속화되고 있는 경영 환경의 변화로 말미암아 미래 예측을 정확하게 하는 일은 점점 더 어려워지고 있다. 이에 기업에서는 정확한 예측을 위하여 전문가의 휴리스틱뿐만 아니라 과학적 예측모형을 함께 활용하여 예측의 성과를 높이는 노력을 해 오고 있다. 본 연구는 사례기반추론모형을 예측을 위한 기본 모형으로 설정하고, 데이터 간의 유사도 측정에 퍼지 관계의 개념을 적용함으로써 개선된 예측성과를 얻고자 하였다. 특히, 독립변수 중 기호 데이터 형식의 속성을 가지는 변수들간의 유사도를 측정하기 위해 이진논리의 개념(일치여부의 판단)과 퍼지 관계 및 합성의 개념을 이용하여 도출된 유사도 매트릭스를 사용하였다. 연구 결과, 기호 데이터 형식의 속성을 가지는 변수들 간의 유사도 측정에서 퍼지 관계 및 합성의 개념을 적용하는 방법이 이진논리의 개념을 적용하는 방법과 비교하여 더 우수한 예측정확성을 나타내었다. 그러나 유사도 측정을 위해 다양한 퍼지합성방법(Max-min 합성, Max-product 합성, Max-average 합성)을 적용하여 예측하는 경우에는 예측정확성 측면에서 퍼지 합성방법 간의 통계적인 차이는 유의하지 않았다. 본 연구는 사례기반추론 모형의 구축에서 가장 중요한 유사도 측정에 있어서 퍼지 관계 및 퍼지 합성의 개념을 적용함으로써 유사도 측정 및 적용 방법론을 제시하였다는데 의의가 있다.

A Table Integration Technique Using Query Similarity Analysis

  • Choi, Go-Bong;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권3호
    • /
    • pp.105-112
    • /
    • 2019
  • In this paper, we propose a technique to analyze similarity between SQL queries and to assist integrating similar tables. First, the table information was extracted from the SQL queries through the query structure analyzer, and the similarity between the tables was measured using the Jacquard index technique. Then, similar table clusters are generated through hierarchical cluster analysis method and the co-occurence probability of the table used in the query is calculated. The possibility of integrating similar tables is classified by using the possibility of co-occurence of similarity table and table, and classifying them into an integrable cluster, a cluster requiring expert review, and a cluster with low integration possibility. This technique analyzes the SQL query in practice and analyse the possibility of table integration independent of the existing business, so that the existing schema can be effectively reconstructed without interruption of work or additional cost.

Collaborative Filtering Algorithm Based on User-Item Attribute Preference

  • Ji, JiaQi;Chung, Yeongjee
    • Journal of information and communication convergence engineering
    • /
    • 제17권2호
    • /
    • pp.135-141
    • /
    • 2019
  • Collaborative filtering algorithms often encounter data sparsity issues. To overcome this issue, auxiliary information of relevant items is analyzed and an item attribute matrix is derived. In this study, we combine the user-item attribute preference with the traditional similarity calculation method to develop an improved similarity calculation approach and use weights to control the importance of these two elements. A collaborative filtering algorithm based on user-item attribute preference is proposed. The experimental results show that the performance of the recommender system is the most optimal when the weight of traditional similarity is equal to that of user-item attribute preference similarity. Although the rating-matrix is sparse, better recommendation results can be obtained by adding a suitable proportion of user-item attribute preference similarity. Moreover, the mean absolute error of the proposed approach is less than that of two traditional collaborative filtering algorithms.

Comparison Analysis of Co-authorship Network and Citation Based Network for Author Research Similarity Exploration

  • 윤지영;송민
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.269-284
    • /
    • 2022
  • Exploring research similarity of researchers offers insight on research communities and potential interactions among scholars. While co-authorship is a popular measure for studying research similarity of researchers, it cannot provide insight on authors who have not collaborated yet. In this work, we present novel approach to capture research similarity of authors using citation information. Extensive study is conducted on DATA & KNOWLEDGE ENGINEERING (DKE) publications to demonstrate and compare suggested approach with co-authorship based approach. Analysis result shows that proposed approach distinguishes author relationships that is not shown in co-authorship network.

Acceleration sensor, and embedded system using location-aware

  • He, Wei;Nayel, Mohamed
    • 중소기업융합학회논문지
    • /
    • 제3권1호
    • /
    • pp.23-30
    • /
    • 2013
  • 본 논문에서는 실제 값과 같은 데이터의 불확실성과 유사성을 측정 할 수 있는 퍼지 엔트로피와 유사성 측정이 소개되고 있다. 퍼지 엔트로피와 유사성 측정의 디자인이 설명하고 입증했다. 획득 수단은 연산 프로세스에 적용되고 논의되었다. 이러한 의사 결정과 퍼지 게임 이론과 같은 데이터 정량화 결과의 연장도 논의되었다.

  • PDF

인자분석과 다효원척를 이용한 스피이커의 음질평가 (The assessment of sound quality of loudspeaker system by using factor analysis and muliti-dimensional scaling)

  • 황영수;김영일;차일환
    • 한국음향학회지
    • /
    • 제3권1호
    • /
    • pp.16-24
    • /
    • 1984
  • The objective data and subjective data correlated in order to rate sound quality of loudspeaker system and these data were analyzed by the Factor Analysis and Multi-Dimensioinal Scaling. The dimensions yielded Factor Analysis were interpreted as "Contrast", "Metallic", "Rich", "Present" and their relation to physical variables were explored by studying the positions of loudspeaker systems in the respective dimension. When the subjective similarity degree of loudspeaker systems was compared with the objective similarity degree of loudspeaker systems by Multi-Dimensional Scaling, the similarity degree of sound pressure response in the listening room closely coincided with the subjective similarity degree regardless of sound source. This result implies the necessity of measurements taken not only in an anechoic room but also in a listening room in order to rate sound quality of loudspeaker systems.

  • PDF

순차 데이터간의 유사도 표현에 의한 동영상 분류 (Video Classification System Based on Similarity Representation Among Sequential Data)

  • 이호석;양지훈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권1호
    • /
    • pp.1-8
    • /
    • 2018
  • 동영상 데이터는 시간에 따른 정보는 물론이고, 많은 정보량과 함께 잡음도 포함하고 있기 때문에 이에 대한 간단한 표현을 학습하는 것은 쉽지 않다. 본 연구에서는 이와 같은 동영상 데이터를 추상적이면서 보다 간단하게 표현할 수 있는 순차 데이터간의 유사도 표현 방법과 딥러닝 학습방법을 제안한다. 이는 동영상을 구성하는 이미지 데이터 벡터들 사이의 유사도를 내적으로 표현할 때 그것들이 서로 최대한의 정보를 가질 수 있도록 하는 함수를 구하고 학습하는 것이다. 실제 데이터를 통하여 제안된 방법이 기존의 동영상 분류 방법들보다도 뛰어난 분류 성능을 보임을 확인하였다.

속성유사도에 따른 사회연결망 서브그룹의 군집유효성 (Clustering Validity of Social Network Subgroup Using Attribute Similarity)

  • 윤한성
    • 디지털산업정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.75-84
    • /
    • 2021
  • For analyzing big data, the social network is increasingly being utilized through relational data, which means the connection characteristics between entities such as people and objects. When the relational data does not exist directly, a social network can be configured by calculating relational data such as attribute similarity from attribute data of entities and using it as links. In this paper, the composition method of the social network using the attribute similarity between entities as a connection relationship, and the clustering method using subgroups for the configured social network are suggested, and the clustering effectiveness of the clustering results is evaluated. The analysis results can vary depending on the type and characteristics of the data to be analyzed, the type of attribute similarity selected, and the criterion value. In addition, the clustering effectiveness may not be consistent depending on the its evaluation method. Therefore, selections and experiments are necessary for better analysis results. Since the analysis results may be different depending on the type and characteristics of the analysis target, options for clustering, etc., there is a limitation. In addition, for performance evaluation of clustering, a study is needed to compare the method of this paper with the conventional method such as k-means.

On the Effect of Significance of Correlation Coefficient for Recommender System

  • Lee, Hee-Choon
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1129-1139
    • /
    • 2006
  • Pearson's correlation coefficient and vector similarity are generally applied to The users' similarity weight of user based recommender system. This study is needed to find that the correlation coefficient of similarity weight is effected by the number of pair response and significance probability. From the classified correlation coefficient by the significance probability test on the correlation coefficient and pair of response, the change of MAE is studied by comparing the predicted precision of the two. The results are experimentally related with the change of MAE from the significant correlation coefficient and the number of pair response.

  • PDF

2차 텐서 기반 유사도 함수를 이용한 영상 데이터 분류 (Image Data Classification using a Similarity Function based on Second Order Tensor)

  • 윤동우;이관용;박혜영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.664-672
    • /
    • 2009
  • 최근 영상 데이터의 효율적인 표현 및 처리를 위해 텐서를 사용하는 연구가 관심을 모으고 있다. 본 연구에서는 2차 텐서로 표현된 데이터를 효과적으로 분류하기 위한 시스템을 개발하는 것을 목적으로 한다. 이를 위해 먼저 일반적인 벡터 데이터에 대해 개발되어진 클래스 요인과 환경 요인으로 이루어진 데이터 생성 모델을 확장하여 2차 텐서로 표현된 영상에 적합한 데이터 생성 모델을 정의하고, 이에 적합한 유사도 함수를 제안하였다. 제안하는 유사도 함수는 행렬정규분포를 이용하여 환경 요인의 확률분포를 추정함으로써 얻을 수 있다. 여러 벤치마크 데이터들을 이용하여 실험한 결과 2차 텐서를 사용함으로써 벡터 형태의 표현방식을 사용하는 것에 비해 분류율이 향상되었음을 확인하였다. 또한 제안하는 유사도 함수가 다른 기존의 유사도 함수에 비해 영상 데이터에 적합함을 확인할 수 있었다.