• 제목/요약/키워드: data similarity

검색결과 2,059건 처리시간 0.027초

2차 텐서 기반 유사도 함수를 이용한 영상 데이터 분류 (Image Data Classification using a Similarity Function based on Second Order Tensor)

  • 윤동우;이관용;박혜영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.664-672
    • /
    • 2009
  • 최근 영상 데이터의 효율적인 표현 및 처리를 위해 텐서를 사용하는 연구가 관심을 모으고 있다. 본 연구에서는 2차 텐서로 표현된 데이터를 효과적으로 분류하기 위한 시스템을 개발하는 것을 목적으로 한다. 이를 위해 먼저 일반적인 벡터 데이터에 대해 개발되어진 클래스 요인과 환경 요인으로 이루어진 데이터 생성 모델을 확장하여 2차 텐서로 표현된 영상에 적합한 데이터 생성 모델을 정의하고, 이에 적합한 유사도 함수를 제안하였다. 제안하는 유사도 함수는 행렬정규분포를 이용하여 환경 요인의 확률분포를 추정함으로써 얻을 수 있다. 여러 벤치마크 데이터들을 이용하여 실험한 결과 2차 텐서를 사용함으로써 벡터 형태의 표현방식을 사용하는 것에 비해 분류율이 향상되었음을 확인하였다. 또한 제안하는 유사도 함수가 다른 기존의 유사도 함수에 비해 영상 데이터에 적합함을 확인할 수 있었다.

문화적 유사성이 의료관광산업에 미치는 영향에 관한 연구 (The Cultural Similarity Effects on the Industry of Medical Tourism)

  • 장준;이훈영
    • 산경연구논집
    • /
    • 제9권1호
    • /
    • pp.67-76
    • /
    • 2018
  • Purpose - With the worldwide aging problem and the development of globalization, customers prefer to seek affordable medical services with the higher quality overseas. This new trend has urged some destination countries to improve their services for the more competitive advantages over other countries. Literature research indicate that medical quality and cost may be the key factors influencing global patients' decisions. In the international environment, however, medical tourism destinations are selected due to cultural similarity between the hosting country and the customers' own country. The more similarity perceived between the two countries leads foreign patients to choose the considering country as the destination for medical tourism. However, little research has been conducted on this topic. Thus, we empirically investigate how cultural similarity influences Chinese medical customers' choice of the destinations. We also consider the factors related to medical competency and travel attribute which might affect customers' decisions along with some moderating roles of disease types. Research design, data, and methodology - We proposed a research model in order to confirm the relations among different variables of cultural similarity, medical competency, travel attractiveness, disease types, and destination choice. The questionnaire survey is processed in the more economically developed regions of China such as Beijing, Shanghai, and Jiangsu. Conditional logit regression is applied to analyze the data of 881. Results - Results indicate that cultural similarity is the important predictor of Chinese customers' decision to select a medical country. However, the effects of cultural similarity vary according to the disease types. We also find that medical competency and travel attractiveness influence their decisions with the moderating role of disease types. Conclusions - Cultural similarity is the important factor that influences Chinese potential medical tourists' decisions to select a destination. Marketing managers should consider the effects of cultural similarity when developing strategies for attracting Chinese medical tourists. Since medical competency and travel attractiveness are still the critical key elements for them to evaluate the destination countries, it is necessary to continuously improve medical service quality and facilities. The results also recommend that medical managers should sharpen their marketing strategies by segmenting Chinese potential customers in terms of disease types.

콘텐츠들 간의 유의어 태그매핑을 이용한 확장된 추천기법의 연구 (A Study of Extended Recommendation Method Using Synonym Tags Mapping Between Two Types of Contents)

  • 김지연;김영창;정종진
    • 전기학회논문지
    • /
    • 제66권1호
    • /
    • pp.82-88
    • /
    • 2017
  • Recently recommendation methods need personalization and diversity as well as accuracy whereas the traditional researches have been mainly focused on the accuracy of recommendation in terms of quality. The diversity of recommendation is also important to people in terms of quantity in addition to quality since people's desire for content consumption have been stronger rapidly than past. In this paper, we pay attention to similarity of data gathered simultaneously among different types of contents. With this motivation, we propose an enhanced recommendation method using correlation analysis with considering data similarity between two types of contents which are movie and music. Specifically, we regard folksonomy tags for music as correlated data of genres for movie even though they are different attributes depend on their contents. That is, we make result of new recommendation movie items through mapping music folksonomy tags to movie genres in addition to the recommendation items from the typical collaborative filtering. We evaluate effectiveness of our method by experiments with real data set. As the result of experimentation, we found that the diversity of recommendation could be extended by considering data similarity between music contents and movie contents.

AI-Based Project Similarity Evaluation Model Using Project Scope Statements

  • Ko, Taewoo;Jeong, H. David;Lee, JeeHee
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.284-291
    • /
    • 2022
  • Historical data from comparable projects can serve as benchmarking data for an ongoing project's planning during the project scoping phase. As project owners typically store substantial amounts of data generated throughout project life cycles in digitized databases, they can capture appropriate data to support various project planning activities by accessing digital databases. One of the most important work tasks in this process is identifying one or more past projects comparable to a new project. The uniqueness and complexity of construction projects along with unorganized data, impede the reliable identification of comparable past projects. A project scope document provides the preliminary overview of a project in terms of the extent of the project and project requirements. However, narratives and free-formatted descriptions of project scopes are a significant and time-consuming barrier if a human needs to review them and determine similar projects. This study proposes an Artificial Intelligence-driven model for analyzing project scope descriptions and evaluating project similarity using natural language processing (NLP) techniques. The proposed algorithm can intelligently a) extract major work activities from unstructured descriptions held in a database and b) quantify similarities by considering the semantic features of texts representing work activities. The proposed model enhances historical comparable project identification by systematically analyzing project scopes.

  • PDF

Using Genre Rating Information for Similarity Estimation in Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권12호
    • /
    • pp.93-100
    • /
    • 2019
  • 유사도 계산은 메모리 기반 협력필터링 시스템의 성능에 매우 중요하다. 이 시스템들은 사용자 평가치들을 이용하여 온라인 상업 사이트에서 고객들에게 상품을 추천한다. 더욱 적합한 추천을 위해 현 사용자와 가장 유사한 사용자들을 선정하여 참조한다. 기존 문헌에는 많은 유사도 척도들이 개발되었는데, 이들은 대개 데이터 희소성이나 완전 시작 문제를 내포하고 있다. 본 논문에서는 기존 척도들과는 달리 사용자 평가치들로부터 선호 정보를 최대한 추출함으로써 희소한 데이터 조건에서도 더욱 신뢰할 수 있는 유사도값을 산출하고자 한다. 사용자 평가치 뿐만 아니라 데이터셋이 제공하는 영화장르 정보를 이용하는 새로운 유사도 척도를 제시한다. 본 척도와 기존의 관련된 척도들의 성능 실험을 하였고, 그 결과, 제안 척도는 주요 성능 평가기준 상으로 더욱 우수하거나 유사한 성능 결과를 보임을 확인하였다.

범주형 시퀀스 데이터의 K-Nearest Neighbor알고리즘 (A K-Nearest Neighbor Algorithm for Categorical Sequence Data)

  • 오승준
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.215-221
    • /
    • 2005
  • 최근에는 단백질 시퀀스, 소매점 거래 데이터, 웹 로그 등과 같은 상업적이거나 과학적인 데이터의 폭발적인 증가를 볼 수 있다. 이런 데이터들은 순서적인 면을 가지고 있는 시퀀스 데이터들이다. 본 논문에서는 이런 시퀀스 데이터들을 분류하는 문제를 다룬다. 분류 기법 으로는 의사결정 나무나 베이지안 분류기, K-NN방법 등 석러 종류가 있는데, 본 연구에서는 또-U방법을 이용하여 시퀀스들을 분류한다. 또한, 시퀀스들간의 유사도를 구하기 위한 새로운 계산 방법과 효율적인 계산 방법도 제안한다.

  • PDF

AMI시스템에서 유사도를 활용한 누락데이터 보정 방법 (Estimate method of missing data using Similarity in AMI system)

  • 권혁록;홍택은;김판구
    • 스마트미디어저널
    • /
    • 제8권4호
    • /
    • pp.80-84
    • /
    • 2019
  • AMI가 확대보급이 빠르게 진행되고 있고, 이에 따라 전력사용 데이터를 활용한 다양한 서비스들이 늘어나고 있다. 이러한 서비스를 효용성을 높이기 위해서 누락된 계량데이터들을 보정할 필요가 있다. 본 논문에서는 누락된 계량데이터의 보정을 위해서 유클리디안 유사도를 이용하여 사용량 패턴이 유사한 고객을 찾아 누락데이터를 보정하는 방식을 제안하고 선행 방식과의 비교자료를 제공한다.

협업 필터링을 사용한 유사도 기법 및 커뮤니티 검출 알고리즘 비교 (Comparison of similarity measures and community detection algorithms using collaboration filtering)

  • 일홈존;홍민표;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.366-369
    • /
    • 2022
  • The glut of information aggravated the process of data analysis and other procedures including data mining. Many algorithms were devised in Big Data and Data Mining to solve such an intricate problem. In this paper, we conducted research about the comparison of several similarity measures and community detection algorithms in collaborative filtering for movie recommendation systems. Movielense data set was used to do an empirical experiment. We applied three different similarity measures: Cosine, Euclidean, and Pearson. Moreover, betweenness and eigenvector centrality were used to detect communities from the network. As a result, we elucidated which algorithm is more suitable than its counterpart in terms of recommendation accuracy.

Learning Free Energy Kernel for Image Retrieval

  • Wang, Cungang;Wang, Bin;Zheng, Liping
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2895-2912
    • /
    • 2014
  • Content-based image retrieval has been the most important technique for managing huge amount of images. The fundamental yet highly challenging problem in this field is how to measure the content-level similarity based on the low-level image features. The primary difficulties lie in the great variance within images, e.g. background, illumination, viewpoint and pose. Intuitively, an ideal similarity measure should be able to adapt the data distribution, discover and highlight the content-level information, and be robust to those variances. Motivated by these observations, we in this paper propose a probabilistic similarity learning approach. We first model the distribution of low-level image features and derive the free energy kernel (FEK), i.e., similarity measure, based on the distribution. Then, we propose a learning approach for the derived kernel, under the criterion that the kernel outputs high similarity for those images sharing the same class labels and output low similarity for those without the same label. The advantages of the proposed approach, in comparison with previous approaches, are threefold. (1) With the ability inherited from probabilistic models, the similarity measure can well adapt to data distribution. (2) Benefitting from the content-level hidden variables within the probabilistic models, the similarity measure is able to capture content-level cues. (3) It fully exploits class label in the supervised learning procedure. The proposed approach is extensively evaluated on two well-known databases. It achieves highly competitive performance on most experiments, which validates its advantages.

Applying Different Similarity Measures based on Jaccard Index in Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.47-53
    • /
    • 2021
  • 희소한 평가 데이터는 사용자들 간의 신뢰할만한 유사도 산출을 저해하기 때문에 추천 시스템을 위한 메모리 기반의 협력 필터링 기법의 성능을 저하시킨다. 기존 연구의 많은 결과물은 이 데이터 희소성 문제를 해결하기 위해 개발되었으며, 가장 단순하고 대표적인 업적은 자카드 계수를 활용하는 방법들이다. 이 계수는 두 사용자의 공통 평가 항목수를 반영하며, 그들 간의 유사도를 보다 정확하게 계산하기 위해 전통적인 유사도 척도와 통합된다. 그러나, 그러한 통합은 데이터 희소성의 정도를 고려하지 않은 매우 단순한 방법이다. 본 연구는 두 사용자의 자카드 계수값에 의거하여 다른 유사도 척도를 적용하는 새로운 아이디어를 제시한다. 제안 방법에서 사용하는 파라미터의 최적값을 구하기 위하여 성능 실험을 진행하였고, 다른 관련된 방법들과 비교 평가하였다. 결과로서, 제안 방법은 예측 정확도와 추천 정확도에 있어서 가장 우수하거나 대등한 성능을 보였다.