• 제목/요약/키워드: Similarity Measurement

검색결과 352건 처리시간 0.028초

Robust Image Similarity Measurement based on MR Physical Information

  • Eun, Sung-Jong;Jung, Eun-Young;Park, Dong Kyun;Whangbo, Taeg-Keun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4461-4475
    • /
    • 2017
  • Recently, introduction of the hospital information system has remarkably improved the efficiency of health care services within hospitals. Due to improvement of the hospital information system, the issue of integration of medical information has emerged, and attempts to achieve it have been made. However, as a preceding step for integration of medical information, the problem of searching the same patient should be solved first, and studies on patient identification algorithm are required. As a typical case, similarity can be calculated through MPI (Master Patient Index) module, by comparing various fields such as patient's basic information and treatment information, etc. but it has many problems including the language system not suitable to Korean, estimation of an optimal weight by field, etc. This paper proposes a method searching the same patient using MRI information besides patient's field information as a supplementary method to increase the accuracy of matching algorithm such as MPI, etc. Unlike existing methods only using image information, upon identifying a patient, a highest weight was given to physical information of medical image and set as an unchangeable unique value, and as a result a high accuracy was detected. We aim to use the similarity measurement result as secondary measures in identifying a patient in the future.

절차지향 소프트웨어로부터 클래스와 상속성 추출 (Extraction of Classes and Hierarchy from Procedural Software)

  • 최정란;박성옥;이문근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권9호
    • /
    • pp.612-628
    • /
    • 2001
  • 본 논문은 절차지향 소프트웨어로부터 클래스와 상속성을 추출하기 위한 방법론을 제안한다. 본 논문에서 제안한 방법론은 모든 경우의 객체 후보군으로부터 정의된 클래스 후보군과 그들의 상속성을 생성하여 클래스 후보군과 영역 모델 사이의 관계성과 유서 정도를 가지고 최고 또는 최적의 클래스 후보군을 선택하는데 초점을 둔다. 클래스와 상속성 추출 방법론은 다음과 같은 두드러진 특징을 가지고 있다. 정적(속성)과 동적(메소드)인 클러스터링 방법을 사용하고, 클래스 후보군의 경우는 추상화에 초점을 두며, m개의 클래스 후보군과 n개의 클래스 후보 사이의 상속 관계의 유사도 측정 즉, 2차원적 유사도 측정은 m개의 클래스 후보와 n개의 클래스 후보 사이의 전체 그룹에 대한 유사도를 구하는 수평적 측정과 클래스 후보군들에서 상속성을 가진 클래스의 집합과 영역 모델에서 같은 클래스 상속성을 가진 클래스 집합 사이의 유사도를 위한 수직적 측정방법이 있다. 이러한 방법론은 최고 또는 최적의 클래스 후보군을 선택하기 위해 제공학 전문가에게 광범위하고 통합적인 환경을 제시하고 있다.

  • PDF

과제 유사도 측정 개선모형에 관한 실증적 연구 (An Empirical Study on Improvement model for Measuring of Project Similarity)

  • 정옥남;류성열;김종배
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.457-465
    • /
    • 2011
  • 지난 5년간 우리나라 R&D투자는 연평균 12.2%씩 증가하고 있다. 연구개발 중복 투자 방지와 독창성 도출을 위해서는 유사 중복과제 수행의 사전방지가 필요하고, 이를 위해 과제 유사도의 정확도를 개선할 필요가 있다. 본 논문에서는 유사 중복과제 수행의 사전방지를 위한 과제 유사도 측정 개선모형을 제안한다. 과제 유사도 측정 개선모형은 크게 두 단계로 정의된다. 먼저 추출단계에서 Document Vector를 기반으로 한 검색엔진에 연구보고서 초록을 추가한다. 다음은 분석단계에서 과제 키워드에서 복합 키워드 중심으로 생성한 과제의 연구주제망과 항목별 가중치를 활용하여 유사도를 측정한다. 실험결과 과제정보만을 활용한 기존방식보다 연구보고서 초록을 활용한 개선모형의 유사도가 평균 0.19이상 개선되었고, 단순키워드를 활용한 기존방식보다 복합 키워드 기반의 연구주제망과 항목별 가중치를 활용한 개선모형의 유사도가 평균 9.25이상 감소되었다. 연구보고서 초록이 유사도에 영향을 미치고 있고, 복합 키워드 기반의 연구주제망을 활용함으로써 유사도에 대한 정확도를 판단할 수 있는 범위가 확대되는 것을 확인하였다. 또한, 추가된 사항의 폭이 넓으면 넓을수록 유사도의 정확도가 높아지는 것과 과제정보 등 검색대상의 모집단이 클수록 과제 유사도의 정확도가 높아지는 것도 실험을 통해 확인하였다.

메소드 참조 빈도와 매니페스트 정보를 이용한 안드로이드 애플리케이션들의 유사도 측정 (Measuring Similarity of Android Applications Using Method Reference Frequency and Manifest Information)

  • 김규식;마수드;조성제;김성백
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권3호
    • /
    • pp.15-25
    • /
    • 2017
  • 소프트웨어 가치와 중요성이 커짐에 따라 소프트웨어의 도용이 증가하고 있어 이에 대한 대책으로 소프트웨어 도용을 정확히 탐지하는 방안이 필요하다. 특히 안드로이드 앱의 경우, 소프트웨어 도용이 상대적으로 용이한 반면 안드로이드 마켓 상에서는 불법 앱에 대한 적절한 검수를 수행하지 않고 있다. 이에 본 논문에서는 소프트웨어 도용을 탐지하기 위해 실행파일 수준에서 안드로이드 앱 간의 유사도를 효과적으로 측정하는 기법을 제안한다. 제안 기법은 유사도 측정을 위한 주요 특징정보로, 안드로이드 앱의 실행파일을 정적으로 분석하여 메소드 참조 빈도와 매니페스트 정보를 추출한다. 각 앱을 이 두 가지 특징정보들의 n-차원 벡터로 표시하고, 코사인 유사도를 사용하여 두 앱의 유사도를 측정한다. 제안 기법을 검증하기 위해 대표적인 소스코드 기반의 유사도 측정 기법과 본 논문에서 제안한 기법을 비교 평가한다. 소스파일과 실행파일이 함께 주어진 안드로이드 앱을 대상으로 진행한 실험에서, 본 논문에서 제안한 실행파일 수준의 유사도 측정 결과와 기존의 잘 알려진 소스파일 수준의 유사도 측정 결과가 동등한 수준으로 나왔다.

소셜 네트워크에서 감정단어의 단계별 코사인 유사도 기법을 이용한 추천시스템 (Personalized Recommendation System using Level of Cosine Similarity of Emotion Word from Social Network)

  • 권응주;김종우;허노정;강상길
    • 정보화연구
    • /
    • 제9권3호
    • /
    • pp.333-344
    • /
    • 2012
  • 본 논문에서는 개인의 취향과 관심이 반영 되어있는 소셜 정보를 활용하여 사용자에게 영화를 추천할 수 있는 시스템을 제안하였다. 시스템에서 데이터 구축은 포털사이트에서 영화 정보를 수집하고 페이스북과 트위터 같은 SNS를 통해 소셜 정보를 수집한다. 본 논문에서는 사용자의 감정에 따른 보다 정교한 처리를 위하여 6단계의 감정단계로 분류한 소셜 정보의 벡터공간 모형의 구축방법을 제안한다. 추천을 위한 유사도 측도 방법은 2단계로 구성되어 있다. 첫 번째는 일반적인 코사인 측도를 통한 영화 목록의 구축 단계이고, 두 번째는 기존의 코사인 측도(Cosine measure)를 활용한 좌표평면에서 감정 단계별 벡터 정보 표현 방법 및 유사도 측도 방법을 통해 추천 영화 목록의 결정 단계이다. 본 논문의 추천 시스템의 성능을 평가하기 위하여 기존의 추천 시스템과 비교 실험을 통하여 본 연구의 추천 시스템의 유용성을 검증하였다.

LOD-기반 추천 시스템에서 LOD 그래프에 가중치를 사용한 의미 거리 측정 모델 (A Semantic Distance Measurement Model using Weights on the LOD Graph in an LOD-based Recommender System)

  • 허원회
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.53-60
    • /
    • 2021
  • LOD-기반 추천 시스템은 보통 DBpedia와 같은 LOD 데이터세트 내에서 사용가능한 데이터를 활용하여 최종 사용자에게 영화, 책, 음악과 같은 아이템을 추천한다. 이러한 시스템은 링크드 데이터 리소스 쌍 간의 일치 정도를 측정하는 의미 유사도 알고리즘을 사용한다. 이 논문에서는 LOD 그래프의 링크에 사용자 평가 등급을 변환한 가중치를 할당하여 LOD-기반 추천 시스템에서 의미 거리를 측정하는 새로운 접근방식을 제안했다. 이 논문에서 제안된 의미 거리 측정 모델은 가중치 계산을 통해 그래프가 사용자에게 개인화되는 처리 단계와 이러한 가중치를 LDSD에 적용하는 방법을 기반으로 한다. 실험 결과는 다른 유사한 방법들과 비교하여 제안된 방법이 더 높은 정확도를 보였으며, 추천 시스템의 의미 거리 측정의 범위를 넓혀서 유사도 향상에 기여하였다. 향후 연구로는 다른 방법의 LOD-기반 유사도 측정을 사용하여 모델에 미치는 영향을 분석하는 것을 목표로 한다.

A Density Peak Clustering Algorithm Based on Information Bottleneck

  • Yongli Liu;Congcong Zhao;Hao Chao
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.778-790
    • /
    • 2023
  • Although density peak clustering can often easily yield excellent results, there is still room for improvement when dealing with complex, high-dimensional datasets. One of the main limitations of this algorithm is its reliance on geometric distance as the sole similarity measurement. To address this limitation, we draw inspiration from the information bottleneck theory, and propose a novel density peak clustering algorithm that incorporates this theory as a similarity measure. Specifically, our algorithm utilizes the joint probability distribution between data objects and feature information, and employs the loss of mutual information as the measurement standard. This approach not only eliminates the potential for subjective error in selecting similarity method, but also enhances performance on datasets with multiple centers and high dimensionality. To evaluate the effectiveness of our algorithm, we conducted experiments using ten carefully selected datasets and compared the results with three other algorithms. The experimental results demonstrate that our information bottleneck-based density peaks clustering (IBDPC) algorithm consistently achieves high levels of accuracy, highlighting its potential as a valuable tool for data clustering tasks.

Similarity Analysis of Hospitalization using Crowding Distance

  • Jung, Yong Gyu;Choi, Young Jin;Cha, Byeong Heon
    • International journal of advanced smart convergence
    • /
    • 제5권2호
    • /
    • pp.53-58
    • /
    • 2016
  • With the growing use of big data and data mining, it serves to understand how such techniques can be used to understand various relationships in the healthcare field. This study uses hierarchical methods of data analysis to explore similarities in hospitalization across several New York state counties. The study utilized methods of measuring crowding distance of data for age-specific hospitalization period. Crowding distance is defined as the longest distance, or least similarity, between urban cities. It is expected that the city of Clinton have the greatest distance, while Albany the other cities are closer because they are connected by the shortest distance to each step. Similarities were stronger across hospital stays categorized by age. Hierarchical clustering can be applied to predict the similarity of data across the 10 cities of hospitalization with the measurement of crowding distance. In order to enhance the performance of hierarchical clustering, comparison can be made across congestion distance when crowding distance is applied first through the application of converting text to an attribute vector. Measurements of similarity between two objects are dependent on the measurement method used in clustering but is distinguished from the similarity of the distance; where the smaller the distance value the more similar two things are to one other. By applying this specific technique, it is found that the distance between crowding is reduced consistently in relationship to similarity between the data increases to enhance the performance of the experiments through the application of special techniques. Furthermore, through the similarity by city hospitalization period, when the construction of hospital wards in cities, by referring to results of experiments, or predict possible will land to the extent of the size of the hospital facilities hospital stay is expected to be useful in efficiently managing the patient in a similar area.

유사성(類似性) 판단(判斷)과 검사수행도(檢査遂行度)에 관한 연구 (An Effect of Similarity Judgement on Human Performance in Inspection Tasks)

  • 손일문;이동춘;이상도
    • 품질경영학회지
    • /
    • 제20권2호
    • /
    • pp.109-117
    • /
    • 1992
  • An inspection task largely can be seen as a job divided up into a series of visual search and classification subtasks. In these subtasks, an Inspector must performs to compare the standard references proposed in visual environments and recalled in his memory with the visual stimuli to be inspected. It means that the judgement of similarity should be demanded on inspection tasks. Therefore, the inspector's ability for the judgement of similarity and the difference similarity between inspection materials are important factors to effect on performances in inspection tasks. In this paper, to analysis the effect of these factors on inspection time, an inspection task is designed and suggested by means of computer simulator. Especially, the skin conductance responses(SCR) of subjects are measured to evaluate the complexity of tasks due to the difference of similarity between materials. In the results of experiment, the more similar or different the difference of similarity between materials is, the shorter the inspection time is because of the reduction of task complexity. And, When the inspector's cognition for similarity between materials is consistanct, the inpsection time is improved. Concludingly, the consistency of reponses for similarity judgement becomes a measurement to present the performance levels. And the information of inspection time that due to the difference of similarity between materials must be considered in planning and scheduling inspection tasks.

  • PDF

온톨로지를 이용한 선박 통관 프로세스의 유사성 측정 (Similarity Measurement Using Ontology in Vessel Clearance Process)

  • 베르나르도;박재훈;배혜림;모정관
    • 대한산업공학회지
    • /
    • 제37권2호
    • /
    • pp.153-162
    • /
    • 2011
  • The demands of complicated data communications have issued a new challenge to port logistics systems. Customers expect ports to handle their generated administrative data while a vessel is docked in a port. One port logistics system, known as the Vessel Clearance Process (VCP), manages large numbers of documents related to port of entry. In the VCP, information flows through many organizations such as the port authority, shipping agents, marine offices, immigration offices, and others. Therefore, for effective management of the Business Process (BP) of the VCP, a standardized method of BP modeling is essential, especially in heterogeneous system environments. In a port, according to port policy, terms and data are sued that are similar to but different from those of other logistics partners, which hinders standardized modeling of the BP. In order to avoid tedious and time-consuming document customization work, more convenient modeling of BP for VCP is essential. This paper proposes an ontology-based process similarity measurement to assist designer for process modeling in port domain, especially VCP. We expect that this methodology will use convenient and quick modeling of port business processes.