• 제목/요약/키워드: Similarity evaluation

검색결과 621건 처리시간 0.023초

프로그램 유사도 평가 알고리즘 (A Program Similarity Evaluation Algorithm)

  • 김영철;황석찬;최재영
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.51-64
    • /
    • 2005
  • 본 논문에서는 서로 다른 두 개의 C 프로그램의 구문트리를 이용하여 유사도를 평가하는 시스템을 제시한다. 구문 트리를 이용하는 방법은 기존의 유사도 평가 방법과는 달리 들여쓰기, 여백, 설명문 등 프로그램과 무관한 프로그램 스타일의 변화에 민감하지 않으며, 문장, 코드 블록, 함수 등의 순서 바꾸기 같은 제어 구조의 변경에 민감하지 않은 특징을 가지고 있다. 그리고 프로그램을 파싱함으로써 구문 오류도 함께 검사찬 수 있는 장점을 제공한다. 논문에서는 유사도를 평가하기 위한 알고리즘과 함께 프로그램의 비교횟수를 줄이기 위한 그룹 짓기 알고리즘도 같이 제공한다. 실험부분에서는 구문트리 비교방법을 이용한 프로그램의 유사도 평가 결과와, 그룹 짓기를 수행한 후에 많은 비교 횟수를 줄일 수 있다는 것을 보여준다.

  • PDF

악성코드 유사도 측정 기법의 성능 평가 모델 개발 (Development of a Performance Evaluation Model on Similarity Measurement Method of Malware)

  • 천성택;김희석;임광혁;김규일;서창호
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.32-40
    • /
    • 2014
  • 날로 급증하는 대량의 악성코드들을 분류하여 악성코드에 대한 분석시간을 단축하고 신종의 악성코드를 발견하기 위한 악성코드 분류의 필요성이 대두됨에 따라 대량의 악성코드들을 분류하기 위한 다양한 악성코드 유사도 측정 기법이 제안되고 있다. 하지만 제안된 기존 연구들은 대부분 유사도 측정 기법을 소개하고 해당 기법에 의한 악성코드 분류 결과만을 제시하고 있으며, 다른 유사도 측정 기법과의 성능 비교 결과는 제시하지 않는다. 이는 유사도 측정 기법의 성능을 비교할 수 있는 평가 모델이 존재하지 않기 때문이다. 본 논문에서는 다양한 악성코드 유사도 측정 기법들의 성능을 비교 및 평가할 수 있는 악성코드 유사도 측정기법의 성능평가 모델로 성공확률과 신뢰도의 두 지표를 제안한다. 또한 본 논문에서는 두 지표를 이용해 기존 유사도 측정 기법들의 성능을 비교 및 평가한다.

Objective Material analysis to the device with IoT Framework System

  • Lee, KyuTae;Ki, Jang Geun
    • International Journal of Advanced Culture Technology
    • /
    • 제8권2호
    • /
    • pp.289-296
    • /
    • 2020
  • Software copyright are written in text form of documents and stored as files, so it is easy to expose on an illegal copyright. The IOT framework configuration and service environment are also evaluated in software structure and revealed to replication environments. Illegal copyright can be easily created by intelligently modifying the program code in the framework system. This paper deals with similarity comparison to determine the suspicion of illegal copying. In general, original source code should be provided for similarity comparison on both. However, recently, the suspected developer have refused to provide the source code, and comparative evaluation are performed only with executable code. This study dealt with how to analyze the similarity with the execution code and the circuit configuration and interface state of the system without the original source code. In this paper, we propose a method of analyzing the data of the object without source code and verifying the similarity comparison result through evaluation examples.

한글의 미적 평가를 위한 특징 추출 및 유사도 함수 정의 (Feature Extraction and Similarity Measure Function Define For Beauty Evaluation of Korean Character)

  • 한군희;오명관;이형우;전병민
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.59-67
    • /
    • 2002
  • 본 논문에서는 입력의 자동화 및 교육을 위한 문자 익히기 시스템을 위하여 자소의 특징 추출과 유사도 함수를 정의하여 한글에 대한 미적평가를 수행하였다. 이를 위해 한글 문자의 자소에 대한 특징 추출 및 유사도 함수를 정의 한 후 표준 문자와 입력 문자가 얼마나 유사한지를 평가하는 방법을 제안하였다. 표준 문자와 입력 문자의 획에 대한 특징 추출 및 유사도 함수를 정의하였으며, 다양한 입력 문자 패턴에 대해 표준 문자 패턴과 얼마나 유사한지를 실험한 결과 예상한 값과 유사하게 일치하는 실험 결과를 얻을 수 있었다. 또한 일반 사람들의 미적 평가 결과와 제안한 방법의 실험 결과가 유사하게 일치한다는 결과도 얻을 수 있었다.

  • PDF

Evaluation of certainty and uncertainty for Intuitionistic Fuzzy Sets

  • Wang, Hong-Mei;Lee, Sang-Hyuk
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제10권4호
    • /
    • pp.259-262
    • /
    • 2010
  • Study about fuzzy entropy and similarity measure on intuitionistic fuzzy sets (IFSs) were proposed, and analyzed. Unlike fuzzy set, IFSs contains uncertainty named hesistancy, which is contained in fuzzy membership function itself. Hence, designing fuzzy entropy is not easy because of ununified entropy definition. By considering different fuzzy entropy definitions, fuzzy entropy is designed and discussed their relation. Similarity measure was also presented and verified its usefulness to evaluate degree of similarity.

관성센서를 이용한 양궁자세 분석 시스템 구축 및 평가 (Development and Evaluation Archery Posture Analysis System using Inertial Sensor)

  • 조우형;권성호;권장우;이상민
    • 전기학회논문지
    • /
    • 제65권10호
    • /
    • pp.1746-1754
    • /
    • 2016
  • In this paper, we provide a development and evaluation method for an archery posture analyzing system, using an inertial sensor. The system was developed using LabVIEW2014 by National Instruments and evaluated using the DTW algorithm. To convert the voltage value of the inertial sensor into a physical value, a coordinate transformation matrix bias was applied. To evaluate the similarity of movement in archery shooting, the DTW distance was calculated and similarity was confirmed based on simple mechanical movement, the same person's shooting movement, shooting movement with another person, and the noise signal. The average similarity comparison results were as follows: simple mechanical movement was 17.05%, the same person's shooting movement was 26.48%, shooting movement with another person was 62.8%, and the noise signal was 328.5%; a smaller value indicates a higher level of similarity. We confirmed the possibility of analyzing the archery posture using 3-axis acceleration of the inertial sensor. We inferred that the proposed method might be important means for assessing shooting skills, evaluation of archer's progress, and finding talented archers in advance.

구문트리에서 키워드 추출을 이용한 프로그램 유사도 평가 (A Program Similarity Evaluation using Keyword Extraction on Abstract Syntax Tree)

  • 김영철;최재영
    • 정보처리학회논문지A
    • /
    • 제12A권2호
    • /
    • pp.109-116
    • /
    • 2005
  • 본 논문에서는 프로그램의 분석 과정에서 생성된 구문트리에서 키워드만을 추출하여 유사도 평가하는 방법을 소개한다. 이 방법은 기존의 구조 기반 방법과 같이 프로그램 구조적 특징에 상관없이 유사도를 평가한 수 있으며, 구문트리의 키워드만을 평가에 이용함으로써 기존 시스템의 단점이었던 속도를 개선할 수 있었다. 따라서 본 논문에서는 유사도 평가 모델을 제시하고, 생성된 구문트리에서 키워드를 추출하는 방법을 제시하였다. 본 논문의 평가 부분에서는 기존 시스템에 비해 본 시스템이 구조적 특징이나 속도 면에서 많이 개선되었다는 것을 보여주었다. 따라서 본 시스템은 향후에 텍스트 위주의 문서의 유사도나 XML과 같은 전자 문서의 유사도 평가에 지대한 영향을 줄 것으로 기대된다.

협업필터링의 희박 행렬 문제를 위한 이행적 유사도 평가 모델 (Transitive Similarity Evaluation Model for Improving Sparsity in Collaborative Filtering)

  • 배은영;유석종
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.109-114
    • /
    • 2018
  • 협업 필터링은 사회적 추천 방식으로서 뛰어난 성능을 제공하는 대표적인 추천 시스템 알고리즘으로 폭넓게 사용되어 오고 있다. 협업 필터링은 구조적으로 아이템 평가 데이터에 의존하고 있기 때문에 평가 행렬의 희박도는 추천 성능에 직접적으로 영향을 미친다. 평가 행렬의 희박성 문제 개선을 위해 협업 필터링과 내용 기반 방법을 결합하는 복합형 추천 방법에 대한 연구는 꾸준하게 이루어져 왔으며, 본 연구에서는 협업 필터링의 희소 평가 행렬(sparse rating matrix) 문제 개선 방안의 하나로 공통 평가 아이템이 누락되어 유사도 측정이 불가능한 상황에 대처하기 위한 방법을 제안한다. 이를 위하여 사용자간 이행적 관계 그래프에 기반하는 유사도 평가 모델을 설계하고 오픈 데이터셋인 Movielens에 적용하여 추천 정확도를 측정 비교하였다.

Information Quantification Application to Management with Fuzzy Entropy and Similarity Measure

  • Wang, Hong-Mei;Lee, Sang-Hyuk
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제10권4호
    • /
    • pp.275-280
    • /
    • 2010
  • Verification of efficiency in data management fuzzy entropy and similarity measure were discussed and verified by applying reliable data selection problem and numerical data similarity evaluation. In order to calculate the certainty or uncertainty fuzzy entropy and similarity measure are designed and proved. Designed fuzzy entropy and similarity are considered as dissimilarity measure and similarity measure, and the relation between two measures are explained through graphical illustration. Obtained measures are useful to the application of decision theory and mutual information analysis problem. Extension of data quantification results based on the proposed measures are applicable to the decision making and fuzzy game theory.

Empirical Comparison of Word Similarity Measures Based on Co-Occurrence, Context, and a Vector Space Model

  • Kadowaki, Natsuki;Kishida, Kazuaki
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.6-17
    • /
    • 2020
  • Word similarity is often measured to enhance system performance in the information retrieval field and other related areas. This paper reports on an experimental comparison of values for word similarity measures that were computed based on 50 intentionally selected words from a Reuters corpus. There were three targets, including (1) co-occurrence-based similarity measures (for which a co-occurrence frequency is counted as the number of documents or sentences), (2) context-based distributional similarity measures obtained from a latent Dirichlet allocation (LDA), nonnegative matrix factorization (NMF), and Word2Vec algorithm, and (3) similarity measures computed from the tf-idf weights of each word according to a vector space model (VSM). Here, a Pearson correlation coefficient for a pair of VSM-based similarity measures and co-occurrence-based similarity measures according to the number of documents was highest. Group-average agglomerative hierarchical clustering was also applied to similarity matrices computed by individual measures. An evaluation of the cluster sets according to an answer set revealed that VSM- and LDA-based similarity measures performed best.