• Title/Summary/Keyword: 유사성 탐색

Search Result 490, Processing Time 0.027 seconds

Source code Plagiarism Detection with Recursive Local Alignments (재귀적 지역정렬을 이용한 프로그램 표절 탐색)

  • 전명재;이평준;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.946-948
    • /
    • 2004
  • 지역정렬(local alignment)과 전체정렬(global alignment)로 대표되는 정렬 문제는 전산학 분야의 전형적인 문제로, 두 서열의 전체적인 또는 부문적인 유사성(similarity)을 찾아 주기 위한 방법이다. 특히 정렬은 두 문자열에서 유사하게 나타나는 유사 서브스트링을 찾아내는 문제라든가 근래의 생물정보학에서 두 DNA시퀀스간의 유사도를 판별하는 문제 등에서 매우 중요란 기법이다. 본 논문에서는 두 서열들을 유사하게 매칭 시켜 주는 기존의 정렬 방법을 응용, 변형하여 C, C++. JAVA등으로 짜여진 프로그램 소스들의 유사도를 측정하는 방법을 제시하였다. 실제로 이런 프로그램 소스의 표절은 대학교육 수업과정 등에서 빈번하게 발생되는 문제점으로서 본 논문에서는 프로그램 소스표절을 검사, 탐지할 수 있는 방법론 및 구체적인 프로그램과 그 결과를 제시하고 있다. 아울러 두 프로그램간의 유사성을 비교하기 위해 기존의 지역정렬 방법을 보다 효율적으로 적절히 변형시키는 방법을 제시하고 있다.

  • PDF

Genetic Algorithm Applying Modified Mutation Operator Based on Hamming Distance for Solving Multi-dimensional Knapsack Problem (개체간 해밍 거리 기반의 변이연산을 적용한 유전알고리즘을 이용한 다차원 배낭 문제 탐색)

  • Jeong, Jae-Hun;Lee, Jong-Hyun;Ahn, Chang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1728-1731
    • /
    • 2012
  • 본 논문에서는 부모 개체의 해밍 거리에 기반하여 선택적 변이연산을 적용한 유전알고리즘을 제안한다. 유전자 형이 매우 유사한 개체들 간의 유전연산은 알고리즘의 탐색성능을 저하시키고 조기 수렴의 가능성을 증가시킨다. 본 논문에서는 이러한 현상을 극복하기 위하여, 교차연산 시 선택된 두 부모 개체간의 해밍 거리에 따라 그 값이 낮으면 교차연산 후 생성된 두 자식 개체 중 한쪽에게 높은 변이확률을 적용하고 다른 한쪽 자식은 부모와 비슷한 유전자 형으로 탐색을 계속하게 하여 조기 수렴을 방지하면서 해집단의 다양성 유지 기능을 향상 시켰다. 제안한 유전 알고리즘을 다차원 배낭 문제에 적용한 결과, 같은 조건에서 단순 유전 알고리즘(SGA) 보다 향상된 탐색 성능을 보여주었다.

Fast Fractal Image Compression Using the outer fence acceleration (블락 외곽선의 기울기를 이용한 프랙탈 이미지 압축)

  • 박인영;위영철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.454-456
    • /
    • 2002
  • 압축 방법에는 크게 손실(lossy)압축과 무손실(lossless)압축으로 나눌 수 있다. 그 중 프랙탈 이미지 압축은 lossy 압축의 한가지 방법으로서 개별적인 화소들에 대한 자료를 저장하기보다는, 영상 생성을 위한 명령이나 방식을 저장하는 방법이다. 특히 이미지의 내에 자기유사성(self-similarity)과 중복성(Redundancy)을 이용하여 관련성을 발견하고 수학적인 공식으로 표현하려는 방식이다. 그러나 이미지를 Domain과 Range로 블록화 한 후 유사한 이미지를 찾아내는 데 걸리는 시간이 상당히 길다. 여기에서는 Domain과 Range의 외곽선의 기울기의 부호를 이용하여 블록을 16가지로 클래스화 하여서, 전체의 Domain 블록을 탐색하는 데 걸리는 시간을 줄이고자 하였다. 전체 탐색을 하는 경우보다 10배 이상의 속도향상을 보였고, 이미지에 따라서는 PSNR 값의 손실도 없음을 보였다.

  • PDF

An Eye-tracking Study: Consumer Perceptual Processing of SPA Brand Extensions (Eye-tracking 연구: SPA 브랜드 확장에 대한 소비자 지각 과정)

  • Kang, Jungsuk
    • Science of Emotion and Sensibility
    • /
    • v.18 no.4
    • /
    • pp.87-98
    • /
    • 2015
  • As SPA brands are growing in Korean apparel markets, they are extending their well-established brands into new markets (i.e., SPA brand extensions). To investigate psychological mechanism underlying SPA brand extensions, this study conceptually proposed such consumer information processing of SPA brand extensions as (1) perception of similarity between SPA brand extensions and their original brands and (2) evaluations on the SPA brand extensions (i.e., attitude and purchase intent). For hypothetical SPA brand extensions (high, moderate and low similarity conditions), perceived similarity was measured by using a eye-tracker and evaluations were assessed by using a self-reported questionnaire. The results reveal that the amount of external information searching for SPA brand extensions was larger in the following order: moderate, low and high similarity conditions. The depth of SPA brand information processing was also deeper in the same order. Evaluations on SPA brand extensions were higher in high and moderate similarity conditions than in low similarity condition. The findings suggest that the evaluations are affected by perceived similarity and the amount of cognitive efforts in processing SPA brand extensions.

Cause Diagnosis Method of Semiconductor Defects using Block-based Clustering and Histogram x2 Distance (블록 기반 클러스터링과 히스토그램 카이 제곱 거리를 이용한 반도체 결함 원인 진단 기법)

  • Lee, Young-Joo;Lee, Jeong-Jin
    • Journal of Korea Multimedia Society
    • /
    • v.15 no.9
    • /
    • pp.1149-1155
    • /
    • 2012
  • In this paper, we propose cause diagnosis method of semiconductor defects from semiconductor industrial images. Our method constructs feature database (DB) of defect images. Then, defect and input images are subdivided by uniform block. And the block similarity is measured using histogram kai-square distance after color histogram calculation. Then, searched blocks in each image are merged into connected objects using clustering. Finally, the most similar defect image from feature DB is searched with the defect cause by measuring cluster similarity based on features of each cluster. Our method was validated by calculating the search accuracy of n output images having high similarity. With n = 1, 2, 3, the search accuracy was measured to be 100% regardless of defect categories. Our method could be used for the industrial applications.

A Comparative Study on the Effectiveness of Hangul Natural Language Retrieval Using KT Test Set (KT Test Set을 이용한 우리말 자연언어검색의 효율성에 관한 비교연구)

  • 이현아;김성혁
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1995.08a
    • /
    • pp.37-40
    • /
    • 1995
  • 본 연구는 자연언어시스템에서 색인어와 탐색어의 특정성에 기인하는 재현율 감소를 극복하기 위한 방법론으로써 탐색어의 확장을 통한 검색효율을 평가하였다. 이를 위하여 우리말 데이터베이스를 대상으로 주제전문가가 자연언어로 작성한 원 질의문 (Q1), 원 질의문에 사용된 탐색어와 데이터베이스내의 색인어간의 유사도를 이용하여 탐색어를 확장한 질의문 (Q2(0.2), Q2(0.3)), 주제전문가인 이용자가 Q1의 의미적인 관계를 고려해서 자연언어로 탐색어를 확장한 질의문 (Q3)을 검색효율면에서 비교하였다. 실험결과, 평균재현율은 Q2(0.2), Q2(0.3), Q3, Q1의 검색의 순이었다. 평균정확율은 Q3, Q2(0.3), Q1, Q2(0.2)검색의 순으로 나타났다.

  • PDF

A Similarity Ranking Algorithm for Image Databases (이미지 데이터베이스 유사도 순위 매김 알고리즘)

  • Cha, Guang-Ho
    • Journal of KIISE:Databases
    • /
    • v.36 no.5
    • /
    • pp.366-373
    • /
    • 2009
  • In this paper, we propose a similarity search algorithm for image databases. One of the central problems regarding content-based image retrieval (CBIR) is the semantic gap between the low-level features computed automatically from images and the human interpretation of image content. Many search algorithms used in CBIR have used the Minkowski metric (or $L_p$-norm) to measure similarity between image pairs. However those functions cannot adequately capture the aspects of the characteristics of the human visual system as well as the nonlinear relationships in contextual information. Our new search algorithm tackles this problem by employing new similarity measures and ranking strategies that reflect the nonlinearity of human perception and contextual information. Our search algorithm yields superior experimental results on a real handwritten digit image database and demonstrates its effectiveness.

Effective Route Finding for Alternative Paths using Genetic Algorithm (유전알고리즘을 이용한 효율적인 대체경로탐색)

  • 서기성
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1998.03a
    • /
    • pp.65-69
    • /
    • 1998
  • 차량주행안내 시스템에서 경로 안내 기능은 사용자에게 출발지와 목적지간의 최단의 경로를 찾아 주는 역할을 수행한다. 그런데 최단경로를 찾는 문제도 중요하지만, 다음과 같이 최단 경로 이외에 대체경로가 필요한 경우가 자주 발생한다. 첫째, 목적지나 출발지가 유사한 차량에 대해서 복수개의 경로를 제시함으로써, 교통량을 분산시킬수 있어, 전체 도로망의 효율을 높일 수 있다. 둘째, 운전자의 선호도가 각기 다르기 때문에 이를 만족시키기 위해서는 복수개의 경로 제시가 필요하다. 본 연구에서는 대체경로의 적합성을 평가할수 있는 지표와 유전 알고리즘 기반의 효율적인 대체경로를 탐색 기법을 제시한다.

  • PDF

Firmware Fuzzing Method through Pseudo-HAL Identification (유사 HAL 함수 탐색을 통한 펌웨어 퍼징 기법)

  • Jeong, Seyeon;Hwang, Eunbi;Cho, Yeongpil;Kwon, Taekyoung
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.32 no.6
    • /
    • pp.1121-1125
    • /
    • 2022
  • HAL-Fuzz, a fuzzing technique to find firmware vulnerabilities, is efficient by using the HAL function of the hardware abstraction layer provided by MCU vendors. However, it cannot handle most firmware that unused the exact HAL function. In this paper, we propose a new method for identifying pseudo-HAL functions to increase the fuzzing availability of HAL-Fuzz. In experiments, we identified not only the HAL but also the pseudo-HAL functions, implemented by the developer, and that fuzzing is possible.

An Efficient Preprocessing System for Searching Similar Texts among Massive Document Repository (대용량 문서 집합에서 유사 문서 탐색을 위한 효과적인 전처리 시스템의 설계)

  • Park, Sun-Young;Kim, Ji-Hun;Kim, Seon-Yeong;Kim, Hyung-Joon;Cho, Hwan-Gue
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.5
    • /
    • pp.626-630
    • /
    • 2010
  • Since the paper plagiarism has become one of important social issues, it is necessary to develop system for measuring the similarity between papers. The speed and accuracy of the system are very important features. So many researchers are studying the features. In this paper, we propose a preprocessing method using 'Global Dictionary' model to enhance performance of the system. The global dictionary includes information of all words in the document repository. The system uses the model to find similar papers with low computing time. Finally our experiment showed that a set of more than 20,000 documents could be reduced to about 50 documents drastically by our filtering techniques, which proves the excellence of our system.