• Title/Summary/Keyword: 유사성

Search Result 14,803, Processing Time 0.041 seconds

Reliable Data Selection using Similarity Measure (유사측도를 이용한 신뢰성 있는 데이터의 추출)

  • Ryu, Soo-Rok;Lee, Sang-Hyuk
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.18 no.2
    • /
    • pp.200-205
    • /
    • 2008
  • For data analysis, fuzzy entropy is introduced as the measure of fuzziness, similarity measure is also constructed to represent similarity between data. Similarity measure between fuzzy membership functions is constructed through distance measure, and the proposed similarity measure are proved. Application of proposed similarity measure to the example of reliable data selection is also carried out. Application results are compared with the previous results that is obtained through fuzzy entropy and statistical knowledge.

Similarity Computation for XML Document with Semantically Extended Tags (의미적으로 확장된 태그들을 이용한 XML 문서들의 유사성 계산.)

  • Song, In-Sang;Paik, Ju-Ryun;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.369-372
    • /
    • 2006
  • XML(eXtensible Markup language) 사용의 급속한 증가는 웹에 존재하는 많은 양의 정보들을 XML기반 데이터로 생성하게 했으며 저장과 교환에 있어서 표준이 되도록 했다. 이는 사용자에 의한 임의의 태그정의를 가능하게 하는 XML 사용의 용이성에 기반한다. 그러나 이러한 장점은 비슷한 내용을 갖는 XML 문서에 대해서 사람들마다 개개의 태그이름과 구조를 사용한다는 문제점을 만든다. 따라서 유사한 의미를 가지고 있지만 서로 다른 문서로 분류된다. 이러한 점을 개선하기 위해 XML 문서 태그들 간의 벡터 스페이스 모델과 XML 데이터를 이용하여 시소러스를 구축하는 방법 등이 연구되고 제안되어 왔지만 아직 초보적인 단계이다. 본 논문에서는 XML 문서를 구성하는 태그들을 동의어로 확장하여 벡터를 생성하고 생성된 벡터를 가지고 태그들 간의 유사성을 체크하여 서로 다른 XML 문서들의 유사성을 수치적으로 계산한다.

  • PDF

Stochastic Self-similarity Analysis and Visualization of Earthquakes on the Korean Peninsula (한반도에서 발생한 지진의 통계적 자기 유사성 분석 및 시각화)

  • JaeMin Hwang;Jiyoung Lim;Hae-Duck J. Jeong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.12 no.11
    • /
    • pp.493-504
    • /
    • 2023
  • The Republic of Korea is located far from the boundary of the earthquake plate, and the intra-plate earthquake occurring in these areas is generally small in size and less frequent than the interplate earthquake. Nevertheless, as a result of investigating and analyzing earthquakes that occurred on the Korean Peninsula between the past two years and 1904 and earthquakes that occurred after observing recent earthquakes on the Korean Peninsula, it was found that of a magnitude of 9. In this paper, the Korean Peninsula Historical Earthquake Record (2 years to 1904) published by the National Meteorological Research Institute is used to analyze the relationship between earthquakes on the Korean Peninsula and statistical self-similarity. In addition, the problem solved through this paper was the first to investigate the relationship between earthquake data occurring on the Korean Peninsula and statistical self-similarity. As a result of measuring the degree of self-similarity of earthquakes on the Korean Peninsula using three quantitative estimation methods, the self-similarity parameter H value (0.5 < H < 1) was found to be above 0.8 on average, indicating a high degree of self-similarity. And through graph visualization, it can be easily figured out in which region earthquakes occur most often, and it is expected that it can be used in the development of a prediction system that can predict damage in the event of an earthquake in the future and minimize damage to property and people, as well as in earthquake data analysis and modeling research. Based on the findings of this study, the self-similar process is expected to help understand the patterns and statistical characteristics of seismic activities, group and classify similar seismic events, and be used for prediction of seismic activities, seismic risk assessments, and seismic engineering.

Comparison of External Information Performance Predicting Subcellular Localization of Proteins (단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교)

  • Chi, Sang-Mun
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.11
    • /
    • pp.803-811
    • /
    • 2010
  • Since protein subcellular location and biological function are highly correlated, the prediction of protein subcellular localization can provide information about the function of a protein. In order to enhance the prediction performance, external information other than amino acids sequence information is actively exploited in many researches. This paper compares the prediction capabilities resided in amino acid sequence similarity, protein profile, gene ontology, motif, and textual information. In the experiments using PLOC dataset which has proteins less than 80% sequence similarity, sequence similarity information and gene ontology are effective information, achieving a classification accuracy of 94.8%. In the experiments using BaCelLo IDS dataset with low sequence similarity less than 30%, using gene ontology gives the best prediction accuracies, 93.2% for animals and 86.6% for fungi.

A Robust Pattern Watermarking Method by Similarity Improvement (유사도 증가를 통한 강인한 패턴 워터마킹 방법)

  • 이경훈;김용훈;이태홍
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.330-333
    • /
    • 2003
  • 본 논문에서는 웨이브릿 변환 영역에 제안한 알고리듬으로 여러 공격에 강인한 워터마크를 삽입하였다. 추출된 워터마크는 정칙화 영상복원에 활용하는 Tikhonov-Miller 처리를 함으로써 워터마크의 유사성 판별을 쉽게 하였다. 제안한 방법의 강인성과 유사성 향상을 실험하기 위해 명암, 크기 변화, 필터링, 잘라내기, 히스토그램 평활화, 손실압축(JPEG, gif)과 같은 영상처리를 하였다. 실험 결과 제안한 방법은 비가시성을 고려한 강인한 워터마크를 삽입할 수 있고 여러 공격에 대해서 더욱 높은 상관 계수로 추출할 수가 있었다.

  • PDF

Comparison procedure in evaluation analysis of source code comparison on Embedded system (정보기기 소스코드 유사성 분석에서 목적물 검증)

  • Nam, SangYep;Kim, Do-Hyeun;Lee, Kyu-Tae
    • Journal of Software Assessment and Valuation
    • /
    • v.17 no.2
    • /
    • pp.31-38
    • /
    • 2021
  • In order to analyze the similarity of the source code object material, the source code on both sides must be able to be compiled and executed. In particular, in the case of hardware-integrated software, it is necessary to check whether the hardware interface matches. However, currently, the source code is provided in an incomplete state which is not original of source code used in developing steps. The complainant confirms that the executing characteristics are similar to their own in the expression and function of the output, and request an evaluation. When a source code compilation error occurs during the evaluation process, the experts draw a flowchart of the source code and applies the method of tracing the code flow for each function as indirect method. However, this method is indirect and the subjective judgment is applied, so there is concern about the contention of objectivity in the similarity evaluation result. In this paper, the problems of unverified source code similarity analysis and improvement directions are dealt with, through the analysis cases of source code disputes applied to embedded systems.

Comparison Between Core Affect Dimensional Structures of Different Ages using Representational Similarity Analysis (표상 유사성 분석을 이용한 연령별 얼굴 정서 차원 비교)

  • Jongwan Kim
    • Science of Emotion and Sensibility
    • /
    • v.26 no.1
    • /
    • pp.33-42
    • /
    • 2023
  • Previous emotion studies employing facial expressions have focused on the differences between age groups for each of the emotion categories. Instead, Kim (2021) has compared representations of facial expressions in the lower-dimensional emotion space. However, he reported descriptive comparisons without statistical significance testing. This research used representational similarity analysis (Kriegeskorte et al., 2008) to directly compare empirical datasets from young, middle-aged, and old groups and conceptual models. In addition, individual differences multidimensional scaling (Carroll & Chang, 1970) was conducted to explore individual weights on the emotional dimensions for each age group. The results revealed that the old group was the least similar to the other age groups in the empirical datasets and the valence model. In addition, the arousal dimension was the least weighted for the old group compared to the other groups. This study directly tested the differences between the three age groups in terms of empirical datasets, conceptual models, and weights on the emotion dimensions.

Pig viral diseases causing reproductie failure in Korea (돼지 바이러스 질병 감염에 의한 유사산 실태조사)

  • Kim, Byoung-han;Kweon, Chang-hee;An, Soo-hwan;Rhee, Jae-chin
    • Korean Journal of Veterinary Research
    • /
    • v.32 no.3
    • /
    • pp.365-368
    • /
    • 1992
  • 1988년부터 1990년 6월까지 전국의 양돈장에서 수집된 돼지 유사산 태아 74복에서 바이러스성 원인체 분리 및 혈청학적 진단을 수행하였던 바 다음과 같은 결과를 얻었다. 공시한 74복의 유사산 태아중 44복의 태아 흉강액에서 면역 globulin이 검출되어 전염성 질병감염에 의한 유사산으로 추정되었다. 이중 37%가 바이러스성 유사산으로 나타났으며 유사산의 원인체별 분포를 살펴보면 돼지 파보바이러스가 21%로 가장 높았으며, 뇌심근염 바이러스가 11%, 일본뇌염 바이러스가 9% 등의 순으로 나타났다. 한편 돼지 콜레라바이러스 및 오제스키병 바이러스에 의한 유사산이 각각 1건씩 검출되었으며 동일 유사산 태아에서 2가지 병원체가 중복감염된 예도 관찰되었다.

  • PDF

Family BOM을 통한 효율적인 설계 정보 관리에 관한 연구

  • 문희석;김선호
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1996.04a
    • /
    • pp.346-351
    • /
    • 1996
  • 본 논문은 다품종 소량생산에서 발생하기 쉬운 제품들의 유사성을 근간으로, 제품들의 공통적인 특성을 관리하기 위한 Famiiy BOM 체제를 구현하여 이를 제품의 설계정보관리에 이용할 수 있는 시스템 개발에 관한 것이다. 이 Family BOM을 통해 기존의 개별 제품별 BOM이 가지는 한계를 극복하고 유사 제품을 군으로 묶어 이들의 공통된 특성을 제품의 설계시에 활용할 수 있다. Family BOM은 부품을 군으로 분류하고 이 부품들의 구성을 공통 부분과 선택 부분으로 모듈화하여 표현하는 방법이다. 이 Family BOM을 통해 기존의 제품별 BOM을 별도로 관리하는데 따른 BOM 개수의 증가, 관리 및 변경의 복잡, 데이터의 정확성 부족 등과 같은 문제점을 해결할 수 있다. 본 연구에서는 먼저 부품을 형상 및 공정, 기능의 유사성에 따라 군별로 분류하기 위하여 부품의 특성을 코드화하여 이 코드의 유사성 정도에 따라 분류하는 Classification & Coding system을 개발하였다. 이 기법을 이용하여 유사한 부품을 군별로 관리할 수 있고 이를 통해 기존부품정보를 신제품 개발에 적 용하여 설계에서부터 공정계획 수립까지 시간을 단축할 수 있으며 체계적으로 도면을 관리 및 분석 할 수 있다. 또한 제품군별 BOM관리를 위한 Family BOM을 구현하였고, 이에 따라 도면 중심의 설계정보관리시스템을 개발 하였다.

  • PDF

A Similarity Evaluation using Structural Information of Documents (문서구조 정보 기반의 유사도 측정)

  • Shin, Mi-Hae;Ko, Bang-Won;Kim, Young-Chul;Jeong, Jin-Yeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF