• Title/Summary/Keyword: 유사도 분석

Search Result 12,837, Processing Time 0.055 seconds

Efficient Similarity Analysis Methods for Same Open Source Functions in Different Versions (서로 다른 버전의 동일 오픈소스 함수 간 효율적인 유사도 분석 기법)

  • Kim, Yeongcheol;Cho, Eun-Sun
    • Journal of KIISE
    • /
    • v.44 no.10
    • /
    • pp.1019-1025
    • /
    • 2017
  • Binary similarity analysis is used in vulnerability analysis, malicious code analysis, and plagiarism detection. Proving that a function is equal to a well-known safe functions of different versions through similarity analysis can help to improve the efficiency of the binary code analysis of malicious behavior as well as the efficiency of vulnerability analysis. However, few studies have been carried out on similarity analysis of the same function of different versions. In this paper, we analyze the similarity of function units through various methods based on extractable function information from binary code, and find a way to analyze efficiently with less time. In particular, we perform a comparative analysis of the different versions of the OpenSSL library to determine the way in which similar functions are detected even when the versions differ.

The Lowest Price Matching Service Using Cosine Similarity Analysis (코사인 유사도 분석을 이용한 최저가 매칭 서비스)

  • Yoo, Songeun;Kang, Byungoh;Kim, Jimin;Lee, Ganghyeok;Lee, Minwoo;Koh, Seokju
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.624-629
    • /
    • 2020
  • 최근 온라인 쇼핑 시장이 커지면서 소비자들은 다양한 물건을 온라인에서 쉽게 접근하고 구매할 수 있게 되었다. 이와 함께 인터파크의 '톡집사', 네이버 쇼핑 등에서는 다양한 쇼핑몰의 가격 정보를 모아서 소비자들이 합리적인 가격에 상품을 구매할 수 있도록 도와주고 있다. 이에 본 논문에서는 이러한 가격 비교 시스템을 활용하여 판매자들을 대상으로 서비스하는 시스템을 제안한다. 문서 유사도를 비교하기 위하여 쓰이던 코사인 유사도 분석 기법을 쇼핑몰 상품명 분석에 이용할 수 있도록 한다. 실제 상품명 정보를 이용해 코사인 유사도 분석을 실행하고 코사인 유사도 분석 결괏값으로 관련성이 낮은 상품을 배제한다. 나머지 상품의 정보를 바탕으로 최저가 분석을 수행하여 적정 판매가격을 추출하여 제시한다. 따라서 제안하는 방식을 적용하여 상품 분석을 시행하면 비슷한 범주에 있는 상품들을 추출한 뒤 최적의 가격을 제시할 수 있을 것이다.

  • PDF

Characteristic Analysis and Rating Development of Suspended Sediment Discharge in 2014 (2014년도 부유사량 특성분석 및 레이팅 개발)

  • Park, Yonghee;Lee, Jung Hoon;Kwon, Dongseok;Lee, YeonKil;Jung, SungWon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.311-316
    • /
    • 2015
  • 하천 유사량 자료는 하천의 이 치수 목적으로 활용할 수 있는 기본 자료중 하나로서 하상변동 예측, 저수지 퇴사량 추정, 하도 계획과 설계, 유사조절 계획 수립 및 기타 구조물 등의 영향 평가 등 다양하게 활용할 수 있다. 정도 높은 유사량 자료를 측정하기 위해서는 현장측정부터 분석까지 정확한 과정과 세밀한 준비가 필요하다. 본 연구에서는 정도 높은 유사량 자료를 생산하기 위하여 국가 유사량 관측망 중 19개 지점(율극, 점촌, 일선교, 구미, 왜관, 선산, 죽고, 진동, 개진2, 정암, 회덕, 마륵, 나주, 학교, 남평, 영수, 선암, 구례2, 죽곡, 용서, 곡성)에 대하여 부유사량 특성분석을 수행하고 이를 반영하여 유량-부유사량관계곡선식을 개발하였다. 유사량 측정과정은 사전조사, 현장측정, 실험실분석, 모형적용 단계를 거친다. 사전조사 단계에서는 현장에 대한 현장안전, 지점특성 등의 현장관련 정보를 수집하여 현장측정 계획을 수립한다. 현장측정 단계에서는 사전에 유량측정 자료를 이용하여 측선을 나누는 등유량법과 등간격법을 사용하였으며, ISO 기준 이상의 5~8개 측선을 나누어 측정하였다. 측정장비는 D-74 부유사 채취기를 이용하여 왕복수심적분법으로 부유사량 샘플을 채취 하였다. 실험실분석은 유량조사사업단 유사분석센터에서 채취 시료에 대한 농도, 레이저 회절법을 이용한 부유사입도분석, 하상토분석(체분석)을 실시하였다. 또한, 유량-부유사량 농도 변화양상과 부유사량 특성분석을 이용한 부유사량 측정결과를 평가하였고 각 지점의 부유사량특성을 잘 나타낼 수 있는 지수식($Q_{ss}=aQ^b$)을 이용하여 유량-부유사량관 계곡선식을 개발하였다.

  • PDF

Analysis of similarity between industries based on unstructured data using topic modeling (토픽 모델링을 이용한 비정형 데이터 기반 산업간 유사도 분석)

  • Kim, Kyungwon;Park, Jongbin;Jung, Jongjin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.180-182
    • /
    • 2018
  • 최근 빠르게 변화하는 산업 환경에서 뉴스 기사와 같은 비정형 데이터를 기반으로 산업 트랜드를 분석하기 위한 연구가 진행되고 있다. 뉴스와 같은 비정형 데이터를 기반으로 산업별 트랜드를 분석하기 위해서는 분석 대상 산업에 대한 많은 양의 시계열 데이터가 요구된다. 하지만, 수집된 비정형 데이터를 분류하면 산업별/기간별 일정하지 않은 데이터 분포를 보이거나, 특정 산업에 대해서는 특정 기간에 데이터가 존재하지 않은 경우가 발생하여 산업별 시계열 분석이 어려운 경우가 발생할 수 있다. 이에, 본 논문에서는 산업별/기간별 균일하지 못한 비정형 데이터의 분포를 보정하기 위한 방법으로 비정형 데이터 기반 산업간 유사도를 분석 기법을 제안한다. 산업별 유사도 분석을 위해 각 산업별 주요 키워드를 도출하고 토픽 모델링 기법을 이용하여 산업간 유사도 분석을 통해 산업별/기간별 비정형 데이터 부족현상을 보완하는 방법을 제시한다.

  • PDF

Sentence Similarity Analysis using Ontology Based on Cosine Similarity (코사인 유사도를 기반의 온톨로지를 이용한 문장유사도 분석)

  • Hwang, Chi-gon;Yoon, Chang-Pyo;Yun, Dai Yeol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.441-443
    • /
    • 2021
  • Sentence or text similarity is a measure of the degree of similarity between two sentences. Techniques for measuring text similarity include Jacquard similarity, cosine similarity, Euclidean similarity, and Manhattan similarity. Currently, the cosine similarity technique is most often used, but since this is an analysis according to the occurrence or frequency of a word in a sentence, the analysis on the semantic relationship is insufficient. Therefore, we try to improve the efficiency of analysis on the similarity of sentences by giving relations between words using ontology and including semantic similarity when extracting words that are commonly included in two sentences.

  • PDF

Document Reranking Model Using Clusters (문서 클러스터를 이용한 재순위화 모델)

  • Lee, Kyung-Soon;Park, Young-Chan;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.81-87
    • /
    • 1998
  • 본 연구에서는 정보검색시스템의 모델로 문서 클러스터를 이용한 재순위화 모델을 제시한다. 이 방법은 검색단계와 분석단계로 이루어지는데, 검색단계에서는 역화일기법을 이용해서 질의어를 포함하는 문서들을 검색하여 질의어-문서 유사도에 따라 순위를 결정한다. 분석단계에서는 이미 구축된 문서 클러스터를 이용해서 검색되어진 문서들의 분석을 통해 질의어-클러스터 유사도를 계산한다. 질의어-문서 유사도와 질의어-클러스터 유사도를 결합하고, 이 유사도에 기반해서 문서들을 재순위화한다. 이때 이용하는 클러스터는 정적 클러스터이고, 질의어에 따라 서로 다른 클러스터를 생성하는 동적인 뷰를 제공한다. 재순위화 모델은 역화일 기법과 클러스터 분석기법이 가지는 장점을 결합하여 질의어 뿐만 아니라 문서에 포함된 모든 단어들을 분석함으로써 문서의 문맥을 고려할 수 있다. 제안하는 모델은 역화일 기법을 이용한 검색 결과에 비해서 우수한 성능 향상을 나타내고 있다.

  • PDF

Statistical Analysis on Size of Flocs (통계학적 접근법의 적용을 통한 유사 문제의 분석)

  • Son, Minwoo;Park, Byeoung Eun;Byun, Jisun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.245-245
    • /
    • 2019
  • 점착성 유사는 유사가 가지는 점착력에 의해 응집현상을 겪으며 그 크기와 밀도가 변화한다. 유사의 크기와 밀도는 침강속도에 직접적인 영향을 주며 침강속도는 변화는 유사의 거동에 매우 중요한 작용을 한다. 따라서 점착성 유사의 크기 특성을 파악하는 것은 필수적이다. 본 연구는 유사가 가지는 입도분포를 파악하기 위해 통계학적 접근법을 적용하여 분석하였다. 점착성 유사의 입자가 가지는 입도 분포를 구체화한 결과를 유사의 입도 분포를 위한 수치 모의 연구에 적용하여 모의 결과를 향상시키고 유사 문제의 분석에 용이하도록 하려 한다. 통계학적인 방법 중 적합도 검정을 이용하여 실제 점착성 유사의 입도가 어떠한 분포를 모사하는지 분석하였다. 수집된 입도 분포 자료에 적합도 검정 방법 중 Kolmogorov-Sminorv(K-S) 검정을 이용하였으며 유의수준 5%를 통과할 경우 이론 분포가 점착성 유사의 입도 분포를 잘 모사하는 것으로 판단하였다. 점착성 유사의 입도 분포를 수집하고 그 자료를 바탕으로 적합도 검정을 실시한 결과 많은 연구에서 점착성 유사의 입도 분포로 가정하고 있는 Log-normal 분포가 유의수준 5%를 기준으로 적합도 검정을 통과한 경우는 많지 않았다. 본 연구에서 검정한 결과로는 기존에 이용되는 Log-normal 분포는 위치 매개변수를 추가하여 3 매개변수 분포를 사용할 경우에만 점착성 유사의 입도 분포를 모사한다고 판단된다. 향후에는 점착성 유사의 입도 분포를 모사하고 사용함에 있어 Log-normal 분포를 무조건적으로 이용하는 것은 지양하고 점착성 유사가 가지는 특성을 파악하여 어떠한 입도 분포 형태를 나타낼지 미리 예측하여 이론 분포를 가정한다면 수치모형을 통해 점착성 유사의 입도 분포를 모사할 때 그 정확도가 크게 증가할 것으로 판단된다. 또한 점착성 유사의 입도 분포로서 제시한 GEV 분포와 Gamma 분포, Log-normal 분포를 FM 모형에 결합하여 입도 분포를 모의한 후 그 결과를 실제 현장에서 측정된 입도 분포와 비교하는 과정을 통해 실제 어떠한 분포가 가장 적합하게 모의하는지도 검증할 필요성이 있다고 판단된다. 또한 점착성 유사의 입도를 모사하는 분포를 새로 개발하여 사용한다면 점착성 유사의 이동과 특성을 연구할 때 가장 중요한 크기 특성에 대한 많은 정보를 제공할 수 있으며 유사와 관련된 문제를 용이하게 분석할 것으로 판단된다.

  • PDF

Sediment Measurement Characteristics Analysis in 2006 (2006년 유사량 측정 성과 분석)

  • Han, Myoung-Sun;Kwon, Dong-Seok;Song, In-Ryeol;Lee, Yeon-Kil;Kang, Kyu-Sang;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1689-1695
    • /
    • 2007
  • 본 연구는 2006년 전국 4대 권역, 6개 지점에 대한 유사량 측정성과에 대한 분석을 실시하였다. 6개 지점에 대해 살펴보면 한강권역은 적성(임진강수계) 및 여주 지점, 낙동강 권역은 왜관 및 낙동 지점, 금강 권역은 공주 지점, 영산강 권역은 구례(섬진강수계) 지점이다. 이들 지점에 대해 유사량 측정 실시하였고, 그 결과를 바탕으로 현장에 적합한 유사량 측정 기준, 부유사 및 하상토 입경 분포 곡선 분석, 부유사량 산정, 향후 개선사항에 대해 정리하였다. 유사량 분석 결과는 다음과 같다. 전반적으로 측선별 농도의 편차는 크지 않는 것으로 나타났으며, 6개지점의 모두 유량 및 유사량 관계를 기존의 단순 지수함수로 표현하기에는 측정성과의 분산이 너무 큰 것으로 나타났다. 이는 기존 보고서에도 알려진 바와 같이 수위 상승시와 하강시의 유사량 특성이 너무 상이하기 때문이다. 향후 정밀한 측정 및 분석으로 유량 및 유사량 관계를 적절히 표현하는 방식이 필요하다고 판단된다. 그리고, 향후 전문인력에 의한 정밀 유사량 관측과 장기관측을 통해 보다 신뢰성 있는 유사량 특성을 분석할 수 있을 것이며, 홍수 방재를 위한 기반을 마련할 수 있을 것이다.

  • PDF

Classification by Clustering Analysis for Watersheds Measuring Sediment Yield (유사량 측정 유역 군집분석에 따른 분류)

  • Shin, Seung Sook;Park, Sang Deog;Park, Sangyeon;Yun, Minu
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.114-114
    • /
    • 2017
  • 하천의 유사량 자료는 하상변동 예측, 저수지 퇴사량 추정, 유사조절 계획 수립 등 유역과 하천관리 그리고 하천 시설물 관리를 위해 필요하다. 최근 4대강 사업구간에 대한 담수용 보로 유입되는 유사량과 하천 유사의 종횡단적 분포와 하상변동량 등의 산정에 기초자료로 활용하고자 유사량 관측망이 구축되어 있다. 본 연구에서는 하천 유사량에 영향을 미치는 유역특성인자에 대한 군집분석을 통해 유사 발생 유역을 분류하고자 한다. 체계화된 유량 및 유사량 측정 방법에 의해 신뢰할만한 유량-총유사량 관계식을 갖는 유량조사사업단의 35개 유역을 대상으로 한다. 유역 군집분석을 수행하고자 유역과 하천에 대한 지형인자, 토양인자, 토지이용 등의 유역특성 매개변수 자료를 수집하였고, 매개변수별 유사도거리 산정에 오류를 줄이기 위해 매개변수를 무차원화 하였다. 유역의 비유사량은 유역면적, 유역경사, 토성, 토지이용 등에 영향을 받았다. K-means 기법에 의해 군집분석을 수행한 결과 유사량 측정 유역은 A, B, C, D 4개의 그룹으로 분류되었다. B그룹 유역은 첨두홍수량이 크고 발생시간이 짧은 유역 및 하천 조건을 가지고 있었으며, 직접유출이 증가하는 지표조건과 침식이 활발한 토양조건을 갖는 것으로 파악되었다. 그룹별로 실측 비유사량을 검토한 결과 B그룹에 포함된 유역의 유사량이 다른 유역에 비해 상대적으로 크게 발생하였다. 이러한 결과는 유역특성 매개변수의 군집분석을 통한 유역의 군집분류가 유역과 하천의 유사관리 측면에서 유용한 관리방안으로 활용될 수 있음을 의미한다.

  • PDF

A Research of Documents Similarity Measuring Based on Word Weight (단어가중치 기반 문서간 유사도 측정에 관한 연구)

  • 김혜숙;박상철;김수형
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.198-201
    • /
    • 2003
  • 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하기 위해 문서간의 의존성, 즉 상·하위 문서간의 연계성 등을 측정할 수 있는 방법에 대한 연구가 절실한데 이를 위해 적게는 두 용어가 얼마나 밀접한 관련이 있는가를 나타내는 용어간의 유사도 정보가 중요시된다. 이에 본 논문은 임의의 두 문서에 대한 다양한 유사도 측정방법을 통하여 최적의 유사도를 알아보고 두 문서간 유사여부를 검증하기 위해 Neural Network을 적용하였다. 이러한 유사도 측정과 검증 방법은 분산환경에서 입력되는 요구사항 문서들을 효율적으로 분류, 관리해 줄 수 있으며 사용자 요구사항 분석과 전체 Project 수행에 좋은 기초자료를 제공해 줄 수 있다.

  • PDF