• Title/Summary/Keyword: 유사도 측정 함수

Search Result 212, Processing Time 0.034 seconds

Redundant and Abnormal Data Processing Scheme in Large-scale IoT Environment (대규모 IoT 환경에서의 중복 및 비정상 데이터 처리 기법)

  • Kim, Min-Woo;Lee, Tae-Ho;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.109-110
    • /
    • 2019
  • 최근 IoT 환경에서는 고밀도로 노드가 분포되어진다. 이러한 센서 노드들은 데이터 전송 시 혼잡을 초래하는 중복 데이터를 생성하여 데이터의 정확도를 저하시킨다. 이에 따라 본 연구에서는 데이터 집중으로 인해 발생하는 네트워크의 정체 문제를 해결하기 위해 제안 기법은 사 분위(Interquatile, IRQ) 분석과 코사인 유사도 함수를 통해 데이터의 이상치와 중복성을 측정하여 중복 데이터 및 특이치를 제거한다. 본 연구를 통하여 최적의 데이터 전송을 통하여 IoT의 통신 성능을 향상시킬 수 있으며 결과적으로 데이터 감소율, 네트워크 수명 및 에너지의 효율성을 높일 수 있다.

  • PDF

Improving Resilience in Graph-based Structure Comparison for Binary Objects (그래프 기반 바이너리 구조 비교 기법의 강인성 개선)

  • Jang, Joon-Hyouk;Cho, Yoo-Kun;Hong, Ji-Man
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.104-106
    • /
    • 2012
  • 소프트웨어 버스마크 (Software Birthmark)는 프로그램 실행 파일로부터 프로그램의 고유한 정보를 추출하는 기법이다. 프로그램의 도용을 판별하기 위해 바이너리로부터 버스마크를 추출하여 원본 프로그램과의 유사도를 측정하거나 악성 코드 탐지에 사용된다. 본 논문에서는 그래프 기반 바이너리 구조 매칭기법을 기반으로 한 버스마크를 제안한다. 제안 기법은 원본 프로그램과 대상 프로그램 사이에서 함수와 함수, 기본 블록과 기본 블록의 매칭 방법을 개선함으로써, 기존 기법에 비해 강인성(Resilience)이 향상된 버스마크를 추출한다.

Source Codes Plagiarism Detection By Using Reserved Word Sequence Matching (예약어 시퀀스 탐색을 통한 소스코드 표절검사)

  • Lee Yeong-Ju;Kim Seung;Gang Seok-Ho
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2006.05a
    • /
    • pp.1198-1206
    • /
    • 2006
  • 프로그램 소스코드 표절 검사에 대한 기존 방법은 크게 지문(finger-print)법과 구조기반 검사법으로 나뉘며, 주로 단어의 유사성이나 발생빈도를 사용하거나 소스코드 구조상의 특징으로 두 소스간의 유사성을 비교한다. 본 연구에서는 프로그래밍 언어의 예약어 시퀀스를 사용하여 소스코드들 간의 유사성을 비교하고, 이 결과를 FCA(Formal Concept Analysis)를 통해 해석하고 시각화 하는 방법을 제시한다. 일반적인 VSM(Vector Space Model)과 같은 단일 단어 분석으로는 단어의 인접성을 구분할 수 없으므로 단어의 시퀀스 분석이 가능하도록 알고리즘을 구성하였으며 이러한 방식은 지문법의 단점인 소스코드의 부분적인 표절 탐지의 난점을 해결할 수 있고 함수의 호출 순서나 수행 순서에 상관없이 표절을 탐지할 수 있는 장점을 가진다. 마지막으로 유사도 측정결과는 FCA를 이용하여 격자(lattice)로 시각화됨으로써 이용자의 이해도를 높일 수 있다.

  • PDF

Development of the Near/Far Absolute Gain Measurement System Using an Extrapolation Technique (외삽기법을 이용한 안테나의 원 ${\cdot}$ 근역장 절대이득 측정시스템 개발)

  • Shin, Joon;Kang, Chan-Koo;Kim, Jeong-Hwan;Chung, Nak-Sam
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.27 no.2
    • /
    • pp.31-38
    • /
    • 1990
  • An antenna gain measurement system using an extrapolation technique is described. The technique is similar to the usual two-antenna method for absolute gain measurement system, but involves the measurement of the received signal as a function of seperation in short distances, and the signal-versus-seperation data is processed in a way that allows an extrapolation of the signal to "infinite" seperation. In this technique it is possible to obtain the near field gain as function of distance by combining the far field gain and a proximity correction factor. The results of gain measurements of standard gain horn antennas and OEG (open ended waveguide) antennas are also presented.

  • PDF

Generating Call Graph for PE file (PE 파일 분석을 위한 함수 호출 그래프 생성 연구)

  • Kim, DaeYoub
    • Journal of IKEEE
    • /
    • v.25 no.3
    • /
    • pp.451-461
    • /
    • 2021
  • As various smart devices spread and the damage caused by malicious codes becomes more serious, malicious code detection technology using machine learning technology is attracting attention. However, if the training data of machine learning is constructed based on only the fragmentary characteristics of the code, it is still easy to create variants and new malicious codes that avoid it. To solve such a problem, a research using the function call relationship of malicious code as training data is attracting attention. In particular, it is expected that more advanced malware detection will be possible by measuring the similarity of graphs using GNN. This paper proposes an efficient method to generate a function call graph from binary code to utilize GNN for malware detection.

Development and Application of TDR Penetrometer for Evaluation of Soil Water Content of Subsoil (지반의 함수비 평가를 위한 관입형 TDR 프로브의 개발 및 적용)

  • Hong, Won-Taek;Jung, Young-Seok;Lee, Jong-Sub;Byun, Yong-Hoon
    • Journal of the Korean Geotechnical Society
    • /
    • v.31 no.2
    • /
    • pp.39-46
    • /
    • 2015
  • Dielectric constant depends on the variation of soil water content, and the estimation of soil water content using time domain reflectometry (TDR) has been studied by many researchers. The purpose of this study is the development and application of TDR penetrometer (TDRP) in order to evaluate the soil water content according to the penetration depth. The TDRP consists of cone, sleeve, driving rod, hammer, and guide. Three electrodes, which are used to measure the dielectric constant of soils, are mounted on the surface of sleeve and, in turn, connected with coaxial cable and time domain reflectometer. To establish the relationship between the volumetric water content and dielectric constant, several laboratory tests by using the TDRP are performed in the specimens with a variety of volumetric water content. The experimental results show that the dielectric constant is strongly correlated to volumetric water content as polynomial equations with an order of 3. In addition, the volumetric water content calculated from the dielectric constant is similar to that obtained from the sample weight. In the field, a small sampler is used to compare the volumetric water content calculated from the dielectric constant with the volumetric water content obtained from the sample. The results of field application demonstrate that the volumetric water content estimated by the TDRP shows similar trend to the gravimetric water content of sample. This study suggests that the TDRP is effectively used to evaluate the volumetric water content of unsaturated soils according to the penetration depth.

Development of Sediment Discharge Computation System for Characteristic Analysis of River Sediment Discharge (하천유사량 특성분석을 위한 유사량산정시스템 개발)

  • Lee, Yeon-Kil;Go, Ju-Yeon;Lee, Jin-Won;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.723-727
    • /
    • 2009
  • 본 연구에서는 유사량 측정의 적절성과 산정결과에 대한 정확성을 도모하고자 총유사량과 하상토유사량을 일관적으로 계산하고, 분석 및 관리할 수 있는 유사량산정시스템(Sediment Discharge Computation System; SDCS)을 개발하였다. 유사량산정시스템(SDCS)은 Microsoft사의 Excel VBA(Visual Basic for Applications)로 개발되어져 실행 및 분석이 간단 용이하고, 또한 유사량 산정결과를 저장하고 관리할 수 있는 DBFPAD가 내재되어 있다. 본 시스템은 크게 총유사량과 하상토유사량 산정 모듈로 구성되어 있어 각각의 모듈에서 유량규모에 대응하는 유사량과 농도를 산정할 수 있다. 총유사량 산정 모듈은 대표적인 확산-이송형 모형이라 할 수 있는 Modified Einstein 공식을 토대로 하였으며, 하상토유사량 산정 모듈은 Einstein, Ackers & White, Engelund & Hansen, Yang의 유사량 공식을 근간으로 되었다. 본 시스템은 크게 총 5개의 모듈을 가지며, 총 20개의 부프로그램(Subroutine Program)과 23개의 사용자정의함수 구문으로 개발되었다. 또한 단면의 특성변화 분석모듈과 DBFPAD 저장 및 관리모듈이 포함되어 있어 산정된 결과를 용이하게 비교 분석할 수 있고, 기존 자료와의 비교도 쉽게 수행할 수 있도록 구성하였다.

  • PDF

Numerical Study on Spatial Prediction of Algae Concentration (조류의 공간적 농도 분포 예측을 위한 수치적 연구)

  • Kim, Jun Song;Seo, Il Won;Lyu, Siwan;Kwak, Sunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.92-92
    • /
    • 2017
  • 본 연구에서는 수치모델을 이용하여 대하천서 발생되는 조류의 공간적 농도 분포를 예측하였고, 현장실험을 통해 모델을 검증하였다. 국내하천은 다수의 지류가 본류로 유입됨에 따라 오염물질의 생산과 공급이 지속적으로 발생하고, 하천의 유로연장과 하폭에 비해 수심이 낮은 지형학적 특성을 지닌다. 따라서 지류 유입 이후 발생되는 조류의 거동 특성을 분석하기 위해 수심 적분된 2차원 이송-확산 모델을 사용하였다. 광합성 성장을 이루는 조류의 성장속도 계산을 위해 영양염류, 수온, 일사량과 수심 등을 변수로 하는 성장속도 함수들을 위의 모델과 결합하였다. 본 연구의 대상구간은 낙동강과 금호강 합류부를 포함한 강정고령보 하류 약 9.2 km 구간으로 모델 검증을 위한 현장실험을 수행하였다. 2차원 이송-확산 모델의 입력 값인 유속 및 수심을 계산하는 수리동역학 모델 검증을 위해 미국 Sontek사의 M9을 이용하여 낙동강과 금호강 각각 32개, 12개 측선에 대하여 수리량을 측정하였다. 수리량 측정결과, 금호강과 낙동강의 평균 유량은 각각 $240m^3/s$, $60m^3/s$로 측정되었고 측정된 유량을 모델의 상류단 경계조건으로 사용하여 측정 유속 및 수심과 유사한 결과를 모델로부터 취득할 수 있었다. 조류 농도 측정을 위해 독일 bbe사의 AlgaeTorch 10을 사용하였으며, 수리량 측정과 동일한 측선서 총 조류 세포수(cells/ml)를 측정하였다. 농도 측정결과, 하류로 내려감에 따라 조류의 농도가 증가하는 경향이 나타났고 금호강 합류 후 최대농도는 측정구간 최하류 우안서 4,460 cells/ml로 나타났다. 주 흐름이 발생하는 하천 중앙부에 비해 유속이 느린 하안서 상대적으로 높은 농도가 측정되었으며, 이와 같은 경향은 하류로 내려감에 따라 강하게 나타났다. 측정된 조류 농도를 이용한 2차원 이송-확산 모델 검증결과, 합류부 최상류 측선서 MAPE = 10.5 %의 최대오차가 발생하였고 최하류 측선서 MAPE = 6.7 %의 최소오차가 발생하였다. 인과 질소와 같은 영양염류의 농도가 높고 횡 방향 수온 분포가 균일한 대상구간의 특성상 영양염류 함수와 수온 함수로부터 계산된 성장속도 가중치 범위는 각각 0.8~1.0, 0.91~1.09로 공간적 변동성이 크게 나타나지 않은 반면, 수심을 변수로 하는 일사량 함수의 성장속도 가중치 범위는 0.05~1.00으로 상대적으로 매우 높은 공간적 변동성이 나타났다. 수심이 4 m 이하인 하천 양안서 0.8 이상의 가중치가 나타났으며, 수심이 7 m 이상인 하천 중앙서 0.4 이하의 가중치가 나타났다. 본 연구의 수치모의 결과, 수리동역학 모델로부터 계산된 수심이 모델 결과 값에 큰 영향을 미치는 것으로 판단된다.

  • PDF

Similarity Pattern Analysis of Web Log Data using Multidimensional FCM (다차원 FCM을 이용한 웹 로그 데이터의 유사 패턴 분석)

  • 김미라;조동섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 마이닝(Data Mining)이란 저장된 많은 양의 자료로부터 통계적 수학적 분석방법을 이용하여 다양한 가치 있는 정보를 찾아내는 일련의 과정이다. 데이터 클러스터링은 이러한 데이터 마이닝을 위한 하나의 중요한 기법이다. 본 논문에서는 Fuzzy C-Means 알고리즘을 이용하여 웹 사용자들의 행위가 기록되어 있는 웹 로그 데이터를 데이터 클러스터링 하는 방법에 관하여 연구하고자 한다. Fuzzv C-Means 클러스터링 알고리즘은 각 데이터와 각 클러스터 중심과의 거리를 고려한 유사도 측정에 기초한 목적 함수의 최적화 방식을 사용한다. 웹 로그 데이터의 여러 필드 중에서 사용자 IP, 시간, 웹 페이지 필드를 WLDF(Web Log Data for FCM)으로 가공한 후, 다차원 Fuzzy C-Means 클러스터링을 한다. 그리고 이를 이용하여 샘플 데이터와 임의의 데이터간의 유사 패턴 분석을 하고자 한다.

  • PDF

Gene Expression Pattern Analysis Using Aspect Model-based Dimensionality Reduction (Aspect model 기반의 차원 축소를 이용한 유전자 발현데이터 분석)

  • 장정호;엄재홍;김유섭;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.247-249
    • /
    • 2004
  • 본 논문에서는 aspect model을 이용한 차원 축소 기반의 유전자 발현 데이터 분석을 제시한다. Aspect model은 은닉변수모델의 하나로서, 이를 이용하여 유전자 발현 데이터에 대한 확률적 학습 과정을 통해 특징적 발현 패턴을 추출할 수 있다. 또한 모델로부터 커널함수를 유도함으로써 발현패턴에 기반한 유전자간의 유사도를 자연스럽게 측정할 수 있다. 모델에 의해 정의되는 은닉공간 차원 수는 데이터 permutation 기반의 검증을 통해 결정한다. 효모 (yeast)의 세포 주기(cell cycle) 관련 발현데이터네 대한 실험에서, 주기별 특징 발현 패턴을 추출할 수 있었다. 또한 aspect model로부터 유도된 커널 기반의 유사도 척도를 이용함으로써, 동일 기능 또는 동일 complex 범주에 속하는 유전자 쌍 예측에서 기본적인 상관계수에 의한 방법에 비해 보다 향상된 성능을 얻을 수 있었다.

  • PDF