• Title/Summary/Keyword: 유사성 측정

Search Result 2,970, Processing Time 0.044 seconds

A Study on the Integration of Similar Sentences in Atomatic Summarizing of Document (자동초록 작성시에 발생하는 유사의미 문장요소들의 통합에 관한 연구)

  • Lee, Tae-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.34 no.2
    • /
    • pp.87-115
    • /
    • 2000
  • The effects of the Case, Part of Speech, Word and Clause Location, Word Frequency etc. were studied in discriminating the similar sentences of the Korean text. Word Frequency was much related to the discrimination of similarity and Tilte word and Functional Clause were little, but the others were not. The cosine coefficient and Salton'similarity measurement are used to measure the similarity between sentences. The change of clauses between each sentence is also used to unify the similar sentences into a represenative sentence.

  • PDF

The Characteristics of Sediment Discharge in 2010 (본 2010년 하천 유사량 특성 분석)

  • Go, Ju-Yeon;Lee, Yeon-Kil;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.332-332
    • /
    • 2011
  • 하천 유사량 특성 분석은 하천유역 내의 수리구조물 설계 및 유지관리, 하천개수 및 하도의 안정, 홍수터 관리, 저수지 설계 및 운영 등 수자원 개발 및 관리를 위한 하천계획의 필요한 요소 중 하나이며 현장 측정에서 분석까지 정밀한 일련의 과정을 통해서 알아낼 수 있다. 본 연구에서는 6개 지점(여주, 왜관, 진동, 공주, 나주, 구례2)에 대해 유사량 특성 분석을 수행하였다. 부유사량은 강우가 집중되는 홍수기(왕복수심적분법; D-74측정장비 / 표면채취법)를 중심으로 측정하였고 하상토의 경우는 Grab Sampler(60L), 선격자법 등을 이용하여 홍수기 전 후로 2회 채취하였다. 채취된 시료는 특성에 따라 여과법(부유사농도), BW관법(부유사입도분포), 체분석법(하상토입도분포)으로 분석하였으며, 이를 통해 산정된 평균 부유사농도, Oden Curve와 입도분포곡선 및 수리량(수위, 유속, 측정수심, 수면폭, 수면경사, 수온)등의 자료를 이용하여 총유사량(Modified Einstein 방법)을 추정하였다. 본 연구 결과는 다음과 같다.: 1) 유량-부유사량 및 총유사량 관계: 유량-부유사량의 관계에 있어 대체적으로 일관된 경향성이 나타났으며 총유사량과의 관계 역시 부유사량과 비슷한 경향성을 보임. 일부 성과의 경우, 총유사량과의 관계에 있어 Modified Einstein 조건의 불충족(자갈하상재료 또는 저유속)으로 부유사량과 동일추정이거나 추정불가 및 이상치가 나타남. 2) 유량-부유사량 특성: 전체적으로 루프현상을 보이며 초기 강우 사상에서는 더 많은 유사량이 발생하는데 이는 초기 강우에 의해 유사 이송이 활발하게 이루어지는 일반적인 특성임. 또한 수위 상승-하강에 따른 부유사량 자료가 더욱더 확보된다면 수위 상승과 하강부로 구분하여 분석하는 것도 의의가 있을 것으로 판단됨. 3) 유량-유사량관계식 개발: 개발된 관계식은 총유사량이 아닌 부유사량으로 개발되었으며, 측정성과들 간의 상관계수가 0.9723(구례2 지점) ~ 0.8490(나주 지점)으로 분석됨. 또한 개발된 관계식에 대한 신뢰도 분석을 실시하지 않았기 때문에 적용 시에는 주의가 요구됨.

  • PDF

Similar Weather Retrieval System using Position Information of High atmospheric pressure (고/저기압 위치 정보를 이용한 유사 일기도 검색 시스템)

  • 정창성;이기범;김진용;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.214-216
    • /
    • 2001
  • 본 연구의 목적은 동아시아 지역에 대한 등압선 일기도를 대상으로 지상 일기 유형을 고저기압의 수 및 위치, 등압선의 간격, 기압값의 유사성을 파라메터로 분류하고 유사 일기도 검색시 동일한 파라메터를 사용하여 유사성 정도를 검색하는 알고리즘을 개발하는데 있다. 격자 데이터로부터 특징값들을 추출하고 이를 이용하여 유사도 측정을 수행하여 유사일기도를 검색하였다.

A Study on the Similarity of Compound Nouns and Noun Phrases in Sentences (문장의 복합명사와 명사구의 유사정도에 대한 고찰)

  • 이태영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.43-46
    • /
    • 1999
  • 문장간의 유사정도와 명사구나 복합어간에서 유사한 그룹을 식별하는 연구를 수행하였다. 명사 어구는 형태소의 대체나 생략 등으로, 문장은 절간의 전체적 일치와 부분적 일치로 유사도를 측정하였다. 유사도가 50%이상되는 경우들에 유사성을 인정하였다.

  • PDF

Estimation of Sediment Concentration Factor based on Entropy Theory (엔트로피 이론 기반의 유사농도 인자 산정)

  • Kim, Yeong-Sik;Nam, Yoon-Chang;Jeon, Hae-Sung;Jeon, Kun-Hak;Choo, Yeon-Moon
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.21 no.10
    • /
    • pp.325-333
    • /
    • 2020
  • Current methods of measuring the sediment concentration of natural streams can be affected by weather conditions and have lower reliability in bed-load sections due to mechanical limits. Theoretical methods have to be used to solve this problem, but they have low reliability compared to the measured values and diverse results for the bed-load sediment concentration. This study proposes a new way to reliably determine the bed-load sediment concentration from the relation with theoretical depth-integrated concentration based on the informational entropy concept. Sediment distribution shows a uniform probability distribution under maximized entropy conditions under some constraints, so a function can be calculated for the sediment distribution and depth-integrated concentration. The parameters of a stream were estimated by a nonlinear regression method using the concentration data from a past experiment. Equilibrium N (EN) was estimated using the relation between two different formulas proposed in this study, which can ease the estimation of both the total sediment distribution and depth-integrated sediment concentration with high reliable results with an average R2 of 0.924.

Noise-tolerant Image Restoration with Similarity-learned Fuzzy Association Memory

  • Park, Choong Shik
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.3
    • /
    • pp.51-55
    • /
    • 2020
  • In this paper, an improved FAM is proposed by adopting similarity learning in the existing FAM (Fuzzy Associative Memory) used in image restoration. Image restoration refers to the recovery of the latent clean image from its noise-corrupted version. In serious application like face recognition, this process should be noise-tolerant, robust, fast, and scalable. The existing FAM is a simple single layered neural network that can be applied to this domain with its robust fuzzy control but has low capacity problem in real world applications. That similarity measure is implied to the connection strength of the FAM structure to minimize the root mean square error between the recovered and the original image. The efficacy of the proposed algorithm is verified with significant low error magnitude from random noise in our experiment.

A Methodology for Semantic Similarity Measurement among Metadata based Information System (메타데이터 기반 정보시스템간 의미 유사도 측정 방법)

  • Lim Jung-Eun;Choi O-Hoon;Na Hong-Seok;Baik Doo-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.85-87
    • /
    • 2006
  • 특정 도메인의 정보시스템간에 정보를 공유하기 위해서, 정보 시스템들은 도메인별로 사용되는 메타데이터를 각기 정의하여 사용하기 때문에 각각의 정보 시스템간의 정보 공유시 메타데이터의 이질성 문제가 발생되지 않는다. 그러나, 메타데이터의 불일치 문제는 이기종 도메인간에 정보를 공유할때 발생된다. 본 논문에서는 메타데이터를 이용하여 구축된 정보시스템 간의 상호운용성을 증진하기 위하여 메타데이터의 의미적 유사성 측정 방법을 제안한다. 이를 위하여 메타데이터 레지스트리(MDR)에 정의되어 있는 메타데이터에 대한 개념 모델을 정의하고. 개념모델의 인스턴스간에 의미유사성을 측정하는 방법을 제안한다. 제안한 방법을 사용한 결과 도메인이 다른 정보시스템간에 점보공유를 위한 의미적으로 유사한 최적의 메타데이터를 선택할 수 있다.

  • PDF

Measuring Methods of Functional Similarity and Code Generation Rate for the Code Generated by MDD (MDD 기법을 이용하여 생성된 코드 간의 기능적 유사도 및 코드 생성률 측정 기법)

  • Ryu, Sung-tae;Park, Chul-hyun;Lee, Eunseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.287-290
    • /
    • 2010
  • 오늘날 모바일 시장을 중심으로 다양한 플랫폼이 등장하면서 모바일 어플리케이션 개발 시 여러 플랫폼을 고려해야 하는 부담이 증대되고 있다. 이러한 상황에서 Model-Driven Development(MDD) 는 멀티플랫폼에 대응하는 어플리케이션 개발의 효율성을 높여줄 수 있다. 하지만 이 기법을 이용하는 대다수의 연구 결과들은 해당 방법론을 통해 생성된 결과물의 질을 객관적으로 평가할 수 없고, 이 때문에 해당 방법론의 성능 평가가 힘들다. 본 연구에서는 대상 플랫폼들이 제공하는 API 를 분석한 결과에 근거하여 공통 요소를 추출하고 이를 이용하여 MDD 기반으로 개발을 진행할 수 있는 개발 프로세스를 소개하고, 이를 통해 생성된 소스 코드의 기능적 유사도 및 코드 생성률과 기능적 유사도를 평가할 수 있는 방법을 제안한다. 이 방법은 코드를 AST 로 바꾸고 API 맵핑 테이블에 근거하여 동일한 키워드로 변환하고 유사도를 측정하여 설계 시 의도한 기능이 얼마나 잘 코드로 생성되었는 지 평가할 수 있는 방법이다. 본 연구에서는 이 방법을 이용하여 생성된 코드의 기능적 유사도와 코드 생성률을 측정하였다.

Development of a Performance Evaluation Model on Similarity Measurement Method of Malware (악성코드 유사도 측정 기법의 성능 평가 모델 개발)

  • Chu, Sung-Taek;Kim, HeeSeok;Im, Kwang-Hyuk;Kim, Kyu-Il;Seo, Chang-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.10
    • /
    • pp.32-40
    • /
    • 2014
  • While there is a great demand for malware classification to reduce the time required in malware analysis and find a new type of malware, various similarity measurement methods of malware to classify a lot of malwares have been proposed. But, the existing methods to measure similarity just represented the classification results by them and have not carried out performance comparison with other methods. This is because an evaluation model to compare the performance of similarity measurement methods is non-existent. In this paper, we propose a new performance evaluation model on similarity measurement methods of malware by using two indicators: success rate and degree of confidence. In addition, we compare and evaluate the performance of existing similarity measurement methods by using these two indicators.

A Method for Measuring Inter-Utterance Similarity Considering Various Linguistic Features (다양한 언어적 자질을 고려한 발화간 유사도 측정 방법)

  • Lee, Yeon-Su;Shin, Joong-Hwi;Hong, Gum-Won;Song, Young-In;Lee, Do-Gil;Rim, Hae-Chang
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.1
    • /
    • pp.61-69
    • /
    • 2009
  • This paper presents an improved method measuring inter-utterance similarity in an example-based dialogue system, which searches the most similar utterance in a dialogue database to generate a response to a given user utterance. Unlike general inter-sentence similarity measures, the inter-utterance similarity measure for example-based dialogue system should consider not only word distribution but also various linguistic features, such as affirmation/negation, tense, modality, sentence type, which affects the natural conversation. However, previous approaches do not sufficiently reflect these features. This paper proposes a new utterance similarity measure by analyzing and reflecting various linguistic features to improve performance in accuracy. Also, by considering substitutability of the features, the proposed method can utilize limited number of examples. Experimental results show that the proposed method achieves 10%p improvement in accuracy compared to the previous method.