• Title/Summary/Keyword: 유사도비

Search Result 19, Processing Time 0.026 seconds

Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model (벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상)

  • 최성환
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

Document Embedding and Image Content Analysis for Improving News Clustering System (뉴스 클러스터링 개선을 위한 문서 임베딩 및 이미지 분석 자질의 활용)

  • Kim, Siyeon;Kim, Sang-Bum
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.104-108
    • /
    • 2015
  • 많은 양의 뉴스가 생성됨에 따라 이를 효과적으로 정리하는 기법이 최근 활발히 연구되어왔다. 그 중 뉴스클러스터링은 두 뉴스가 동일사건을 다루는지를 판정하는 분류기의 성능에 의존적인데, 대부분의 경우 BoW(Bag-of-Words)기반 벡터유사도를 사용하고 있다. 본 논문에서는 BoW기반의 벡터유사도 뿐 아니라 두 문서에 포함된 사진들의 유사성 및 주제의 관련성을 측정, 이를 분류기의 자질로 추가하여 두 뉴스가 동일사건을 다루는지 판정하는 분류기의 성능을 개선하는 방법을 제안한다. 사진들의 유사성 및 주제의 관련성은 최근 각광을 받는 딥러닝기반 CNN과 신경망기반 문서임베딩을 통해 측정하였다. 실험결과 기존의 BoW기반 벡터유사도에 의한 분류기의 성능에 비해 제안하는 두 자질을 사용하였을 경우 3.4%의 성능 향상을 보여주었다.

  • PDF

Efficient Speech Enhancement based on left-right HMM with State Sequence Decision Using LRT (좌-우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상)

  • 이기용
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.1
    • /
    • pp.47-53
    • /
    • 2004
  • We propose a new speech enhancement algorithm based on left-right Hidden Markov Model (HMM) with state decision using Log-likelihood Ratio Test (LRT). Since the conventional HMM-based speech enhancement methods try to improve speech quality for all states, they introduce huge computational loads inappropriate to real-time implementation. In the left-right HMM, only the current and the next state are considered for a possible state transition so to reduce the computational complexity. In this paper, we propose a method to decide the current state by using the LRT on the previous state. Experimental results show that the proposed method improves the speed up to 60% with 0.2∼0.4 dB degradation of speech quality compared to the conventional method.

Application of Machine Learning Techniques for Resolving Korean Author Names (한글 저자명 중의성 해소를 위한 기계학습기법의 적용)

  • Kang, In-Su
    • Journal of the Korean Society for information Management
    • /
    • v.25 no.3
    • /
    • pp.27-39
    • /
    • 2008
  • In bibliographic data, the use of personal names to indicate authors makes it difficult to specify a particular author since there are numerous authors whose personal names are the same. Resolving same-name author instances into different individuals is called author resolution, which consists of two steps: calculating author similarities and then clustering same-name author instances into different person groups. Author similarities are computed from similarities of author-related bibliographic features such as coauthors, titles of papers, publication information, using supervised or unsupervised methods. Supervised approaches employ machine learning techniques to automatically learn the author similarity function from author-resolved training samples. So far however, a few machine learning methods have been investigated for author resolution. This paper provides a comparative evaluation of a variety of recent high-performing machine learning techniques on author disambiguation, and compares several methods of processing author disambiguation features such as coauthors and titles of papers.

Prediction of Urban Inundation using SIND Model : Application of Nakdong River Basin (SIND Model을 적용한 도시침수 예측 : 낙동강 유역 적용)

  • Kim, Dong Hyun;Lee, Seung Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.293-293
    • /
    • 2019
  • 최근 도심지 침수예방을 위해 구조적 비구조적인 대책 등이 수행되어 왔으나, 도심지의 국지성 호우의 발생빈도가 증가함에 따라 단시간의 도심지 침수예측의 중요성이 다시 대두되고 있다. 이에 도심지 침수 예측을 위해서는 수치모의 프로그램을 사용한 연구가 진행되어 왔으나, 국지성 호우에 의한 침수를 막을 만킁의 실시간 위험예측은 아직까지 힘든 실정이다. 한편 해양재난의 침수를 예방하기 위해서 국립재난안전연구원(2017)에서는 과학적 보간법을 적용한 침수예측 모형인 SIND(Scientific Interpolation for Natural Disaster) Model을 개발한 바 있다. 따라서 본 연구에서는 SIND Model을 도심지 침수예측에 적용하여 집중호우와 같은 단기간의 침수를 예방하고자 한다. SIND Model은 기 구축된 침수예상도를 활용하여 모든 시나리오에 대한 침수 위험도 등급을 실시간으로 평가하는 모형이다. 국토부에서 제공하는 국가홍수위험지도와 내수침수지도를 활용하였고, SIND Model은 Comsol Multyphisic를 활용하여 침수예측지도를 생성하였다. 기존에 해양재난 예측을 위해 사용하였던 Risk Grade 방정식에 시간 항(time term)과 도심지의 최초 침수 발생위치에 생성 항(source term)을 추가하여 도심지 침수특성을 반영하였다. 결과를 평가하기 위하여 CRITIC(CRiteria Importance Through Intercriteria Correlation) 방법을 활용한 형상유사도를 산출하였다. 그 결과, 기 구축된 홍수위험지도와 형상유사도는 전체 구역 중 80%의 구역이 0.8 이상의 값을 나타내었다. 20%의 구역에서는 복잡한 도심지의 건물, 구조물 등의 침수특성을 반영하지 못하여 형상유사도가 낮게 평가된 것으로 판단되며, 향후 위험도 예측을 위해 배수시스템 등의 영향인자를 고려한다면 위험도 등급 예측의 정확도를 높일 수 있을 것이라 기대된다.

  • PDF

Comparing the Performance of Global Query Expansion according to Similarity Measures (유사계수에 따른 전역적 질의확장 검색 성능 비교)

  • 이재윤
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.526-528
    • /
    • 2003
  • 공기빈도를 이용한 전역적 질의확장 검색에서 공기유사도를 판정하는데 이용되는 유사계수의 특성에 따른 질의확장 성능을 비교해보았다. 먼저 각 유사계수의 통계적인 특성을 말뭉치와 검색실험 문서집단을 대상으로 살펴본 결과 코사인 계수, 자카드 계수는 고빈도어 선호경향을 보이고 상호정보량과 율의 Y는 저빈도어 선호경향을 보이는 것으로 나타났다. 질의확장 검색실험에서는 고빈도어 선호경향을 가진 유사계수에 비해서 저빈도어 선호경향을 가진 유사계수률 이용할 때 더 종은 성능이 나타났다. 특히 율의 Y는 질의어의 DF가 1에 가깝게 매우 낮을 때 다른 유사계수와 달리 고빈도어를 선호함으로써 항상 저빈도어를 선호하는 상호정보량에 비해서 질의확장 검색에 유리함을 알 수가 있었다.

  • PDF

An Improved Block-matching Algorithm Based on Motion Similarity of Adjacent Macro-blocks (인접 매크로블록간 움직임유사도 기반 개선된 블록매칭 알고리즘)

  • Ryu, Tae-kyung;Jeong, Yong-jae;Moon, Kwang-seok;Kim, Jong-nam
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.663-667
    • /
    • 2009
  • 본 논문에서는 인접블록간의 움직임 유사도를 이용하여 불필요한 후보블록을 보다 빠르게 제거하는 PDE기반의 고속 블록매칭 알고리즘을 제안한다. 제안한 방법은 기존의 방법보다 불필요한 계수를 효율적으로 제거하기 위하여 인접 블록간의 영상의 유사성에 기초하여 인접한 네개의 매크로블록 가운데 최대 복잡도를 가지는 서브블록의 누적된 비율(cumulative distribution function-CDF)을 사용하고 서브블록별 복잡도가 집중되지 않도록 하기위하여 normalized 기반 매칭스캔 방법을 사용하여 효율적으로 계산량을 줄였다. 제안한 알고리즘은 화질의 저하 없이 기존의 PDE 알고리즘에 비해 60% 이상의 계산량을 줄였으며, MPEG-2 및 MPEG-4 AVC를 이용하는 비디오 압축 응용분야에 유용하게 사용될 수 있을 것이다.

  • PDF

A Fast Partial Distortion Elimination Algorithm Using Motion Similarity of Macro-blocks (매크로블록 간 움직임유사도를 이용한 고속 PDE 알고리즘)

  • Ryu, Tae-Kyung;Jeong, Yong-Jae;Moon, Kwang-Seok;Kim, Jong-Nam
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.225-228
    • /
    • 2009
  • 본 논문에서는 인접블록간의 움직임 유사도를 이용하여 불필요한 후보블록을 보다 빠르게 제거하는 PDE기반의 고속 블록매칭 알고리즘을 제안한다. 제안한 방법은 기존의 방법보다 불필요한 계수를 효율적으로 제거하기 위하여 인접 블록간의 영상의 유사성에 기초하여 네 개의 인접 매크로블록 가운데 최대 복잡도를 가지는 서브블록의 누적 분포 함수(cumulative distribution function-CDF)와 서브블록별 복잡도가 집중되지 않도록 하기위하여 normalized스캔 방법에 사용하여 효율적으로 계산량을 감소하였다. 제안한 알고리즘은 화질의 저하 없이 기존의 PDE 알고리즘에 비해 55% 이상의 계산량을 줄였으며, MPEG-2 및 MPEG-4 AVC를 이용하는 비디오 압축 응용분야에 유용하게 사용될 수 있을 것이다.

  • PDF

LDPC-LDPC Product Code Using Modified Log-likelihood Ratio for Holographic Storage System (홀로그래픽 저장장치를 위한 수정된 로그-유사도비를 이용한 LDPC-LDPC 곱부호)

  • Jeong, Seongkwon;Lee, Jaejin
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.54 no.6
    • /
    • pp.17-21
    • /
    • 2017
  • Since holographic data storage has the advantage of high recording density and data transfer rate, it is a candidate for the next generation storage systems. However, Holographic data storage system is affected by interpage interference and two dimensional intersymbol interference. Also, burst error occurs by physical impact. In this paper, we propose an LDPC product code using modified log-likelihood ratio and extrinsic information to correct burst error and improve performance of holographic data storage. The performance of proposed LDPC product code is 0.5dB better than that of the conventional LDPC code.

Phylogenetic Analysis of Human Bocavirus in Hospitalized Children with Acute Respiratory Tract Infection in Korea (급성 호흡기 감염으로 입원한 소아에서 분리된 보카바이러스의 계통분석)

  • Ahn, Jong Gyun;Choi, Seong Yeol;Kim, Dong Soo;Kim, Ki Hwan
    • Pediatric Infection and Vaccine
    • /
    • v.19 no.2
    • /
    • pp.71-78
    • /
    • 2012
  • Purpose: Human bocavirus (hBoV), a recently discovered virus, has been detected in children with respiratory tract infections worldwide. The aim of this study was to analyze the frequency and molecular phylogeny of hBoV in the respiratory samples of children with acute respiratory tract infections in 2010. Methods: Nasopharyngeal samples were collected from 953 children with lower respiratory tract infections at Severance children's hospital in Korea from January 2010 to December 2010. We applied the multiplex PCR technique for the identification of 12 respiratory viruses from the samples. Among the total specimens, hBoV positive samples were subjected to phylogenetic analysis by sequencing a fragment of the VP1/VP2 gene junction. Results: hBoV was detected in 141 (14.8%) among 953 patients. The 61.7% of hBoV-positive samples were found to co-exist with other respiratory viruses. The results of phylogenetic analysis showed that all 141 hBoV-positive isolates were identified as hBoV 1, revealing a high similarity among the isolates (>98%). Conclusion: hBoV 1 with minimal sequence variations circulated in children with acute respiratory infections during 2010. More research is needed to determine the clinical severity and outcomes of the minimal sequence variations.

  • PDF