• Title/Summary/Keyword: 집합 기반 분석

Search Result 536, Processing Time 0.029 seconds

Efficient Part-of-Speech Set for Knowledge-based Word Sense Disambiguation of Korean Nouns (한국어 명사의 지식기반 의미중의성 해소를 위한 효과적인 품사집합)

  • Kwak, Chul-Heon;Seo, Young-Hoon;Lee, Chung-Hee
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.4
    • /
    • pp.418-425
    • /
    • 2016
  • This paper presents the part-of-speech set which is highly efficient at knowledge-based word sense disambiguation for Korean nouns. 174,000 sentences extracted for test set from Sejong semantic tagged corpus whose sense is based on Standard korean dictionary. We disambiguate selected nouns in test set using glosses and examples in Standard Korean dictionary. 15 part-of-speeches which give the best performance for all test set and 17 part-of-speeches which give the best performance for accuracy average of selected nouns are selected. We obtain 12% more performance by those part-of-speech sets than by full 45 part-of-speech set.

A Performance Evaluation of Indexing Methods for Content-based Retrieval of High Dimensional Multimedia Data (고차원 멀티미디어 데이터에 대한 내용기반 검색을 위한 인덱싱 방법들의 성능 평가)

  • Moon, Joo-Sun;Choi, Jeong-Hoon;Nang, Jong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06a
    • /
    • pp.345-346
    • /
    • 2008
  • 멀티미디어 데이터베이스의 효과적인 내용 기반 검색을 위한 많은 색인 방법들이 연구되어왔지만 정작 동일한 데이터 집합과 동일한 평가 기준으로 서로 다른 검색 방법들의 성능을 분석한 실험은 이뤄지지 않았다. 본 논문에서는 기존의 대표적인 색인 방법들을 구현하고 공통의 데이터 집합에 대한 색인 검색을 여러 성능 측정 기준에 따라 분석함으로써 각 색인 방법들의 특징 및 성능을 객관적으로 평가하였다. 향후 본 논문에서 실험한 결과들을 이용하면 특정 데이터 집합에 효과적인 색인 방법을 선택할 수 있을 것이다.

  • PDF

A Piecewise Linear Transformation Method based on SPMF and Its Application to Linguistic Approximation (표준 매개변수 소속 함수에 기반을 둔 구간 선형 변환 방법과 언어 근사에의 응용)

  • Choe, Dae-Yeong
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.351-356
    • /
    • 2001
  • 표준 매개변수 소속 함수(SPMF)에 기반을 둔 구간 선형 변환 방법(PLTM)을 제안한다. 이는 구간 선형 변환 방법을 사용해서 비 매개변수 소속 함수(NPMF)로 표현된 퍼지 집합이 매개변수 소속 함수(PMF)로 표현된 퍼지 집합으로 변환될 수 있다는 생각에서 유래되었다. 이 경우, 이들 매개변수들은 퍼지 집합의 구조를 결정하기 위한 특징점들 이라고 할 수 있다. 결과적으로 구간 선형 변환 방법은 비 매개변수 소속 함수를 매개변수 소속 함수로 변환해 줌으로써 비 매개변수 소속 함수에 기반을 둔 퍼지 시스템과 비교해 볼 때 퍼지 시스템이 상대적으로 빠르게 처리될 수 있게 한다. 한편, 표준 매개변수 소속 함수들의 전형적인 형태가 소개되고 분석된다. 끝으로, PLTM의 전형적인 응용을 제시하고 수치적인 예를 보여준다.

  • PDF

A Comparative Study of Parametric Methods for Significant Gene Set Identification Depending on Various Expression Metrics (유전자 발현 메트릭에 기반한 모수적 방식의 유의 유전자 집합 검출 비교 연구)

  • Kim, Jae-Young;Shin, Mi-Young
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.1
    • /
    • pp.1-8
    • /
    • 2010
  • Recently lots of attention has been paid to gene set analysis for identifying differentially expressed gene-sets between two sample groups. Unlike earlier approaches, the gene set analysis enables us to find significant gene-sets along with their functional characteristics. For this reason, various novel approaches have been suggested lately for gene set analysis. As one of such, PAGE is a parametric approach that employs average difference (AD) as an expression metric to quantify expression differences between two sample groups and assumes that the distribution of gene scores is normal. This approach is preferred to non-parametric approach because of more effective performance. However, the metric AD does not reflect either gene expression intensities or variances over samples in calculating gene scores. Thus, in this paper, we investigate the usefulness of several other expression metrics for parametric gene-set analysis, which consider actual expression intensities of genes or their expression variances over samples. For this purpose, we examined three expression metrics, WAD (weighted average difference), FC (Fisher's criterion), and Abs_SNR (Absolute value of signal-to-noise ratio) for parametric gene set analysis and evaluated their experimental results.

Transformation of Constraint-based Analyses for Efficient Analysis of Java Programs (Java 프로그램의 효율적인 분석을 위한 집합-기반 분석의 변환)

  • Jo, Jang-Wu;Chang, Byeong-Mo
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.7
    • /
    • pp.510-520
    • /
    • 2002
  • This paper proposes a transformation-based approach to design constraint-based analyses for Java at a coarser granularity. In this approach, we design a less or equally precise but more efficient version of an original analysis by transforming the original construction rules into new ones. As applications of this rule transformation, we provide two instances of analysis design by rule-transformation. The first one designs a sparse version of class analysis for Java and the second one deals with a sparse exception analysis for Java. Both are designed based on method-level, and the sparse exception analysis is shown to give the same information for every method as the original analysis.

PKI 표준화 동향과 PKI 영역간 상호 연동 방법

  • 염흥열
    • Review of KIISC
    • /
    • v.12 no.4
    • /
    • pp.23-45
    • /
    • 2002
  • 공개키 기반구조는 공개키 알고리즘을 이용하여 정보보호 서비스를 제공하는 정보처리 및 정보통신시스템에서 사용자 공개키의 무결성과 인증성을 제공하기 위한 중요한 기반 서비스이다. 공개키에 대한 무결성을 제공하기 위해서는 전자서명이 요구되며, 인증성을 제공하기 위해서는 제3의 신뢰기관이 요구된다. 제3의 신뢰기관이 통칭 인증기관이다. 사용자는 인증서를 이용하여 응용에게 공개키의 무결성과 인증성을 알려주며, 응용은 인증서에 포함되어 있는 공개키를 이용하여 정보통신 시스템에서 다양한 정보보호 서비스를 실현한다. 인증서 정책은 하나의 인증서를 특정응용에 적용 가능한지를 알려주기 위한 법칙들의 집합이라고 될 수 있다. PKI 영역(Domain)은 하나의 통일되고 합의된 인증서 정책으로 구현되는 인증기관들과 사용자들의 집합이라고 볼 수 있다. PKI 응용 영역간의 상호 연동은 PKI 서비스를 확장하기 위하여 중요한 기술이다. 본 고에서는 PKI 영역간 상호 연동을 위한 공개키 기반구조의 개요와 필요성 등을 기술하고, IETF PKIX의 공개키 기반구조 표준화 동향을 분석하며, 상호 연동을 위하여 요구되는 인증서 정책과 인증서 확장자를 살펴보고, 대표적인 주요 인증서 정책들을 분석하며, 최근 PKI 포럼에서 연구된 PKI 영역간 상호 연동 방식을 살펴보고, 마지막으로 상호 연동 방식간의 특징과 장단점을 제시한다.

Design and Performance Analysis of MapReduce-based kNN join Query Processing Algorithm (맵리듀스 기반 kNN join 질의처리 알고리즘의 설계 및 성능평가)

  • Kim, TaeHoon;Lee, HyunJo;Chang, JaeWoo
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.733-736
    • /
    • 2014
  • 최근 대용량 데이터에 대한 효율적인 데이터 분석 기법이 활발히 연구되고 있다. 대표적인 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의를 처리하기 때문에 질의처리 시간을 감소시킨다. 그러나 VkNN-join은 색인 구축 비용이 높으며, kNN 연산 오버헤드가 큰 문제점이 존재한다. 이를 해결하기 위해, 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 감소시킨다. 또한 시드 간 평균 거리를 기반으로 후보 영역을 선정함으로써, 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 나타낸다.

Visualization of Exception Propagation for Java Programs based on Static Analysis (정적분석을 이용한 자바 프로그램의 예외 전파 시각화)

  • 허순희;창병모
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.7_8
    • /
    • pp.696-702
    • /
    • 2003
  • This paper presents a static analysis based on set-based framework which estimates exception propagation paths of Java programs, and a visualization tool which visualizes propagation paths of exceptions using the static analysis information. We have implemented the exception propagation analysis and a visualization tool, which can guide programmers to handle exceptions more effectively.

The Software Classification Criteria based on the Tolerant Rough Set (허용적 러프집합에 기반한 소프트웨어 분류기준)

  • 김상용;최완규;김영식;이성주
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.307-310
    • /
    • 2000
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나는 "구조적인" 프로그램 범주에 속하고 또 다른 하나는 비구조적인 프로그램 범주에 속한다고 명확히 분류 할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류 기준 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석하여 생성된 분류기준이 타당함을 보여준다.

  • PDF

A Study on Comparison of Clustering Algorithm-based Methods for Acquiring Training Sets for Social Image Classification (소셜 이미지 분류를 위한 클러스터링 알고리즘 기반 트레이닝 집합 획득 기법의 비교)

  • Jeong, Jin-Woo;Lee, Dong-Ho
    • Annual Conference of KIPS
    • /
    • 2011.04a
    • /
    • pp.1294-1297
    • /
    • 2011
  • 최근, Flickr, YouTube 와 같은 사용자 참여형 미디어 공유 및 검색 사이트가 폭발적으로 증가하면서, 이를 멀티미디어 정보 검색 서비스에 효과적으로 활용하기 위한 다양한 연구들이 시도되고 있다. 특히, 이미지에 할당되어 있는 태그를 이용하여 이미지를 효과적으로 검색하기 위한 연구가 활발히 진행 중이다. 그러나 사용자들에 의해 제공되는 소셜 이미지들은 매우 다양한 범위와 주제를 가지고 있기 때문에, 소셜 이미지들의 분류 및 태그 할당을 위한 트레이닝 집합의 획득이 쉽지 않다는 한계점을 가지고 있다. 본 논문에서는 데이터 군집화를 위한 클러스터링 알고리즘들 중 K-Means, K-Medoids, Affinity Propagation 을 활용하여 소셜 이미지 집합으로부터 트레이닝 집합을 획득하기 위한 방법들을 살펴 본다. 또한, 각 알고리즘으로부터 획득한 트레이닝 집합을 이용하여 소셜 이미지를 분류한 결과를 비교 분석한다.