• Title/Summary/Keyword: 중복분석

Search Result 1,435, Processing Time 0.03 seconds

A Note on Generalized Canonical Correlation Analysis Via an Extended Redundancy Analysis (중복분석의 확장과 이를 이용한 일반화 정준상관분석)

  • 강현철;김기영
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.105-113
    • /
    • 2000
  • Wollenberg(1977)의 중복분석(redundancy analysis)을 두 개 이상의 변수집단이 주어져 있는 경우로 확장하고, 확장된 중복분석과 일반화 정준상관분석의 관계를 논의하며, 이 관계를 이용하여 새로운 형태의 일반화 정준상관분석을 제안한다.

  • PDF

Study on Judgement and Improvement of R&D Overlap Analysis during National R&D Pre-feasibility Study : Analysis based on Survey Response of Pre-feasibility Studying Team (예비타당성조사 R&D 중복성 검토의 판단 및 개선 방안에 대한 연구 : 조사 담당자의 설문 응답 기반 분석)

  • Park, Chang-hyun
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.11a
    • /
    • pp.535-546
    • /
    • 2017
  • 국가 R&D 사업에 대한 예비타당성조사 시 R&D 중복성에 대한 검토는 중복된 투자를 방지하여 재정 투자의 효율성을 높이는데 중요하다. 본 연구에서는 예비타당성조사 담당자들을 대상으로 중복성 검토에 대한 중요요인, 개선사항, 판단기준, 판단주체에 대한 설문조사 분석을 진행하였고, 외부 전문가 그룹의 인식차이와 비교하였다. 설문조사 결과에 대한 통계 분석을 통해 중복성 검토에서 가장 중요한 요인은 '중복성 판단기준, 시스템의 데이터베이스 및 검색 알고리즘'으로 확인되었고, 3가지 요인에 대한 개선이 중복성 검토를 개선하는데 가장 중요함을 확인하였다. 또한 다중회귀분석을 통해 주요 요인들이 중복성 검토결과의 정확성에 미치는 영향성을 분석하여 요인들의 유의성에 대해 확인하였다. 본 연구를 통해 예비타당성 조사 시 R&D 중복성에 대한 검토가 향후 어떤 방향으로 개선되어야하는지에 대해 시사점이 제시된다.

  • PDF

Stream based DNA Read Deduplication Method (스트림 기반 DNA 리드 중복제거 방법)

  • Lee, Hyeon-byeong;Song, Seok-il;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.9-10
    • /
    • 2019
  • NGS 분석과정 중 증폭된 DNA 리드(Read)는 중복이 발생하여 이로 인해 다음 단계의 정확도 저하 등의 문제를 야기한다. 이 논문에서는 기존 DNA 리드 중복 제거 도구 중 하나인 Samblaster의 중복제거 알고리즘을 이용하여 분산 병렬 형태로 중복제거를 수행하는 방법을 제안한다. 제안하는 중복제거 방법은 중복제거 전단계인 정렬단계애서 정렬된 리드에 대해 중복제거 키를 생성하고 이를 스트림으로 전달하여 중복제거를 수행한다.

  • PDF

Measuring Improvement of Sentence-Redundancy in Multi-Document Summarization (다중 문서요약에서 문장의 중복도 측정방법 개선)

  • 임정민;강인수;배재학;이종혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.493-495
    • /
    • 2003
  • 다중문서요약에서는 단일문서요약과 달리 문장간의 중복도를 측정하는 방법이 요구된다. 기존에는 중복된 단어의 빈도수를 이용하거나, 구문트리 구조를 이용한 방법이 있으나, 중복도를 측정하는데 도움이 되지 못하는 단어와, 구문분석기 성능에 따라서 중복도 측정에 오류를 발생시킨다. 본 논문은 주절 종속절의 구분, 문장성분, 주절 용언의 의미를 이용하는 문장간 중복도 측정방법을 제안한다. 위의 방법으로 구현된 시스템은 기존의 중복된 단어 빈도수 방식에 비해 정확율에서 56%의 성능 향상이 있었다.

  • PDF

A Study on De-Duplication for Cloud Storage Systems (클라우드 스토리지 시스템을 위한 중복제거 기술 연구)

  • Kim, Taehun;Kim, Jee Hong;Eom, Young Ik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.188-190
    • /
    • 2012
  • 클라우드 스토리지에 저장되는 데이터가 급증하면서 데이터 중복으로 인한 스토리지의 저장 비용이 증가하고 있다. 이러한 데이터 중복 문제를 해결하기 위해서 기존의 스토리지 환경에서는 다양한 데이터 중복제거 기술이 제안되었다. 이에 본 논문에서는 클라우드 스토리지를 위한 데이터 중복제거 기술의 분석을 통하여 대규모 클라우드 스토리지에서의 데이터 중복 제거율을 높이기 위해 데이터 유형의 특성을 고려한 스토리지 중복제거 기술의 필요성을 제시한다.

Shredding XML Documents into Relations using Structural Redundancy (구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장)

  • Kim Jaehoon;Park Seog
    • Journal of KIISE:Databases
    • /
    • v.32 no.2
    • /
    • pp.177-192
    • /
    • 2005
  • In this paper, we introduce a structural redundancy method. It reduces the query processing cost incurred when reconfiguring an XML document from divided XML data in shredding XML documents into relations. The fundamental idea is that query performance can be enhanced by analyzing query patterns and replicating data essential for the query performance. For the practical and effective structural redundancy, we analyzed three types of ID, VALUE, and SUBTREE replication. In addition, if given XML data and queries are very large and complex, it can be very difficult to search optimal redundancy set. Therefore, a heuristic search method is introduced in this paper. Finally, XML query processing cost arising by employing the structural redundancy, and the efficiency of proposed search method arc analyzed experimentally It is manifest that XML read query is performed more quick]y but XML update query is performed more slowly due to the additional update consistency cost for replicas. However, experimental results showed that in-place ID replication is useful even in having excessive update cost. It was also observed that multiple-place SUBTREE replication can enhance read query performance remarkably if only update cost is not excessive.

An analysis of Data Deduplication techniques (데이터 중복 제거 기술 분석)

  • Jho, Min-Jeong;Lee, Chang-hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.305-308
    • /
    • 2016
  • 저장하는 데이터의 용량이 증가함에 따라 데이터들은 효율적으로 보관될 필요성이 증가하였다. 이에 따라, 데이터 용량을 줄이는 기술로 많은 서비스들이 데이터 중복 제거 기술을 사용한다. 본 연구에서는 일부 서비스의 데이터 중복 제거 기술을 분석하고, 데이터 중복 제거 기술의 발전 동향을 예측하고자한다.

Development of Reliability Block Diagram Analysis Tool for H/W Redundancy Structure based on Unit Module (단위 모듈 기반의 하드웨어 중복구조 신뢰도 분석 도구 개발)

  • Kim, Sung-Su;Park, Sang-Hyuk;Kim, Sung-Hwan;Choi, Kee-Young;Ha, Cheol-Keun;Park, Choon-Bae
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.37 no.6
    • /
    • pp.595-601
    • /
    • 2009
  • A flight control system for high reliability consists of complicated redundant structures. This redundancy can improve fault tolerant characteristics of system. So, a system manager is able to choose a suitable structure using analyzed quantitative data of various redundant structures. In this paper, we analyzed redundant characteristics and reliability. We defined necessary mathematical model for analysis tool. Then we compose a reliability block diagram analysis tool applying such defined analysis model using Simulink blocks. Finally we verified the analysis tool using a commercial tool.

The Analysis of Duplicated Contents and Sequence between Science and Technology·Home Economics Curricular and Textbooks in Middle School about 'Digestion' and 'Energy' (중학교 과학 및 기술·가정 교과의 교육과정과 교과서에 제시된 소화와 에너지 단원의 내용 중복 및 연계성 분석)

  • Sim, Wangseop;Lee, Hyundong;Park, Kyungsuk
    • Journal of Science Education
    • /
    • v.41 no.1
    • /
    • pp.1-15
    • /
    • 2017
  • The purpose of this study was to deduct implications for national curriculum and textbook by analysing the duplicated contents and sequence between science and technology home economics subjects of the 2009 revised middle school curriculum. For duplication analysis, overlapped achievement standards and themes were examined by comparing the science and technology home economics curricular. Next, analysis of duplicated concepts is performed by comparing science and technology home economics textbooks through the concept map. The result of analyses of the achievement standards showed 4 standards related with 'digestion', 'energy' were duplicated. The other results of studying duplicated contents in textbooks suggested overlapped concepts(terms) were existed as following: digestion(22 contents), Energy(9 contents). In science textbook, the duplicated concept is usually described in detail. In contrast, the technology home economics textbook explain the duplicated concept briefly with providing various type of examples and cases. There are differences of using terminology between two subject textbooks. The findings of this study may provide educational insights into teaching of the duplicated contents between science and technology home economics.

Constructing Algorithm of Edge-Disjoint Spanning Trees in Even Interconnection Network Ed (이븐 연결망 Ed의 에지 중복 없는 스패닝 트리를 구성하는 알고리즘)

  • Kim, Jong-Seok;Kim, Sung-Won
    • The KIPS Transactions:PartA
    • /
    • v.17A no.3
    • /
    • pp.113-120
    • /
    • 2010
  • Even networks were introduced as a class of fault-tolerant multiprocessor networks and analyzed so many useful properties and algorithms such as simple routing algorithms, maximal fault tolerance, node disjoint path. Introduced routing algorithms and node disjoint path algorithms are proven to be optimal. However, it has not been introduced to constructing scheme for edge-disjoint spanning trees in even networks. The design of edge-disjoint spanning trees is a useful scheme to analyze for measuring the efficiency of fault tolerant of interconnection network and effective broadcasting. Introduced routing algorithm or node disjoint path algorithm are for the purpose of routing or node disjoint path hence they are not applicable to constitute edge disjoint spanning tree. In this paper, we show a construction algorithm of edge-disjoint spanning trees in even network $E_d$.