• 제목/요약/키워드: 중복분석

검색결과 1,435건 처리시간 0.038초

중복분석의 확장과 이를 이용한 일반화 정준상관분석 (A Note on Generalized Canonical Correlation Analysis Via an Extended Redundancy Analysis)

  • 강현철;김기영
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.105-113
    • /
    • 2000
  • Wollenberg(1977)의 중복분석(redundancy analysis)을 두 개 이상의 변수집단이 주어져 있는 경우로 확장하고, 확장된 중복분석과 일반화 정준상관분석의 관계를 논의하며, 이 관계를 이용하여 새로운 형태의 일반화 정준상관분석을 제안한다.

  • PDF

예비타당성조사 R&D 중복성 검토의 판단 및 개선 방안에 대한 연구 : 조사 담당자의 설문 응답 기반 분석 (Study on Judgement and Improvement of R&D Overlap Analysis during National R&D Pre-feasibility Study : Analysis based on Survey Response of Pre-feasibility Studying Team)

  • 박창현
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.535-546
    • /
    • 2017
  • 국가 R&D 사업에 대한 예비타당성조사 시 R&D 중복성에 대한 검토는 중복된 투자를 방지하여 재정 투자의 효율성을 높이는데 중요하다. 본 연구에서는 예비타당성조사 담당자들을 대상으로 중복성 검토에 대한 중요요인, 개선사항, 판단기준, 판단주체에 대한 설문조사 분석을 진행하였고, 외부 전문가 그룹의 인식차이와 비교하였다. 설문조사 결과에 대한 통계 분석을 통해 중복성 검토에서 가장 중요한 요인은 '중복성 판단기준, 시스템의 데이터베이스 및 검색 알고리즘'으로 확인되었고, 3가지 요인에 대한 개선이 중복성 검토를 개선하는데 가장 중요함을 확인하였다. 또한 다중회귀분석을 통해 주요 요인들이 중복성 검토결과의 정확성에 미치는 영향성을 분석하여 요인들의 유의성에 대해 확인하였다. 본 연구를 통해 예비타당성 조사 시 R&D 중복성에 대한 검토가 향후 어떤 방향으로 개선되어야하는지에 대해 시사점이 제시된다.

  • PDF

스트림 기반 DNA 리드 중복제거 방법 (Stream based DNA Read Deduplication Method)

  • 이현병;송석일;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.9-10
    • /
    • 2019
  • NGS 분석과정 중 증폭된 DNA 리드(Read)는 중복이 발생하여 이로 인해 다음 단계의 정확도 저하 등의 문제를 야기한다. 이 논문에서는 기존 DNA 리드 중복 제거 도구 중 하나인 Samblaster의 중복제거 알고리즘을 이용하여 분산 병렬 형태로 중복제거를 수행하는 방법을 제안한다. 제안하는 중복제거 방법은 중복제거 전단계인 정렬단계애서 정렬된 리드에 대해 중복제거 키를 생성하고 이를 스트림으로 전달하여 중복제거를 수행한다.

  • PDF

다중 문서요약에서 문장의 중복도 측정방법 개선 (Measuring Improvement of Sentence-Redundancy in Multi-Document Summarization)

  • 임정민;강인수;배재학;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.493-495
    • /
    • 2003
  • 다중문서요약에서는 단일문서요약과 달리 문장간의 중복도를 측정하는 방법이 요구된다. 기존에는 중복된 단어의 빈도수를 이용하거나, 구문트리 구조를 이용한 방법이 있으나, 중복도를 측정하는데 도움이 되지 못하는 단어와, 구문분석기 성능에 따라서 중복도 측정에 오류를 발생시킨다. 본 논문은 주절 종속절의 구분, 문장성분, 주절 용언의 의미를 이용하는 문장간 중복도 측정방법을 제안한다. 위의 방법으로 구현된 시스템은 기존의 중복된 단어 빈도수 방식에 비해 정확율에서 56%의 성능 향상이 있었다.

  • PDF

클라우드 스토리지 시스템을 위한 중복제거 기술 연구 (A Study on De-Duplication for Cloud Storage Systems)

  • 김태훈;김지홍;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.188-190
    • /
    • 2012
  • 클라우드 스토리지에 저장되는 데이터가 급증하면서 데이터 중복으로 인한 스토리지의 저장 비용이 증가하고 있다. 이러한 데이터 중복 문제를 해결하기 위해서 기존의 스토리지 환경에서는 다양한 데이터 중복제거 기술이 제안되었다. 이에 본 논문에서는 클라우드 스토리지를 위한 데이터 중복제거 기술의 분석을 통하여 대규모 클라우드 스토리지에서의 데이터 중복 제거율을 높이기 위해 데이터 유형의 특성을 고려한 스토리지 중복제거 기술의 필요성을 제시한다.

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

데이터 중복 제거 기술 분석 (An analysis of Data Deduplication techniques)

  • 조민정;이창훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.305-308
    • /
    • 2016
  • 저장하는 데이터의 용량이 증가함에 따라 데이터들은 효율적으로 보관될 필요성이 증가하였다. 이에 따라, 데이터 용량을 줄이는 기술로 많은 서비스들이 데이터 중복 제거 기술을 사용한다. 본 연구에서는 일부 서비스의 데이터 중복 제거 기술을 분석하고, 데이터 중복 제거 기술의 발전 동향을 예측하고자한다.

단위 모듈 기반의 하드웨어 중복구조 신뢰도 분석 도구 개발 (Development of Reliability Block Diagram Analysis Tool for H/W Redundancy Structure based on Unit Module)

  • 김성수;박상혁;김성환;최기영;하철근;박춘배
    • 한국항공우주학회지
    • /
    • 제37권6호
    • /
    • pp.595-601
    • /
    • 2009
  • 높은 신뢰도를 요구하는 비행제어 시스템은 복잡한 중복구조로 구성된다. 이러한 중복 구조는 시스템의 내고장성(fault tolerant)을 향상시킬 수 있다. 따라서 시스템 설계자는 다양하게 구성될 수 있는 중복구조의 정량적 데이터를 바탕으로 적절한 구조를 선택할 수 있다. 본 논문에서는 중복구조의 특징을 분석하고 신뢰도 해석을 위해 필요한 수학적 모델을 정의하였다. 이렇게 정의된 해석 모델을 적용하여 Simulink 블록 기반의 Reliability Block Diagram 해석 도구를 구성하고, 상용으로 사용되고 있는 도구를 이용하여 분석도구의 타당성을 검증하였다.

중학교 과학 및 기술·가정 교과의 교육과정과 교과서에 제시된 소화와 에너지 단원의 내용 중복 및 연계성 분석 (The Analysis of Duplicated Contents and Sequence between Science and Technology·Home Economics Curricular and Textbooks in Middle School about 'Digestion' and 'Energy')

  • 심왕섭;이현동;박경숙
    • 과학교육연구지
    • /
    • 제41권1호
    • /
    • pp.1-15
    • /
    • 2017
  • 이 연구의 목적은 미래의 교육과정과 교과서 개발에 시사점을 제시하기 위해 2009 개정 교육 과정의 과학과 기술 가정 교과에 대한 내용 중복과 연계성을 분석하였다. 교육과정의 내용 중복성 분석 및 주제 선정을 위하여 과학과 기술 가정의 교육과정에서 제시한 성취기준을 분석하였다. 그리고 과학과 기술 가정 교과서 각 1종을 선택하여 '소화'와 '에너지'에 단원에서 제시된 개념의 중복성을 분석하였고 개념도를 통해 개념의 수준, 전체적인 구성 및 연계성을 비교하였다. 교과서의 중복성을 분석한 결과 소화와 에너지에 관련된 4개의 성취 기준이 중복되어 있었다. 교과서를 분석한 결과, 소화는 22개 개념이 에너지는 9개의 개념이 중복되어 제시되고 있음을 알 수 있었다. 전체적으로 동일한 개념을 기술할 때 과학 교과서에서는 그 내용이 상세하게 제시된 반면 기술 가정 교과서에서는 다양한 예시나 유형이 제시되어 있지만 그 내용의 수준이 다소 낮았다. 동일한 용어를 다르게 표현한 사례도 있었다. 이 연구 결과를 토대로 두 교과의 중복된 내용에 대한 교수에 있어서 학습의 선후 관계나 연계성을 고려한다면 교육의 효율성을 증진시킬 수 있을 것이다.

이븐 연결망 Ed의 에지 중복 없는 스패닝 트리를 구성하는 알고리즘 (Constructing Algorithm of Edge-Disjoint Spanning Trees in Even Interconnection Network Ed)

  • 김종석;김성원
    • 정보처리학회논문지A
    • /
    • 제17A권3호
    • /
    • pp.113-120
    • /
    • 2010
  • 이븐 연결망은 고장허용 다중컴퓨터에 대한 하나의 모형으로 제안된 연결망으로, 간단한 라우팅 알고리즘, 최대고장허용도, 노드 중복 없는 경로와 같은 여러 가지 유용한 성질과 알고리즘들이 분석되었다. 기존에 발표된 라우팅 알고리즘과 노드 중복 없는 경로를 구성하는 알고리즘은 최적임이 증명되었다. 하지만 아직까지 이븐 연결망에서 에지 중복 없는 스패닝 트리를 구성하는 기법은 소개되지 않았다. 에지 중복 없는 스패닝 트리는 상호연결망의 고장허용도의 성능 향상과 효율적인 방송 기법을 분석하기 위해서 사용되는 매우 유용한 기법이다. 기존에 발표된 라우팅 알고리즘 또는 노드 중복 없는 경로를 구성하는 알고리즘은 라우팅 또는 노드 중복 없는 경로를 위한 알고리즘으로 에지 중복 없는 스패닝 트리를 구성하기 위해 적용될 수 없는 알고리즘이다. 본 논문에서는 이븐 연결망 $E_d$에서 에지 중복 없는 스패닝 트리를 구성하는 알고리즘을 제안한다.