• 제목/요약/키워드: 고차원

검색결과 463건 처리시간 0.023초

점진적인 주성분분석기법을 이용한 고차원 자료의 특징 추출 (Feature Extraction on High Dimensional Data Using Incremental PCA)

  • 김병주
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1475-1479
    • /
    • 2004
  • 고차원 자료를 효율적으로 처리하기 위해서는 특징 추출 기법이 필요하다. 주성분분석 방법은 대표적인 특징추출 방법이지만 학습 자료의 차원이 큰 경우에는 고유공간을 계산하기 위해 많은 기억공간과 계산량을 필요로 한다. 본 논문에서는 고차원 자료의 특징 추출을 위해 점진적인 주성분분석 방법을 사용한다. 제안한 방법에 대해 신경망에서 점진적인 주성분분석을 하는 대표적인 방법인 APEX모델과 실험을 통해 비교해 본 결과 제안된 방법이 APEX 모델 보다 성능이 우수함을 나타내었다.

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 황지익;손대온;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.46-48
    • /
    • 2005
  • 기존의 다차원 색인 기법들이 고차원의 특징 벡터를 갖는 멀티미디어 컨텐츠 검색 분야에서 만족할 만한 성능을 보이지 못하므로, 이를 해결하기 위해 VA-File, LPC-File 등의 벡터 근사 방법이 개발 되었다. 이러한 방법들은 데이터의 접근에 소요되는 시간이 전체 검색시간의 대부분을 차지하는 경우에 효과적으로 사용할 수 있다. 그러나 고차원의 멀티미디어 데이터 검색에서 객체간의 거리 계산 시간은 데이터 접근 시간에 비해 무시할 만큼 작지 않으므로 이 방법들을 그대로 적용하기는 어렵다. 본 논문에서는 객체간의 거리 계산 시간을 줄이기 위한 새로운 색인 기법을 제안하고 실험을 통해 이 방법이 기존의 방법들에 비해 우수한 검색 성능을 가진다는 것을 보인다.

  • PDF

MiDAS-III에서 CIR-Tree를 위한 효율적인 벌크로딩 알고리즘의 설계 (Design of an Efficient Bulk Loading Algorithm for CIR-Tree on MiDAS-III)

  • 피준일;송석일;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.65-68
    • /
    • 2001
  • 이 논문에서는 고차원 색인 구조인 CIR-트리를 위한 효율적인 벌크로딩 알고리즘을 설계하고 구현한다. 벌크로딩 기법은 대량의 고차원 데이터가 색인 구성 시 함께 주어진는 경우 색인의 구성을 빠르게 하고 구축한 색인의 검색 성능을 향상시킨다. CIR-트리는 변별력 있는 일부 차원만 이용해서 비 단말노드의 엔트리를 구성하기 때문에 엔트리 크기가 일정하지 않다는 특징이 있으며 이는 비단말 노드의 팬아웃을 높이고 탐색 성능을 향상시키는 효과가 있다. 기존에 다차원 및 고차원 색인구조를 위한 벌크로딩 기법이 제안되었지만 이러한 CIR-트리의 특징을 제대로 살릴 수 있는 방법은 없다. 따라서 이 논문에서는 기존의 벌크로딩 알고리즘을 개선하면서 CIR-트리의 특징을 효과적으로 색인 구성에 반영할 수 있는 알고리즘을 제안한다. 또한 이를 BADA-III의 하부 저장 시스템인 MiDAS-III에서 구현하고 다양한 실험을 통해 그 성능을 입증한다.

  • PDF

저차원 영역에서 고차원 데이터 집합의 표현 방법 (Visualizing a Multi-Dimensional Data Set in a Lower Dimensional Space)

  • 서동훈;아나스타씨야;이원돈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.40-43
    • /
    • 2008
  • 본 논문에서는 고차원 영역의 데이터 집합을 저차원 영역으로 표현하는 방법에 대해서 제안한다. 특별히 고차원 영역을 2 차원 영역으로 실험하였다. 제안한 방법은 사람이 데이터 객체 사이의 거리나 관계를 직관적으로 인지할 수 있도록 하는 방법이다. 데이터 객체 사이의 거리나 관계를 계산하기 위하여 Kullback-Leibler divergence 를 사용하였다. 이 방법은 확률 분포를 갖는 벡터들 사이의 거리를 계산하여 사용한다. Kullback-Leibler divergence 를 사용하여 계산된 거리 값들은 저차원 영역에서 객체들의 좌표를 계산하기 위하여 사용된다. 좌표계산을 위해서 Simulated Annealing 란 최적화 기법을 사용하였다. 실험 결과를 통해 다차원 데이터를 2 차원 영역으로 표현한 것이 충분히 직관적임을 보였다.

동영상 내용기반 검색을 위한 고차원 벡터 데이터 색인 구조의 성능 분석 (Performance Analysis of High-Dimensional Index Structure for Vector Data in Content-Based Video Retrieval)

  • 이현조;장재우;박순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.211-214
    • /
    • 2007
  • 최근 멀티미디어 데이터, 특히 UCC를 중심으로 동영상 데이터가 급증하고 있다. 그러나 현재 대부분의 검색 시스템은 키워드 기반의 동영상 데이터 검색만을 지원하고 있으며, 따라서 사용자가 원하는 동영상 데이터를 효율적으로 검색하지 못하는 실정이다. 동영상 데이터에 대한 효율적인 검색을 지원하기 위해서는, 동영상의 내용(이미지, 색, 모양 등)을 고차원의 특징 벡터 데이터로 표현하여 유사한 동영상을 검색하는 내용-기반 검색이 요구된다. 본 논문에서는 내용-기반 검색을 위해 제안된 기존의 고차원 벡터 데이터 색인 구조를 실험을 통하여 성능을 비교하며, 이를 통해 동영상 내용-기반 검색에 가장 효율적인 색인 기법을 제시한다. 아울러 보다 효율적인 내용-기반 검색을 위한, 근사 k-NN 질의 탐색 기법의 유용성을 검증한다.

고차원펄스 스펙트럼 분석을 위한 이러닝 시스템의 설계 (Design of e-Learning System for Spectral Analysis of High-Order Pulse)

  • 오용선
    • 한국콘텐츠학회논문지
    • /
    • 제11권8호
    • /
    • pp.475-487
    • /
    • 2011
  • 본 논문에서는 고차원펄스의 스펙트럼을 유도하는 체계적인 방법을 제시하고, 이를 학습내용으로 하는 효율적인 이러닝 시스템을 설계한다. 고차원펄스의 스펙트럼은 연속미분법이나 콘볼루션법 등 기존의 방법에 의하여 유도될 수 있으나, 그 차수가 증가함에 따라 현저하게 높아지는 복잡도 때문에 사용할 수 없다. 우리는 고차원펄스의 차수에 따라 순환적으로 적용되는 알고리듬을 제시하고, 이를 찾아보기표에 의하여 함수적으로 차수에 연관된 스펙트럼의 식을 유도한다. 또한, 이를 이용하여 고차원펄스의 스펙트럼을 분석하는 과정을 학습하는 이러닝 콘텐츠를 설계한다. 여기에는 기존의 순차적 재생을 기본으로 하여 이른바 개념단위 오브젝트별 분기방식을 적용하는 콘텐츠 처리방식이 사용된다. 모델링, 임펄스응답과 전달함수, 파라미터, 찾아보기표 등 전체를 네 개의 개념단위로 분할한 콘텐츠페이지를 설계하고, 이들로부터 하향식으로 분화된 개념단위들을 모듈과 서브모듈로 설정한다. 이들은 개념단위 오브젝트별 분기방식에 의하여 학습자에게 다양한 학습순서와 반복학습 등을 제공하여 상호작용을 증대하고, 저작된 이러닝 콘텐츠에 의한 학습효과를 현저히 향상시킨다. 또한, 콘텐츠 자체의 효율성 측면에서도 현저한 향상을 이룬다.

구형 피라미드 기법 : 고차원 데이터의 유사성 검색을 위한 효율적인 색인 기법 (Spherical Pyramid-Technique : An Efficient Indexing Technique for Similarity Search in High-Dimensional Data)

  • 이동호;정진완;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1270-1281
    • /
    • 1999
  • 피라미드 기법 1 은 d-차원의 공간을 2d개의 피라미드들로 분할하는 특별한 공간 분할 방식을 이용하여 고차원 데이타를 효율적으로 색인할 수 있는 새로운 색인 방법으로 제안되었다. 피라미드 기법은 고차원 사각형 형태의 영역 질의에는 효율적이나, 유사성 검색에 많이 사용되는 고차원 구형태의 영역 질의에는 비효율적인 면이 존재한다. 본 논문에서는 고차원 데이타를 많이 사용하는 유사성 검색에 효율적인 새로운 색인 기법으로 구형 피라미드 기법을 제안한다. 구형 피라미드 기법은 먼저 d-차원의 공간을 2d개의 구형 피라미드로 분할하고, 각 단일 구형 피라미드를 다시 구형태의 조각으로 분할하는 특별한 공간 분할 방법에 기반하고 있다. 이러한 공간 분할 방식은 피라미드 기법과 마찬가지로 d-차원 공간을 1-차원 공간으로 변환할 수 있다. 따라서, 변환된 1-차원 데이타를 다루기 위하여 B+-트리를 사용할 수 있다. 본 논문에서는 이렇게 분할된 공간에서 고차원 구형태의 영역 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 마지막으로, 인위적 데이타와 실제 데이타를 사용한 다양한 실험을 통하여 구형 피라미드 기법이 구형태의 영역 질의를 처리하는데 있어서 기존의 피라미드 기법보다 효율적임을 보인다.Abstract The Pyramid-Technique 1 was proposed as a new indexing method for high- dimensional data spaces using a special partitioning strategy that divides d-dimensional space into 2d pyramids. It is efficient for hypercube range query, but is not efficient for hypersphere range query which is frequently used in similarity search. In this paper, we propose the Spherical Pyramid-Technique, an efficient indexing method for similarity search in high-dimensional space. The Spherical Pyramid-Technique is based on a special partitioning strategy, which is to divide the d-dimensional data space first into 2d spherical pyramids, and then cut the single spherical pyramid into several spherical slices. This partition provides a transformation of d-dimensional space into 1-dimensional space as the Pyramid-Technique does. Thus, we are able to use a B+-tree to manage the transformed 1-dimensional data. We also propose the algorithm of processing hypersphere range query on the space partitioned by this partitioning strategy. Finally, we show that the Spherical Pyramid-Technique clearly outperforms the Pyramid-Technique in processing hypersphere range queries through various experiments using synthetic and real data.

인공데이터첨가를 통한 SOM의 quantization error 감소 (Error reduction by adding artificial data in SOM)

  • 김승택;조성준
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.260-267
    • /
    • 2005
  • 자기조직화지도(Self Organizing Map, SOM)는 비지도 신경망으로서 고차원의 입력공간을 위상적관계를 유지시키면서 저차원으로 사영 시킬 수 있는 특징을 갖고 있다. SOM은 패턴인 식과 자료압축/재생 등 여러 분야에서 유용하게 활용될 수 있으며 특히 고차원 자료의 시각화 방법으로 많은 관심을 받고 있다. 본 연구에서는 SOM의 quantization error를 줄이기 위한 목적으로 인공데이터를 생성시켜 학습에 이용하는 방법을 제시한다. 이는 특히 데이터가 부족한 상황에서 SOM을 학습시켜야 할 때 유용하게 적용될 수 있을 것으로 기대된다.

  • PDF

대용량 멀티미디어 데이터베이스를 위한 LSH 파라메터 실험 (A Study on LSH Parameters for Large Multimedia Databases)

  • 홍지원;문병문;김상욱
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.445-446
    • /
    • 2015
  • LSH는 고차원 데이터베이스에서의 빠른 유사 아이템 검색을 위해 널리 사용되고 있는 인덱싱 방안이나, 다양한 파라메터가 존재하여 각 파라메터를 적절하게 설정하는 데에 어려움이 있다. 본 논문에서는 다양한 실험을 통해 고차원의 대용량 멀티미디어 데이터베이스에서의 유사 아이템 검색을 위한 LSH의 파라메터에 따른 성능 추이를 살펴보고, 적절한 파라메터를 설정하는 방안에 대해 논의한다.

  • PDF

고차원 데이터에서 점진적 프로젝션을 이용한 클러스터링 (A Clustering using Incremental Projection for High Dimensional Data)

  • 이혜명;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.189-191
    • /
    • 2000
  • 데이터 마이닝의 방법론 중 클러스터링은 데이터베이스 객체들의 에트리뷰트 값에 근거하여 유사한 그룹으로 식별하는 기술적인 작업이다. 그러나 대부분 알고리즘들은 데이터의 차원이 증가할수록 형성된 전체 데이터 공간은 매우 방대하므로 의미있는 클러스터의 탐색이 더욱 어렵다. 따라서 효과적인 클러스터링을 위해서는 클러스터가 포함될 데이터 공간의 예측이 필요하다. 본 논문에서는 고차원 데이터에서 각 차원에 대한 점진적 프로젝션을 이용한 클러스터링 방법을 제안한다. 제안한 방법에서는 클러스터가 포함될 가능성이 있는 데이터공간의 후보영역을 결정하여, 이 영역에서 점들의 평균값을 중심으로 클러스터를 탐색한다.

  • PDF