• 제목/요약/키워드: 고차원

검색결과 465건 처리시간 0.024초

색상과 모양 특징을 이용한 효율적인 이미지 검색기법 (Efficient Image Search Technique Using Color and Shape Feature)

  • 조범석;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2000
  • 내용기반 이미지 검색을 위한 기존의 대부분의 기법들은 이미지 데이터에 효과적으로 적용할 수 있는 고차원의 색인구조를 고려하지 않았다. 이 연구에서는 이미지 데이터베이스에서 보다 효율적이며 정확도가 높은 검색결과를 기대할 수 있는 색상 특징 데이터 표현방법인 ECCV기법, 모양 특징 데이터 표현방법인 EPA기법을 소개한다. 또한 고차원 데이터에 대해서도 검색속도를 향상시킬 수 있는 새로운 다차원 공간 인덱스 구조인 XS-트리를 제안한다. 이 방법을 이용하면 특징표현단계에서는 차원의 수가 증가되어 저장에 필요한 공간을 많이 요구하지만 인덱싱 단계를 거치면 이미지 검색 속도가 향상되며 정확한 이미지를 검색 할 수 있는 장점이 있다.

  • PDF

필터링에 기반한 고차원 색인구조의 동시성 제어 기법의 설계 및 구현 (Design and Implementation of High-dimernsional Index Structure supporting Concurrency Control)

  • 이용주;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.33-35
    • /
    • 2000
  • 최근 멀티미디어 객체를 위한 효율적인 색인 기술에 대한 많은 연구가 활발히 진행되고 있으나 이러한 색인 구조들은 단일 사용자만을 지원하는데 그치고 있는 실정이며 상용 DBMS에 통합되어 실제 응용되는 사례는 드물다. 이에 본 논문에서는 필터링에 기반한 고차원 색인구조를 위한 효율적인 동시성 제어 기법을 제안하고, 지속성 객체 시스템인 SHORE 하부 저장 구조에 통합한다. 제안하는 동시성 제어 기법은 쓰레드의 개수를 증가시켜 삽입과 검색 측면에서 실험한 결과 약 30%의 응답시간 감소를 보였다.

  • PDF

HMM 모델을 이용한 의료 문서 대상 고차원 개념 태깅 (High Level Semantic Tagging in Clinical Documents Using a HMM Model)

  • 장혜주;송사광;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.19-21
    • /
    • 2006
  • 본 논문에서는 의료임상 문서의 구절(phrase)를 대상으로 고차원 개념의 정보를 태깅하는 시맨틱 태깅 시스템을 제안하고 있다. 시스템은 의사들이 기록한 임상 기록으로부터 정보를 추출한다. 태깅은 UMLS와 POS, 약어 태깅이 된 문서를 대상으로 HMM 모델에 의거하여 이루어지게 된다. 태깅된 결과는 의료 상에서의 경험적 지식을 추출하는데 이용되어 의사들의 의사 결정을 지원하게 된다.

  • PDF

적응적 상관도를 이용한 주성분 분석에 관한 연구 (A Study on PCA using Adaptive Correlation)

  • 고명숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.13-14
    • /
    • 2020
  • 고차원의 데이터를 처리하기 위해서는 데이터의 성질을 유지하면서 특징을 잘 반영할 수 있는 특징 추출 방법이 필요하며 주성분분석 방법은 대표적인 특징 추출 방법이다. 본 연구에서는 데이터가 고차원인 경우 데이터 특징 추출을 위한 주성분 분석의 주성분 변수 선정시 적응적 상관도(Correlation)를 기반으로 한 주성분 분석 방법을 제안한다. 제안하는 방법은 입력 데이터간의 상관관계를 기반으로 상관도를 적응적으로 반영하여 데이터의 주성분을 분석함으로써 실제 데이터의 특징을 나타내는 세분화 변수 선정 시 데이터 편향성의 영향을 줄이기 위한 방법이다.

고차원 데이터를 부분차원 클러스터링하는 효과적인 알고리즘 (An Effective Algorithm for Subdimensional Clustering of High Dimensional Data)

  • 박종수;김도형
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.417-426
    • /
    • 2003
  • 고차원 데이터에서 클러스터를 찾아내는 문제는 그 중요성으로 인해 데이터 마이닝 분야에서 잘 알려져 있다. 클러스터 분석은 패턴 인식, 데이터 분석, 시장 분석 등의 여러 응용 분야에 광범위하게 사용되어지고 있다. 최근에 이 문제를 풀 수 있는 투영된 클러스터링이라는 새로운 방법론이 제기되었다. 이것은 먼저 각 후보 클러스터의 부분차원들을 선택하고 이를 근거로 한 거리 함수에 따라 가장 가까운 클러스터에 점이 배정된다. 우리는 고차원 데이터를 부분차원 클러스터링하는 새로운 알고리즘을 제안한다. 알고리즘의 주요한 세 부분은, $\circled1$적절한 개수의 점들을 갖는 여러 개의 후보 클러스터로 입력 점들을 분할하고, $\circled2$다음 단계에서 유용하지 않은 클러스터들을 제외하고, 그리고 $\circled3$선택된 클러스터들은 밀접도 함수를 사용하여 미리 정해진 개수의 클러스터들로 병합한다. 다른 클러스터링 알고리즘과 비교하여 제안된 알고리즘의 좋은 성능을 보여주기 위하여 많은 실험을 수행하였다.

GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조 (GC-Tree: A Hierarchical Index Structure for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.13-22
    • /
    • 2004
  • 멀티미디어 데이타의 사용이 증가함에 따라 고차원 이미지 데이타에 대한 효율적인 색인과 검색 기법이 크게 요구되고 있다. 그러나 많은 노력에도 불구하고 현재의 다차원 색인 기법들은 고차원 데이타 공간에서 만족할 만한 성능을 보여주지 못하고 있다. 이러한 소위 차원의 저주를 해결하기 위해 최근에 차원을 줄이거나 근사 해를 구하는 둥의 접근법이 시도되고 있지만 이러한 방법들은 근본적으로 정확도의 상실이라는 문제를 갖고 있다. 정확도의 보존을 위해 VA-file, LPC-file둥과 같이 벡터 근사에 기반 한 기법들이 최근에 개발되었다. 그러나 이 기법은 검색 성능이 색인 파일의 크기에 큰 영향을 받으며, 한번에 큰 검색 공간을 줄이는 계층 색인 구조의 장점을 상실한다. 본 논문에서는 이미지 데이터베이스에서 유사성 질의를 위한 새로운 계층 색인 구조인 GC-트리를 제안한다. GC-트리는 밀도 함수에 기초하여 데이타 공간을 적응적으로 분할하고, 색인 구조를 동적으로 생성한다. 이러한 특성을 갖는 GC-트리는 군집화 된 고차원 이미지 데이타 검색에 훌륭한 성능을 나타낸다.

고차원 자료에서 영향점의 영향을 평가하기 위한 그래픽 방법 (Graphical method for evaluating the impact of influential observations in high-dimensional data)

  • 안소진;이재은;장대흥
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1291-1300
    • /
    • 2017
  • 고차원 자료에서는 관측값의 개수보다 변수의 개수가 과다하게 많은 것이 특징이다. 그러므로 회귀 계수 추정에 있어 관측값의 영향이 매우 클 수 있다. Jang과 Anserson-Cook (2017)은 라쏘추정량 사용시 영향점의 영향을 평가할 수 있는 라쏘 영향그림을 제안하였다. 본 연구에서는 고차원 자료에서 영향점을 평가하기 위한 그래픽 방법들로서 라쏘 영향그림 뿐만 아니라 라쏘 변수선택 순위그림, 삼차원 라쏘 영향그림을 제안하였다. 실세 두 가지 고차원 자료 예들에 영향점들을 찾기 위한 회귀진단 수단으로서 세가지 그래픽 방법들을 사용하여 본 결과 영향점들을 효과적으로 찾아낼 수 있었다.

CIR-Tree를 위한 효율적인 대량적재 알고리즘의 설계 및 구현 (Design and Implementation of an Efficient Bulk Loading Algorithm for CIR-Tree)

  • 피준일;송석일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.193-206
    • /
    • 2002
  • 이 논문에서는 고차원 색인 구조인 CIR-트리를 위한 효율적인 벌크로딩 알고리즘을 설계하고 구현한다. 벌크로딩 기법은 대량의 고차원 데이타가 색인 구성 시 함께 주어지는 경우 색인의 구성을 빠르게 하고 구축한 색인의 검색 성능을 향상시킨다. CIR-트리는 반드시 필요한 차원만 이용해서 비단말 노드의 엔트리를 구성하기 때문에 엔트리 크기가 일정하지 않다. 이 특성은 비단말 노드의 분기율을 높이고 탐색 성능을 향상시키는 효과가 있다. 기존에 다차원 및 고차원 색인구조를 위한 벌크로딩 기법이 제안되었지만 이러한 CIR-트리의 특징을 제대로 살릴 수 있는 방법은 없다. 이 논문에서는 기존의 벌크로딩 알고리즘을 개선하면서 CIR-트리의 특징을 효과적으로 색인 구성에 반영할 수 있는 알고리즘을 제안한다. 또한 이를 BADA-III의 하부 저장 시스템인 MiDAS-III에서 구현하고 다양한 실험을 통해 그 성능을 입증한다.

고차원 공간 데이터를 위한 연속 범위 질의의 효율적인 처리 (An Efficient Processing of Continuous Range Queries on High-Dimensional Spatial Data)

  • 장수민;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.397-401
    • /
    • 2007
  • 이동객체에 대한 연속 범위 질의(Continuous Range Query)의 응용프로그램이 급속도로 확장되면서 이차원정보를 넘어서 고차원 공간 데이타에 대한 처리를 요구하고 있다. 만약 고차원 데이타에 대한 중첩되어지는 연속 범위 질의의 정보를 기존의 색인으로 구성한다면 객체의 수와 질의의 수가 증가함에 따라 질의처리성능이 저하된다. 본 논문은 이러한 문제점을 해결하기 위하여 PAB(Projected Attribute Bit)-기반의 질의색인방법을 제안한다. 제안하는 기법은 성능향상을 위하여 질의의 정보를 각 속성 축에 투영이라는 작업을 통하여 고차원의 데이타를 1차원 정보들로 변환하고 이러한 정보를 비트단위로 구성하였다. 또한 제안하는 질의색인은 보다 효율적인 질의의 처리를 위하여 점진적인 갱신(Incremental Update)을 지원한다. 다양한 성능평가 및 분석을 통하여 제안하는 방법이 최근에 연구된 CES-기반의 질의색인 기법보다 더 나은 확장성(Scalability)을 가짐을 입증한다.