• 제목/요약/키워드: 이미지 질의

검색결과 554건 처리시간 0.027초

GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조 (GC-Tree: A Hierarchical Index Structure for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.13-22
    • /
    • 2004
  • 멀티미디어 데이타의 사용이 증가함에 따라 고차원 이미지 데이타에 대한 효율적인 색인과 검색 기법이 크게 요구되고 있다. 그러나 많은 노력에도 불구하고 현재의 다차원 색인 기법들은 고차원 데이타 공간에서 만족할 만한 성능을 보여주지 못하고 있다. 이러한 소위 차원의 저주를 해결하기 위해 최근에 차원을 줄이거나 근사 해를 구하는 둥의 접근법이 시도되고 있지만 이러한 방법들은 근본적으로 정확도의 상실이라는 문제를 갖고 있다. 정확도의 보존을 위해 VA-file, LPC-file둥과 같이 벡터 근사에 기반 한 기법들이 최근에 개발되었다. 그러나 이 기법은 검색 성능이 색인 파일의 크기에 큰 영향을 받으며, 한번에 큰 검색 공간을 줄이는 계층 색인 구조의 장점을 상실한다. 본 논문에서는 이미지 데이터베이스에서 유사성 질의를 위한 새로운 계층 색인 구조인 GC-트리를 제안한다. GC-트리는 밀도 함수에 기초하여 데이타 공간을 적응적으로 분할하고, 색인 구조를 동적으로 생성한다. 이러한 특성을 갖는 GC-트리는 군집화 된 고차원 이미지 데이타 검색에 훌륭한 성능을 나타낸다.

모바일폰에서의 실시간 도로교통상황 서비스를 위한 동영상 처리 방법 (Video Stream Processing for Service of Heal-Time Road Traffic Scones on Mobile Phone)

  • 고석민;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.223-225
    • /
    • 2002
  • 오늘날 실시간 하에서 자동적인 교통정보의 분석은 IVHS(Intelligent Vehicle High-way Systems)의 많은 분야에서 필수적으로 사용된다. 또한 바쁜 현대인들이 러시아워에서 교통이 다소 원활한 지역으로 이동하여 시간을 절약하고자 교통 정보를 이용하고자 한다. 하지만 모바일폰은 작은 디스플레이, 메모리, 전원 장치 등등의 제약 사항을 가지고 있다. 본 논문에서는 이러한 제약을 가지고 있는 도로 교통 영상 스트림을 모바일폰에서 서비스하기 위한 실시간 비디오 처리 방법을 제안한다. 영상 스트림의 시간적 정보를 바탕으로 프레임 율을 조절하는 시간적 처리 방안과 불필요한 영역제거, 이미지 크기 변환, 칼라 수 줄이기등의 공간적 활용 방안을 제안하고자 한다. 이와 더불어 모바일폰에서의 질 높은 서비스를 제공하기 위하여 비디오 스트림을 이루는 이미지 각각에 대한 이미지 질 향상에 대한 처리 방법들을 제안 하고자 한다. 본 연구의 실험으로 모바일폰에서 효율적인 도로 교통 영상 서비스를 제공할 수 있음을 알 수 있다.

  • PDF

다수의 트랜스코딩 프록시 환경하에서 효율적인 이미지 전송을 위한 프록시 선택 방법 (A Method for Selecting one among Multiple Transcoding Proxies for Efficient Image Transmission)

  • 윤수미;김상철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.594-596
    • /
    • 2000
  • 인터넷 환경에서 프록시(proxy)는, 효율적인 데이터의 전송을 위해 다양한 클라이언트 장치들과 WWW 서버들간의 다리역할을 수행한다. 특히, 최근의 인터넷 환경은 이미지 같은 복잡하고 대량의 크기를 갖는 데이터 전송을 많이 요구하고 있으므로, 클라이언트 환경에 맞는 최선의 화질과 최소의 지연시간을 갖도록 데이터를 변환하여 재전송하는 트랜스코딩(transcoding)이 중요시되고 있다. 본 연구에서는 트랜스코딩을 수행하는 다수의 프록시들이 존재할 때, 클라이언트의 요구(request)와 장치(device), 또는 네트워크의 여러 가지 조건에 가장 적합한 프록시를 선택할 수 있는 수리적인 모델을 제안한다. 이러한 수리적 모델은 경로연결(redirector)내에서 동작하는 알고리즘으로서, 예상되는 지연시간과 오버플로우의 가능성을 최소화할 수 있는 최선의 프록시를 클라이언트와 서버사이에 연결함으로서 이미지 전송에 있어서 더 큰 효과를 얻을 수 있다. 실험 결과, 전체적인 지연시간을 줄일 수 있을 뿐만 아니라 클라이언트에게 적절한 양과 질의 데이터 전송효과를 가진다.

  • PDF

컬러 특성에 의한 영상 검색 알고리즘 (A New Image Search and Retrieval System using Color Features)

  • 이효종;이도균;송명성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.695-698
    • /
    • 2000
  • 본 논문에서는 이미지 데이터 컬러 속성을 기반으로 한 영상 검색 방법을 제안한다. 두 이미지 사이의 유사성을 측정하기 위하여 컬러 히스토그램의 분포 특성을 이미지 데이터베이스 영상과질의 영상에서 계산하여 유사도를 결정하도록 설계하였다. 두 영상의 유사도를 측정하기 위해 두영상의 R, G, B 히스토그램에 대해서 같은 값에 대한 빈도 수의 차를 거리로 측정한 후, 구해진 거리의 차를 비교한 방법과 히스토그램의 분포 곡선을 이루는 방정식을 구한 수 있도록 곡선 정합을 한 후에 두 영상의 컬러 특징 속성에 관한 특징 값의 추출을 위해서 다항식 보간법에 의한 방정식을 이용한 방법을 소개한다. 공간 데이터베이스 시스템에서 질의에 대한 효율적인 처리를 위해 R-Tree와 최대 점을 이용하여 영상을 검색한다.

  • PDF

엔빌로프 기반의 하한을 사용한 윤곽선 이미지 매칭 (Boundary Image Matching using the Envelop-based Lower Bound)

  • 김상필;문양세;김범수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.49-52
    • /
    • 2010
  • 본 논문에서는 윤곽선 이미지 매칭에서 회전-불변 거리를 계산하는 효율적 방법을 제안한다. 회전-불변 거리 계산은 이미지 시계열을 한 칸씩 회전하면서 매번 유클리디안 거리를 계산해야 하는 고비용의 연산이다. 본 논문에서는 엔빌로프 기반 하한을 사용하여 불필요한 회전-불변 거리 계산을 크게 줄이는 효율적인 해결책을 제시하다. 이를 위해, 먼저 질의 시퀀스 대상의 엔빌로프 작성과 이의 하한 개념을 제시한다.다음으로, 엔빌로프 기반 하한을 회전-불변 거리 계산에 사용하면 많은 수의 회전-불변 거리계산을 줄일 수 있음을 보인다. 실험 결과, 제안한 엔빌로프 기반 매칭 기법은 기존 기법에 비해 최대 수배에서 수십배까지 매칭 성능을 향상시킨 것으로 나타났다.

  • PDF

프롬프트 기반 퓨샷 러닝을 통한 한국어 대화형 텍스트 기반 이미지 생성 (Image Generation from Korean Dialogue Text via Prompt-based Few-shot Learning)

  • 이은찬;안상태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.447-451
    • /
    • 2022
  • 본 논문에서는 사용자가 대화 텍스트 방식의 입력을 주었을 때 이를 키워드 중심으로 변환하여 이미지를 생성해내는 방식을 제안한다. 대화 텍스트란 채팅 등에서 주로 사용하는 형식의 구어체를 말하며 이러한 텍스트 형식은 텍스트 기반 이미지 생성 모델이 적절한 아웃풋 이미지를 생성하기 어렵게 만든다. 이를 해결하기 위해 대화 텍스트를 키워드 중심 텍스트로 바꾸어 텍스트 기반 이미지 생성 모델의 입력으로 변환하는 과정이 이미지 생성의 질을 높이는 좋은 방안이 될 수 있는데 이러한 태스크에 적합한 학습 데이터는 충분하지 않다. 본 논문에서는 이러한 문제를 다루기 위한 하나의 방안으로 사전학습된 초대형 언어모델인 KoGPT 모델을 활용하며, 퓨샷 러닝을 통해 적은 양의 직접 제작한 데이터만을 학습시켜 대화 텍스트 기반의 이미지 생성을 구현하는 방법을 제안한다.

  • PDF

Quadtree를 사용한 색상-공간 특징과 객체 MBR의 질감 정보를 이용한 영상 검색 (Image Retrieval based on Color-Spatial Features using Quadtree and Texture Information Extracted from Object MBR)

  • 최창규;류상률;김승호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권6호
    • /
    • pp.692-704
    • /
    • 2002
  • 본 논문은 이미지에서 Quadtree를 이용한 색상-공간 특징 추출과 이미지 내에 포함되어 있는 객체의 MBR(Minimum Boundary Rectangie)을 구하여 질감 정보를 추출하는 방법을 제안한다. 제안된 방법은 각 이미지로부터 DC 이미지를 만들고 색상 좌표계를 변환한 후, Quadtree를 이용하여 영역을 분할한다. 영역의 분한 기준은 제안된 조건에 의하여 이루어지며, 각 분할된 영역으로부터 대표 색상을 추출한다. 그리고, 이미지 분할(segmentation)을 통하여 각 이미지의 객체, 객체를 포함한 배경, 또는 일부 배경의 MBR을 구하고, 제안된 알고리즘에 의하여 검색된 MBR의 웨이블릿 계수(wavelet coefficients)를 계산한다. 이 계수들이 MBR의 질감 정보가 되며, 추출된 색상-공간 정보와 질감 정보를 이용하여 제안된 유사도 계산 방법을 통하여 결과를 나타내게 된다. 제안된 방법은 원 이미지(original image)에 비해 특징 정보의 저장 공간을 53% 감소시켰으며, 성능은 유사하게 나타났다. 그리고, 질감 정보를 추가함으로써, 색상-공간 특징의 단점인 객체 정보의 손실을 보완하였고, 질의 이미지의 객체를 포함한 검색 결과를 보였다.

3차원 그래픽 이미지를 위한 XML 데이타베이스 시스템 (An XML Database System for 3-Dimensional Graphic Images)

  • 황종하;황수찬
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.110-118
    • /
    • 2002
  • 본 논문에서는 3차원 이미지의 내용기반 검색을 지원하는 XML 기반의 3차원 그래픽 데이터 베이스 시스템에 대해 기술한다. 현재 대부분의 그래픽 응용들은 2차원 이미지를 대상으로 하고 있으며 3차원 그래픽스 분야에서는 3차원 이미지의 표현에 대해서만 중점적으로 연구가 되고 있을 뿐 이미지가 포함하고 있는 의미 단위로서의 객체 모델링이나 이들 간의 공간 관계에 대한 처리는 아직 미흡한 실정이다. 본 논문의 모델에서 3차원 이미지는 공간관계를 가지고 있는 3차원 그래픽 객체의 조합으로 표현된다. 복잡한 3차원 객체는 기존의 그래픽 시스템에서 사용하는 선과 면 대신에 기본적인 객체들을 이용하여 모델링된다. 이렇게 구성된 3차원 그래픽 이미지들은 객체 모양이나 객체간의 공간관계를 이용한 내용기반 검색의 대상이 된다. 3차원 그래픽 이미지들은 XML 문서 형태로 표현되며, 이를 위한 3DGML DTD를 정의하였다. 끝으로 웹 기반으로 구현된 프로토타입 시스템에서의 질의 예를 보인다.

자동 주석 갱신 및 멀티 분할 색상 히스토그램 기법을 이용한 의미기반 비디오 검색 시스템 (A Semantic-based Video Retrieval System using Method of Automatic Annotation Update and Multi-Partition Color Histogram)

  • 이광형;전문석
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1133-1141
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 설계하고 구현한 시스템은 실험을 통한 성능평가에서 90% 이상의 높은 정확도를 보였다.

인덱싱 에이전트를 이용한 멀티미디어 데이터베이스 시스템 (A Multimedia Database System using Indexing Agent)

  • 이광형;이창수;이종희;오해석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.57-60
    • /
    • 2003
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템은 설계한다.

  • PDF