• Title/Summary/Keyword: 영상기반

Search Result 11,592, Processing Time 0.042 seconds

Implementation of Hierarchical Content-based Image Retrieval System using CCV & GLCM (CCV와 GLCM을 이용한 계층적 내용기반 영상검색시스템의 구현)

  • 이경자;정성환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.28-33
    • /
    • 1998
  • 대량의 영상데이터베이스에서 질의영상에 대한 유사영상을 검색할 때의 유사도 계산을 위한 시간소모는 영상의 실시간 검색효율을 저하시키는 요인이 된다. 본 논문에서는 키영상(key image)을 이용하여 영상데이터베이스의 각 영상과 키영상의 유사도를 미리 계산해 둠으로써 질의영상과 데이터베이스 영상간의 유사도 계산시간을 단축시킨다. 그리고 검색효율을 높이기 위해 1차적으로 칼라특징으로 유사영상들을 분류한 후, 1차 분류된 영상들만을 대상으로 계층적으로 질감특징값으로 영상을 비교함으로써 검색효율을 상승시킨다. Oracle 데이터베이스 상에서 본 계층적 내용기반 영상검색시스템을 구현하였다.

  • PDF

Accelerating Depth Image-Based Rendering Using GPU (GPU를 이용한 깊이 영상기반 렌더링의 가속)

  • Lee, Man-Hee;Park, In-Kyu
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.33 no.11
    • /
    • pp.853-858
    • /
    • 2006
  • In this paper, we propose a practical method for hardware-accelerated rendering of the depth image-based representation(DIBR) of 3D graphic object using graphic processing unit(GPU). The proposed method overcomes the drawbacks of the conventional rendering, i.e. it is slow since it is hardly assisted by graphics hardware and surface lighting is static. Utilizing the new features of modem GPU and programmable shader support, we develop an efficient hardware-accelerating rendering algorithm of depth image-based 3D object. Surface rendering in response of varying illumination is performed inside the vertex shader while adaptive point splatting is performed inside the fragment shader. Experimental results show that the rendering speed increases considerably compared with the software-based rendering and the conventional OpenGL-based rendering method.

텍스타일 영상에서의 감성 기반 검색 시스템

  • Kim, Young-Rae;Shin, Yun-Hee;Kim, Eun-Yi
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.82-87
    • /
    • 2009
  • 본 논문에서는 감성 기반으로 텍스타일을 자동으로 색인하고 검색 할 수 있는 시스템을 제안한다. 제안된 시스템은 영상 수집기, 감성 색인기, 검색기(Matcher), 질의 인터페이스로 구성되어 있다. 감성 색인기는 텍스타일 영상에 포함된 컬러와 패턴 정보를 기반으로 감성개념을 인식하고, 이를 이용하여 영상을 색인한다. 이때, 감성 어휘로 고바야시가 정의한 8개 (romantic, natural, casual, elegant, chic, classic, dandy, modern)를 사용한다. 질의 인터페이스에서 사용자는 두 가지 방식으로 질의를 선택할 수 있다. 첫 번째 방법은 감성 키워드를 사용하는 것이고, 두 번째는 사용자의 의도를 설명할 수 있는 영상을 이용하는 예제 기반 질의 방식이다. 질의가 주어지면, 검색기는 랭킹 알고리즘을 사용하여 검색 결과를 생성한다. 이 때, 유사도 비교방식은 선택된 질의방식에 따라 달라진다. 제안된 시스템의 성능을 검증하기 위해 웹 검색에 익숙한 50명(남자: 32명, 여자: 18명)을 대상으로 웹에서 수집한 3,416 장에 대해서 3가지 항목으로 사용자 평가를 하였다. 사용자 평가의 항목인 적합도(Relevance), 노력(Search Effort), 만족도(Satisfaction)의 결과로 사용자가 검색한 결과영상에서 적합도의 수치가 낮게 나왔지만, 만족도와 노력의 수치는 높게 평가되었다. 제안된 시스템에서 사용자는 자신이 선호하는 결과 영상을 상위 40개의 영상 내에서 얻을 수 있었다. 이는 제안된 시스템이 사용자들이 원하는 영상을 효율적으로 검색할 수 있다는 것을 증명했다.

  • PDF

Image Segment-Based Stereo Matching for Improving Boundary Accuracy (경계영역 정확도 향상을 위한 영상분할 기반 스테레오 매칭)

  • Mun, Ji-Hun;Ho, Yo-Sung
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.11a
    • /
    • pp.63-66
    • /
    • 2015
  • 3차원 영상을 생성하기 위해 스테레오 매칭을 통해 깊이 정보를 획득한다. 이때 발생하는 경계영역과 텍스처가 부족한 부분의 깊이정보 부정확성 문제를 해결하기 위해 영상 분할 기반 스테레오 매칭 방법을 제안한다. 일반적으로 사용하는 윈도우 기반 스테레오 매칭 결과를 기반으로 분할된 영상 내에서 최적의 변위 값을 재 할당함으로서 깊이정보의 정확성을 향상시킬 수 있다. Mean-shift는 참조 영상에서 화소 간 평균값 차이가 최대가 되는 영역들을 반복적으로 찾는다. 유사한 평균값을 갖는 영역들을 기반으로 영상을 분할하는 것을 Mean-shift를 이용한 영상분할 이라고 한다. 분할된 영상은 각 영역을 대표하는 패치 구조를 가지고 있어 참조 영상에 포함되어있는 잡음에 강인한 특성을 지닌다. 스테레오 매칭을 통해 화소별로 변위 값을 할당해주는 대신, 분할된 영상을 이용하여 각 분할 영역에 동일한 변위 값을 할당한다. 분할된 영상에 동일한 변위 정보를 할당할 경우 객체와 배경의 경계영역에서 잘못된 변위 값이 할당되는 경우가 발생한다. 이러한 경계 영역의 변위정보 부정확성을 보완하기 위해 화소의 기울기 항을 비용 값 계산 과정에 추가하여 단점을 보완한다. 최종 비용 값 계산을 통해 획득한 초기 변위 지도에 중간 값 필터를 적용하여 분류된 영역에 동일한 변위 값을 할당한다. 제안한 방법을 적용하여 경계영역의 정확도가 향상된 최종 변위 지도를 획득한다.

  • PDF

Analysis of Vision based Technology for Smart Railway Station System (스마트 철도역사시스템 구축을 위한 영상기반 기술 분석)

  • Lee, Sang-Hak
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.13 no.5
    • /
    • pp.1065-1070
    • /
    • 2018
  • These days there are many researches on the vision based technology using deep learning. The lots of studies on the intelligent operation and maintenance for railway station system used technologies with vision analysis function. This paper analyzes the papers which studied the intelligent station system with vision analysis function for passengers and facilities monitoring, platform monitoring, fire monitoring, and effective operation and design. Also, this paper proposes research which uses the more powerful vision technology with deep-learning for smart railway station system.

Development of Convolutional Network-based Denoising Technique using Deep Reinforcement Learning in Computed Tomography (심층강화학습을 이용한 Convolutional Network 기반 전산화단층영상 잡음 저감 기술 개발)

  • Cho, Jenonghyo;Yim, Dobin;Nam, Kibok;Lee, Dahye;Lee, Seungwan
    • Journal of the Korean Society of Radiology
    • /
    • v.14 no.7
    • /
    • pp.991-1001
    • /
    • 2020
  • Supervised deep learning technologies for improving the image quality of computed tomography (CT) need a lot of training data. When input images have different characteristics with training images, the technologies cause structural distortion in output images. In this study, an imaging model based on the deep reinforcement learning (DRL) was developed for overcoming the drawbacks of the supervised deep learning technologies and reducing noise in CT images. The DRL model was consisted of shared, value and policy networks, and the networks included convolutional layers, rectified linear unit (ReLU), dilation factors and gate rotation unit (GRU) in order to extract noise features from CT images and improve the performance of the DRL model. Also, the quality of the CT images obtained by using the DRL model was compared to that obtained by using the supervised deep learning model. The results showed that the image accuracy for the DRL model was higher than that for the supervised deep learning model, and the image noise for the DRL model was smaller than that for the supervised deep learning model. Also, the DRL model reduced the noise of the CT images, which had different characteristics with training images. Therefore, the DRL model is able to reduce image noise as well as maintain the structural information of CT images.

Representative Feature Extraction of Objects Using VQ and Its Application To Content-Based Image Retrieval (VQ를 이용한 영상의 객체 특징 추출과 이를 이용한 내용기반 영상 검색)

  • 정세환;유헌우;장동식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.359-361
    • /
    • 1999
  • 내용 기반 영상 검색을 위해 본 연구에서는 Vector Quantization을 이용하여 영상을 구성하는 주요 객체들의 특징 추출 방법을 제안한다. 내용 기반 검색 시스템에서 사용되는 영상의 주요 특징들은 색상, 질감, 형태 및 영상을 구성하고 있는 객체들의 공간적 위치 등이 사용된다. 이러한 특징들 중에서 어떤 특징들을 사용하고 또 어떤 방식으로 결합하느냐에 따라 혹은 영상의 특성을 잘 나타낼 수 있는 주요 특징을 어떻게 추출, 표현하느냐에 따라 검색 성능에 큰 영향을 미친다. 이 중 본 논문에서는 일반적인 색상, 질감 특징 추출방법과 더불어 Vector Quantization 알고리즘을 이용하여 정지 영상을 구성하고 있는 객체들의 대표 색상과 질감 특징을 빠르게 추출하고 이를 내용 기반 검색에 이용함으로써 객체의 위치, 회전 및 크기 변화에 무관한 검색을 가능케 했다. 연구의 실험 결과 VQ를 이용함으로써 대표특징치 추출시간을 줄일 수 있었고 검색시 색상과 질감 특징의 가중치를 각각 0.5, 0.5로 주는 것이 가장 높은 검출율을 보였으며 제안된 방식에 의해 '사람' 영상의 경우 0.9의 검출율을 보였다.

  • PDF

인공지능 기반 영상 화질 개선 최신 기술 동향

  • Kim, Won-Jun
    • Broadcasting and Media Magazine
    • /
    • v.25 no.1
    • /
    • pp.20-27
    • /
    • 2020
  • 최근 모바일 기기를 위한 카메라 관련 기술이 발전하면서 취득할 수 있는 영상의 화질 또한 크게 향상되고 있다. 그러나, 일상 생활에서 빈번히 발생하는 다양한 실내외 불규칙한 조명 조건 및 저조도 환경은 여전히 영상 화질 저하를 야기한다. 본 고에서는 이러한 문제를 해결하기 위해 최근 널리 연구되고 있는 심층신경망 기반 영상 화질 개선 연구의 최신 동향을 소개하고자 한다. 먼저, 다양한 최적화 기법을 바탕으로 영상 내 조명 성분을 추정하고, 이를 개선하는 방법들에 대해 간략히 설명한다. 또한, 영상 인식, 객체 검출 등에서 뛰어난 성능을 입증한 합성곱 신경망 구조를 기반으로 영상의 잠재적 특징을 효과적으로 검출한 후 이를 바탕으로 개선된 영상을 생성하는 방법에 대해 설명한다. 다양한 데이터셋에 대한 실험 결과를 통해 인공지능 기반 영상 화질 개선의 우수성을 보인다.

Effective Image Clustering Using Shock Graphsm (쇼크 그래프를 이용한 효과적인 영상 군집화)

  • Jang, Seok-Woo;Khanam, Solima;Paik, Woo-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.249-252
    • /
    • 2011
  • 본 논문에서는 쇼크(shock) 그래프 기반의 뼈대 특징을 이용하여 모양 정보를 분류하기 위해 그래프 편집 거리(edit cost) 기반의 k-means 군집화 알고리즘을 적용하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 질의 영상과 대상 데이터베이스 영상으로부터 뼈대 기반의 쇼크 그래프를 추출한 후 종점(end points)과 분기점(branch points)을 가중치를 이용하여 적응적으로 선택한다. 그런 다음, 두 영상 사이의 편집 거리를 구하여 이를 k-means 군집화 알고리즘의 거리 척도로 적용함으로써 대용량의 영상을 보다 효과적으로 분류한다. 성능을 평가하기 위해서 제안된 알고리즘을 MPEG-7 데이터베이스에 적용하였으며, 그 결과 제안된 영상 분류 방법이 기존의 영상 분류 방법에 비해서 보다 효과적으로 모양 기반의 영상을 분류하였음을 확인하였다.

  • PDF

Design and Implementation for Hybrid 3DTV Service based on Streaming Content (스트리밍 콘텐츠 기반 하이브리드 3DTV 시스템 설계 및 구현)

  • Yim, Hyun-Jeong;Yun, Kugjin;Lee, Jin Young;Lee, Gwangsoon;Cheong, Won-Sik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.11a
    • /
    • pp.216-219
    • /
    • 2012
  • 본 논문에서는 기준 영상은 방송 스트림으로 전송하고, 부가 영상은 스트리밍 콘텐츠 형태로 수신측에 전달하여 3DTV 서비스를 제공할 수 있는 하이브리드 3DTV 시스템을 제안한다. 부가 영상을 파일 기반으로 수신측에 전달할 경우 전체 파일을 다운로드해야만 3DTV 서비스 이용이 가능하다는 문제점을 해결하기 위하여 본 논문에서는 MPEG DASH 규격을 이용하여 부가 영상을 전송하였다. 또한 서로 다른 전송망을 기반으로 전달되는 기준 영상과 부가 영상을 프레임 단위로 동기화하기 위한 정보를 실시간 방송 스트림에 포함하여 기준 영상 전송 시 함께 전송하였다. 이와 같은 방법으로 스트리밍 콘텐츠 기반 하이브리드 3DTV 송신 및 수신 시스템을 구현한 결과 사용자가 서비스에 접근 시점부터 부가 영상 데이터를 수신하고 이를 기준 영상과 동기화하여 3DTV 서비스의 제공이 가능함을 확인하였다.

  • PDF