• 제목/요약/키워드: 영상 표현

검색결과 2,310건 처리시간 0.025초

딥러닝 모형의 복잡도에 관한 연구 (A study on complexity of deep learning model)

  • 김동하;백규승;김용대
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1217-1227
    • /
    • 2017
  • 딥러닝은 영상 인식, 음성 인식 등 기존의 머신 러닝 기법들로 해결이 어려웠던 분야에서 매우 우수한 성능을 보였고, 그로 인해 딥러닝의 폭발적인 연구의 증가가 있었다. 좋은 성능을 보이는 모형 및 모수 추정 방법에 대한 연구들이 주를 이루고 있는 현 흐름 속에서 딥러닝의 이론적인 연구 또한 조심스럽게 진행되고 있다. 본 논문에서는 딥러닝의 성공을 딥러닝 함수가 복잡한 함수를 효율적으로 잘 표현할 수 있음에 해답을 찾고, 이에 관련된 이론적인 연구들을 조사하여 분석하고자 한다.

HEVC 코덱의 영블록 검출 및 CU 조기 종료 부호화 기법 (An Early CU Termination Scheme using All Zero Block Detection in HEVC)

  • 정재홍;이범식;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.12-14
    • /
    • 2014
  • 본 논문에서는 AZB (All-Zero Block) 검출을 이용한 조기 부호화 단위(Coding Unit, CU) 결정 방법을 제안한다. HEVC 영상 코덱의 하드웨어 구현에서 이산여현변환(DCT)는 많은 부호화 자원을 필요로 하는 과정으로 DCT 수행 이전에 블록 내의 모든 양자화 계수가 0 이 되는 영블록(All-zero Block)을 미리 검출하여 DCT 및 양자화 과정을 생략하고 CU 의 부호화 과정을 조기에 종료함으로써 부호화 복잡도를 크게 감소시키는 방법을 제안한다. 기존의 SAD (Sum of Absolute Difference) 또는 SATD (Sum of Absolute Transform Difference)에 기반하는 AZB 검출 방법은 HEVC 에서 새롭게 추가된 큰 크기의 $16{\times}16$$32{\times}32$ DCT 에서 AZB 을 효율적으로 검출할 수 없는 한계가 존재한다. 본 논문에서는 DCT 변환 커널이 하다마드 변환 커널과 또 다른 정규 직교 변환 커널로 분할하여 표현할 수 있는 성질을 이용하여, 부화소 움직임벡터 추정 과정을 통해 생성된 하드마드 변환 계수에 DCT 를 생성하는 변환 커널을 곱하여 DCT 변환 커널을 생성한 후 양자화 계수를 이용하여 CU 단위의 AZB 을 검출하는 방법을 제안한다. 또한 AZB 검출과 움직임 벡터의 크기를 이용하여 현재 CU 의 부호화 과정을 조기에 종료하는 방법을 제안한다. 제안하는 AZB 검출과 CU 조기 종료 부호화 방법을 사용하면 평균적으로 34.7%의 부호화 시간을 감소시켜 부호화 복잡도를 크게 줄일 수 있다.

  • PDF

참조 블록의 특성에 기반한 선택적 1비트 변환 알고리듬 (Adaptive One-Bit Transform Using Characteristic of Reference Block)

  • 박미소;김재훈;김형도;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.223-226
    • /
    • 2013
  • 정확한 움직임 추정 기술은 원본과 가장 유사한 영상의 복원에 효과적이고 압축률에도 중요한 영향을 미친다. 하지만 기존의 전역 탐색 (Full Search) 알고리듬과 Sum of Absolute Difference (SAD)라는 정합 오차 기준은 연산량이 높고 하드웨어 구현시 비효율적이다. 이를 보완하기 위한 1비트 변환 알고리듬은 움직임 벡터의 변화량을 0과 1의 연산으로 나타내는데, 이 알고리듬은 움직임이 많아 픽셀 값의 변화가 심한 블록의 변화량도 0과 1로만 표현한다. 그렇기 때문에 정확한 움직임이 반영되지 않고 그로 인해 낮은 Peak Siganl to Noise Ratio (PSNR)을 가져온다. 이 점을 개선하고자 본 논문에서는 참조블록들의 움직임 벡터를 파악하고 분류하여 선택적으로 움직임의 변화량이 큰 영역은 전역 탐색 알고리듬을, 움직임이 작거나 없는 영역은 1비트 연산을 수행하도록 하여 기존의 알고리듬과 비교하여 Peak Siganl to Noise Ratio (PSNR)측면에서 우수한 성능을 확인할 수 있었다.

  • PDF

애니메이션의 이중적 기호작용 원리 - 구조주의 기호학의 관점에서 - (The Principle of Dual Semiotic Process in Animation - Within Structuralism Semiotics -)

  • 주영숙;김치용
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1196-1207
    • /
    • 2006
  • 본 논문에서는 구조주의 기호학자인 바르트의 기호학적 이론에 근거하여, 기호학을 구성하는 요소들과 애니메이션 텍스트에 나타나는 기호학의 원리를 알아보았다. 이러한 접근은 고전 기호학의 도식적 분석에서 벗어나, 애니메이션이 대중에게 효과적으로 메시지를 전달하는 원리의 분석을 가능하게 한다. 또한 사회적 작용을 고려하지 않는 순수 미학의 맹목적 관점을 경계할 수 있다. 애니메이션 텍스트를 바르트의 구조주의 기호학적 관점에서 한마디로 표현하자면 "애니메이션 텍스트는 하나의 기호가 갖는 이중적인 역할"이다. 이는 "대중매체의 애니메이션은 사회를 개념화하고 의미화 하는 특별한 과정이다"라고 말할 수 있다. 다시 말하면 "지배질서가 자신을 자연적 질서로 여겨지도록 대중을 동화하는 과정"이라는 것이다.

  • PDF

추적 조건 분석에 의한 개선된 외곽선 추적 기법들 (Advanced Contour Tracing Algorithms based on Analysis of Tracing Conditions)

  • 정철호;서종훈;한탁돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.431-436
    • /
    • 2006
  • 외곽선 추적 알고리즘은 영상 인식 및 표현에 있어서 물체의 기본 성질을 파악하는데 중요하다. 따라서 많은 알고리즘들이 연구되어 왔으며, 이중에는 간단한 경계선 추적자 알고리즘(SBF: Simple Boundary Follower)이다. 이외에도 수정된 간단한 경계선 추적자 알고리즘 (MSBF: Modified Simple Boundary Follower), 개선된 간단한 경계선 추적자 알고리즘(ISBF: Improved Simple Boundary Follower), 무어-네이버 추적 알고리즘(MNT: Moore-Neighbor Tracer), 방사형 탐색 알고리즘(RSA: Radial Sweep Algorithm), 그리고 Theo Pavlidis 알고리즘(TPA)이 있다. 이러한 알고리즘들은 추적 경로 특성들이 다르며 각기 장점과 제약성이 있다.외곽선 알고리즘들의 제약성은 크게 두 가지로 나눌 수 있다. 하나는 알고리즘 특성에 따라 외곽선 픽셀간 인접 형태에 따라 추적하지 못하는 경우가 존재할 수 있다는 것이다. 또 다른 하나는 외곽선 추적 알고리즘의 시작과 종료 조건에 따라서 특정 위치 픽셀들을 찾지 못하는 경우도 존재한다는 점이다. 본 논문에서는 이러한 문제점들을 중심으로 외곽선 추적 알고리즘들의 성능을 분석하였다. 또한, ISBF의 시작 조건과 TPA의 인너코너 추적을 개선하는 기법들을 제안하여 이를 해결토록 하였다. 실험 결과 제안한 기법들은 외곽선 추적 성능을 개선하는데 효과적이었다.

  • PDF

카메라 획득 영상에서의 색 분산 및 개선된 K-means 색 병합을 이용한 텍스트 영역 추출 및 이진화 (Text Detection and Binarization using Color Variance and an Improved K-means Color Clustering in Camera-captured Images)

  • 송영자;최영우
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.205-214
    • /
    • 2006
  • 이미지에 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 정보로서 이러한 정보를 실시간에 찾아내서 인식한다면 다양한 응용에 활용할 수 있다. 본 논문에서는 카메라로 취득한 다양한 종류의 이미지로부터 텍스트를 추출하는 방법과 추출된 영역에서 텍스트를 분리하는 방법을 새롭게 제안한다. 텍스트 영역 추출을 위해서 RGB 색 공간에서 색 분산을 특징으로 제안하며, 텍스트 영역 분리를 위해서 RGB 색 공간에서 개선된 K-means 병합을 제안한다. 실험은 디지털 카메라와 핸드폰 카메라로 취득한 다양한 종류의 문서유형 이미지와 실내외의 일반적인 자연이미지를 사용하였으며, ICDAR 콘테스트[1] 이미지의 일부도 사용하였다.

임베디드 시스템을 이용한 소형 엔터테인먼트 이족 로봇 개발 (Development of Small Biped Entertainment Robot Using Embedded System)

  • 신창훈;이동명;곽용욱;이정호;하종은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.1433-1436
    • /
    • 2005
  • 임베디드 시스템의 발전으로 현재 진보된 로봇 시스템들은 운영 체제, 비젼 시스템 및 센서 시스템들을 별도의 호스트 PC의 도움 없이 독립적으로 탑재하여 가동 시킬 수 있다. 본 논문에서는 임베디드 시스템을 이용한 SBER (Small Biped Entertainment Robot)에 필요한 로봇의 제어기 구조와 로봇에 최적화된 임베디드 시스템을 구현한다. 또한 주 프로세서와 주 컨트롤러를 탑재한 최적화된 소형 엔터테인먼트 이족 로봇 개발을 목적으로 한다. SBER은 TI사의 DSP인 TMS320LF2407A를 로봇의 주 컨트롤러로 사용하여 로봇의 관절 제어를 통한 기본적인 보행 실험과 음원의 위치를 파악하기 위한 음원 위치 추적 문제를(Sound Localization) 수행한다. 또한 Intel사의 PXA255A를 주 프로세서로 사용하여 연산량이 높은 영상처리 알고리즘과 감정 표현, 장애물 인식 및 장애물 회피를 적용하여 보다 지능적인 로봇 시스템을 구현한다.

  • PDF

하이브리드 기법을 이용한 LBS기반의 유사궤적 추적시스템 (Location-based System for Tracking Similar Trajectories Using Hybrid Method)

  • 한경복;권훈;이혜선;곽호영
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.9-21
    • /
    • 2007
  • 본 연구에서는 소량의 차량 위치정보를 통해 과거의 차량 위치를 추적하고, 운행궤적을 표현할 수 있는 방향각 정보를 이용한 하이브리드 기법을 제안하였다. 제안한 기법의 효율성을 검증하기 위해 다양한 조건 하에서 실제 차량 이동객체를 운행하여 차량 위치정보를 수집하였으며, 수집된 차량 위치정보에서 기존의 시간 간격별 차량 위치정보와 방향각 정보를 이용한 차량 위치정보를 추출하여 비교 분석하였다. 또한, 제안 기법의 효율성을 검증하기 위하여 GPS TrackMaker와 차영상 기법 그리고 일관성 비교, 정량적 비교, 차량 운행거리 비교 등 다양한 방법으로 비교 분석하였다.

수문지형분석을 위한 DEM에서의 sink 처리에 관한 연구 (A Study on the Treatment of Sink for Hydrological Geographic Analysis in DEM)

  • 김경탁;최윤석;김주훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.819-823
    • /
    • 2004
  • 수자원 분야에서 DEM을 이용하여 유역의 수문학적 지형인자를 추출하기 위해서는 DEM으로부터 하천망을 추출하고, 유역을 분할하며 이를 이용하여 유역 범위 내에서 지형인자를 계산하는 일련의 과정이 필요하다. 이때 사용되는 기초 자료인 DEM은 최종 결과물인 유역의 지형인자에 영향을 미치게 되며, 따라서 지표면의 수리${\cdot}$수문 현상을 가장 적절히 표현할 수 있는 DEM을 수문학적으로 어떻게 처리할 것인가가 중요한 문제이다. 수치지도의 등고선이나 영상으로부터 추출된 DEM을 그대로 유역 분석에 이용할 경우 지표면 흐름 모의에 장애를 초래하는 sink나 flat area와 같은 오류를 다수 포함하고 있다 그러므로 이러한 오류들을 합리적인 방법으로 제거하는 과정이 필요하다. 본 연구에서는 DEM을 이용하여 유역의 수문학적 지형인자를 계산하기 위해 DEM이 가지고 있는 오류 중 sink를 제거하는 기술을 개발하였다. 본 연구에서 구현한 sink 제거 기술을 이용하여 실제 유역의 DEM에서 sink를 제거하고, 그 결과를 Arc Hydro와 WMS v6.1과 비교하여 적용된 sink 처리 알고리즘의 타당성과 적용성을 검토하였다. Sink 제거 기능의 효율성과 오류 수정후의 DEM에서 추출된 하천망의 형태적 특성 및 실제하천과의 유사성에 대하여 검토한 결과 유역의 모든 sink가 양호하게 보정되었으며 보정된 DEM을 이용하여 추출된 하천망 또한 국외의 Arc Hydro 및 WMS v6.1과 유사한 결과를 나타내고 있다.

  • PDF

자유시점 TV를 위한 다시점 비디오의 계층적 깊이 영상 표현과 H.264 부호화 (Layered Depth Image Representation And H.264 Encoding of Multi-view video For Free viewpoint TV)

  • 신종홍
    • 디지털산업정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.91-100
    • /
    • 2011
  • Free viewpoint TV can provide multi-angle view point images for viewer needs. In the real world, But all angle view point images can not be captured by camera. Only a few any angle view point images are captured by each camera. Group of the captured images is called multi-view image. Therefore free viewpoint TV wants to production of virtual sub angle view point images form captured any angle view point images. Interpolation methods are known of this problem general solution. To product interpolated view point image of correct angle need to depth image of multi-view image. Unfortunately, multi-view video including depth image is necessary to develop a new compression encoding technique for storage and transmission because of a huge amount of data. Layered depth image is an efficient representation method of multi-view video data. This method makes a data structure that is synthesis of multi-view color and depth image. This paper proposed enhanced compression method using layered depth image representation and H.264/AVC video coding technology. In experimental results, confirmed high compression performance and good quality reconstructed image.