• Title/Summary/Keyword: 복잡한 영상

Search Result 1,870, Processing Time 0.032 seconds

Generating Korean Sentences Using Word2Vec (Word2Vec 모델을 활용한 한국어 문장 생성)

  • Nam, Hyun-Gyu;Lee, Young-Seok
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.209-212
    • /
    • 2017
  • 고도화된 머신러닝과 딥러닝 기술은 영상처리, 자연어처리 등의 분야에서 많은 문제를 해결하고 있다. 특히 사용자가 입력한 문장을 분석하고 그에 따른 문장을 생성하는 자연어처리 기술은 기계 번역, 자동 요약, 자동 오류 수정 등에 널리 이용되고 있다. 딥러닝 기반의 자연어처리 기술은 학습을 위해 여러 계층의 신경망을 구성하여 단어 간 의존 관계와 문장 구조를 학습한다. 그러나 학습 과정에서의 계산양이 방대하여 모델을 구성하는데 시간과 비용이 많이 필요하다. 그러나 Word2Vec 모델은 신경망과 유사하게 학습하면서도 선형 구조를 가지고 있어 딥러닝 기반 자연어처리 기술에 비해 적은 시간 복잡도로 고차원의 단어 벡터를 계산할 수 있다. 따라서 본 논문에서는 Word2Vec 모델을 활용하여 한국어 문장을 생성하는 방법을 제시하였다. 본 논문에서는 지정된 문장 템플릿에 유사도가 높은 각 단어들을 적용하여 문장을 구성하는 Word2Vec 모델을 설계하였고, 서로 다른 학습 데이터로부터 생성된 문장을 평가하고 제안한 모델의 활용 방안을 제시하였다.

  • PDF

Stereoscopic Perception Improvement based on Depth Map (깊이맵 기반 입체감 개선 방법)

  • Jeong, Daun;Jang, Seongeun;Gil, Jongin;Kim, Manbae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.301-302
    • /
    • 2011
  • 최근 3D 디스플레이가 3DTV는 물론 스마트폰이나 태블릿PC와 같이 작은 디스플레이 사이즈와 해상도를 가지는 휴대용 기기들에도 적용되어 다양한 형태로 사용자들에게 보급되어 보다 많은 관심을 받고 있다. 2D+Depth 형태의 입체영상에서 사용자에게 입체감을 주는 데는 깊이맵이 큰 영향을 준다. 또한 깊이맵이 복잡하게 구성되어 있을수록 사용자에게 보다 다양한 입체감을 제공할 수 있지만 실제로 사용자가 느끼는 입체감의 지각은 그렇지 못한 경우가 많기 때문에 사용자가 느끼는 임체감의 개선이 필요하다. 이에 본 논문에서는 깊이맵의 히스토그램을 기반으로 하여 깊이 평면과 깊이 편차를 이용하여 입체감을 개선하는 방법을 제안하고 주관적 실험을 통해 입체감의 변화를 확인하였다.

  • PDF

Illumination Analysis and Normalization for Face Detection on Handheld Devices (휴대 단말 기기에서 얼굴 검출을 위한 조명 분석 및 개선 방법)

  • Kim, Byeoung-Su;Choo, Hyon-Gon;Kim, Jin Woong;Kim, Whoi-Yul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.520-523
    • /
    • 2011
  • 휴대 단말 기기에 대한 관심 증가와 함께 사용자의 얼굴을 검출하는 응용 방법에 대한 연구가 활발히 진행되고 있다. 하지만 주변 조명 등의 영향으로 얼굴 검출이 어려운 문제점이 있다. 이를 해결하기 위하여 다양한 접근방법이 제안되어 왔지만, 제한된 하드웨어에 적용하기에는 높은 복잡도를 가지는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하고 효율적으로 얼굴 검출 정확도를 향상 시킬 수 있는 조명 대비를 개선 알고리즘을 제안하였다. 이를 위하여 입력된 영상에서 가우시안 분포를 분석하고, 분석된 분포를 기반으로 각기 다른 조명 대비 개선 알고리즘을 적용하였다. 실험 결과 제안하는 방법이 다양한 조명 환경에서 얼굴 검출 정확도를 향상 시키는 것을 확인하였다.

  • PDF

HEVC Test Model에서 확장 블록 구조및변환 기술과 성능 분석

  • Kim, Jae-Il;Kim, Mun-Cheol
    • Broadcasting and Media Magazine
    • /
    • v.15 no.4
    • /
    • pp.45-54
    • /
    • 2010
  • 최근 ISO/IEC와 ITU는 공동협력팀(Joint Collaborative Team on Video Coding-JCT-VC)을 구성하여 HEVC(High Efficiency Video Coding)라 불리는 새로운 비디오 압축 표준 기술을 개발하고 있다. JCT-VC의 목표 중 하나는 H.264/AVC 압축률의 2배를 향상하는 것으로 최근 HEVC 테스트 모델(HEVC Test Model - HM)을 확정했다. HM의 여러 기술 중에서 확장 블록 구조 (large block structure) 기술은 CTB(Coded Tree Block)와 TU(Transform Unit), PU(Partition Unit)로 구성된다. CTB와 TU는 압축 단위와 변환 기술을 확장한 반복적인 문법구조(recursive syntax structure)이며, PU는 H.264/AVC과 동일한형태를 띈다. 확장 블록 구조는CTB, PU, TU의 여러 조합에 의해 다양한 모드를 지원하여 압축 성능은 높아졌지만 HM 부호화기의 복잡도는 증가한다. 본 논문에서는 HM에 채택된 확장블록구조 및 변환 기술에 대해 설명한 후, TMuC 및 HM의 테스트 영상을 이용하여 다양한 최대 CTB 및 TU 크기의 압축성능 및 선택비율을 분석한다.

Sampling Techniques for Wireless Data Broadcast in Communication (통신에서의 무선 데이터 방송을 위한 샘플링 기법)

  • Lee, Sun Yui;Park, Gooman;Kim, Jin Young
    • Journal of Satellite, Information and Communications
    • /
    • v.10 no.3
    • /
    • pp.57-61
    • /
    • 2015
  • This paper describes the basic principles of 3D broadcast system and proposes new 3D broadcast technology that reduces the amount of data by applying CS(Compressed Sensing). Differences between Sampling theory and the CS technology concept was described. CS algorithm SS-CoSaMP(Single-Space Compressive Sampling Matched Pursuit) and AMP(Approximate Message Passing) was described. Image data compressed and restored by these algorithm was compared. Calculation time of the algorithm having a low complexity is determined.

The Multi-marker Tracking for Facial Animation (Facial Animation을 위한 다중 마커의 추적)

  • 이문희;김철기;김경석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.553-557
    • /
    • 2001
  • 얼굴 표정을 애니메이션하는 것은 얼굴 구조의 복잡성과 얼굴 표면의 섬세한 움직임으로 인해 컴퓨터 애니메이션 분야에서 가장 어려운 분야로 인식되고 있다. 최근 3D 애니메이션, 영화 특수효과 그리고 게임 제작시 모션 캡처 시스템(Motion Capture System)을 통하여 실제 인간의 동작 및 얼굴 표정을 수치적으로 측정해내어 이를 실제 애니메이션에 직접 사용함으로써 막대한 작업시간 및 인력 그리고 자본을 획기적으로 줄이고 있다. 그러나 기존의 모션 캡처 시스템은 고속 카메라를 이용함으로써 가격이 고가이고 움직임 추적에서도 여러 가지 문제점을 가지고 있다. 본 논문에서는 일반 저가의 카메라와 신경회로망 및 영상처리기법을 이용하여 얼굴 애니메이션용 모션 캡처 시스템에 적응할 수 있는 경제적이고 효율적인 얼굴 움직임 추적기법을 제안한다.

  • PDF

Skin segmentation and hand tracking for gesture recognition (제스처 인식을 위한 피부영역 분할기법 및 추적)

  • Chae, Seung-Ho;Seo, Jong-Hoon;Han, Tack-Don
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2012.05a
    • /
    • pp.371-373
    • /
    • 2012
  • 본 논문에서는 컬러 영상 기반에서 배경에 강인한 피부 영역 검출 기법을 제안하고 손 인식기법을 활용한 응용프로그램을 제안한다. 코드북 모델[1]을 이용하여 배경/전경을 분리하고, 분리된 전경에서 피부색정보를 이용하여 관심영역을 도출한다. 피부 영역을 검출하기 위한 단계에서는 YCbCr, HSV, LUV 색상 모델의 혼합하여 피부색 후보 영역에 대한 임계구간을 통해 강인한 피부 영역을 분할한다. 분할된 영역을 관심영역으로 설정하고 Kalman filter를 이용하여 영역을 추적한다. 결과적으로 복잡하고 고정된 배경에서 조명에 강인한 피부 영역 분할 및 추적이 가능하며 이를 응용한 사용자 인터페이스로 사용될 수 있다.

  • PDF

Constant Time RMESH Algorithm to Find Neighbor Blocks in Linear Quadtrees (선형 사진트리에서 이웃 블록을 찾기 위한 상수시간 RMESH 알고리즘)

  • Kim, Gi-Won;U, Jin-Un
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.1
    • /
    • pp.66-74
    • /
    • 1999
  • A linear quadtree representation as a way to store a quadtree is efficient to save space compared with other representations. It , therefore, has been widely studied to develop efficient algorithms to execute operations related with quadtrees. In this paper, we present algorithm to find neighbor blocks of binary images represented by linear quadtrees, using three-dimensional n${\times}$n${\times}$n processors on RMESH(Reconfigurable MESH). Pur algorithm have O(1) time complexity.

  • PDF

Dynamic Control Algorithm of GOP Structure based on Picture Complexity (영상 복잡도에 기반한 GOP구조의 동적 제어 알고리즘)

  • 문영득;최금수
    • The Transactions of the Korean Institute of Electrical Engineers D
    • /
    • v.53 no.4
    • /
    • pp.258-264
    • /
    • 2004
  • This paper propose a method that GOP structure based on the picture complexity change realtime adaptive without pre-analysis or time delay. Proposed algorithm calculates the complexity of pictures at first, and the ratio of the complexity( X$\sub$p/ /X$\sub$i/) between P picture and I picture is calculated. The suitable M value for the three picture select by comparing with predetermined threshold. Used bit and vbv_delay the value of GOP is calculated according to selected M. Experimental results show that the prediction error is reduce than the fixed GOP structure. Since the complexity distribution of the sequence is different, applied limits of threshold value is changed, also.

Gesture Recognition in Multiple People Environment (복수 등장인물을 대상으로 한 제스처 인식)

  • Hong, Seok-Ju;Setiawan, Nurul Arif;Kim, Song-Gook;Kim, Jang-Woon;Lee, Chil-Woo
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.891-896
    • /
    • 2007
  • 지금까지 진행된 제스처 인식 연구는 한 사람을 대상으로 정적인 환경을 가정하여 이루어져 왔다. 본 논문에서는 복수의 등장인물이 존재하는 환경에서 대화 상대를 선택하여 제스처를 인식하는 방법에 대해 기술한다. 먼저 복수의 인물이 존재하는 환경에서 배경영역을 제외한 행위자의 영역을 추출한다. 그 후 각각의 행위자를 트래킹하면서 카메라와 가장 가까이 있는 행위자를 대화 상대자로 선택한다. 대화상대자가 선택되면 스테레오 카메라에서 입력된 영상에서 추출된 실루엣 이미지를 이용하여 얼굴과 두 손을 특징 영역으로 하여 매 프레임마다 Kalman filter를 사용하여 각 영역을 트래킹한다. 트래킹되는 특징 영역의 2차원 좌표 값을 모델 제스처의 2차원 좌표 값과 비교하여 가장 높은 유사값을 갖는 모델 제스처를 입력 제스처로 인식하게 된다. 본 논문에서 사용한 방법은 복수의 등장인물이 있는 경우 효과적으로 행위 대상자를 선택하여 제스처를 인식할 수 있다. 또한 제스처 인식에 있어서 단순한 큐 매칭을 사용함으로써 계산이 복잡하지 않은 장점이 있다. 실험을 통해 본 논문에서 제시한 방법을 적용함으로써 복수의 인물이 등장하는 환경에서 제스처 인식이 가능함을 입증한다.

  • PDF