• 제목/요약/키워드: 이미지 시퀀스

검색결과 70건 처리시간 0.025초

Temporal 웨이브릿을 이용한 물체 추적 알고리즘 (Object Tracking Algorithm using Temporal Wavelet)

  • 장도임;김도년;강민숙;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.2843-2845
    • /
    • 1999
  • Temporal 웨이브릿 변환은 2차원 이미지 시퀀스 즉, 프레임 사이의 시간적 변화를 포함한다. Temporal 웨이브릿 변환은 우선 2차원 이미지를 프레임 단위로 행방향, 열방향의 순서로 웨이브릿 변환을 수행한 후 원영상의 1/2 해상도의 영상 프레임 시퀀스를 시간축 방향으로 웨이브릿 변환을 수행한다. Temporal Wavelet 변환의 결과로 나온 계수는 각 프레임의 특성과 프레임과 프레임 사이의 특성을 포함한다. 본 논문에서는 이 Temporal 웨리브릿 변환 결과로 나온 계수의 특성을 이용하여 물체의 움직임을 추적하는 Division Rule을 제시하고, 더욱 정확한 결과를 얻기 위해 Division Rule이 적용된 결과에 실험적으로 최적화된 가중치를 결정하여 컨벌루션을 적용한다.

  • PDF

딥러닝을 활용한 한글문장 OCR연구 (A Study on the OCR of Korean Sentence Using DeepLearning)

  • 박선우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

모양 시퀀스 기술자를 이용한 효과적인 동작 표현 및 검색 방법 (Efficient Representation and Matching of Object Movement using Shape Sequence Descriptor)

  • 최민석
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.391-396
    • /
    • 2008
  • 동영상에서 객체의 움직임은 동영상의 내용을 분석하는데 중요한 요소로 작용한다. 따라서 움직임 정보를 이용하여 동영상 내용을 분석하고 검색하기 위한 많은 방법들이 제안되었다. 그러나 대부분의 방법들은 객체 자체의 동작 보다는 움직임의 방향이나 경로를 분석하는 쪽으로 치중되었다. 본 논문에서는 객체의 움직임에 의한 모양 변화를 이용하여 객체의 동작을 표현하고 비교하기 위한 모양 시퀀스 기술자(descriptor)를 제안한다. 객체의 움직임 정보는 입력된 이미지 시퀀스에서 객체 영역을 추출하여 연속된 2차원 모양 정보로 표현되고, 각각의 2차원 모양 정보는 모양 기술자를 이용하여 1차원 모양 특징 값으로 변환된다. 순서에 따라 배열된 모양 기술자들을 시간 축으로 주파수 변환한 후 저주파영역의 계수를 취하여 모양 시퀀스 기술자를 얻게 된다. 실험을 통하여 제안된 방법이 객체의 동작 정보를 매우 효과적으로 표현 및 비교 가능하여 내용 기반 동영상 검색, 동작 인식 등의 인지적 관점의 움직임 분석 응용에 적용 가능함을 보였다.

이미지 캡션 생성을 위한 심층 신경망 모델 학습과 전이 (Learning and Transferring Deep Neural Network Models for Image Caption Generation)

  • 김동하;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.617-620
    • /
    • 2016
  • 본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하고, 컨볼루션 신경망 층의 출력을 임베딩 층뿐만 아니라 멀티 모달 층에도 연결함으로써, 캡션 문장 생성을 위한 매 단계마다 이미지의 시각 정보를 이용할 수 있는 연결 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 우수성을 입증하였다.

블록매칭을 이용한 비디오 시퀀스의 이미지 모자익 (Image Mosaic from a Video Sequence using Block Matching Methods)

  • 이지근;김희숙;정성태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.604-606
    • /
    • 2001
  • 최근 들어 이미지 모자익은 가상현실과 웹 브라우저 상에서의 가상환경 구축, 관광, 광고 등, 많은 응용분야에서 관심을 모으고 있다. 이미지 모자익을 위해 해결해야 할 주된 문제는 이미지들 간의 중복되는 영역에서 정확한 대응점을 찾는 것이다. 지금까지 이 대응점을 찾기 위한 노력은 시스템의 많은 계산량과 시간을 투자해야만 했다. 또한 대부분의 모자익이 여러 차례의 촬영에 의한 정지 화상들 간의 모자익에 그치고 있다. 따라서 본 논문에서는 비디오 카메라를 이용하여 프레임들 간의 중복되는 영역에서 일정한 비교 영역을 지정하고 그 비교 영역 안에서 대응점을 찾는 블럭 매칭 방법을 적용함으로써 전체적인 모자익 시간을 줄이는 방법을 구현하였다.

  • PDF

연속 입력된 영상을 이용한 높이 측정 (Height Measurement using the image sequences)

  • 김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제7권1호
    • /
    • pp.9-14
    • /
    • 2006
  • 본 논문에서는 보안 시스템에서 사람 인식을 위한 중요한 단서 중의 하나인 사람의 키를 측정하는 알고리즘으로, 이미지 시퀀스에서 사람의 영역을 추출하고 기하학적 정보를 이용해 추출된 사람의 키를 측정하고자 한다. 이를 위해 단일 이동 물체 사람을 대상으로 하여 시퀀스 이미지에서 사람의 움직임 정보를 추출하고, 추출된 영역에서 수직히스토그램 투영을 하여 사람의 중심선을 찾아 머리와 발의 좌표점을 추출한다. 추출된 좌표점들은 소실점과 소실선의 기하학적 해석과 미리 입력한 다른 물체의 기준 높이를 가지고 실세계에서의 사람의 키를 측정하게 된다.

  • PDF

텍스트와 공간이미지의 구조 - "갈매기" 의 극공간 구조와 의미작용을 중심으로 - (The Structure of Text and Spatial Image - Focused on the Signification and Dramatic Space of ${\ulcorner}$the Sea-gull${\lrcorner}$ -)

  • 오경환
    • 디자인학연구
    • /
    • 제14권4호
    • /
    • pp.199-207
    • /
    • 2001
  • 극의 공연은 희곡 텍스트를 무대라는 시각적 이미지로 바꾸어 표현하고 전달하는 것이 본질이다. 시각적 이미지는 두대라는 골간을 통해 형성된다. 무대는 시각적 이미지의 모태이다. 다시 말해서 극의 시각적 이미지는 결국 총체적인 공간이미지가 되는 것이다. 본 연구는 극텍스트의 공간이미지를 기호학적 관점에서 해석해 보고, 그것을 통하여 구현되는 공간의 구조와 체계를 파악해 보고자 하는 시도이다. 특히 본고에서 관심을 갖는 것은 이미지 속에 도입된 문자의 기호학이 아니라 텍스트의 언술내용 자체를 도입하는 공간의 이미지텍스트, 극공간의 구조와 의미작용을 파악하는 과정과 내용이며, 결국 이를 통하여 텍스트 그리고 실제 기념적·상징적 공간의 해석방법론으로서 기호학적 측면에서의 '공간 구현의 체계'를 제시하였다.

  • PDF

지역적 유사성을 이용한 픽셀 값 예측 기법에 기초한 가역 데이터 은닉 알고리즘 (Reversible Data Embedding Algorithm based on Pixel Value Prediction Scheme using Local Similarity in Image)

  • 정수목
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.617-625
    • /
    • 2017
  • 본 논문에서는 기밀 데이터를 커버 이미지에 은닉하는 효과적인 가역 데이터 은닉 기법을 제안하였다. 제안된 기법에서는 이미지에 존재하는 지역적 유사성을 이용하여 픽셀 값을 정확하게 예측하여 예측 이미지를 생성하였고, 생성된 예측 이미지와 원본 커버 이미지를 사용하여 차분 시퀀스를 생성한 후, 히스토그램 쉬프트 기법을 적용하여 기밀데이터가 은닉된 스테고 이미지(stego-image)를 생성하였다. 스테고 이미지로부터 기밀 데이터를 추출하고 원본 커버 이미지를 손실 없이 복원할 수 있다. 제안된 기법을 적용하면 기존의 APD 기법에 비하여 더 많은 기밀 데이터를 은닉할 수 있음을 실험으로 확인하였다.

엔빌로프 기반 하한을 사용한 효율적인 회전-불변 윤곽선 이미지 매칭 (Efficient Rotation-Invariant Boundary Image Matching Using the Envelope-based Lower Bound)

  • 김상필;문양세;홍선경
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.9-22
    • /
    • 2011
  • 본 논문에서는 윤곽선 이미지 매칭에서 회전-불변 거리 계산의 효율적 방법을 제안한다. 회전-불변 거리 계산은 이미지 시계열을 한 칸씩 회전하면서 매번 유클리디안 거리를 계산해야 하는 고비용의 연산이다. 본 논문에서는 엔빌로프 기반 하한을 사용하여 회전-불변 거리 계산을 크게 줄이는 획기적인 해결책을 제시한다. 이를 위해, 먼저 질의 시퀀스 대상의 단일 엔빌로프 작성과 이의 하한 개념을 제시하고, 이를 회전-불변 거리 계산에 사용하면 많은 수의 회전-불변 거리 계산을 줄일 수 있음을 보인다. 그런데, 단일 엔빌로프 기법은 하나의 엔빌로프가 가능한 모든 회전 시퀀스를 포함하기 때문에 하한이 커지고, 이에 따라 매칭 성능이 저하되는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 회전 구간의 개념을 도입하여 단일 엔빌로프 기반 하한을 다중 엔빌로프 기반 하한 개념으로 확장한다. 또한, 다중 엔빌로프 기법에서 회전 구간을 결정하기 위한 방법으로 동일-너비 기법과 엔빌로프 최소화 기법을 제안한다. 실험 결과, 제안한 엔빌로프 기반 매칭 기법은 기존 기법에 비해 최대 수 배에서 수십 배까지 매칭 성능을 향상시킨 것으로 나타났다.

타이틀 시퀀스에서 모션그래픽의 표현경향에 관한 연구 (A Study on the Tendencies of the Motion Graphic Expressions in the Title sequence)

  • 정희진;나준기
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.195-199
    • /
    • 2006
  • 영상디자인에서 모션그래픽의 경향은 기본적인 모션그래픽의 구성 요소인 공간(Space), 표현형식(Form), 시간(Time)를 적절히 이용하여 하나의 메시지로 전달하기 위해 구현되는 모션그래픽은 보다 강력한 커뮤니케이션 수단으로 사용되어 지고 있다. 관객들이 요구하는 움직임이 빠르고 다양한 이미지와 이펙트 등 그에 어울리는 사운드가 조화롭게 이루어져 타이틀 시퀀스가 제작되었음을 실증사례를 통해 알 수 있다. 본 연구내용을 통해 모션그래픽은 타이틀 시퀀스에 있어서 더욱 강력한 영상 커뮤니케이션 도구로 확장되고 있으며. M-NET, DMB, CABLE TV와 IPTV 등에서도 적용되고있다.

  • PDF