• 제목/요약/키워드: 시간과 움직임

검색결과 672건 처리시간 0.028초

H.264/AVC 표준에서 역트리 구조를 이용하여 고속으로 화면내 모드를 결정하는 방법 (Fast Intra-Mode Decision for H.264/AVC using Inverse Tree-Structure)

  • 고현석;유기원;서정동;손광훈
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.310-318
    • /
    • 2008
  • H.264/AVC는 각 매크로블록에 대해서 최적의 부호화 모드와 참조 프레임을 결정해 주는 RDO (Rate-Distortion Optimization) 기법을 사용하여 기존의 비디오 압축 표준보다 더 좋은 부호화 효율을 얻고 있다. 하지만, RDO 기법은 하나의 매크로블록 모드를 결정할 때마다, 다양한 블록 타입의 화면내 (Intra) 예측을 수행하고 화면간 (Inter) 예측에 대해서도 1/4 화소까지 고려하는 움직임 추정(Motion Estimation)을 수행한 후 발생되는 비트까지 고려하여 최적의 모드를 결정하기 때문에 부호화기의 복잡도가 매우 큰 문제점이 있다. 따라서 영상의 객관적 화질은 유지하면서 부호화기의 복잡도를 낮추기 위한 많은 고속 알고리즘들이 제안되었고 연구 중에 있다. 본 논문에서는, 역 트리 구조의 경계 방향 예측 알고리즘을 이용한 고속 화면내 모드 결정 기법을 제안한다. 제안된 방법은 $4{\times}4$ 블록의 지역 경계 정보를 이용하여 해당 블록의 DE (Dominant Edge)를 찾아내고 DE에 상응하는 화면내 모드를 이용하여 RDO를 수행한다 $8{\times}8$ 블록 (또는 $16{\times}16$ 블록)의 DE는 이전 단계 4개의 $4{\times}4$ 블록 (또는 $8{\times}8$ 블록) DE들로부터 계산되고, 이 단계에서의 RDO 또한 DE에 상응하는 화면내 모드를 이용한다. 실험결과 제안 방법은 화면내 부호화에 사용되는 후보 모드의 수를 줄임으로써 JM12.2와 비교하여 화면내 부호화 시간을 평균 64% 단축시킬 수 있었다.

제어 가능한 카메라 환경에서 실시간 관심 보행자 검출 및 추적 (Real-Time Interested Pedestrian Detection and Tracking in Controllable Camera Environment)

  • 이병선;이은주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.293-297
    • /
    • 2007
  • 본 논문에서는 실시간으로 획득된 칼라 영상에서 CMODE(Correct Multiple Object DEtection)방법을 이용하여 움직이는 다수 물체를 검출하고, 위치 정보와 색상 정보를 이용하여 관심 보행자만을 추적하는 새로운 알고리즘을 제안한다. 다수 물체가 검출되면, 사람의 구조적 특징과 형태 정보를 이용하여 나무의 흔들림이나 차량의 움직임은 제거하고 관심 보행자만을 검출한다. 검출된 관심 보행자 추적을 위한 1차 유사성 판단은 이전 관심 보행자의 무게중심과 현재 관심 보행자의 무게중심간의 거리차를 이용한다. 1차 유사성이 판단된 영역에 대하여 k-평균 알고리즘으로 세 개의 특징점을 구하고, 각 특징점의 $3{\times}3$ 영역에 대한 평균 색상값으로 2차 유사성을 판단하여 추적하도록 한다. 카메라 배율은 원거리의 보행자에 대한 추적을 용이하게 하기 위해서 조정하고, 카메라 시계(FOV: Field of View)는 보행자의 위치가 화면내의 일정 범위에 있지 않을 경우에 조정한다. 실험 결과, 제안한 CMODE 방법이 라벨링 방법보다 평균 접근 횟수가 1/4배정도 덜 접근하였으며, 평균 검출시간도 3배정도 빠르게 검출됨을 확인할 수 있었다. 나무의 흔들림으로 인한 영역이나 차량의 움직임 영역, 그림자 영역과 같이 복잡한 배경에서도 관심 보행자 검출은 평균 96.5%의 높은 검출률을 보였다. 관심 보행자 추적은 위치 정보와 색상 정보를 이용하여 평균 95%의 높은 추적률을 보였으며, 관심 보행자는 카메라 시계와 배율을 조정함으로써 연속적으로 추적할 수 있었다.

  • PDF

퍼포먼스.이벤트의 결합체로서 건축환경연구 (A Study on the Architectural Environment as a Combination of Performance and Event)

  • 김주미
    • 디자인학연구
    • /
    • 제14권
    • /
    • pp.121-138
    • /
    • 1996
  • 전환기적 시대상황의 인식과 뉴 패러다임에 기초하여 미래 건축환경의 변화를 예측하고 그에 대응할 수 있는 건축언어와 새로운 디자인 전략을 제안하는데 본 연구의 목적이 있었으며, 그 연구내용과 결과는 다음과 같다. 첫째, 현대 예술 속에서 공간, 인간의 신체, 그리고 움직임을 재해석하고 그 예술적 의도를 환경디자인과 결합시켜 퍼포먼스·이벤트건축의 가능성을 고찰하였다. 둘째, 건축환경은 물질들만의 집합보다는 공간, 움직임, 우연적 상황 그리고 이벤트들의 결합체로서 보았다. 또한 퍼포먼스장소로서의 환경을 이해함과 동시에 디자인 행위자체를 퍼포먼스 과정으로 제시하였다. 셋째, 인간은 환경과의 상호작용을 통해 항상 반응하며 스스로의 조절을 통해 적응하는 유기체적 시스템이다. 건축 또한 현시대의 불확정적인 인식체계와 빠르게 변화하는 사회구조, 테크놀러지의 발전과 함께 인간의 행위, 활동이 결합되어 끊임없이 변화하는 역동적 시스템으로 설명되었다. 넷째, 본 연구자는 종래 모더니즘 디자인에서의 형태와 기능의 인과론적, 기계론적 조형태도에서 벗어나 상대론 적, 유기론 적 관점을 취하과자 하였다. 특히 탈 물질적인 환경의 개념을 강조하였으며 형태와 기능의 상호 텍스트 성, 그리고 시간의 흐름 속에서 상호변화 가능성을 지원할 수 있는 탈 프로그램 방법을 제안하였다. 결과적으로 퍼포먼스·이벤트건축의 전략은 인간의 자율적 기능의 회복과 예술로서의 환경을 어느 정도 가능하게 할 수 있는 개념이라고 보았으며, 시스템적 세계관으로의 전환을 강조하였다.

  • PDF

적외선 비디오에서 Gain과 Offset 결합 보정을 통한 고정패턴잡음 제거기법 (Fixed Pattern Noise Reduction in Infrared Videos Based on Joint Correction of Gain and Offset)

  • 김성민;배윤성;장재호;나종범
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.35-44
    • /
    • 2012
  • 대부분의 최근 적외선 센서는 focal-plane array (FPA) 구조로 되어있다. 이러한 구조의 센서는 공간적 불균일 응답성을 갖는 것으로 알려져 있고, 이로 인해 고정패턴잡음을 발생시킴으로써 영상열화를 가져온다. 따라서 적외선 영상의 고정패턴잡음을 제거하기 위해서는 픽셀 불균일 보정을 해야 한다. 픽셀 불균일 보정기법은 참조물체기반 접근법과 영상기반 접근법으로 나눌 수 있다. 참조물체기반 접근법에서는 흑체와 같은 균일한 온도를 갖는 물체를 이용해서 고정패턴잡음을 분리시킬 수 있는 방법이다. 하지만 센서의 응답성은 시간이 지나면서 변할 수 있기 때문에, 최근에는 비디오 영상을 이용하는 영상기반 접근법이 많이 연구되고 있다. 영상기반 접근법들 중에서 칼만 필터를 기반으로 하는 최신 알고리듬은 영상 간에 움직임 보상 시에 한 방향 워핑을 이용하고 센서의 offset 불균일성만을 보상해준다. 하지만 한 방향 워핑을 이용한 시스템 모델은 영상의 경계 부근에서 고정패턴잡음을 효과적으로 제거하지 못한다. 게다가, offset만 보정하는 접근법은 gain의 불균일성의 영향을 많이 받는 영상에서는 성능이 악화될 수 있다. 그러므로 본 논문에서는 양방향 워핑을 이용하여 시스템 모델링을 하고, gain과 offset의 결합 보정을 수행하는 알고리듬을 제안한다. 모사 영상과 실제 영상에 대한 실험 결과들은 제안하는 알고리듬이 기존 알고리듬들보다 더 효과적으로 고정패턴잡음을 제거하는 것을 확인할 수 있다.

칼라 불변 기반의 특징점을 이용한 영상 모자이킹 (Image Mosaicking Using Feature Points Based on Color-invariant)

  • 권오설;이동창;이철희;하영호
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.89-98
    • /
    • 2009
  • 컴퓨터 비전 분야에서 영상 모자이킹 (Image Mosaicking)은 제한된 시야각의 카메라를 사용하여 획득한 여러 장의 중첩된 영역을 가지는 영상을 한 장의 영상으로 정합하여 나타내는 기법이다. 최근에는 연속된 영상에서 카메라의 기학학적인 움직임 때문에 발생하는 영상의 왜곡이나 밝기 차에 관계없이 정확한 정합을 수행하기 위해서 특징점을 기반으로 서술자를 구성하는 정합 방법이 많이 연구되고 있다. 그러나 대부분의 특징점 검출 알고리즘들은 영상의 밝기값 기반의 처리 과정을 수행하기 때문에 영상의 칼라 성분은 다르지만 밝기값이 비슷한 경우, 또는 동영상에서 시간의 흐름에 따라 광원이 변화하는 경우에는 광원의 영향에 따라 검출되는 특징점의 수와 각각의 지역 서술자의 특성이 변하여 정확한 대응점을 검출하는데 오류를 유발하게 된다. 이런 문제점을 해결하기 위해서 본 논문은 영상의 칼라 정보를 이용한 특징점 기반의 영상 모자이킹 방법을 제안하였다. 디지털 칼라 카메라로부터 획득한 디지털 값을 좁은 대역을 갖는 가상의 카메라 출력값으로 변환하여 물체의 분광 반사율 기반의 값으로 유도하고 이것을 광원의 변화에 불변하는 칼라 불변 값 (Color-Invariant Value)으로 정의하였다. 제안된 칼라 불변값의 유효성을 검증하기 위해서 시뮬레이션된 광원들과 Macbeth Color-Checker를 이용하여 확인하였으며, 실험결과에서 제안한 방법과 기존의 SIFT 알고리즘을 비교를 통해 제안된 방법의 정합율의 향상을 확인하였다.

인간과 결합한 내용기반 동영상 율제어 (A Content-based Video Rate-control Algorithm Interfaced to Human-eye)

  • 황재정;진경식;황치규
    • 한국통신학회논문지
    • /
    • 제28권3C호
    • /
    • pp.307-314
    • /
    • 2003
  • 일반적으로 화자와 같이 중요하게 인식되는 객체를 시퀸스 전체에서 높은 우선순위를 부여한다. 그러나 다중 객체 동영상 부호화에서 각 객체의 중요도는 시퀸스 전체에서 일관적이지 않고 프레임마다 변화되므로 시변적으로 중요도를 변화시킬 필요가 있다. 따라서 본 논문에서는 독립적 율제어 알고리즘과 정적 파라미터들인 객체 중요도 또는 우선 순위와 목표 PSNR, 가중치 왜곡에 따라 각 객체에 QP를 할당하는 포괄적 율제어 알고리즘을 설명하고 정적 파라미터 중 우선 순위는 카메라 인터페이스를 통해 인간의 시각적 관심도 또는 중요도에 따라 동적 파라미터로 적용하며 목표 PSNR 및 가중치 왜곡은 객체의 크기, 움직임, 왜곡의 세 변수를 기준으로 비율적으로 나타내어 가중치 왜곡 제어와 우선 순위 기반 제어 알고리즘에 적용하여 비트율 분배의 효율을 높이고 있다. 결과로서 중요도가 적은 객체에 대해서는 매우 적은 비트를 할당받게 하며 시각적 중요도가 높은 객체에 대해서는 많은 비트를 할당받게 한다. 또한 화질이 적정 수준으로 안정되는 안정화 시간도 15 프레임 이내로 줄어드는 효과를 보였다 PSNR의 측면에서도 다른 기법에 비해 평균레벨에서 2㏈ 이상 높아지는 결과를 얻어서 인간과 결합한 내용기반 부호기가 다중객체 통영상 부호기에 효과적으로 사용될 수 있음을 제시하였다.

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 배철수
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.59-68
    • /
    • 1999
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원 형상 모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차원 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다. 본 논문에서는 한국어 10개 모음에 대하여 인식실험하여 비교적 높은 인식율을 얻을 수 있는 것으로 보아 본 연구에서 사용한 특징 벡터를 시간적 변별 요소로서 사용할 수 있음을 제시하였다.

  • PDF

3D 영상 특성 인식이 프레즌스, 그리고 프레즌스가 시각 피로도와 인지된 안구운동에 미치는 영향 (Influence of 3D Characteristics Perception on Presence, and Presence on Visual Fatigue and Perceived Eye Movement)

  • 양호철;정동훈
    • 방송공학회논문지
    • /
    • 제17권1호
    • /
    • pp.60-72
    • /
    • 2012
  • 영화 아바타의 성공 이후, 3D 영화의 성공 사례가 계속 이어지지 못하고 있다. 3D 영상이 성공하기 위해 많은 것을 고려해야하지만, 특히 휴먼팩터 부분을 간과시한 결과가 아닌가 하는 주장이 제기되고 있다. 3D 영상이 시청자에게 어떠한 영향을 미치는지 이제 막 초기 연구가 실행되고 있는 상황에서 본 연구는 3D 영상 시청 후 시청자의 심리적 반응을 인지된 특성, 프레즌스, 시각 피로도 그리고 양안운동 지각을 통해 측정하고자 했다. 90명을 대상으로 한 실험연구 결과 첫째, 인지된 특성은 프레즌스에 영향을 미치고 인지된 특성의 세부 요인 중 실물감이 프레즌스에 영향을 미치는 것으로 나타났다. 둘째, 프레즌스의 경험정도가 높을수록 인지된 안구운동이 증가했지만, 시각피로도는 감소하였다. 이처럼, 프레즌스가 눈 움직임 지각과 시각피로도에 미치는 영향이 가지는 첫 번째 함의는 다음과 같다. 우리가 눈을 움직인다는 것은 우리가 미디어적인 도구로서 우리의 눈을 사용한다고 여기기보다는 눈과 함께 환경과 상호 작용하고 있다는 것이다. 따라서 콘텐츠에서 경험할 수 있는 상호작용의 요소들이 많아야 할 것이라고 추론할 수 있으며 이를 후속 연구를 통해 검증하는 것이 필요할 것이다. 다음으로는 프레즌스의 요인 중 시간 관여가 높아짐에 따라 시각피로도에 대한 지각이 감소한다. 반면 몰입 실재감이 증가함에 따라 시각피로도는 증가하게 되므로 콘텐츠 제작 시 몰입 실재감을 높이는 효과는 일정 수준이상이 되지 않도록 조절해야 할 것이다. 이를 위해 프레즌스에 영향을 미치는 인지된 특성변인 중 실물감 요인이 프레즌스의 세부요인별로 어떠한 영향을 미치는지, 프레즌스에 영향을 미치는 다른 변인은 무엇인지를 후속 연구를 통해 알아볼 필요가 있을 것이다.

재활 및 교정을 위한 견인운동치료기의 견인측정센서 개발에 관한 실험적 연구 (Experimental Research for Traction force Sensor Development on Drawing Exercise Medical Instrument)

  • 이상식;박원엽;이충호
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권2호
    • /
    • pp.3-8
    • /
    • 2009
  • 척추 및 보행질환 등에서 재활과 교정을 위하여 정형외과 및 가정 등에서는 견인운동치료기를 주로 사용하고 있다. 하지만 견인운동치료기를 사용함에 있어 간혹 무리하게 사용함에 따라 인체에 문제점이 발생하고 있다. 지속적인 견인력 작용을 이용한 치료방법에 견인운동치료기를 이용하는데, 이 때 작용하는 견인력을 측정하여 운동 시간을 조절할 필요가 있다. 그러나 현재 출시되고 있는 제품에는 견인력을 측정하는 센서가 대부분이 장착되어 있지 않고 있다. 그래서 스트레인 게이지를 이용한 견인측정센서, 출력신호로서의 변환을 위한 증폭기 및 성능 검증을 위하여 측정용 실험 장치를 설계 제작하고, 이를 이용하여 견인측정센서를 실험 하였다. 견인 부하에 따른 견인측정센서의 전기적 반응치를 측정하고 분석 결과, 캘리브레이션을 통하여 센서는 선형적인 출력을 보였고 환자의 움직임 여부에 관계없이 일정하게 견인측정센서의 반응이 나타남을 알 수가 있었다. 정적인 상태에서의 실험에서 최대 에러율이 약 1%이내이고, 동적인 실험에서 평균 에러율이 약 0.7%로 나타났다. 온도 변화에 따른 견인측정센서의 최대 출력치 변화량(output variation)이 약 0.3%이므로 견인 측정용 센서로 사용 가능하다고 판단된다.

  • PDF

2단계 신경망과 계층적 프레임 탐색 방법을 이용한 MPEG 비디오 분할 (MPEG Video Segmentation using Two-stage Neural Networks and Hierarchical Frame Search)

  • 김주민;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.114-125
    • /
    • 2002
  • 본 논문에서는 MPEG 비디오 데이터의 컷(cut)과 디졸브(dissolve)를 검출하여 샷(shot) 단위로 분할하고 각 샷의 카메라 동작 또는 객체 움직임의 형태를 분류하는 방법을 제안하고자 한다. 정확한 샷의 위치와 카메라, 객체의 세분화된 동작을 구별하기 위한 전단계의 연구에서[1] 우선 MPEG 데이터의 I(Intra) 프레임의 DC(Direct Current) 계수를 분석하여 픽처 그룹을 Shot(장면이 바뀐 경우), Move(카메라 동작 또는 객체가 움직인 경우), Static(영상의 변화가 거의 없는 경우)으로 세분화하여 분류하였다. 이 과정에서 2단계 구조의 신경망을 구성하고 여러 종류의 특징을 서로 다른 해상도에서 추출하여 결합시키는 방법을 제안하였다. 다음 단계로 Shot 또는 Move로 분류된 픽처 그룹의 P(Predicted), B(Bi-directional) 프레임을 선별적, 계층적으로 탐색하여 컷의 정확한 발생 위치와 카메라 동작 또는 객체 움직임의 종류를 결정하는 방법을 제안한다. P, B 프레임의 매크로 블록의 종류별 분포를 통계적으로 이용하여 컷의 발생 위치를 검출하여, P, B 프레임의 매크로 블록 종류와 움직임 벡터를 동시에 사용하는 신경망을 구성하여 디졸브, 카메라 동작, 객체 움직임의 종류를 검출한다. 본 논문에서 제안하는 방법은 MPEG 데이터의 압축을 풀지 않은 상태에서 I 프레임의 DC 계수만을 사용하여 픽처 그룹을 분류하며, 분류된 픽처 그룹 내에서 일부의 P, B 프레임만을 계층적으로 선택하여 탐색함으로서 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이터를 사용한 실험에서 93.9-100.0%로 픽처 그룹을, 96.1-100.0%로 컷을 검출하였다. 또한 두 종류의 비디오 데이터를 사용한 실험에서 90.13% 및 89.28%의 정확성으로 카메라 동작 또는 객체 움직임을 분류하였다.