• 제목/요약/키워드: 장면분할

검색결과 132건 처리시간 0.023초

팽창된 합성곱 계층 연산 풀링을 이용한 멀티 모달 네트워크 성능 향상 방법 (Improved Multi-modal Network Using Dilated Convolution Pyramid Pooling)

  • 박준영;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.84-86
    • /
    • 2018
  • 요즘 자율주행과 같은 최신 기술의 발전과 더불어 촬영된 영상 장면에 대한 깊이있는 이해가 필요하게 되었다. 특히, 기계학습 기술이 발전하면서 카메라로 찍은 영상에 대한 의미론적 분할 기술에 대한 연구도 활발히 진행되고 있다. FuseNet은 인코더-디코더 구조를 이용하여 장면 내에 있는 객체에 대한 의미론적 분할 기술을 적용할 수 있는 신경망 모델이다. FuseNet은 오직 RGB 입력을 받는 기존의 FCN보다 깊이정보까지 활용하여 RGB 정보를 기반으로 추출한 특징지도와의 요소합 연산을 통해 멀티 모달 구조를 구현했다. 의미론적 분할 연구에서는 객체의 전역 컨텍스트가 고려되는 것이 중요한데, 이를 위해 여러 계층을 깊게 쌓으면 연산량이 많아지는 단점이 있다. 이를 극복하기 위해서 기존의 합성곱 방식을 벗어나 새롭게 제안된 팽창 합성곱 연산(Dilated Convolution)을 이용하면 객체의 수용 영역이 효과적으로 넓어지고 연산량이 적어질 수 있다. 본 논문에서는 컨볼루션 연산의 새로운 방법론적 접근 중 하나인 팽창된 합성곱 연산을 이용해 의미론적 분할 연구에서 새로운 멀티 모달 네트워크의 성능 향상 방법을 적용하여 계층을 더 깊게 쌓지 않더라도 파라미터의 증가 없이 해상도를 유지하면서 네트워크의 전체 성능을 향상할 수 있는 최적화된 방법을 제안한다.

  • PDF

장면전환 탐지와 예측을 통한 비디오 자료의 전송 제어 (Transmission Control of Video Data through Prediction and Shot Transition Detection)

  • 이근수;김원
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.59-66
    • /
    • 2004
  • 본 논문에서는 MPEG 비디오 데이터를 GoP 단위로 분할하여 장면전환 특성을 파악하고 그에 따라 칼만필터를 사용하여 비디오 데이터의 전송량을 예측하는 방법을 제안하고자 한다. 비디오 데이터의 정확한 장면전환을 파악하기 위해서 압축 도메인에서 고속으로 장면에 대한 정보를 검출하는 알고리즘을 사용하여 급진적 장면전환 유형과 점진적 장면전환 유형으로 분류하였다. 분류된 정보는 칼만필터의 세부 인자로 사용되어 비디오 데이터의 전송량을 예측한다. 본 논문에서 제안한 방법은 압축 도메인에서 장면전환 탐지와 비디오 데이터의 전송량을 예측하여 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이터 911개의 1프레임을 사용한 실험에서 96.2- 97.6%로 전송량을 예측하였다.

  • PDF

웨이블렛 변환을 적용한 장면전환의 cut과 fade검출 (Cut and Fade Detection of Scene Change Using Wavelet transform)

  • 이명은;박종현;박순영;방만원;조완현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.207-210
    • /
    • 2000
  • 본 논문에서는 신호를 해석하는데 유용한 웨이블렛 변환을 적용하여 장면전환 요소 중 cut과 fade를 검출하는 알고리즘을 제안한다. 제안된 방법은 웨이블렛 저대역 부밴드로부터 각 프레임의 히스토그램을 구한 후 이전 프레임과 현재 프레임사이의 히스토그램 차를 구하여 이 값이 임계값 이상이면 급격한 장면전환(abrut shot transition)인 cut으로 분류한다. 다음으로 페이드인(fade in)이나 페이드 아웃(fade out)등 컷의 지점이 불분명한 점진적 장면전환(gradual scene transition)을 검출하기 위하여 고대역 부밴드에서 추출한 에지성분에 모멘트를 계산하여 인접한 프레임 사이의 변동율을 분석하여 값이 증가하면 페이드 인을 검출하고 반면에 감소하면 페이드 아웃을 검출하게된다. 성능평가를 위하여 실제의 비디오 분할에 적용한 결과 웨이블렛 적용 방법론이 매우 높은 Precision을 갖는다는 것을 알 수 있으며 윤곽정보에 모멘트 정보를 더함으로써 기존의 방법보다 정확한 페이드(fade) 구간을 검출할 수 있었다.

  • PDF

방송 영상 패턴을 이용한 축구 경기 장면 분석 (An Scene Analysis is for Soccer Game Video using TV Broadcasting Pattern)

  • 최영수;유채곤;이성환;황치정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.490-492
    • /
    • 2000
  • 본 논문에서는 방송영상 특성을 이용한 축구 경기 장면 분석을 제안한다. 동영상의 프레임들을 분할하기 위해서는 급격한 장면 변화나 화면의 색상과 같은 화면의 형식적인 변화가 주요 결정사항이다. 그러나 축구경기와 같은 동영상에서의 하이라이트는 화면의 형식적인 변화와는 조금 다른 의미를 가진다. 그러므로, 축구 경기 동영상에서 하이라이트 부분을 검출하기 위해서는 장면의 변화와 더불어 화면의 의미를 해석할 필요가 있다. 본 논문에서는 축구 경기 동영상의 모든 프레임을 순차적으로 검사한다. 임의의 프레임에 대하여 RGB 정보의 분석을 통하여 영상의 구성내용을 파악한 후, 구성 내용의 위치와 분포를 참조하여 하이라이트 여부를 판단한다. 제안된 방법에서는 RGB 값의 변화 문제를 해결하기 위하여, 주 RGB 범위 군집화(Dominant RGB Grouping) 방법을 통하여 임의의 영상에서 RGB 값의 변화에 최대한 덜 민감한 방법으로 대상의 RGB 정보를 취득할 수 있는 방법을 사용하였다.

  • PDF

ART2를 이용한 장면 전환 검출 (Scene Change Detection using ART2)

  • 임혁순;박상성;문호석;이만희;장동식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.676-678
    • /
    • 2005
  • 디지털 비디오에 있어서 멀티미디어 데이터베이스 및 검색 시스템 구축을 하기 위해서는 비디오를 여러개의 장면으로 분할하는 기술이 요구된다. 본 논문에서는 다양한 종류의 장면 전환을 검출하기 위해 기존의 규칙기반이 아닌 신경망 이론을 접목하여 자율학습과 실수값 입력이 가능한 ART2를 이용하였다. 매프레임마다 발생할 수 있는 변동의 폭을 줄이기 위해 MPEG 동영상의 DC에 해당하는 값만을 이용하고, 프레임마다 색상의 분산값을 이용하여 Plateaus 구간을 검출한 다음 Plateaus 구간에 해당하는 프레임들에 대해서만 프레임차이, 히스토그램차이, 상관계수 등의 특징치를 추출하여 ART2에 특징벡터를 입력하여 장면 전환을 검출하였다.

  • PDF

점진적 장면 변화 검출을 위한 개선된 Shot 경계 검출기법 (Advanced Shot Boundary Detection Algorithm by Gradual Transition)

  • 성창우;강대성
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.249-252
    • /
    • 2000
  • 본 논문에서는 MPEG으로 압축된 영상에 대해서 급격한 장면 변화에 의한 shot 경계(cut)와 점진적 장면 변화에 의한 shot 경계(dissolve)를 검출하여 비디오 shot을 분할하는 기법을 제안한다. 기존의 방법으로 잘 검출하지 못하였던 점진적 장면 변화에 의한 shot의 경계를 검출하기 위한 기법을 제안한다. 먼저 압축영역의 기법 중 DCT DC 값을 비교하는 방법을 이용하여 cut에 의한 shot 경계를 검출한다 그리고 움직임 벡터(MV)의 비를 비교하는 방법을 사용하여 dissolve에 의한 shot 경계의 후보지들을 얻어내고, 선택된 후보지들 중 n번째와 n+2번째 후보지 영상으로 dissolve 영상을 만들어 n+1번째 후보지의 영상과 유사도를 비교하여 dissolve를 검출한다. 이와 같이 압축영역에서 cut에 의한 shot 경계와 dissolve에 의한 shot 경계의 후보지를 검출해 내고, 검출된 shot 경계 후보지들에서 dissolve에 의한 shot 경계를 검출하는 방법을 함으로서 MPEG 비디오 영상의 복원량을 최소화하여 수행 속도를 높이면서도 cut과 dissolve 두 가지 모두를 효과적으로 검출할 수 있었다.

  • PDF

정지장면의 연속 프레임 영상 간 통계에 기반한 영상분할 (Image Segmentation based on Statistics of Sequential Frame Imagery of a Static Scene)

  • 서수영;고인철
    • Spatial Information Research
    • /
    • 제18권3호
    • /
    • pp.73-83
    • /
    • 2010
  • 본 연구는 정지장면의 연속영상간 각 픽셀위치에서 일어나는 통계적 특성을 활용하여 영상을 분할하는 기법을 제안한다. 공간정보의 획득과 분석에서 디지털 영상 처리 기법의 활용은 아주 중요한 의미를 가진다. 특히 디지털 영상의 영역 구분을 위해 다양한 영상 분할(image segmentation) 기법들이 활용되고 있다. 본 연구에서는 선행 연구한 연속프레임 영상의 분광학적 특성 분석의 결과를 바탕으로 연속 프레임 간 Randomness를 활용한 이미지 분할 방법을 제안하였다. 우선 연속 프레임 간 각 화소에 통계학적인 분석 방법을 적용하여 각 화소의 평균과 표준편차 값을 구하고, 이를 통하여 대상 영상에서 가장 신뢰할 만한 화소들을 찾아 씨앗 점(seed point)을 결정하였다. 그리고 이 씨앗 점들을 시작으로 이웃 화소 간 T-test를 실시하였으며, 이를 기반으로 영역 성장(region growing)의 개념을 적용하여 영상을 분할 할 수 있는 기법을 연구하였다. 제안방식의 성능을 검증하기 위하여 실험을 통하여 기존의 방식과 비교분석을 수행하였다. 이러한 실험의 결과 영상분할에서 영상의 단일 프레임을 활용한 것보다 연속 프레임을 활용한 경우가 유리함을 확인 할 수 있었다.

Multi-Pass 구조를 가지는 Shot 경계 검출기법 (Shot Boundary Detection Algorithm using Multi-Pass Mechanism)

  • 성창우;강대성
    • 융합신호처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.58-63
    • /
    • 2000
  • 본 논문에서는 MPEG으로 압축된 영상에 대해서 급격한 장면 변화에 의한 shot 경계(cut)와 점진적 장면 변화에 의한 shot 경계(dissolve)를 검출하여 비디오 shot을 분할하는 기법을 제안한다. 제안하는 shot 경계 검출 기법은 기존에 잘 검출하지 못하였던 점진적 장면 변화에 의한 shot의 경계검출을 위한 알고리즘이다. 먼저 압축영역의 기법 중 DCT DC 값을 비교하는 방법을 이용하여 급격한 장면 변화에 의한 shot 경계를 검출한다. 그리고 움직임 벡터(MV)의 비를 비교하는 방법을 사용하여 점진적 장면 변화에 의한 shot 경계의 후보지들을 얻어내고, 선택된 후보지들 중 n번째와 n+2번째 후보지 영상으로 feded image를 만들어 n+1번째 후보지의 영상과 유사도를 비교하여 점진적 장면 변화에 의한 shot 경계를 검출한다. 이와 같이 압축영역의 기법으로 급격한 장면 변화에 의한 shot 경계와 점진적 장면 변화에 의한 shot 경계 후보지를 검출해 내고, 검출된 shot 경계 후보지들에서 점진적 장면 변화에 의한 shot 경계를 검출하는 방법을 함으로서 MPEG 비디오 영상의 복원량을 최소화하여 수행 속도를 높이면서도 급격한 장면 변화에 의한 shot 경계와 점진적 장면 변화에 의한 shot 경계, 두 가지 모두를 효과적으로 검출할 수 있었다.

  • PDF

MPEG 압축된 비디오의 자동 분할 기법 (Automatic Parsing of MPEG-Compressed Video)

  • 김가현;문영식
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.868-876
    • /
    • 1999
  • 본 논문에서는 MPEG으로 압축된 비디오(MPEG-compressed video)를 대상으로 내용기반 색인(content-based indexing)에 기초가 될 동영상 자도 d분할에 관한 효과적인 방법을 제안한다. 제안하는 방법은 MPEG 시퀀스의Ⅰ(Intra), P(Predictive), B(bidirectional) 픽쳐 구성에 구애받지 않고 장면 전환점(scene change)을 검출해 낸다. 컷(cut) 검출을 위해서는 Ⅰ픽쳐의 dc 계수와 P, B 픽쳐의 매크로 블록 참조 특성을 이용하여 차이 측도(difference measure)를 설정한다. 그리고 점진적인 (gradual)장면 전환에서는 p, B 픽쳐의 참조 블록 비율을 이용하여 정확하게 장면 전환 지점을 검출한다. 이때 MPEG 시퀀스를 완전히 복원하지 않고 필요한 데이터만을 추출해 내어 전체 데이터 처리 과정을 좀 더 효율적으로 구성한다. 차이 척도의 성능과 검출 결과는 정확도(precision)와 완전추출도(recall)를 기준으로 비교분석하고, 제안한 방법을 다양한 MPEG 시퀀스에 적용시켜 검출 결과와 수행 시간 측면에서 그 효율성을 확인하였다.

  • PDF

HDTV 인코더를 위한 적응적 율제어 방식 (An adaptive rate control scheme for HDTV encoder)

  • 남재열;강병호;이호영;하영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1996년도 학술대회
    • /
    • pp.213-216
    • /
    • 1996
  • HDTV는 DTV에 비해 공간해상도가 4∼6배 이상됨에 따라 처리할 샘플수가 증가하게 된다. 따라서 기존의 DTV급으로 개발된 칩세트나 코덱을 그대로 HDTV 코덱 개발에 적용하기가 어렵게 된다. 따라서 HDTV의 높은 샘플링 주파수 때문에 HDTV 코덱은 화면분할 방식과 같은 새로운 코덱 구조를 가지게 되며, 그 분할된 각각은 기존의 DTV급 코덱으로 처리할 수 있게 된다. 이 때 각 대역마다 발생되는 부호화된 비트수가 다르기 때문에 일정한 전송율로 채널을 통하여 전송되기 위해서 버퍼 및 율제어 방식에 필요하게 된다. 본 논문에서는 각 대역별 영상의 특성과 버퍼 상황에 따라 적응적으로 율제어를 수행함으로써 화질의 균일성을 도모하고 부호화 효율을 증가시킬 수 있는 새로운 율제어 방식을 제안하였다. 또한 장면 전환이 발생했을 때에도 적응적으로 율제어를 수행할 수 있는 장면전환 검출 및 이를 이용한 적응적 율제어방식을 제안하였다.

  • PDF