• 제목/요약/키워드: 영상 특징추출

검색결과 2,333건 처리시간 0.03초

지능형 PVR을 위한 축구 동영상 하이라이트 요약 (Soccer Video Highlight Summarization for Intelligent PVR)

  • 김형국;신동
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.209-212
    • /
    • 2009
  • 본 논문에서는 MDCT기반의 오디오 특징과 영상 특징을 이용하여 축구 동영상의 하이라이트를 효과적으로 요약하는 방식을 제안한다. 제안하는 방식에서는 입력되는 축구 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 분리된 연속적인 오디오 신호를 압축영역의 MDCT계수를 통해 이벤트 사운드별로 분류하여 오디오 이벤트 후보구간을 추출한다. 입력된 비디오 신호에서는 장면 전환점을 추출하고 추출된 장면 전환점으로부터 페널티 영역을 검출한다. 검출된 오디오 이벤트 후보구간과 검출된 페널티 영역장면을 함께 결합하여 축구 동영상의 이벤트 장면을 검출한다. 검출된 페널티 영역 장면을 통해 검출된 이벤트 구간을 다른 이벤트 구간보다 더 높은 우선순위를 갖는 하이라이트로 선정하여 요약본이 생성된다. 생성된 하이라이트 요약본의 평가는 precision과 recall을 통해 정확도를 평가하였다.

  • PDF

에지 영상의 방향성분 히스토그램 특징을 이용한 자동차 번호판 영역 추출 (Extraction of Car License Plate Region Using Histogram Features of Edge Direction)

  • 김우태;임길택
    • 한국산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.1-14
    • /
    • 2009
  • 본 논문에서는 번호판 영역의 추출에 사용될 수 있는 특징 벡터와 이를 이용하여 문자와 비문자를 판별하고 숫자를 인식하는 방법을 제안한다. 제안하는 특징 벡터는 영상의 기울기 벡터에서 얻어지는 에지 영상의 방향 코드 히스토그램으로부터 추출된다. 추출된 특징 벡터를 MD로 구현되는 문자 및 비문자 인식기에 입력하여 문자와 비문자를 판별함으로써 번호판 영역의 위치를 추정하고, 숫자를 인식한다. 실험 결과 제안하는 방법이 문자와 비문자의 정확한 판별, 번호판 영역의 위치 추정 및 숫자의 인식에 유용하게 적용될 수 있음을 알 수 있었다.

다관절체 운동의 분석을 위한 실루엣 상의 특징점 추출 (Detection of Feature on the Silhouette for Articulated Body Motion)

  • 이동훈;정순기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.553-555
    • /
    • 2000
  • 인체와 같은 다관절체의 운동은 세그먼트 단위로 강체의 특성을 포함하고 있으나, 움직임에 따라 옷의 주름과 같은 잡음과 관절의 변화 등의 비강체의 성질을 가진다. 따라서 잡음과 움직임에 따라 다양한 특징점이 추출되며, 영상 간 특징점의 변화가 심하므로, 대상의 특징을 비교적 정확히 반영하는 대응관계를 가진 특징점을 추출하는 것은 어려운 문제이다. 본 논문에서는 인체와 같은 다관절체의 움직임으로부터 신뢰성 있는 대응관계를 가진 특징점을 추출하기 위한 기법을 제안한다. 또한 쌍 대응(pairwise correspondence)의 문제를 확장하여 특정 동작을 이루는 다수의 프레임에서의 일관성 있는 특징점 대응을 위한 간단한 전략을 제안한다. 이를 통해 정확하고 안정적인 대응관계를 가진 특징점을 추출할 수 있다.

  • PDF

일차 고유벡터와 히스토그램 분석에 의한 영상 정합 (Image Matching by First Eigenvector and Histogram Analysis)

  • 임문철;황선철;김우생
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권10호
    • /
    • pp.1054-1061
    • /
    • 2000
  • 영상 정합은 물리적으로 유사한 영상 내의 영역들을 기하학적으로 일치시키는 처리이며 지형 정보, 영상검색, 원격탐사, 의료영상 등의 많은 영상처리 응용에서 사용된다. 영상 정합에 관한 연구는 주로 회전, 크기, 위치 등의 인자 추출에 소요되는 시간과 정확성에 중점을 두어 왔다. 본 연구에서는 영상의 특징 점들에 대한 일차 고유벡터의 방향 분포를 히스토그램으로 표현하고 이를 비교 분석함으로써 정합하는 방법을 제안한다. 일차 고유벡터를 이용함으로써 특징 묘사의 단순성을 제공하고. 히스토그램을 이용하여 정합 인자를 미리 추정함으로써 정합 인자 추출 시 목적함수의 연산에 소요되는 비용을 현저하게 줄였다. 본 연구의 결과를 평가하기 위해 제안한 방식을 일반 영상과 ICG(IndoCyanine Green)망막 영상에 적용한 결과를 보여주고 목적함수의 연산횟수와 시간 복잡도를 기존의 방법들과 비교하였다.

  • PDF

컬러와 패턴을 이용한 텍스타일 영상에서의 감정인식 시스템 (Emotion Recognition Using Color and Pattern in Textile Images)

  • 신윤희;김영래;김은이
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.154-161
    • /
    • 2008
  • 본 논문에서는 컬러와 패턴 정보를 이용하여 텍스타일 영상에 포함된 감성을 자동으로 인식할 수 있는 방법을 제안한다. 이때, 감성을 표현하기 위해 고바야시의 10가지 감성 그룹 - {romantic, clear, natural, casual, elegant chic, dynamic, classic, dandy, modern}- 을 이용한다. 제안된 시스템은 특징 추출과 분류로 구성된다. 특징 추출 단계에서는 주관적인 감성을 물리적인 영상 특징으로 표현하기 위해 텍스타일을 구성하는 대표 컬러와 패턴을 추출 한다. 이 때 대표 컬러를 추출하기 위해서 양자화 기법을 이용하고, 패턴정보를 표현하기 위해서는 웨이블릿 변환 후의 통계적인 정보를 이용한다 추출된 컬러와 패턴 특징은 신경망을 이용한 분류기의 입력으로 사용되고, 분류기를 통해 입력 텍스타일이 임의의 감성을 가지는지 여부가 결정된다. 제안된 감성인식 방법의 효율성을 증명하기 위해서 인위적인 도메인, 패션 도메인, 인테리어 도메인에서 얻어진 389장의 텍스타일 영상에서 실험하였다. 다양한 도메인의 영상에 대해 사용된 결과 제안된 방법은 100%의 정확도와 99%의 재현율을 보였다. 이러한 실험 결과는 제안된 감성인식 방법이 다양한 텍스타일 관련 산업분야에 일반화되어 사용될 수 있음을 보여주었다.

딥 러닝 기반의 SIFT 이미지 특징 추출 (SIFT Image Feature Extraction based on Deep Learning)

  • 이재은;문원준;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.234-242
    • /
    • 2019
  • 본 논문에서는 일정 크기로 자른 영상의 가운데 픽셀이 SIFT 특징점인지를 판별함으로써 SIFT 특징점을 추출하는 딥 뉴럴 네트워크(Deep Neural Network)를 제안한다. 이 네트워크의 데이터 세트는 DIV2K 데이터 세트를 $33{\times}33$ 크기로 잘라서 구성하고, 흑백 영상으로 판별하는 SIFT와는 달리 RGB 영상을 사용한다. 그라운드 트루스(ground truth)는 옥타브(scale, octave)를 0, 시그마(sigma)는 1.6, 간격(intervals)은 3으로 설정하여 추출한 RobHess SIFT 특징들로 구성한다. VGG-16을 기반으로 컨볼루션 층을 13개에서 23개와 33개로 점점 깊은 네트워크를 구성하고, 영상의 스케일을 증가시키는 방법을 바꿔가며 실험을 수행한다. 출력 층의 활성화 함수로 시그모이드(sigmoid) 함수를 사용한 결과와 소프트맥스(softmax) 함수를 사용한 결과를 비교하여 분석한다. 실험결과 제안한 네트워크가 99% 이상의 추출 정확도를 가질 뿐 아니라 왜곡된 영상에 대해서도 높은 추출 반복성을 가진다는 것을 보인다.

영상의 텍스쳐 정보를 이용한 내용 기반 영상 검색에 관한 연구 (A Study on Content-based Image Retrieval Technique using Texture Information)

  • 박경식;박강서;홍민석;정태윤;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.751-753
    • /
    • 1999
  • 본 논문에서는 영상의 텍스쳐 정보를 이용하여 일반 영상에 대한 내용기반 영상 검색을 수행할 수 있는 알고리듬을 제안한다. Gabor 웨이브렛 변환을 이용하여 Gabor 필터 뱅크 내의 각 필터에 의해 필터링된 대역의 평균과 표준편차를 영상의 특징 벡터(Gabor Texture Feature)로 추출하여 영상들간의 유사성을 계산하는데 사용한다. 논문의 목적이 영상에 가해진 외적 변형, 즉 잡음 첨가, 블러링, 샤프닝 등과 같은 변형에 강인하게 동작할 수 있는 텍스쳐 특징 기반 영상 검색 기법을 제안하는 것이므로, 기존의 Gabor 필터만을 사용하여 텍스쳐 특징을 추출하여 검색의 기준으로 삼을 경우에 발생할 수 있는 주파수 성분의 변화에 대한 민감성을 Daubechies의 웨이브렛 필터를 사용하여 낮은 해상도에서 영상을 해석함으로써, 외적 변형에 대하여도 강인하게 동작할 수 있는 알고리듬을 제시하였다. 기존의 텍스쳐를 이용한 검색이 주로 텍스쳐 영역(textured region)에 대한 해석만을 하였지만, 본 논문에서는 이를 일반 영상에 적용하였으며, 일반 영상에 대해서도 효율적인 검색을 수행할 수 있음을 보였다.

  • PDF

웨이브릿 변환 영역에서 특징추출을 이용한 내용기반 영상 검색 (Content-based Image Retrieval using Feature Extraction in Wavelet Transform Domain)

  • 최인호;이상훈
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.415-425
    • /
    • 2002
  • 본 논문에서는 웨이브릿 변환 영역에서 추출된 특징을 기반으로 한 내용기반 영상검색 방법에 관해 연구하였다. 기존의 웨이브릿 기반의 방법에서의 문제점인 특징벡터의 크기를 줄이기 위해 웨이브릿 계수의 영역별 에너지 값을 이용하였으며, 대상물의 이동, 회전, 크기 변화에 영향을 받지 않는 모멘트 특성을 이용한 검색방법을 제안하였다. 본 방법은 특징벡터의 크기를 줄이고, 기존의 특징벡터와 비교해서 검색시간을 단축하면서 분류검색의 효율성을 향상시켰다. 영역기반 영상검색 기능을 제공하기 위해 영상분할 방법에 대해 연구하였으며, 불규칙한 광원에 의한 영향을 최소화할 수 있는 영상분할 방법을 제안하였다 영상분할은 영역병합을 이용하였고, 병합후보영역은 웨이브릿 변환의 고주파 대역 에너지 값을 이용하여 선정하였다 분할된 영역정보를 이용하여 칼라와 질감, 모양 특징벡터를 구성하여 영역기반 영상검색을 수행하였다.

  • PDF

계층적 신경망을 이용한 객체 영상 분류 (Object Image Classification Using Hierarchical Neural Network)

  • 김종호;김상균;신범주
    • 한국산업정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.77-85
    • /
    • 2006
  • 본 논문에서는 내용기반 영상 분류를 위한 방법론으로써 신경망을 이용한 계층적 분류 방법을 제안한다. 분류 대상 영상은 인터넷상의 다양한 영상들 중에서 전경과 배경의 구분이 있는 객체 영상이다. 전처리 과정에서 영역 분할을 이용하여 영상 내에서 배경을 제거하고 객체 영역을 추출한다. 분류를 위한 특징으로는 웨이블릿 변환 후 추출된 형태 특징과 질감 특징을 이용한다. 추출된 특징 값들을 Principal Component Analysis(PCA)와 K-means를 이용해서 군집화 시키고 유사한 군집들을 묶으면서, 5단계의 계층적 분류기를 구성한다. 계층적 분류기는 BP를 학습 알고리즘으로 사용하는 59개의 신경망분류기로 구성된다. 배경을 제거하고 질감특징 중 가장 높은 분류율을 보이는 대각 모멘트를 사용하여 실험하였을 때, 100종류에서 각 10개씩, 총 1000개의 학습 데이터와 1000개의 테스트 데이터에 대하여 각각 81.5%와 75.1%의 정분류율을 보였다.

  • PDF

일반화 대칭 변환을 이용한 축소 영상에서의 얼굴특징추출 (Facial Feature Extraction in Reduced Image using Generalized Symmetry Transform)

  • 팽영혜;정성환
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.569-576
    • /
    • 2000
  • 일반화 대칭 변환(Generalized Symmetry Transform : GST)은 디칭성을 이용하여 영상의 사전 정보 없이 얼굴 특징의 위치를 추출할 수 있는 방법이다. 그러나, 눈, 코, 입 등의 특징보다 마스크의 크기가 커야 하므로 많은 처리시간이 필요하다. 그리고, 얼굴의 특징을 결정하기 위해 통계적 처리가 수반되는 중심선 계산으로 인해 처리 과정이 복잡하다. 이러한 단점을 개선하기 위해, 본 논문에서는 두 가지 방법을 제안하였다. 첫째, 처리 시간을 단축하기 위해 원 영상 대신 영상의 정보를 충분히 가지는 축소 영상을 사용하였다. 둘째, 중심선 계산을 위해 복잡한 통계적 처리 대신 추출된 첨두치의 위치를 이용하였다. 제안된 방법의 성능을 살펴보기 위해, 정면, 회전, 안경, 수염이 있는 영상 등 200개의 영상에 대해 실험하였다. 그 결과, 제안된 방법은 85%의 특징 탐지율과 기존의 방법에 비해 약 53배 이상감소된 처리시간을 나타내었다.

  • PDF