• 제목/요약/키워드: 영상 특성벡터

검색결과 329건 처리시간 0.027초

형태 Correlogram을 이용한 내용기반 영상검색 (Content-Based Image Retrieval Using Shape Correlogram)

  • 남기현;문영식
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.215-222
    • /
    • 2001
  • 본 논문에서는 새로운 형태 특징값으로서 형태 correlogram을 제안하고 이를 기반으로 한 효과적인 내용기반 영삼검색(content-based image retrieval) 방법을 제시한다. 기존읜 색상 correlogram은 색상 정보에 공간적인 정보를 부여함으로써 영상검색 성능을 향상시켰다. 그러나 이 특징값은 형태 정보를 포함하고 있지 않아서 색상이 다르면서 비슷한 윤곽선 형태를 갖는 물체의 검색에는 좋은 효과를 보이지 못한다.이 문제를 해결하기 위해 예지(edge)들의 correlogram인 형태(shape) correlogram을 제안한다. 색상 correlogram이 색상들의 거리에 따른 상관관계를 나타내는데 반해 형태 correlogram은 에지 각도들의 상관관게를 나타낸다. 형태 correlogram은 gradient 축과 각도 축을 가지는 2차원 특징 벡터(feature vector)로 표현된다. 각 축은 24개 빈(bin)으로 나뉘어져서 총 576개의 원소를 가지게 된다. 또한 본 논문에서는 형태 correlogram의 데이터 크기를 줄이고, 회전에 대해 불변인 특성을 가지게 하기 위해 투영(projected) 형태 correlogram을 제안한다. 실험결과를 통하여 본 논문에서 제안한 형태 correlogram과 투영 형태 correlogram을 사용한 영상검색 방법이 기존의 방법보다 성능면에서 우수함을 입증한다.

  • PDF

3차 칼라 객체 관계에 의한 내용 기반 영상 검색 (Content-Based Image Retrieval using Third Order Color Object Relation)

  • 권희용;최재우;이인행;조동섭;황희융
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.62-73
    • /
    • 2000
  • 본 논문에서는 기존의 칼라 특성을 이용한 내용 기반 영상 검색 방법을 적용 영역별로 분류 할 수 있는 기준을 제시하고, 그 기준에 의해 영상 내 공간 정보를 충분하게 표현할 수 있어 이동 및 회전 확대/축소 변형에 강한 영상 검색 방법을 제안한다. 일반적으로 칼라 특성을 이용한 내용 기반 영상 검색은 영상 내 공간정보를 충분하게 표현하지 못하여 이동 및 회전, 확대/축소 변형에 약한 단점을 지니고 있다. 이에 기존 연구에서는 인위적으로 영상을 여러 개로 분할하는 방법 등으로 공간 정보를 표현하고자 하였지만 특징 벡터의 수가 급격히 늘어남에 따라 검색 효율이 저하된다는 단점을 가지고있다. 본 논문에서는 기존의 방법을 사용된 칼라 객체의 상호 관계에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소,확대)에 탁월한 성능을 보이는 칼라 객체의 3차 관계를 이용한 방법을 제안한다. 제안된 방법은 주어진 영상으로부터 양자화된 24개의 버킷을 생성해서 각 버킷의 히스토그램의 크기 순서로 세 개 버킷을 선정하고 그들의 평균 칼라 위치를 계산해서 그들 간의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험 결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

차량 식별마크와 번호판 인식을 통한 차량인식 (Vehicle Recognition with Recognition of Vehicle Identification Mark and License Plate)

  • 이응주;김성진;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1449-1461
    • /
    • 2005
  • 본 논문에서는 차량의 식별마크 분류 및 차량번호판 인식을 통한 차량인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 먼저 입력 차량영상으로 부터 잡음제거, 세선화 과정 등 전처리 과정들을 수행하고 명암값 변화 빈도 분포를 사용하여 차량식별마크와 번호판 영역을 추출하였다. 또한 추출된 후보 영역으로부터 차량 식별마크와 번호판 영역의 구조적 특성 정보를 사용하여 차량 식별마크, 번호판의 문자 및 숫자를 분류하였으며, 하이브리드 패턴벡터 및 수직수평 패턴벡터를 사용하여 식별마크, 문자 및 숫자를 인식하여 차량 정보 인식율을 개선하였다. 제안한 알고리즘에서는 차량의 식별마크가 차량의 종류에 따라 독립적인 특성, 식별마크와 번호판 영역에서는 문자와 배경이 뚜렷하게 구별되는 특성 및 수평 및 수직빈도수 분포가 식별마크 및 번호판 이외의 영역과 뚜렷이 구별된다는 특성들을 이용하였다. 제안한 방법의 성능을 확인하기 위하여 다양한 환경에서 촬영된 350여개의 영상에 대하여 차량인식 실험을 수행하였고 제안한 방법이 차량번호판의 크기와 위치에 무관하고 잡음의 영향에 덜 민감하였을 뿐만 아니라 불규칙적인 외부환경에서도 인식율이 개선되었다. 또한 식별마크와 번호판 인식의 실시간 처리가 가능하여 실제 주차장이나 도시화도로등에 적용이 가능하다.

  • PDF

가중치 기반 Bag-of-Feature와 앙상블 결정 트리를 이용한 정지 영상에서의 인간 행동 인식 (Human Action Recognition in Still Image Using Weighted Bag-of-Features and Ensemble Decision Trees)

  • 홍준혁;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제38A권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 논문에서는 CS-LBP (Center-Symmetric Local Binary Pattern) 특징과 공간 피라미드를 이용한 BoF (Bag of Features)를 생성하고 이를 랜덤 포레스트(Random Forest) 분류기에 적용하여 인간의 행동을 인식하는 알고리즘을 제안한다. BoF를 생성하기 위해 영상을 균일한 패치로 나누고, 각 패치 마다 CS-LBP 특징을 추출한다. 행동 분류 성능을 향상시키기 위해 패치들마다 추출한 특징벡터들에 대해 K-mean 클러스터링을 적용하여 코드 북을 생성한다. 본 논문에서는 영상의 지역적인 특성을 고려하기 위해 공간 피라미드 방법을 적용하고 각 공간 레벨에서 추출된 BoF에 대해 가중치를 적용하여 최종적으로 하나의 특징 벡터로 결합한다. 행동 분류를 위해 결정트리의 앙상블로 이루어진 랜덤 포레스트는 학습 단계에서 각 행동 클래스를 위한 분류 모델을 만든다. 가중 BoF가 적용된 랜덤 포레스트는 다양한 인간 행동 영상을 포함하고 있는 Standford Actions 40 데이터를 성공적으로 분류하였다. 또한 기존 방법에 비해 분류 성능이 유사하거나 우수하며, 한 장의 영상에 대해 빠른 인식속도를 보였다.

Trellis 부호 및 엔트로피 마스킹을 이용한 정보부호화 기반 워터마킹 (A Watermarking Method Based on the Informed Coding and Embedding Using Trellis Code and Entropy Masking)

  • 이정환
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2677-2684
    • /
    • 2009
  • 본 논문에서는 trellis 부호 및 엔트로피 마스킹을 이용한 정보부호화 기반 워터마킹 방법에 대하여 연구하였다. 영상을 $8{\times}8$ 블록으로 중복되지 않게 나누어 DCT 변환을 수행하고 각 블록으로부터 16개의 중간주파수 대역의 계수를 추출한다. 이를 trellis 부호화의 각 단계에서 평균이 0이고 분산이 1인 가우시안 난수와 비교하여 선형상관계수 및 왓슨거리의 선형결합이 최소인 벡터를 Viterbi 알고리즘으로 구하고 이를 원 영상에 삽입하여 워터마킹된 영상을 얻는다. 영상의 특성을 고려하기 위해 삽입벡터를 구할 때 엔트로피 마스킹 함수를 사용하여 선형상관계수와 왓슨거리의 가중치를 다르게 적용한다. 제안방법의 성능을 평가하기 위해 다수의 영상에 대한 평균비트오차율을 계산하여 성능을 비교하였으며, 평균비트오차율 측면에서 성능 개선이 있었다.

실감형 360도 미디어의 RGB 벡터 및 객체 특징정보를 이용한 대표 프레임 선정 방법 (A Reference Frame Selection Method Using RGB Vector and Object Feature Information of Immersive 360° Media)

  • 박병찬;유인재;이재청;장세영;김석윤;김영모
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1050-1057
    • /
    • 2020
  • 실감형 360도 미디어는 기존 영상보다 고품질, 초대용량으로 영상의 크기가 크며, 다양한 렌더링 방식을 사용하여 기존방식으로 이미지 처리할 경우 영상인식 속도가 느려지는 문제가 있다. 또한, 실감형 360도 미디어의 특성상 특정 장소에서 카메라를 고정시켜 한 장면만 촬영하는 경우가 대부분이기 때문에, 모든 영상에서 특징정보를 추출할 필요가 없다. 본 논문에서는 실감형 360 미디어의 프레임 추출과정, 프레임 다운사이징, 구형 형태의 렌더링 과정을 거치고, 렌더링 과정에서 영상을 16개 프레임으로 분할 캡처하여 캡처된 프레임에서 객체 정보가 많은 중앙 부분에서 픽셀당 RGB 벡터와 딥 러닝을 이용하여 객체를 추출한 뒤, 객체 특징정보를 이용하여 대표 프레임을 선정하는 방법을 제안한다.

연기 영상의 정적 및 동적 텍스처를 이용한 강인한 연기 검출 (Reliable Smoke Detection using Static and Dynamic Textures of Smoke Images)

  • 김재민
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.10-18
    • /
    • 2012
  • 감시 카메라를 이용하여 화재 연기를 자동 검출하는 시스템은 신뢰도 높은 연기 영상의 검출 방법을 필요로 한다. 카메라를 이용하여 공기 중에 확산하는 연기의 영상을 연속적으로 획득하였을 때, 연기 영상의 각 장면은 독특한 텍스처(정적 텍스처)를 가지며, 연기의 확산 운동으로 인하여 그 차분 영상 또한 다른 물체와 구별이 되는 독특한 텍스처(동적 텍스처)를 가진다. 특정 객체가 연기와 유사한 정적 텍스처를 가지고 있을 지라도 그 움직임의 특성이 연기 특유의 확산 운동과 다르다면, 그 차분 영상의 텍스처는 연기의 차분 영상 텍스처와 유사할 수 없다. 본 논문에서는 이 두 가지 정적 및 동적 텍스처를 이용하여 신뢰도 높은 연기 영상 검출 방법을 제안한다. 제안하는 방법은 누적된 장면 차분 영상을 이용하여 변화 영역을 일차적으로 검출하고, 검출된 변화 영역의 정적 및 동적 텍스처로부터 추출한 Haralick 특징 벡터 이용하여 최종적으로 연기로 인한 변화 영역을 검출한다.

새로운 계층적 이동 보상 피라미드 부호화 방식 연구 (A Study on New Hierarchical Motion Compensation Pyramid Coding)

  • 전준현
    • 방송공학회논문지
    • /
    • 제8권2호
    • /
    • pp.181-197
    • /
    • 2003
  • 대역 분할 부호화(Sub-Band Coding: SBC)방식은 계층적 피라미드(hierarchical pyramid) 구조를 갖고 있어 움직임 예측 시 상위 계층에서는 전체적인 이동특성을 추정하고 하위 계층에서는 국부적인 세부 이동 특성을 추정할 수가 있어 실제 동영상 움직임 보상 성능이 매우 우수하다. 이와 같은 계층적 이동보상피라미드를 이용한 기존의 저대역(low-band) 이동보상 피라미드 방식에는 다음 두 가지 문제점들로 인해 매우 심각한 화질 저하가 발생한다. 첫째는 저대역 이동보상 피라미드의 각 계층에서 양자화기가 포함된 부호화기를 사용할 경우 하위 계층의 재생 영상일수록 상위 계층에서 누적된 양자화 오차(quantization error)들을 그대로 포함하기 때문에 연속된 영상에서의 정확한 이동 보상이 어렵게 된다. 둘째는 피라미드의 계층적 구조 모순으로 상위 계층예서 잘못된 움직임 추정(motion estimation)은 하위 계층으로 진행될수록 막대한 성능 저하의 원인이 된다. 본 논문에서는 우선 대역분할 부호화 방식을 이용한 대역별 계층적 이동보상에 대한 수학적 분석을 하였으며, 이를 바탕으로 제안되었던 통과 대역(pass-band) 이동보상 피라미드 방식이 누적된 양자화 오차 요인이 제거됨으로서 기존의 저대역 이동보상 피라미드에 비해 성능이 우수하다는 것을 이론적으로 분석하여 이를 증명하였다. 또한 계층적 이동보상 피라미드에서 매우 중요한 최고 계층의 초기 이동벡터 추정을 위하여 에지 패턴 분류를 이용한 이동벡터 추정 방식을 새로이 제안하였으며, 실험 결과 성능의 우수함이 입증되었다.

신경회로망에 의한 의료영상 질환인식 (Disease Recognition on Medical Images Using Neural Network)

  • 이준행;이흥만;김태식;이상복
    • 한국방사선학회논문지
    • /
    • 제3권1호
    • /
    • pp.29-39
    • /
    • 2009
  • 본 논문에서는 신경회로망을 이용한 의료영상의 질환부위 인식방법을 제안하였다. 질환부위 인식을 위한 신경회로망은 입력층, 은닉층, 출력층으로 구성하여 적응 오차 역전파 알고리즘으로 학습하였다. 신경회로망에 입력된 의료영상의 특징 파라미터는 웨이브릿 변환에 의하여 분해된 저주파 영역을 행렬식으로 표현하여 특성 다항식의 계수값(n+1)개로 하였다. 추출된 특징 파라미터는 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용하였다. 제안된 방법의 타당성을 입증하기 위해서 실험에 사용된 입력 의료영상을 가지고 모사실험을 통해 질환부위의 인식률을 평가하였다. 실험 결과 4레벨 DWT로 변환된 저주파영역 행렬의 특성 다항식 계수를 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용했을 때 최적의 학습 횟수를 보였다. 신경회로망의 학습은 적응 오차 역전파 알고리즘을 사용하였고, 학습계수를 0.01, 모우멘텀을 0.95로 하였을 때, 위영상에 대해서는 55회, 가슴영상은 55회, CT영상은 46회, 초음파영상은 55회 그리고 혈관영상에 대해서는 157회 등의 최적의 학습 횟수를 보이며 100%의 인식률을 보였다.

  • PDF

웨이블렛 변환 계수의 비트 플레인을 이용한 영상부호화 (Image Coding Using Bit-Planes of Wavelet Coefficients)

  • 김영로;홍원기;고성제
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.714-725
    • /
    • 1997
  • 본 논문에서는 웨이블렛 변환된 영상을 비트 플레인으로 분해하여 효과적으로 영상을 부호화하는 방법을 제안한다. 제안하는 방법은 원영상을 웨이블렛 변환하여 저대역 부분은 그대로 무손실 전송하고 고대역 부분은 비트 플레인(bit-plane)으로 분해한 다음, 각 비트 플레인에 나타나는 이진 영상들을 각각의 특성에 따라 부호화한다. 부호화 방법은 먼저 원영상을 웨이블렛 변환한 후, 부동소수점 값을 가지는 웨이블렛 변환 계수를 정수화하고 이 값을 N비트 데이터와 부호 비트로나눈다. 이러한 이진값으로 표현된 그레이 원영상을 비트 플레인으로 분할하여 N개의 이진 영상과 부호 비트에 대응하는 1개의 부호 비트 플레인을 생성시킨다. N개의 비트 플레인에 존재하는 이진 영상은 상대적으로 화질에 미치는 중요도가 적은 하위 비트 플레인의 고대역 부분을 제거한 후, 2차원 이진 블록 부호화 방법을 사용하여 부호화한다. 부호 비트 플레인은 N비트로 데이터의 값이 0이 아닐 경우 그에 해당하는 부호값 만을 부호화하여 압축효과를 높일 수 있었다. 본 논문에서 제안한 방법은 웨이블렛 변환 계수로부터 추출된 비트 플레인 중에서 화질에 크게 영향을 주는 중상위 비트 플레인의 이진영상들이 원영상의 에지(edge) 정보와 함께 지역적으로 모여 있는 특성을 보임에 따라 효과적인 부호화가 가능하다. 또한 비트 플레인 부호화 방식은 상대적으로 영상의 화질에 중요도가 적은 하위 비트 플레인을 쉽게 분리하여 제거함으로서 적정한 영상화질을 유지하면서 비트율(bit rate)을 조정할 수 있는 장점이있다. 제안한 방법은 실험을 통하여 기존의 벡터 양자화 기법에 의한 부호화 방법보다 압축율이나 PSNR 측면에서 성능이 좋음을 입증하였다.

  • PDF