• 제목/요약/키워드: 블록 기반 추출

검색결과 261건 처리시간 0.027초

축사에서 비젼 기반의 이동 객체 분류 방법 (Vision-based classification of moving objects in the cattle shed)

  • 김성관;이정식;주영훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1357-1358
    • /
    • 2015
  • 본 논문에서는 축사에서 비젼 기반으로 이동 객체를 분류하는 방법을 제안한다. 제안하는 방법은 축사 내 설치된 CCTV로부터 영상을 입력받아 Adaptive GMM알고리즘을 이용하여 이동 객체를 추출한다. 다음, 이동 객체 가 사람인지 소인지 또는 차량인지 분류하기 위해 이동 객체의 특징을 추출한다. 이동 객체 특징 추출 방법으로는 기존의 Monolithic-based방법인 HoG알고리즘을 개선하여 축사의 복잡한 환경에서 다양한 자세를 가지는 사람과 소 그리고 차량의 구조적 특징을 추출한다. 추출한 특징은 벡터화 하여 SVM분류기 입력값에 적합하도록 한다. SVM 분류를 통해 이동 객체의 구조적 특징을 블록화 하여 이동 객체의 신체 모델을 생성한다. 마지막으로 생성된 신체 모델을 이용하여 이동 객체가 사람인지 소인지 또는 차량인지 분류한다.

  • PDF

견고한 입술 영역 추출을 이용한 립리딩 시스템 설계 및 구현 (Design & Implementation of Lipreading System using Robust Lip Area Extraction)

  • 이은숙;이호근;이지근;김봉완;이상설;이용주;정성태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.524-527
    • /
    • 2003
  • 최근 들어 립리딩은 멀티모달 인터페이스 기술의 응용분야에서 많은 관심을 모으고 있다. 동적 영상을 이용한 립리딩 시스템에서 해결해야 할 주된 문제점은 상황 변화에 독립적인 얼굴 영역과 입술 영역을 추출하는 것이다. 본 논문에서는 움직임이 있는 영상에서 화자의 얼굴영역과 입술영역을 컬러, 조명등의 변화에 독립적으로 추출하기 위해 HSI 모델과 블록 매칭을 이용하였고 특징 점 추출에는 이미지 기반 방법인 PCA 기법을 이용하였다. 추출된 입술 파라미터와 음성 데이터에 각각 HMM 기반 패턴 인식 방법을 개별적으로 적용하여 단어를 인식하였고 각각의 인식 결과를 가중치를 주어 합병하였다. 실험 결과에 의하면 잡음으로 음성 인식률이 낮아지는 경우에 음성인식과 립리딩을 함께 사용함으로써 전체적인 인식 결과를 향상시킬 수 있었다.

  • PDF

교육용 도서 영상을 위한 효과적인 객체 자동 분류 기술 (Efficient Object Classification Scheme for Scanned Educational Book Image)

  • 최영주;김지해;이영운;이종혁;홍광수;김병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권7호
    • /
    • pp.1323-1331
    • /
    • 2017
  • 오늘날 저작권 관련 산업이 사회, 경제적으로 큰 영향을 미치는 대규모 산업으로 성장하였음에도 불구하고 저작물에 대한 소유권 및 저작권에 대한 문제가 끊임없이 발생하고 있으며 특히 이미지 저작권과 관련된 연구는 거의 진행되지 않는 상태이다. 본 연구에서는 기존의 문서 영상처리 기술과 딥 러닝 기술을 융합하여 교육용 도서 영상에서의 객체 자동 추출 및 분류 기술 시스템을 제안한다. 제안된 기술은 먼저 잡음을 제거한 후, 시각적 주의(visual attention) 기반 영역 추출 과정을 수행한다. 추출된 영역을 기반으로 블록화 작업을 수행하고, 각 블록을 그림인지 아니면 문자 영역인지를 분류한다. 마지막으로 추출된 그림 영역 주위를 검색하여 캡션 영역을 추출한다. 본 연구에서 진행한 성능 평가 결과, 그림 영역은 최대 97% 정확도를 보이며, 그림 및 캡션 영역 추출에 있어서는 평균 83%의 정확도를 보여 준다.

자막방송을 위한 잔차 합성곱 순환 신경망 기반 음향 사건 분류 (Residual Convolutional Recurrent Neural Network-Based Sound Event Classification Applicable to Broadcast Captioning Services)

  • 김남균;김홍국;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.26-27
    • /
    • 2021
  • 본 논문에서는 자막방송 제공을 위해 방송콘텐츠를 이해하는 방법으로 잔차 합성곱 순환신경망 기반 음향 사건 분류 기법을 제안한다. 제안된 기법은 잔차 합성곱 신경망과 순환 신경망을 연결한 구조를 갖는다. 신경망의 입력 특징으로는 멜-필터벵크 특징을 활용하고, 잔차 합성곱 신경망은 하나의 스템 블록과 5개의 잔차 합성곱 신경망으로 구성된다. 잔차 합성곱 신경망은 잔차 학습으로 구성된 합성곱 신경망과 기존의 합성곱 신경망 대비 특징맵의 표현 능력 향상을 위해 합성곱 블록 주의 모듈로 구성한다. 추출된 특징맵은 순환 신경망에 연결되고, 최종적으로 음향 사건 종류와 시간정보를 추출하는 완전연결층으로 연결되는 구조를 활용한다. 제안된 모델 훈련을 위해 라벨링되지 않는 데이터 활용이 가능한 평균 교사 모델을 기반으로 훈련하였다. 제안된 모델의 성능평가를 위해 DCASE 2020 챌린지 Task 4 데이터 셋을 활용하였으며, 성능 평가 결과 46.8%의 이벤트 단위의 F1-score를 얻을 수 있었다.

  • PDF

이종의 도로망 데이터 셋에서 면 객체 매칭 기반 변화탐지 (Automatic Change Detection Based on Areal Feature Matching in Different Network Data-sets)

  • 김지영;허용;유기윤;김정옥
    • 한국측량학회지
    • /
    • 제31권6_1호
    • /
    • pp.483-491
    • /
    • 2013
  • 차량용 내비게이션의 빠른 확산과 스마트폰 등 개인 단말기의 측위 기술 발달로 사용자 중심위치기반서비스, 특히 보행자 내비게이션 서비스에 대한 관심이 증대되고 있다. 보행자 내비게이션 서비스를 위한 핵심정보인 수치지도는 대용량이고 짧은 갱신주기를 요구하는 경우가 많아 수치지도의 효율적인 갱신이 중요한 이슈가 된다. 본 연구에서는 구축시기가 상이한 이종의 도로망 데이터 셋에 형상유사도 기반 면 객체 매칭을 적용하여 변화 탐지하는 기법을 제안하였다. 변화탐지에 앞서 이종의 도로망 데이터 셋의 면 객체 매칭에서 탐지될 수 있는 갱신 유형을 정의하였다. 면 객체 매칭 기반 변화 탐지를 위하여 이종의 두 도로망 데이터 셋의 선형인 도로객체를 이들로 둘러싸인 면인 블록으로 변환하였다. 변환된 블록을 중첩하여 중첩된 블록 간의 형상유사도를 계산하고, 이 값이 0.6 이상인 것을 후보 블록 쌍으로 추출하였다. 객체 유형별로 이분 그래프 군집화와 오목다각형 특성을 적용하여 정의된 갱신유형별 블록 쌍을 탐지하고, 해당 블록 쌍을 구성하거나 내부에 있는 도로 세그먼트 간의 프레셰 거리를 계산하였다. 이때, 프레셰 거리가 50 이상인 도로명주소기본도 도로구간의 도로객체가 갱신 도로객체로 추출된다. 그 결과 0.965의 높은 탐색율을 보여 제안된 기법이 이종의 도로망 데이터 셋의 선형 객체의 변화탐지에 적용될 수 있음을 확인할 수 있었다.

블록기반 세그멘테이션을 이용한 실외환경에서의 보행영역 및 장애물 검출 (Walking Area and Obstacle Detection System Using Block Segmentation in the Outdoor Environment)

  • 유재형;한영준;한헌수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.185-188
    • /
    • 2009
  • 단일 카메라 영상으로 입력되는 환경 정보에 대해서 보도에 대한 길의 소실점과 보도 영역에 대한 정보를 획득하는 방법과 보도 영역에 대해 블록 세그멘테이션을 통하여 장애물과 같은 물체 영역을 구분한다. 소실정과 보도 영역을 획득하기 위한 방법으로 에지영상에서 보도의 외곽선 정보를 추출하도록 한다. 이를 위해 체인코드를 이용하여 특정한 방향으로 향하는 직선 성분을 검출하도록 한다 보도 영역 내에 존재하는 물체의 영역을 구분하기 위해서 영역을 특정 크기를 가지는 블록으로 구분하고 각 블록이 가지는 평균 컬러 정보를 이용하여 영역을 세그멘테이션 한다. 세그멘테이션을 통해 얻은 영역을 통해 보도의 영역과 장애물의 영역을 구분하고 각 장애물의 위치를 계산하다. 알고리즘의 평가를 위해 실내의 복도 환경과 단순한 형태를 가지는 실외 환경에서 획득한 영상을 이용하여 실험하였다.

  • PDF

비디오 부호화 루프 내에서 의사 윤곽 오차의 선택적 제거 알고리즘 (In-Loop Selective Decontouring Algorithm in Video Coding)

  • 유기원;손광훈
    • 방송공학회논문지
    • /
    • 제15권5호
    • /
    • pp.697-702
    • /
    • 2010
  • 디지털 영상 내의 평탄한 영역에 대한 양자화 과정은 종종 의도하지 않은 의사 윤곽 오차 (false contour artifact)를 발생한다. 본 레터논문에서는 통상적인 블록 기반 비디오 부호화 방식의 양자화 과정에서 발생되는 이러한 오차의 효율적 제거 알고리즘을 보인다. 먼저, 입력 블록에 대해 의사 윤곽의 발생 특성에 기반하여 추출된 특징값들을 이용하여 후보 블록을 선정 한다. 그리고, 해당 블록에 대해 미리 준비된 pseudo-random noise mask를 적용함으로써 의사 윤곽을 제거한다. 이러한 후보 블록 선정을 통한 선택적인 필터링 과정은 불필요한 처리를 최소화함으로써, 화질 열화 억제와 연산 복잡도 감소를 동시에 달성한다. 또한 블록 기반의 처리는 비디오 부호화 루프와의 통합을 용이하게 함으로써, 종래의 코덱 루프 밖에서의 후처리 필터링 방식과 비교하여 구현에 필요한 자원 절감과 프레임 지연 방지라는 측면에서 큰 이점을 갖는다. 제안 알고리즘은 H.264/AVC표준 소프트웨어에 구현되어 율-왜곡 최적화(rate-distortion optimization) 관점에서 압축 성능의 저하없이 낮은 복잡도에서 의사 윤곽을 효율적으로 제거함을 확인하였다.

블록 기반 실시간 계수 시스템 (A block-based real-time people counting system)

  • 박현희;이형구;김재희
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.22-29
    • /
    • 2006
  • 본 논문에서는 블록 기반 실시간 계수 시스템을 제안한다. 계수 시스템은 쇼핑몰이나 대형건물의 출입구, 엘리베이터, 에스컬레이터 등과 같은 다양한 환경에 적용될 수 있다. 본 논문의 핵심은 세 부분으로 구분 할 수 있다. 첫째, 환경 변화에 강인한 배경 제거 기법, 둘째, 학습을 이용한 블록 기반 계수 결정 방법, 마지막으로 4 채널에서 실시간으로 처리가 가능한 시스템 구현이다. 환경 변화에 강인한 배경 제거 기법으로 MOG(mixture of gaussian) 방법을 적용하였으며, 블록 기반 계수 결정 방법은 영상을 $6{\times}12$개의 영역으로 구분하고, 학습 영상을 이용하여 각각의 블록에서 물체의 크기에 대한 평균과 분산을 계산하고 이를 저장하여 계수에 적용하는 방법을 제안하였으며, 마지막으로 4 채널에서 실시간으로 처리 하기 위하여 추출된 물체 각각을 구분하여 추적하는 것이 아니라 물체가 이동 중에 발생할 수 있는 여러 상황 즉 결합이나 분리되는 현상을 분석하여 계수 판단에 적용하였다. 제안된 방법을 이용하여 에스컬레이터, 복도 그리고 출입문등과 같이 조명환경과 그림자 상황 등이 변하는 환경에서 의 계수 정확도는 $90{\sim}94%$, 채널 당 처리 속도는 15 frames/sec 이상의 성능을 보였다.

블록 인덱싱을 이용한 블라인드 워터마킹 기법 (A Novel Blind Watermarking Scheme Using Block Indexing)

  • 강현호;신상욱;한승우
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.331-342
    • /
    • 2005
  • 본 논문에서는 멀티미디어 콘텐츠에 정보를 은닉시키기 위해 블록의 인덱스 값을 이용한 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 대역확산통신 기반에서 인덱스화된 워터마크를 이용하는 새로운 블라인드 워터마킹 기법이다. 워터마크 삽입은 원 영상을 서브블록으로 분할한 후 각 블록에 인덱스 값을 할당한 후, 삽입하고자하는 워터마크를 블록의 인덱스 값과 매핑시키고, 매핑 된 블록을 DCT로 변환시킨 다음 DCT 공간의 중간 주파 주파수 영역에 PN시퀀스를 삽입한다. 결과적으로 워터마크를 인덱스 값으로 표현하는 기법이다. 워터마크의 추출은 원 영상 없이 PN시퀀스와 워터마크가 삽입된 영상의 상관관계에 의해서 가능하다. 실험결과 워터마크가 삽입된 영상은 시각적으로 손상을 감지하기 어려울 정도로 화질열화는 적었으며, 다양한 신호처리 적인 공격에도 강인성을 보였다.

  • PDF

블록 매칭 기반 영상 스테가노그래피의 삽입 용량 개선을 위한 통계적 접근 방법 (A Statistical Approach for Improving the Embedding Capacity of Block Matching based Image Steganography)

  • 김재영;박한훈;박종일
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.643-651
    • /
    • 2017
  • 스테가노그래피는 정보 은닉 기법중의 하나로, 제 3자에 의해 은닉 정보의 존재를 알지 못하게 방지한다는 점에서 정보의 해독을 막기 위한 암호 기법과는 구별된다. 본 논문에서는 영상을 미디어로 사용하는 영상 스테가노그래피 방법으로, 블록 매칭을 이용하여 이산웨이블릿 변환 영역에 정보를 삽입하는 새로운 스테가노그래피 방법을 제안한다. 제안 방법은 블록 매칭 후보군 블록의 불균등한 사용으로 인해서 발생하는 삽입 용량의 손실을 개선하여 고용량의 영상 정보를 삽입할 수 있다. 이를 위해, 블록 내부의 분산값을 고려하여 고주파수 성분을 갖는 후보군 블록은 최대한 보존하고, 저주파수 성분의 후보군 블록의 수는 k-평균 군집화 알고리즘을 이용한 압축을 통해 줄인다. 제안된 방법을 통해 기존 블록 매칭 기반 스테가노그래피 방법과 유사한 PSNR을 갖는 비밀 영상의 추출이 가능하면서 동시에 고용량의 영상 정보 삽입이 가능한 것을 확인할 수 있었다.