• 제목/요약/키워드: Foreground image

검색결과 209건 처리시간 0.021초

Haar-like Feature 및 CLNF 알고리즘을 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Haar-like Feature and CLNF Algorithm)

  • 박승현;조성원
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.15-23
    • /
    • 2016
  • 본 논문은 한국의 차량 번호판 인식에 효과적인 방법을 제안한다. 획득한 자동차 이미지로부터 Haar-Like Feature를 이용해 대략적인 번호판 후보 영역을 찾아낸 후, 랭크 필터를 사용하여 전처리를 하고 캐니 에지 추출 (Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 알고리즘을 사용하여 학습된 신경망을 이용하여 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.

보로노이 다이어그램에 기반한 개선된 유클리디언 거리 변환 방법 (Improved Euclidean transform method using Voronoi diagram)

  • 장석환;박용섭;김회율
    • 한국통신학회논문지
    • /
    • 제29권12C호
    • /
    • pp.1686-1691
    • /
    • 2004
  • 본 논문에서는 기존의 고속 유클리디언 거리 변환법을 개선한 새로운 계산 방법을 제안한다. 기존의 고속 유클리디언 거리 변환법이 가지고 있는 단점인 특징점의 수에 비례하여 계산량이 늘어나는 단점을 극복하기 위해서, 본 논문에서는 특징점들 중에서 비특징점과 4방향으로 연결되어 있는 특징점만을 이용하여 보로노이 다이어그램을 계산함으로써 유클리디언 거리 변화도(Euclidean distance map)의 계산 시간을 기존의 방법보다 평균 40%로 감소시켰다. 본 논문에서 제안한 방법의 효율성을 검증하기 위해서 크기의 바이너리 영상 16장에서 대해서 기존의 방법과 제안한 방법으로 똑같이 유클리디언 거리 변화도를 계산하여 계산 시간을 비교함으로써 그 효능을 입증하였다.

단안 영상의 입체 자유시점 Tour-Into-Picture (Stereoscopic Free-viewpoint Tour-Into-Picture Generation from a Single Image)

  • 김제동;이광훈;김만배
    • 방송공학회논문지
    • /
    • 제15권2호
    • /
    • pp.163-172
    • /
    • 2010
  • 자유시점 비디오는 원하는 시점을 자유로이 선택하여 보는 능동형 비디오이다. 이 기술은 박물관 투어, 엔터테인먼트 등의 다양한 분야에서 활용된다. 본 논문에서는 자유시점 비디오의 새로운 분야로 가상 카메라와 깊이맵을 이용하여 한 장의 영상 내부를 항해하는 입체 자유시점 Tour-Into-Picture (TIP)을 제안한다. 오래전부터 TIP가 연구되어 왔는데, 이 분야는 한 장의 단안 사진 내부를 항해하면서 애니메이션으로 볼 수 있게 하는 기술이다. 제안 방법은 전경 마스크, 배경영상, 및 깊이맵을 반자동 방법으로 구한다. 다음에는 영상 내부를 항해하면서 입체 원근투영 영상들을 획득한다. 배경영상과 전경객체의 3D 데이터를 기반으로 가상 카메라의 3차원 공간이동, 요/피치/롤링 등의 회전, 룩어라운드, 줌 등의 다양한 카메라 기능을 활용하여 입체 자유시점 비디오를 구현한다. 원근투영은 직교투형보다 우수한 입체감을 전달하며, 기존 방법과 비교하여 텍스쳐의 3D 데이터를 직접 원근투영하여 처리속도를 향상시켰다. 소프트웨어는 MFC Visual C++ 및 OpenGL 기반으로 구축되었으며, 실험영상으로 신윤복의 단오풍정을 사용하여 고전화의 입체 자유시점 비디오를 시청이 가능하다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.

증강가소성: 물리적 오브젝트에 형태적 편집가능성 부여하기 (Augmented Plasticity: Giving Morphological Editability to Physical Objects)

  • 이우훈;강혜경
    • 디자인학연구
    • /
    • 제19권1호
    • /
    • pp.225-234
    • /
    • 2006
  • 디자인과정 후반에서 제품 디자이너는 전경 형태(디테일 디자인)에 대한 다양한 아이디어를 스케치하고 배경형태(기본 조형)와의 수많은 조합을 테스트하게 된다. 이 때 디자이너들은 실제 제품과 거의 동일한 하이피델리티(high fidelity)의 디자인 모형을 제작해 세밀한 부분까지 점검하게 된다. 하지만 디자인 모형 제작에는 적지 않은 시간과 경비가 소요되기 때문에 배경형태와 전경 형태에 대한 다양한 조합을 모두 평가해 보는 것은 사실상 불가능하다고 할 수 있다. 또한 물리적으로 구현된 아이디어는 화면 속의 디지털 모형과는 달리 편집가능성이 부족하기 때문에 '디자인과 평가'라는 순환적 작업과정이 제한적으로 이루어질 수밖에 없다. 이런 문제를 해결하기 위해 본 연구는 증강현실기술을 응용하여 물리적 오브젝트에 디지털적으로 조형적 편집가능성을 증강시킬 수 있는 증가가소성의 개념을 제안하고 이를 디지털스킨으로 구체화하였다. 디지털스킨은 ARToolKit의 비주얼 마커를 이용해 오브젝트 표면의 위치와 방향을 트래 킹하고 차분렌더링기법을 활용하여 변형된 표면을 이음매 없이 덧붙일 수 있다. 본 연구는 구현된 디지털스킨을 제품 디테일과 부분수정 디자인 그리고 디자인 소재탐색 작업에 대한 적용해 보았다. 그 결과 디자인과정 후반에서 효과적으로 디자인 아이디어를 구현하고 테스트하는데 상당한 도움을 줄 수 있을 것으로 평가되었다.

  • PDF

계위 공간을 이용한 고품질 3차원 비디오 생성 방법 -다단계 계위공간 개념을 이용해 깊이맵의 경계영역을 정제하는 고화질 복합형 카메라 시스템과 고품질 3차원 스캐너를 결합하여 고품질 깊이맵을 생성하는 방법- (High-qualtiy 3-D Video Generation using Scale Space)

  • 이은경;정영기;호요성
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.620-624
    • /
    • 2009
  • 본 논문은 고화질(high definition, HD) 복합형 카메라 시스템과 고품질(high-quality) 3차원 스캐너를 결합하여 다시점 비디오와 그에 상응하는 다시점 깊이맵을 생성하는 시스템을 제안한다. 복합형 카메라 시스템과 3차원 스캐너를 이용해 3차원 비디오를 생성하기 위해서는, 우선 움직임이 없는 배경영역에 대한 깊이정보를 고품질 3차원 스캐너를 이용해 미리 획득하고, 동적으로 움직이는 전경영역에 대해서는 다시점 카메라와 깊이 카메라를 결합한 복합형 카메라 시스템을 이용해 다시점 비디오와 깊이맵을 획득한다. 그리고 3차원 스캐너와 깊이카메라를 통해 획득한 깊이정보를 이용해 3차원 워핑(warping)을 적용하여 각 다시점 카메라를 위한 초기 깊이정보를 예측한다. 초기 깊이정보를 이용해 다시점 깊이를 예측하는 것은 다시점 카메라의 각 시점에서의 초기 깊이맵을 계산하기 위한 것이다. 고화질의 다시점 깊이맵을 생성하기 위해서 belief propagation 방법을 이용하여 초기 깊이맵을 정제한다. 마지막으로, 전경영역의 경계선 영역의 불규칙적인 깊이맵을 정제하기 위해 전경영역의 외곽선 정보를 추출하여 생성된 깊이맵의 경계선 영역을 다시한번 정제한다. 제안한 3차원 스캐너와 복합형 카메라를 결합한 시스템은 기존의 깊이맵 예측 방법보다 정확한 다시점 깊이맵을 포함하는 3차원 비디오를 생성할 수 있었으며, 보다 자연스러운 3차원 영상을 생성할 수 있었다.

  • PDF

다중연산구조기반의 고밀도 성능향상을 위한 움직임추정의 디인터레이싱 방법 (Deinterlacing Method for improving Motion Estimator based on multi arithmetic Architecture)

  • 이강환
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.49-55
    • /
    • 2007
  • 본 논문에서는 필드/프레임의 공간적, 시간적 움직임 특성을 활용한 디인터레이스드 기법을 이용해 재구성된 영상프레임으로부터 넓은 탐색영역에서의 움직임추정이 가능한 이중연산구조 기반의 다해상도 계층적 움직임 추정 방식(multi- resolution hierarchical motion estimation, MHME)의 효율적인 다중연산구조 기반의 움직임 추정을 제안한다. 공간적, 시간적 움직임 특성으로부터 디인터레이스드 기법을 적용하여 재구성된 영상프레임으로부터는 계층적 움직임 추정방식을 적용하여 빠른 움직임 영역에서도 화질의 열화가 거의 없는 다해상도 계층적 움직임 추정(MHME) 영상처리를 구현하였고, 비교적 높은 PSNR을 얻을 수 있었다. 다양한 모드 M=2 또는 M=3의 여러 가지 모의실험을 통해 제안된 구조가 전역탐색 블록정합 알고리듬(Full-search Block Matching Algorithm, FBMA)에 대하여 예측성능에 있어 최고 1.49dB(CAR), 최저0.421dB(Mobile & Calendar)의 모의실험결과 평균 -0.7dB 정도의 미소한 평균 PSNR 저하를 나타내었다. 이의 구현을 위해 제안된 전역/후역 탐색방식의 연산처리방식은 하나의 처리기소자(Processor Element, PE)에 이중연산처리기(DAPE) 구조를 채택하여 제한된 PE로부터 넓은 탐색영역에서의 움직임 추정이 가능한 전역/후역 탐색방식(Foreground & Background Search Algorithm, FBSA)의 비트 처리열 탐색 알고리듬을 제안 적용하여 움직임추정 연산의 성능을 구조적으로 향상시키는 다중프로세서 어레이 구조(Multiple Processor Array Unit, MPAU)를 개발 제안하였다.

2단계 하이브리드 방법을 이용한 2D 스테레오 영상의 3D 모델링 (3D Modeling from 2D Stereo Image using 2-Step Hybrid Method)

  • 노윤향;고병철;변혜란;유지상
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권7호
    • /
    • pp.501-510
    • /
    • 2001
  • 일반적으로 2D 스테레오 영상으로부터 3차원 모델링을 위해서는 정확한 변위 측정이 필수이다. 기존의 스테레오 영상에서 변위 측정 방식은 전체 영상에 대하여 정합 연산을 수행함으로써 많은 연산 시간과 함께 높은 오 정합 확률의 문제가 있다. 본 논문에서는 스테레오 영상에서의 변위 벡터가 전체 탐색 범위 안에 골고루 분포되어 있지 않고 배경과 물체의 변위에 해당하는 값만을 갖는다는 특성을 이용하여 스테레오 영상을 웨이블릿 변환을 하고 1/4 크기로 줄어든 저주파 영역으로부터 영역 기반 방법을 이용하여 대략적인 변위 영역을 구한다. 대략적인 변위 백터로부터 변위 히스토그램을 생성하고, 이를 이용하여 전경과 배경을 분할 한 뒤, 다시 전경 영상만을 원 영상으로 복원하여 화소의 밝기값이 아닌 2차 미분값을 이용한 화소기반 방법을 통해 조밀한 변위를 구하는 2단계 하이브리드 방법을 제안한다. 또한, 분할된 전경 영역으로부터, 특징점들을 뽑아내고 변위 벡터와 카메라 파라미터를 이용하여 특징점들의 깊이 정보를 추정해 내는 3차원 모델링 과정을 제시한다. 본 논문에서 제안한 방법을 적용할 경우, 기존의 영역 기반 방법의 문제점인 계산 시간 문제를 상당 부분 단축시킬 수 있고, LOG 필터를 통한 2차 미분값을 이용한 화소기반 방법을 추가함으로써, 정밀한 변위를 구할 수 있다. 또한 교차 일치성 검사를 통해 잘못된 변위를 제거하고, 폐색 영역들을 검사할 수 있다. 아울러 3차원 모델링 과정에서, 기존의 Delaunay 삼각측량법의 문제점인 오정합 문제를 전경/배경 분할 알고리즘을 제안함으로써 효과적으로 해결 할 수 있다.

  • PDF

RGB-D 모델을 이용한 강건한 객체 탐지 및 추적 방법 (A Robust Object Detection and Tracking Method using RGB-D Model)

  • 박서희;전준철
    • 인터넷정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.61-67
    • /
    • 2017
  • 최근 지능형 CCTV는 빅 데이터, 인공지능 및 영상 분석과 같은 분야와 결합하여 다양한 이상 행위들을 탐지하고 보행자와 같은 객체의 전반적인 상황을 분석할 수 있으며, 이러한 지능형 영상 감시 기능에 대한 영상 분석 연구가 활발히 진행되고 있는 추세이다. 그러나 일반적으로 2차원 정보를 이용하는 CCTV 영상은 위상학적 정보 부족으로 인해 객체 오 인식과 같은 한계가 존재한다. 이러한 문제는 두 대의 카메라를 사용하여 생성된 객체의 깊이 정보를 영상에 추가함으로써 해결 할 수 있다. 본 논문에서는 가우시안 혼합기법을 사용하여 배경 모델링을 수행하고, 모델링 된 배경에서 전경을 분할하여 움직이는 객체의 존재 여부를 탐지한다. RGB 정보 기반 분할 결과를 이용하여 깊이 정보 기반 분할을 수행하기 위해 두 대의 카메라를 사용하여 스테레오 기반 깊이 지도를 생성한다. RGB 기반으로 분할된 영역을 깊이 정보를 추출하기 위한 도메인으로 설정하고, 도메인 내부에서 깊이 기반 분할을 수행한다. 강건하게 분할된 객체의 중심점을 탐지하고 방향을 추적하기 위해 가장 기본적인 객체 추적 방법인 CAMShift 기법을 적용하여 객체의 움직임을 추적한다. 실험을 통하여 제안된 RGB-D 모델을 이용한 객체 탐지 및 추적 방법의 우수성을 입증하였다.

혼합분류기 기반 영상내 움직이는 객체의 혼잡도 인식에 관한 연구 (A Study on Recognition of Moving Object Crowdedness Based on Ensemble Classifiers in a Sequence)

  • 안태기;안성제;박광영;박구만
    • 한국통신학회논문지
    • /
    • 제37권2A호
    • /
    • pp.95-104
    • /
    • 2012
  • 혼합분류기를 이용한 패턴인식은 약한 분류기를 결합하여 강한 분류기를 구성하는 형태이다. 본 논문에서는 고정된 카메라를 통해 입력된 영상을 이용하여 특징을 추출하고 이것들을 이용한 약한 분류기의 결합으로 강한 분류기를 만들어 낸다. 제안하는 시스템 구성은 차영상 기법을 이용해서 이진화된 전경 영상을 얻고 모폴로지 침식연산 수행으로 얻어진 혼잡도 가중치 영상을 이용해 특징을 추출하게 된다. 추출된 특징을 조합하고 혼잡도를 판단하기 위한 모델의 훈련 및 인식을 위한 혼합분류기 알고리즘으로 부스팅 방법을 사용하였다. 혼합 분류기는 약한 분류기의 조합으로 하나의 강한 분류기를 만들어 내는 분류기로서 그림자나 반사 등이 일어나는 환경에서도 잠재적인 특징들을 잘 활용할 수 있다. 제안하는 시스템의 성능실험은 "AVSS 2007"의 도로환경의 차량 영상과 철도환경내의 승강장 영상을 사용하였다. 조명변화가 심한 야외환경과 승강장과 같은 복잡한 환경에서도 시스템의 우수한 성능을 보여주었다.