• 제목/요약/키워드: video filtering

검색결과 254건 처리시간 0.026초

A CPU-GPU Hybrid System of Environment Perception and 3D Terrain Reconstruction for Unmanned Ground Vehicle

  • Song, Wei;Zou, Shuanghui;Tian, Yifei;Sun, Su;Fong, Simon;Cho, Kyungeun;Qiu, Lvyang
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1445-1456
    • /
    • 2018
  • Environment perception and three-dimensional (3D) reconstruction tasks are used to provide unmanned ground vehicle (UGV) with driving awareness interfaces. The speed of obstacle segmentation and surrounding terrain reconstruction crucially influences decision making in UGVs. To increase the processing speed of environment information analysis, we develop a CPU-GPU hybrid system of automatic environment perception and 3D terrain reconstruction based on the integration of multiple sensors. The system consists of three functional modules, namely, multi-sensor data collection and pre-processing, environment perception, and 3D reconstruction. To integrate individual datasets collected from different sensors, the pre-processing function registers the sensed LiDAR (light detection and ranging) point clouds, video sequences, and motion information into a global terrain model after filtering redundant and noise data according to the redundancy removal principle. In the environment perception module, the registered discrete points are clustered into ground surface and individual objects by using a ground segmentation method and a connected component labeling algorithm. The estimated ground surface and non-ground objects indicate the terrain to be traversed and obstacles in the environment, thus creating driving awareness. The 3D reconstruction module calibrates the projection matrix between the mounted LiDAR and cameras to map the local point clouds onto the captured video images. Texture meshes and color particle models are used to reconstruct the ground surface and objects of the 3D terrain model, respectively. To accelerate the proposed system, we apply the GPU parallel computation method to implement the applied computer graphics and image processing algorithms in parallel.

최근접 유효 화소의 탐색을 사용한 임펄스 잡음 제거 필터 (Impulse Noise Removal Filter using Nearest Effective Pixel Search)

  • 정영수;정회성;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.139-141
    • /
    • 2022
  • 디지털 영상 매체 및 지능형 시스템에 대한 관심이 급격히 증가함에 따라 보안, 인공지능 등 다양한 분야에서 영상 정보를 이용한 기술들을 접목해 사용하고 있다. 디지털 영상 처리 중 발생하는 임펄스 잡음은 영상의 화질을 저하시켜 정보의 신뢰성을 떨어뜨리기 때문에 필터를 통한 제거가 필요하다. 이미 잘 알려진 선행된 방식으로 SMF, AWMF, MDBUTMF가 있지만 이들 모두 알고리즘 자체의 문제로 유효한 화소의 정보의 손실이 크고 오염도가 큰 환경에서 원활하지 못한 필터링을 이루는 한계를 가진다. 따라서 본 논문은 마스크 내에 존재하는 가장 근접한 유효 화소를 탐색함으로써 정보의 신뢰도를 반영한 가중치를 적용하는 메디안 필터 알고리즘을 설계한다. 성능 평가를 위해 PSNR과 확대영상을 사용하여 본 알고리즘과 선행된 알고리즘을 비교, 분석하였다.

  • PDF

깊이맵의 정보 분해와 경계 평탄 필터링을 이용한 다시점 영상 생성 방법 (Generation of Multi-view Images Using Depth Map Decomposition and Edge Smoothing)

  • 김성열;이상범;김유경;호요성
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.471-482
    • /
    • 2006
  • 본 논문은 깊이맵의 정보 분해(information decomposition)와 적응적 경계 평탄 필터링(adaptive edge smooth filtering)을 이용하여 다시점 영상을 생성하는 방법을 제안한다. 제안한 방법은 깊이맵의 경계 영역에 평탄 필터링을 수행한 후, 깊이맵을 네 가지 종류의 분해 영상, 즉, 규칙 메쉬 영상, 경계 영상, 특징점 영상, 계층의 수 영상으로 변환한다. 그런 다음, 네 가지의 분해 영상에 3차원 메쉬 표현법을 적용하여 3차원 장면을 생성하고, 3차원 공간에서 가상 카메라의 위치를 변경하여 생성한 3차원 장면으로부터 다시점 영상을 추출한다. 실험 결과는 제안한 방법이 rubber-sheet 문제를 최소화하여 다시점 영상을 성공적으로 생성할 수 있었고, 깊이맵의 정보 분해를 통해 실시간으로 3차원 장면을 렌더링할 수 있었음을 보여준다. 또한, 제안한 방법은 기존의 방법과 달리 깊이맵 정보를 보존하기 때문에, 깊이 키잉(depth keying)과 같이 깊이 정보를 이용하는 3차원 응용에 활용할 수 있다.

적응 대역필터를 이용한 의료 초음파 감쇠 예측 (Estimation of Medical Ultrasound Attenuation using Adaptive Bandpass Filters)

  • 허서원;이준환;김형석
    • 전자공학회논문지SC
    • /
    • 제47권5호
    • /
    • pp.43-51
    • /
    • 2010
  • 의료 초음파 신호의 인체내 감쇠지수는 검사대상 조직의 병리학적 특성을 반영할 뿐 아니라 다른 여러 의료 초음파 지수들의 정확한 예측을 위해 선행하여 측정해야 하는 중요한 정량적 정보 중 하나이다. 그러나 초음파 감쇠지수의 주파수 선택적 감쇠특성을 이용한 주파수 영역에서의 정량적 감쇠지수 예측 방법은 계산량이 많아 실시간 적용에 많은 어려움이 있고, 상대적으로 계산량이 적은 시간 영역의 감쇠지수 예측 방법은 전송 펄스의 회절효과를 잘 보상하지 못하는 단점이 있다. 표준 반향신호를 이용하여 전송 펄스의 회절효과를 보상하는 시간 영역의 예측 알고리듬인 VSA(Video Signal Analysis) 방법은 광대역 펄스를 이용하는 경우, 원거리에서 반향된 신호의 왜곡이 발생하여 예측 정확도가 저하되는 단점이 있다. 본 논문에서는 그 단점을 해결하기 위해 적응 대역필터를 이용한 초음파 감쇠지수 예측 알고리듬을 제안한다. 제안된 방식은 반향 경로를 따라 누적된 신호 감쇠를 고려하여 적응 대역필터의 중심 주파수를 이동시킴으로써, 기존의 고정 대역필터를 사용하는 방법보다 예측 정확도와 정밀도를 높인다. 인체 조직의 초음파 반향특성을 모방한 컴퓨터 모의실험과 실제 TM(tissue-mimicking) phantom을 이용한 실험에서, 광대역 전송 펄스를 사용하는 경우보다 반향 깊이에 따른 상대적 echogenicity의 왜곡이 크게 감소하여 평균적으로 예측 감쇠지수의 정확도가 5.1% 향상되었고, 예측 편차도 기존의 방법에 비해 46.9% 감소되었다.

형태학과 문자의 모양을 이용한 뉴스 비디오에서의 자동 문자 추출 (Automatic Text Extraction from News Video using Morphology and Text Shape)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.479-488
    • /
    • 2002
  • 최근 들어 인터넷 사용의 증가와 더불어 디지털 비디오의 수요 또한 급격히 증가하고 있는 추세이다. 따라서 디지털 비디오 데이타베이스의 인덱싱을 위한 자동화된 도구가 필요하게 되었다. 디지털비디오 영상에 인위적으로 삽입되어진 문자와 배경에 자연적으로 포함되어진 배경문자 등의 문자 정보는 이러한 비디오 인덱싱을 위한 중요한 단서가 되어질 수 있다. 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 제안된 알고리즘은 다음과 같이 세 단계로 구성된다. 첫 번째 전처리 단계에서는 입력된 컬러 영상을 명도 영상으로 변환하고, 히스토그램 스트레칭을 적용하여 영상의 수준을 향상시킨다. 이 영상에 적응적 임계값 추출에 의한 분할 방법을 수정 적용하여 영상을 분할한다. 두 번째 단계에서는 적응적 이진화가 적용된 결과 영상에 모폴로지 연산을 적절하게 사용하여, 우선 문자 영역은 아니면서 문자로 판단되기 쉬운 양의 오류(false-positive) 요소들이 강조되어 남아있는 영상을 만든다. 또한, 변형된 이진화 결과 영상에 모폴로지 연산과 본 논문에서 제안한 기하학적 보정(Geo-corrertion) 필터링 방법을 적용하여 문자와 문자로 판단되기 쉬운 요소들이 모두 강조되어 남아있는 영상을 만든다. 이 두 영상의 차를 구함으로서 찾고자 하는 문자 요소들이 주로 남고, 문자가 아닌 문자처럼 보이는 오류 요소들은 대부분 제거된 결과 영상을 만든다. 문자로 판단되는 양의 오류 영역들을 남기는데 사용된 모폴로지 연산은 3$\times$3 크기의 구조 요소를 갖는 열림과 (열림닫힘+닫힘열림)/2 이며, 문자 및 문자와 유사한 요소들을 남기는데 사용된 연산은 (열림닫힘+닫힘열림)/2와 기하학적 보정이다. 세 번째 검증 단계에서는 전체 영상 화소수 대비 각 후보 문자 영역의 화소수 비율, 각 후보 문자 영역의 전체 화소수 대비 외곽선의 화소수 비율, 각 외곽 사각형의 폭 대 높이간의 비율 등을 고려하여 비문자로 판단되는 요소들을 제거한다. 임의의 300개의 국내 뉴스 영상을 대상으로 실험한 결과 93.6%의 문자 추출률을 얻을 수 있었다. 또한, 본 논문에서 제안한 방법으로 국외 뉴스, 영화 비디오 등의 영상에서도 좋은 추출을 보임을 확인할 수 있었다.

PACS을 기반으로 한 의료 영상 보안 워터마킹 알고리즘 설계 (Design of Watermarking Algorithm of Medical Image Security based on Picture Archiving & Communication System)

  • 이윤배;오근탁;정민식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.527-530
    • /
    • 2008
  • 디지털 워터마크 기법은 1990년대 초 지적 창작물(음악, 영상, 동영상)에 대한 저작권과 재산권의 보호 및 인증, 데이터 손실 여부 판단, 복사 방지 및 추적 등을 목적으로 한 사후 재산전의 보호기술로 제안되었다. 본 연구에서는 의료 영상 정보에서 발생할 수 있는 기하학적 변환과 압축 등의 영상 변환에서도 워터마크의 견고성을 확인할 수 있는 워터쉐드 분할 알고리즘을 적응한 견고한 워터마킹기법을 제안하였다. 견고한 워터마컴 기법은 의료 영상에 대한 압축, 필터링, 노이즈와 같은 공격에 보다 견고한 몇 개의 알고리즘을 적용하였다.

  • PDF

전자 튜너 조정을 위한 위치와 방향 인식 (Position and Orientation Recognition for Adjusting Electronic Tuners)

  • 양재호;공영준;이문규
    • 한국정밀공학회지
    • /
    • 제16권2호통권95호
    • /
    • pp.39-49
    • /
    • 1999
  • This paper describes the development of a vision-aided position and orientation recognition system for automatically adjusting electronic tuners which control the waveform by rotating variable resisters. The position and orientation recognition system estimates the center and the angle of the tuner grooves so that the main controller may correct the difference from the ideal position and thereby manipulate the variable resisters automatically. In this paper a robust algorithm is suggested which estimates the center and the angle of the tuner grooves fast and precisly from the source image with lighting variance and video noise. In the algorithm morphological filtering, 8-chain coding, and invariant moments are sequentially used to figure out image segments concerned. The performance of the proposed system was evaluated using a set of real specimens. The results indicate the system works well enough to be used practically in real manufacturing lines. If the system adopts a high speed frame grabber which enables real time image processing, it can also be applied to positioning of robot manipulators as well as automated PCB adjusters.

  • PDF

Intelligent Healthcare Service Provisioning Using Ontology with Low-Level Sensory Data

  • Khattak, Asad Masood;Pervez, Zeeshan;Lee, Sung-Young;Lee, Young-Koo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권11호
    • /
    • pp.2016-2034
    • /
    • 2011
  • Ubiquitous Healthcare (u-Healthcare) is the intelligent delivery of healthcare services to users anytime and anywhere. To provide robust healthcare services, recognition of patient daily life activities is required. Context information in combination with user real-time daily life activities can help in the provision of more personalized services, service suggestions, and changes in system behavior based on user profile for better healthcare services. In this paper, we focus on the intelligent manipulation of activities using the Context-aware Activity Manipulation Engine (CAME) core of the Human Activity Recognition Engine (HARE). The activities are recognized using video-based, wearable sensor-based, and location-based activity recognition engines. An ontology-based activity fusion with subject profile information for personalized system response is achieved. CAME receives real-time low level activities and infers higher level activities, situation analysis, personalized service suggestions, and makes appropriate decisions. A two-phase filtering technique is applied for intelligent processing of information (represented in ontology) and making appropriate decisions based on rules (incorporating expert knowledge). The experimental results for intelligent processing of activity information showed relatively better accuracy. Moreover, CAME is extended with activity filters and T-Box inference that resulted in better accuracy and response time in comparison to initial results of CAME.

Image Browse for JPEG Decoder

  • 정의필
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.96-100
    • /
    • 1998
  • DCT 변환을 기반으로 하는 비디오 코딩은 많은 사용자와 더불어 급속한 기술 발전을 하게 되었다. 공간영역내에서 디코딩을 수행하는 것보다 DCT 영역에서 직접 데이터를 처리하는 것이 계산속도 면에서 빠르다. 그리고 블록처리 알고리듬은 병렬처리에 기초하므로 데이터 처리속도가 빠른 하드웨어로 구성되어질 수 있다. 본 논문에서는 서브밴드의 필터뱅크에서 블록변환영역 필터링을 이용한 JPEG브라우저를 제안한다. 디코딩시에 압축된 파일로부터 전체 영상을 디코딩하는대신 사용자가 원하는 크기의 영상을 브라우징 할 수 있다. 한편 DCT 영상 데이터가 입력으로 사용될 경우 제안된 블록변환 필터링은 일반적인 서브밴드 필터링보다 필터뱅크내에서의 곱셈 수를 줄임으로서 계산속도면에서 빠른 결과를 얻을 수 었다.

  • PDF

Fast Hybrid Transform: DCT-II/DFT/HWT

  • 쉬단핑;신태철;단위;이문호
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.782-792
    • /
    • 2011
  • In this paper, we address a new fast DCT-II/DFT/HWT hybrid transform architecture for digital video and fusion mobile handsets based on Jacket-like sparse matrix decomposition. This fast hybrid architecture is consist of source coding standard as MPEG-4, JPEG 2000 and digital filtering discrete Fourier transform, and has two operations: one is block-wise inverse Jacket matrix (BIJM) for DCT-II, and the other is element-wise inverse Jacket matrix (EIJM) for DFT/HWT. They have similar recursive computational fashion, which mean all of them can be decomposed to Kronecker products of an identity Hadamard matrix and a successively lower order sparse matrix. Based on this trait, we can develop a single chip of fast hybrid algorithm architecture for intelligent mobile handsets.