• 제목/요약/키워드: High level visual processing

검색결과 46건 처리시간 0.026초

I형 맞대기 용접선 추적용 시각센서 시스템에 관한 연구 (A Study on the Vision Sensor System for Tracking the I-Butt Weld Joints)

  • 배희수;김재웅
    • 한국정밀공학회지
    • /
    • 제18권9호
    • /
    • pp.179-185
    • /
    • 2001
  • In this study, a visual sensor system for weld seam tracking the I-butt weld joints in GMA welding was constructed. The sensor system consists of a CCD camera, a diode laser with a cylindrical lens and a band-pass-filter to overcome the degrading of image due to spatters and arc light. In order to obtain the enhanced image, quantitative relationship between laser intensity and iris number was investigated. Throughout the repeated experiments, the shutter speed was set at 1-milisecond for minimizing the effect of spatters on the image, and therefore most of the spatter trace in the image have been found to be reduced. Region of interest was defined from the entire image and gray level of searched laser line was compared to that of weld line. The differences between these gray levels lead to spot the position of weld joint using central difference method. The results showed that, as long as weld line was within $^\pm$15$^\circ$from the longitudinal straight fine, the system constructed in this study could track the weld line successful1y. Since the processing time reduced to 0.05 sec, it is expected that the developed method could be adopted to high speed welding such as laser welding.

  • PDF

Adaptive data hiding scheme based on magic matrix of flexible dimension

  • Wu, Hua;Horng, Ji-Hwei;Chang, Chin-Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권9호
    • /
    • pp.3348-3364
    • /
    • 2021
  • Magic matrix-based data hiding schemes are applied to transmit secret information through open communication channels safely. With the development of various magic matrices, some higher dimensional magic matrices are proposed for improving the security level. However, with the limitation of computing resource and the requirement of real time processing, these higher dimensional magic matrix-based methods are not advantageous. Hence, a kind of data hiding scheme based on a single or a group of multi-dimensional flexible magic matrices is proposed in this paper, whose magic matrix can be expanded to higher dimensional ones with less computing resource. Furthermore, an adaptive mechanism is proposed to reduce the embedding distortion. Adapting to the secret data, the magic matrix with least distortion is chosen to embed the data and a marker bit is exploited to record the choice. Experimental results confirm that the proposed scheme hides data with high security and a better visual quality.

통합 이미지 처리 기술을 이용한 콘크리트 교량 균열 탐지 및 매핑 (Crack Inspection and Mapping of Concrete Bridges using Integrated Image Processing Techniques)

  • 김병현;조수진
    • 한국안전학회지
    • /
    • 제36권1호
    • /
    • pp.18-25
    • /
    • 2021
  • In many developed countries, such as South Korea, efficiently maintaining the aging infrastructures is an important issue. Currently, inspectors visually inspect the infrastructure for maintenance needs, but this method is inefficient due to its high costs, long logistic times, and hazards to the inspectors. Thus, in this paper, a novel crack inspection approach for concrete bridges is proposed using integrated image processing techniques. The proposed approach consists of four steps: (1) training a deep learning model to automatically detect cracks on concrete bridges, (2) acquiring in-situ images using a drone, (3) generating orthomosaic images based on 3D modeling, and (4) detecting cracks on the orthmosaic image using the trained deep learning model. Cascade Mask R-CNN, a state-of-the-art instance segmentation deep learning model, was trained with 3235 crack images that included 2415 hard negative images. We selected the Tancheon overpass, located in Seoul, South Korea, as a testbed for the proposed approach, and we captured images of pier 34-37 and slab 34-36 using a commercial drone. Agisoft Metashape was utilized as a 3D model generation program to generate an orthomosaic of the captured images. We applied the proposed approach to four orthomosaic images that displayed the front, back, left, and right sides of pier 37. Using pixel-level precision referencing visual inspection of the captured images, we evaluated the trained Cascade Mask R-CNN's crack detection performance. At the coping of the front side of pier 37, the model obtained its best precision: 94.34%. It achieved an average precision of 72.93% for the orthomosaics of the four sides of the pier. The test results show that this proposed approach for crack detection can be a suitable alternative to the conventional visual inspection method.

Development of LiDAR Simulator for Backpack-mounted Mobile Indoor Mapping System

  • Chung, Minkyung;Kim, Changjae;Choi, Kanghyeok;Chung, DongKi;Kim, Yongil
    • 한국측량학회지
    • /
    • 제35권2호
    • /
    • pp.91-102
    • /
    • 2017
  • Backpack-mounted mapping system is firstly introduced for flexible movement in indoor spaces where satellite-based localization is not available. With the achieved advances in miniaturization and weight reduction, use of LiDAR (Light Detection and Ranging) sensors in mobile platforms has been increasing, and indeed, they have provided high-precision information on indoor environments and their surroundings. Previous research on the development of backpack-mounted mapping systems, has concentrated mostly on the improvement of data processing methods or algorithms, whereas practical system components have been determined empirically. Thus, in the present study, a simulator for a LiDAR sensor (Velodyne VLP-16), was developed for comparison of the effects of diverse conditions on the backpack system and its operation. The simulated data was analyzed by visual inspection and comparison of the data sets' statistics, which differed according to the LiDAR arrangement and moving speed. Also, the data was used as input to a point-cloud registration algorithm, ICP (Iterative Closest Point), to validate its applicability as pre-analysis data. In fact, the results indicated centimeter-level accuracy, thus demonstrating the potentials of simulation data to be utilized as a tool for performance comparison of pointdata processing methods.

블록 기반 압축 이미지 및 비디오를 위한 디블로킹 필터의 SoC 구현 (SoC Implementation of Deblocking Filter for Block-based Compressed Images and Videos)

  • 서광석;이주흥
    • 전기전자학회논문지
    • /
    • 제23권3호
    • /
    • pp.925-933
    • /
    • 2019
  • 본 논문에서는 Zynq Soc Platform의 부분 재구성 기능을 사용하여 영상 압축으로 생성된 blocking artifacts를 제거하는 후처리 시스템을 설계한다. 높은 연산량을 제공하고 실시간으로 1080p 영상을 처리하도록 부분 재구성이 가능한 FPGA(Field Programmable Gate Array) 영역에 디블로킹 필터를 구현한다. 또한 부분적으로 재구성 가능한 영역을 활용하여 제한된 환경의 임베디드 시스템에서 하드웨어 리소스를 보다 효율적으로 사용할 수 있다. 제안된 시스템의 실험결과는 디블로킹 필터처리 후 약 0.6dB의 PSNR 향상을 보여준다. Zynq SoC에서 구현된 필터가 동작할 때 68.33mW의 전력을 소모한다.

중앙 영역의 컬러 특징과 최적화된 빈 수를 이용한 내용기 반 영상검색 (Contend Base Image Retrieval using Color Feature of Central Region and Optimized Comparing Bin)

  • 류은주;송영준;박원배;안재형
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.581-586
    • /
    • 2004
  • 본 논문은 중앙 영역에서의 컬러 특징 추출 기법과 추출된 컬러 특징들의 비교 빈(bin)를 최적화한 새로운 내용기반 영상 검색 방법을 제안한다. 인간의 시각적 특징이 중심 객체의 유무에 영향을 받고, 대부분의 영상의 중심 객체는 중앙에 존재한다는 가정 하에 영상의 중앙 영역에서 컬러 특징을 추출한다. 따라서, 배경이 단순한 경우 영상의 전체영역을 특징으로 하여 검색했을 때 배경의 영향에 좌우되는 단점을 극복할 수 있다. 또한 영상의 컬러 특징값은 HSV 컬러 공간으로 변환한 후 16레벨로 양자화를 하여 추출한다. 실험값을 통해 기존의 16개 빈을 모두 비교하여 검색한 경우에 비해 상위 8개 빈만을 가지고 검색한 경우 주관적인 평가와 객관적인 평가 모두 다 좋은 결과를 보인다. 영상 전체를 특징으로 추출한 경우보다 중앙 영역만으로 특징을 추출한 경우 평균 precision이 약 5%정도 좋았다.

AWGN에 훼손된 영상복원을 위한 복합 필터 알고리즘에 관한 연구 (A Study on Mixed Filter Algorithm for Restoration of Image Corrupted by AWGN)

  • ;김남호
    • 한국정보통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1064-1070
    • /
    • 2012
  • 현재, 영상처리는 다양한 분야에서 활용되고 있으며, 영상의 우수한 화질을 위해 열화현상을 제거하여야 한다. 잡음은 열화현상의 대표적인 원인으로서, 영상은 AWGN(additive white Gaussian noise)에 의해 많이 훼손된다. 따라서 본 논문에서는 AWGN을 제거하기 위해, 공간영역에서의 워너 필터와 웨이브렛 영역에서의 임계값 잡음 처리방법을 병렬 연결하여 처리하는 복합 필터 알고리즘을 제안하였다. 웨이브렛 영역에서의 처리방법은 각 스케일에 따라 서로 다른 thresholding function을 사용하여 처리하며, 제안한 변형된 thresholding function은 parent 웨이브렛 계수와 child 웨이브렛 계수를 이용함으로서, 우수한 잡음제거 특성을 나타냈다.

HDR 영상 압축을 위한 시각 밝기 함수를 이용한 다중 스케일 톤 맵핑 모델 (Multi Scale Tone Mapping Model Using Visual Brightness Functions for HDR Image Compression)

  • 권혁주;이성학;채석민;송규익
    • 한국통신학회논문지
    • /
    • 제37A권12호
    • /
    • pp.1054-1064
    • /
    • 2012
  • HDR (high dynamic range) 톤 맵핑 (tone mapping) 알고리듬은 높은 다이내믹 레인지 영상을 압축하여 LDR (low dynamic range) 영상 장치에 구현하기 위해 사용된다. 대표적인 톤 맵핑 알고리듬의 한 방법인 레티넥스 (retinex)는 효과적인 다이내믹 레인지 압축과 색 항상성을 보존할 수 있는 특성을 가지고 있으며, 다중 스케일 및 휘도 성분 기반 알고리듬 등으로 발달되어왔다. 그러나 레티넥스 기반 알고리듬들은 어두운 영역에서 노이즈가 강하게 나타나고 밝은 영역에서는 채도 저하 현상이 나타나는 단점이 있다. 본 논문에서는 명암대비 성능의 개선과 채도 저하 및 노이즈 개선을 위해 시각 밝기 함수를 기반으로 하는 다중 스케일 톤 맵핑 알고리듬을 제안하였다. 제안된 알고리듬은 원영상의 채도 및 색상의 보존을 위해 HSV 색 공간에서 처리가 이루어지며 인간 시각 특성을 반영하기 위해 조명의 변화에 따른 최소 및 최대 휘도 레벨 예측 함수와 시각 감마 모델링 함수를 이용하였다. 그리고 주관적 및 객관적 성능 비교로부터 제안된 알고리듬의 우수성을 확인하였다. 제안된 알고리듬은 시청환경의 변화로 인해 다이내믹 레인지의 개선이 필요한 분야에서 영상화질의 효과적인 개선을 기대할 수 있을 것이다.

다중 공간정보 데이터의 점진적 조합에 의한 의미적 분류 딥러닝 모델 학습 성능 분석 (Training Performance Analysis of Semantic Segmentation Deep Learning Model by Progressive Combining Multi-modal Spatial Information Datasets)

  • 이대건;신영하;이동천
    • 한국측량학회지
    • /
    • 제40권2호
    • /
    • pp.91-108
    • /
    • 2022
  • 대부분의 경우 광학 RGB 영상을 딥러닝(DL: Deep learning)의 학습 데이터로 사용하여 객체탐지, 인식, 식별, 분류, 의미적 분할 및 객체 분할 등을 수행하지만, 실세계의 3차원 객체들을 2차원 영상으로 완전하게 파악하는 것은 한계가 있다. 그러므로 대표적인 3차원 지형 공간정보인 수치표면모델(DSM: Digital Surface Model)과 더불어 DSM에 내재된 특성정보를 이용하여 3차원 지형지물을 분석하는 것이 효과적이다. 건물과 같이 기하학적으로 정형화된 형태의 인공구조물은 3차원 공간데이터로부터 얻을 수 있는 기하학적 요소와 특성을 이용하여 객체의 분류와 형상 묘사가 가능하다. 이 연구는 고차원 시각정보(high-level visual information) 시스템에서 중요한 역할을 하는 내재된 고유의 특성정보(intrinsic information)를 기반으로 하며, 이를 위하여 객체의 기하학적 요소인 경사와 주향을 DSM으로부터 도출하고, 다방향에서 생성한 음영기복영상(SRI: Shaded Relief Image)과 함께 DL 모델의 학습 수행에 사용하였다. 실험은 ISPRS (International Society for Photogrammetry and Remote Sensing)에서 제공하는 데이터 셋 중에서 DSM과 레이블 데이터를 객체의 의미적 분류를 위해 개발된 합성곱 기반의 SegNet 학습에 사용하였다. 지형지물을 분류하고 분류 결과를 이용하여 건물을 추출하였다. 특히 DL 모델의 학습 성능 향상을 위해 학습 데이터의 여러 조합에 따른 시너지 효과를 분석하는 것에 핵심이다. 제안한 방법은 건물 분류와 추출에 효과적임을 보여주고 있다.

감성 자극 판단을 위한 효과적인 PPG 신호 처리 방법 (Effective PPG Signal Processing Method for Detecting Emotional Stimulus)

  • 오동기;민병석;권성오;김현중
    • 한국통신학회논문지
    • /
    • 제37권5C호
    • /
    • pp.393-402
    • /
    • 2012
  • 본 논문에서는 PPG(Photoplethysmography)센서를 통하여 검출되는 심장박동신호를 이용하여 스트레스 여부를 판단하고, 이를 위한 효과적인 신호처리를 연구한다. 측정되는 PPG신호를 바탕으로 PPI(Pulse to Pulse Interval)와 이산 신호처리 방법을 이용하여 감성자극을 판단한다. 감성자극에 대한 반응을 실험하기 위하여 피실험자들은 스트레스영상과 안정영상을 TV를 통하여 시청하였다. 스트레스 정도에 따라 다양한 신체반응이 나타나며, 그 중 가장 큰 변화를 나타내는 심장박동수의 변화를 PPG센서를 이용하여 검출한다. 그러나 측정에 의한 오차와 피실험자의 동작에 의한 오차가 발생한다. 본 논문에서는 감성자극 판단에 오차를 유발하는 신호잡음과 동작잡음을 제거하기 위한 방안을 제안한다. PPG센서를 통하여 검출된 심장박동신호에 섞여있는 고주파대역의 신호잡음을 제거하기 위하여 전처리에서 스펙트로그램을 이용한 에너지밀도 분석법으로 피실험자에 적응된 해밍 필터를 적용한다. PPG센서와 피실험자간의 접촉상태 때문에 발생되는 동작잡음으로 인하여 발생될 수 있는 스트레스 검출오차를 수정하기 위하여 후처리에서 히스테리시스를 적용한다. 실험결과 심장박동의 특성을 고려하지 않은 방안에 비하여 신호잡음을 효과적으로 줄였으며, 동작잡음에 의한 검출오차를 개선하였다.