• 제목/요약/키워드: Pixel representation

검색결과 67건 처리시간 0.022초

REAL-TIME 3D MODELING FOR ACCELERATED AND SAFER CONSTRUCTION USING EMERGING TECHNOLOGY

  • Jochen Teizer;Changwan Kim;Frederic Bosche;Carlos H. Caldas;Carl T. Haas
    • 국제학술발표논문집
    • /
    • The 1th International Conference on Construction Engineering and Project Management
    • /
    • pp.539-543
    • /
    • 2005
  • The research presented in this paper enables real-time 3D modeling to help make construction processes ultimately faster, more predictable and safer. Initial research efforts used an emerging sensor technology and proved its usefulness in the acquisition of range information for the detection and efficient representation of static and moving objects. Based on the time-of-flight principle, the sensor acquires range and intensity information of each image pixel within the entire sensor's field-of-view in real-time with frequencies of up to 30 Hz. However, real-time working range data processing algorithms need to be developed to rapidly process range information into meaningful 3D computer models. This research ultimately focuses on the application of safer heavy equipment operation. The paper compares (a) a previous research effort in convex hull modeling using sparse range point clouds from a single laser beam range finder, to (b) high-frame rate update Flash LADAR (Laser Detection and Ranging) scanning for complete scene modeling. The presented research will demonstrate if the FlashLADAR technology can play an important role in real-time modeling of infrastructure assets in the near future.

  • PDF

Classification of Objects using CNN-Based Vision and Lidar Fusion in Autonomous Vehicle Environment

  • G.komali ;A.Sri Nagesh
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.67-72
    • /
    • 2023
  • In the past decade, Autonomous Vehicle Systems (AVS) have advanced at an exponential rate, particularly due to improvements in artificial intelligence, which have had a significant impact on social as well as road safety and the future of transportation systems. The fusion of light detection and ranging (LiDAR) and camera data in real-time is known to be a crucial process in many applications, such as in autonomous driving, industrial automation and robotics. Especially in the case of autonomous vehicles, the efficient fusion of data from these two types of sensors is important to enabling the depth of objects as well as the classification of objects at short and long distances. This paper presents classification of objects using CNN based vision and Light Detection and Ranging (LIDAR) fusion in autonomous vehicles in the environment. This method is based on convolutional neural network (CNN) and image up sampling theory. By creating a point cloud of LIDAR data up sampling and converting into pixel-level depth information, depth information is connected with Red Green Blue data and fed into a deep CNN. The proposed method can obtain informative feature representation for object classification in autonomous vehicle environment using the integrated vision and LIDAR data. This method is adopted to guarantee both object classification accuracy and minimal loss. Experimental results show the effectiveness and efficiency of presented approach for objects classification.

Super-Resolution Reconstruction of Humidity Fields based on Wasserstein Generative Adversarial Network with Gradient Penalty

  • Tao Li;Liang Wang;Lina Wang;Rui Han
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권5호
    • /
    • pp.1141-1162
    • /
    • 2024
  • Humidity is an important parameter in meteorology and is closely related to weather, human health, and the environment. Due to the limitations of the number of observation stations and other factors, humidity data are often not as good as expected, so high-resolution humidity fields are of great interest and have been the object of desire in the research field and industry. This study presents a novel super-resolution algorithm for humidity fields based on the Wasserstein generative adversarial network(WGAN) framework, with the objective of enhancing the resolution of low-resolution humidity field information. WGAN is a more stable generative adversarial networks(GANs) with Wasserstein metric, and to make the training more stable and simple, the gradient cropping is replaced with gradient penalty, and the network feature representation is improved by sub-pixel convolution, residual block combined with convolutional block attention module(CBAM) and other techniques. We evaluate the proposed algorithm using ERA5 relative humidity data with an hourly resolution of 0.25°×0.25°. Experimental results demonstrate that our approach outperforms not only conventional interpolation techniques, but also the super-resolution generative adversarial network(SRGAN) algorithm.

Local Prominent Directional Pattern을 이용한 얼굴 사진과 스케치 영상 성별인식 방법 (Local Prominent Directional Pattern for Gender Recognition of Facial Photographs and Sketches)

  • ;채옥삼
    • 융합보안논문지
    • /
    • 제19권2호
    • /
    • pp.91-104
    • /
    • 2019
  • 본 논문에서는 성별 인식을 위해 얼굴 영상을 효과적으로 기술하는 새로운 지역 패턴 방법 Local Prominent Directional Pattern (LPDP)를 제안한다. 제안된 LPDP 방법은 성별 인식에 중요한 얼굴 모양을 명확하게 구분하기 위해 주변 패턴이 누적된 히스토그램을 통계적으로 분석하고 패턴 변화가 크게 발생하는 픽셀을 부호화 한다. 통계적인 정보를 사용하는 얼굴 모양 구분에 중요한 뚜렷한 에지 방향 패턴 영역을 구분하는 중요한 정보를 제공 할 수 있다. 이는 뚜렷한 에지 방향 패턴이 나타나는 영역의 주변도 유사한 에지 방향 패턴이 나타내기 때문에 통계적으로 특정 방향이 히스토그램에 많이 누적될 수 있기 때문이다. 또한 통계적인 방법은 주변 영역의 정보를 많이 수용하기 때문에 잡음으로 발생하는 에지 방향 변화 오류에 강력한 장점이 있다. 제안된 방법은 기존 방법들 보다 더 강력한 성별인식에 중요한 얼굴 모양 구분 능력을 보여주면서 국소적으로 발생하는 잡음에 견고함을 보여준다. 우리는 제안된 방법의 성능을 평가하기 위해 밝기, 표정, 연령, 머리 포즈가 변화하는 성별 인식 데이터 셋에 다양한 실험을 실험 했고 기존 방법 보다 제안된 방법의 성능이 우수함을 입증했다.

입술의 대칭성에 기반한 효율적인 립리딩 방법 (An Efficient Lipreading Method Based on Lip's Symmetry)

  • 김진범;김진영
    • 대한전자공학회논문지SP
    • /
    • 제37권5호
    • /
    • pp.105-114
    • /
    • 2000
  • 본 논문에서는 영상 변환 기반 자동 립리딩 알고리즘에서 처리하는 데이터 수를 효과적으로 감소시키는데 중점을 두었다 화자의 입술에 대한 압축된 정보를 갖는 영상 변환 방식이 입술 윤곽선 기반 방식보다 우수한 립리딩 성능을 보이지만 이 방식은 입술 특정 파라미터를 다수 갖게 되므로 데이터 처리량이 많아지고 인식시간이 길어지게 된다 계산되는 데이터를 줄이기 위해 우리는 엽술의 대칭성에 기반하여 입술영상을 수직으로 접는 간단한 방법을 제안한다 추가적으로 주성분 분석(PCA) 알고리즘을 사용하여 빠른 알고리즘을 고려하였고, HMM을 이용한 단어 인식실험 결과를 보인다 제안된 방법에서 접어진 입술영상을 이용한 결과, 일반적으로 $16{\times}16$ 입술영상을 사용하는 방법에 비해 특정파라미터 수가 $22{\sim}47%$ 감소하였고, HMM(hidden Markov model) 인식 알고리즘을 이용한 단어 인식률에서도 $2{\sim}3%$ 개선된 결과를 얻었다.

  • PDF

A New Hyper Parameter of Hounsfield Unit Range in Liver Segmentation

  • Kim, Kangjik;Chun, Junchul
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.103-111
    • /
    • 2020
  • Liver cancer is the most fatal cancer that occurs worldwide. In order to diagnose liver cancer, the patient's physical condition was checked by using a CT technique using radiation. Segmentation was needed to diagnose the liver on the patient's abdominal CT scan, which the radiologists had to do manually, which caused tremendous time and human mistakes. In order to automate, researchers attempted segmentation using image segmentation algorithms in computer vision field, but it was still time-consuming because of the interactive based and the setting value. To reduce time and to get more accurate segmentation, researchers have begun to attempt to segment the liver in CT images using CNNs, which show significant performance in various computer vision fields. The pixel value, or numerical value, of the CT image is called the Hounsfield Unit (HU) value, which is a relative representation of the transmittance of radiation, and usually ranges from about -2000 to 2000. In general, deep learning researchers reduce or limit this range and use it for training to remove noise and focus on the target organ. Here, we observed that the range of HU values was limited in many studies but different in various liver segmentation studies, and assumed that performance could vary depending on the HU range. In this paper, we propose the possibility of considering HU value range as a hyper parameter. U-Net and ResUNet were used to compare and experiment with different HU range limit preprocessing of CHAOS dataset under limited conditions. As a result, it was confirmed that the results are different depending on the HU range. This proves that the range limiting the HU value itself can be a hyper parameter, which means that there are HU ranges that can provide optimal performance for various models.

가상카메라 이동에 따른 3차원 입체영상 제작에 관한 연구 (3D Stereoscopic Image Production Techniques in accordance with moving Virtual Camera)

  • 이준상;이임건
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.337-343
    • /
    • 2012
  • 3D 영상은 인간이 인지하는 시각적 경험을 바탕으로 입체적인 표현기술에 의해 발전해 왔다. 최근 입체영상구현 기술연구는 현실감 있는 영상을 제작하기 위해서 다양하고 새로운 영상 제작방법들이 시도되고 있다. 그러나 가상카메라가 이동할 때 발생하는 키스톤 왜곡(keystone distortion)에 대한 문제는 많은 연구가 필요한 상태다. 본 연구에서는 가상카메라의 이동에 따라 발생하는 결상차이에 대한 픽셀거리를 분석함으로써 키스톤 왜곡에 대한 현상을 최소화 하고 그래픽스 환경에서 구현 가능한 제작방법을 제시하였다. 그래픽스 입체영상 제작환경에서 각각의 오브젝트를 레이어별로 분류한 후 영상데이타를 추출하여 입체영상으로 제작한 결과 화면결상으로 인한 왜곡된 영상데이터를 보정 할 수 있었다.

물체 정합을 위한 특징점 추출 및 물체 표현에 관한 연구 (A Study on the salient points detection and object representation for object matching)

  • 박정민;손광훈;허영
    • 전자공학회논문지S
    • /
    • 제35S권6호
    • /
    • pp.101-108
    • /
    • 1998
  • 물체를 인식하기 위한 효율적인 방법 중의 하나는 물체의 경계선에서 가장 적절한 특징들을 추출해 내어 인식에 사용하는 것이다. 본 논문에서는 경계선 위의 각 화소에서 주변 화소들과의 관계를 이용해 코너점, 접점, 변곡점을 추출하여 물체의 특징점으로 사용하였다. 기존에 주로 사용되던 중요한 특징점의 하나인 코너점은 곡률 함수상에서 찾고, 또한 물체가 직선과 곡선으로 이루어져 있을 경우 코너점만으로 물체를 표현하기에 부족하므로 곡률 함수를 미디안 필터링하여 양자화 잡음을 제거함으로써 접점과 변곡점을 찾는 새로운 방법을 제안하였다. 그리고 이 세 가지 특징점을 물체 정합의 요소로 사용하여 물체를 정합하였다. 정합 방법으로는 Discrete Hopfield Neural Network을 사용하였으며, 성능 분석 결과 곡선이 섞인 물체에서 코너점만으로 물체를 정합한 경우보다 특징점으로 물체를 정합한 경우 우수한 정합 성능을 나타내었다.

  • PDF

밝기순위 특징을 이용한 적외선 정지영상 내 물체검출기법 (Object Detection in a Still FLIR Image using Intensity Ranking Feature)

  • 박재희;최학훈;김성대
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.37-48
    • /
    • 2005
  • 본 논문에서는 적외선 영상에서 밝기변화를 예측하기 어려운 일정한 크기의 관심 물체를 검출하기 위하여, 밝기순위 특징과 이론 이용한 물체식별기법을 제안한다. 제안하는 밝기순위 특징은 밝기값의 분포가 균일하도록 영상을 정규화하여 나타낸 것으로, 적외선 영상과 같이 검출대상 물체의 밝기분포를 쉽게 예측하기 어려운 경우에 적합한 특징이다. 제안하는 식별기법은 주어진 후보영역이 검출대상 물체의 학습영상들에 대해 밝기순위가 부합하는 정도를 수치화하여 각각의 후보영역을 물체와 비물체로 식별한다 제안하는 기법을 통하여 별도의 후보영역 선정과정 없이도 일정한 크기의 관심 물체에 대해 화소단위의 검출결과를 획득할 수 있다. 실험에서는 적외선 자동차 영상을 이용하여 밝기순위특징이 적외선 영상 내 물체식별에 적합함을 보이고, 잡음 및 물체의 크기변화, 기울어짐이 존재하는 상황에서의 검출결과를 보인다.

비지역적 유사성 및 3차원 필터링 기반 영상 잡음제거 (Image Denoising Using Nonlocal Similarity and 3D Filtering)

  • 김시현
    • 한국정보통신학회논문지
    • /
    • 제21권10호
    • /
    • pp.1886-1891
    • /
    • 2017
  • 영상 신호 처리 분야 중 잡음제거(denoising)는 가산 잡음이 포함된 영상의 복원을 다룬다. 자연 영상은 지역적 유사성 뿐 만 아니라 비지역적 유사성도 높다는 점은 널리 알려져 있다. 즉, 입력 영상의 특성을 결정짓는 에지나 텍스쳐 패턴이 떨어져 있는 영역에서도 반복적으로 나타난다. 본 논문에서는 비지역적 유사도가 높은 영상 블록을 검출하여 과충분한 신호 집합을 만들고 이를 3차원 변환을 통해 희소(sparse)하게 표현한 후 영상에 포함된 잡음 성분을 제거하는 잡음제거 알고리듬을 제안한다. 여러 영상에 대해 잡음제거 결과로부터 제안된 알고리듬이 부드러운 영역과 에지 영역을 잘 살려 원 영상을 복원할 수 있음을 알 수 있고, 또한 최근 보고된 여러 잡음제거 알고리듬들과의 복원 성능 비교를 통해 상대적으로 우수한 성능을 보임을 확인하였다.