• Title/Summary/Keyword: 이미지 해상도

Search Result 346, Processing Time 0.026 seconds

Real-Time Detection of Large Objects using Image Pyramid (이미지 피라미드를 이용한 큰 객체 실시간 탐지)

  • Joo, Gwonil;Son, Seungwook;Ahn, Hanse;Chung, Yongwha;Park, Daihee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.709-712
    • /
    • 2020
  • 영상 처리 응용을 위해 개발된 대부분의 CNN 기반 객체 탐지 기법은 mAP 를 올리기 위해 작은 객체 탐지에 더 주력하는 경향이 있다. 본 연구에서는 이미지 피라미드를 통한 서로 다른 해상도의 탐지 결과를 앙상블을 하여 작은 객체의 탐지 성능은 유지하면서 큰 객체의 탐지 성능을 향상시키고자 한다. 또한, 기존 NMS 방식의 문제점을 파악하고 새로운 NMS 방식인 G-NMS 를 제안한다. COCO 데이터로 실험 결과 서로 다른 해상도의 탐지 결과 앙상블을 통하여 30fps 이상의 실시간 탐지를 만족하면서 큰 객체에 대한 AP 가 0.5~1.5% 상승되었음을 확인하였다. 제안한 G-NMS 방식 적용시 큰 객체에 대한 AR 이 2.6~3.8% 상승되었으며, 작은 객체를 포함한 전체 mAP 가 0.7~0.9% 상승되었음을 확인하였다.

Performance analysis of audio super-resolution based on neural networks (신경망 기반 오디오 초 해상도 기술 성능 분석)

  • Lim, Wootaek;Beack, Seungkwon;Sung, Jongmo;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.337-339
    • /
    • 2020
  • 오디오 초 해상도 기술은 저 해상도의 오디오 신호를 이용하여 고 해상도의 오디오를 복원 또는 생성해 내는 기술이다. 본 기술 분야는 기존에 주파수 대역 확장, 인공 대역 확장 기술 등으로 연구되었으나, 최근 딥러닝 기술의 발전, 이미지 초 해상도 기술 연구 등에 힘입어 오디오 초 해상도 기술 이라는 이름으로 주로 연구되고 있다. 본 논문에서는 이러한 오디오 초 해상도 기술에 연구 동향에 대하여 설명하고, 기존의 논문 들에서 주로 다루고 있는 음성 데이터 베이스가 아닌 MedleyDB 음악 데이터 베이스를 활용하여 실험을 수행하였다. 실험은 4-폴드 교차 검증을 통해 수행되었으며, 실험 결과 제안하는 컨벌루션 신경망 구조 기반 오디오 초 해상도 기술은 입력 저해상도 오디오 대비 SNR 이 3.41 dB 향상됨을 확인하였다.

  • PDF

Comparative analysis of the deep-learning-based super-resolution methods for generating high-resolution texture maps (고해상도 텍스처 맵 생성을 위한 딥러닝 기반 초해상도 기법들의 비교 분석 연구)

  • Hyeju Kim;Jah-Ho Nah
    • Journal of the Korea Computer Graphics Society
    • /
    • v.29 no.5
    • /
    • pp.31-40
    • /
    • 2023
  • As display resolution increases, many apps also tend to include high-resolution texture maps. Recent advancements in deep-learning-based image super-resolution techniques make it possible to automate high-resolution texture generation. However, there is still a lack of comprehensive analysis of the application of these techniques to texture maps. In this paper, we selected three recent super-resolution techniques, namely BSRGAN, Real-ESRGAN, and SwinIR (classical and real-world image SR), and applied them to upscale texture maps. We then conducted a quantitative and qualitative analysis of the experimental results. The findings revealed various artifacts after upscaling, which indicates that there are still limitations in directly applying super-resolution techniques to texture-map upscaling.

Design of A New Anti-Aliasing Algorithm for Computer Graphics Image. (컴퓨터 그래픽 이미지에서 새로운 Anti-Aliasing 알고리즘 설계)

  • 지용준;김명신;이성태;김판구;이윤배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.661-663
    • /
    • 2000
  • 자연에 존재하는 연속량의 데이터는 디지털화 될 때 숫자로 변환된다. 이때 부딪치는 일반적인 문제는 완전히 통합되지 않았거나 잘못 통합된 표본 추출의 결과로 정보를 잃어버리는 앨리어싱(Aliasing) 현상이 일어나게 된다. 현재 일반 사용자가 사용하는 PC기반의 모니터 해상도는 96PPI(Pixel ZPer Inch)밖에 제공하지 못한다. 이러한 저해상도에서 컴퓨터 그래픽 이미지 객체를 디스플레이 할 때 앨리어싱 현상이 자주 발생한다. 현재 PC 기반의 그래픽 하드웨어 구조의 변형없이 저해상도 모니터상에서 앨리어싱 현상이 발생하는 이미지를 기존의 계산 방법을 감소시키면서 앨리어싱 현상을 제거하는 기법이 필요하다. 본 연구에서는 이와 같이 앨리어싱 현상을 감소시켜 이미지 데이터의 품질을 향상시킬 수 있는 개선된 Anti-Aliasing 알고리즘을 제안한다.

  • PDF

Improvement of point cloud data using 2D super resolution network (2D super resolution network를 이용한 Point Cloud 데이터 개선)

  • Park, Seong-Hwan;Kim, Kyu-Heon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.16-18
    • /
    • 2021
  • 미디어 기술은 사용자가 더욱 몰입감을 느낄 수 있는 방향으로 개발되어 왔다. 이러한 흐름에 따라 기존의 2D 이미지에 비해 깊이감을 느낄 수 있는 증강 현실, 가상 현실 등 3D 공간 데이터를 활용하는 미디어가 주목을 받고 있다. 포인트 클라우드는 수많은 3차원 좌표를 가진 여러 개의 점들로 구성된 데이터 형식이므로 각각의 점들에 대한 좌표 및 색상 정보를 사용하여 3D 미디어를 표현한다. 고정된 크기의 해상도를 갖는 2D 이미지와 다르게 포인트 클라우드는 포인트의 개수에 따라 용량이 유동적이며, 이를 기존의 비디오 코덱을 사용하여 압축하기 위해 국제 표준기구인 MPEG(Moving Picture Experts Group)에서는 Video-based Point Cloud Compression (V-PCC)을 제정하였다. V-PCC는 3D 포인트 클라우드 데이터를 직교 평면 벡터를 이용하여 2D 패치로 분해하고 이러한 패치를 2D 이미지에 배치한 다음 기존의 2D 비디오 코덱을 사용하여 압축한다. 본 논문에서는 앞서 설명한 2D 패치 이미지에 super resolution network를 적용함으로써 3D 포인트 클라우드의 성능 향상하는 방안을 제안한다.

  • PDF

Neural network model for detected object style transformation using Mask R-CNN and zi2zi (Mask R-CNN 과 zi2zi 모델을 활용하여 탐지된 객체의 스타일을 변환시키는 신경망 모델)

  • Jo, In-su;Choi, Dong-Bin;Park, Young B.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.562-565
    • /
    • 2021
  • 스타일 변환 모델은 이미지 전체나 이미지 내에서 사용자가 지정한 영역을 대상으로 스타일을 변환시킨다. 이런 방식은 이미지 내의 다수의 객체에 대해 스타일 변환을 시행할 때 일일이 영역을 지정해 줘야 한다는 불편함과 결과물의 전체 해상도가 떨어진다는 한계를 가지고 있다. 본 논문에서는 이런 한계들을 극복하기 위해 객체탐지 모델과 스타일변환 모델을 연동한 객체스타일변환모델을 제안하고 모델 간 연동방법에 대해 자세히 서술한다. 객체탐지모델인 Mask R-CNN 을 통해 필요한 객체를 탐지하고 탐지한 객체의 특징맵들을 스타일변환 모델인 zi2zi 의 입력 값으로 전달하여 이미지 내의 필요한 객체들만 스타일변환이 이루어지도록 모델이 동작한다. 이러한 모델은 기존에 있는 두 모델을 재사용함으로써 모델을 처음부터 새로 설계할 필요가 없다는 장점이 있으며, 공개된 다양한 모델들을 서로 융합하여 사용할 수 있는 방법을 제시하는데 도움을 줄 것이다.

Soil Particle Shape Analysis Using Fourier Descriptor Analysis (퓨리에 기술자 분석을 이용한 단일 흙 입자의 형상 분석)

  • Koo, Bonwhee;Kim, Taesik
    • Journal of the Korean GEO-environmental Society
    • /
    • v.17 no.3
    • /
    • pp.21-26
    • /
    • 2016
  • Soil particle shape analysis was conducted with sands from Jumujun, Korea and Ras Al Khair, Saudi Arabia. Two hundred times enlarged digital images of the particles of those two sands were obtained with an optical microscope. The resolution of the digital images was $640{\times}320$. By conducting digital image processing, the coordinates of the soil particle boundary were extracted. After mapping those coordinates to the complex space, Fourier transformation was performed and the coefficients of each trigonometry term were computed. The coefficients reflect the shape characteristics of the sand grains and are invariant to translation. To evaluate the shape itself excluding the size of the soil particle, the coefficient was normalized by the equivalent radius of soil particle; this is called Fourier descriptor. After analyzing the Fourier descriptors, it was found that the major characteristics of Jumunjin and Ras Al Khair sands were elongation and asymmetry. Furthermore, it was found that the particle shapes reflect the self-similar, fractal nature of the textural features. The effects of resolution on soil particle shape analysis was also studied. Regarding this, it was found that the significant Fourier descriptors were not significantly affected by the image resolution investigated in this study, but the descriptors associated with textural features were affected.

A Study on Distance Estimation in Virtual Space According to Change of Resolution of Static and Dynamic Image (가상현실공간에서 정적 및 동적 이미지의 해상도 변화에 따른 거리추정에 관한 연구)

  • Ryu, Jae-Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.16 no.3
    • /
    • pp.109-119
    • /
    • 2011
  • The virtual reality (VR) technology has been used as the application of architectural presentation or simulation tool in the field of industry. The high immersion and intuitive visual information are the great merits of design evaluation or environmental simulation when we are using the virtual environments. But the distortion of distance perception in VR is still a big problem when the accuracy of distance presentation is strictly required. For example, distance estimation is especially important when the virtual environments are applied to the presentational tool for evaluation the space design or planning in the field of architecture. If there are some perception error between the built space in real and represented space in virtual, the accurate design evaluation or modification of design is hard to be carried out during the design development stage. In this paper, we have carried out some experiments about distance estimation in the immersive virtual environments to verify the factors and their influence. We made a hypothesis that the lack of the information for the user in VR causes the different distance estimation from the real world because users are usually comfortable with moving fast and long distance in VR environments compared with moving slow and short distance in real space. So, we carried out basic experiment to prove our hypothesis that the lack of information makes subjects estimate the distance of walking in VR shorter compared with the same distance in real. Also, among the factors that probably affect the distance estimation in VR, we have verified the influence of the image resolution. The influence of resolution degradation of image on the distance estimation was verified with the condition of static and dynamic images. The results showed that the resolution has deep relation with the distance estimation. For example, the subject underestimated the distance at the lower resolution condition. We also found the methods of the making the lower resolution image could affect on the visual perception of subjects.

A Study on the Application of Task Offloading for Real-Time Object Detection in Resource-Constrained Devices (자원 제약적 기기에서 자율주행의 실시간 객체탐지를 위한 태스크 오프로딩 적용에 관한 연구)

  • Jang Shin Won;Yong-Geun Hong
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.12 no.12
    • /
    • pp.363-370
    • /
    • 2023
  • Object detection technology that accurately recognizes the road and surrounding conditions is a key technology in the field of autonomous driving. In the field of autonomous driving, object detection technology requires real-time performance as well as accuracy of inference services. Task offloading technology should be utilized to apply object detection technology for accuracy and real-time on resource-constrained devices rather than high-performance machines. In this paper, experiments such as performance comparison of task offloading, performance comparison according to input image resolution, and performance comparison according to camera object resolution were conducted and the results were analyzed in relation to the application of task offloading for real-time object detection of autonomous driving in resource-constrained devices. In this experiment, the low-resolution image could derive performance improvement through the application of the task offloading structure, which met the real-time requirements of autonomous driving. The high-resolution image did not meet the real-time requirements for autonomous driving due to the increase in communication time, although there was an improvement in performance. Through these experiments, it was confirmed that object recognition in autonomous driving affects various conditions such as input images and communication environments along with the object recognition model used.