• 제목/요약/키워드: Image Memory

검색결과 825건 처리시간 0.026초

기저 함수의 대칭성을 이용한 저니키 모멘트의 효율적인 계산 방법 (An Efficient Computation Method of Zernike Moments Using Symmetric Properties of the Basis Function)

  • 황선규;김회율
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.563-569
    • /
    • 2004
  • 저니키 모멘트(Zernike moment)는 영상의 표현 능력이 뛰어나기 때문에 객체 인식 또는 내용기반 영상 검색 시스템에서 많이 사용되었으나, 정의식이 복잡하기 때문에 많은 연산량을 필요로 하는 단점이 있다. 저니키 모멘트를 빠르게 계산하는 기존의 방법들은 주로 1차원 실수 방사 다항식을 빠르게 계산하는 방법에 중점을 두었다. 본 논문에서는 저니키 복소 기저 함수의 대칭성을 유도하여 저니키 기저함수를 빠르게 계산하고 입력 영상으로부터 저니키 모멘트를 효율적으로 추출하는 방법을 제안한다. 제안하는 방법은 저니키 기저 함수 계산에 필요한 연산량을 기존 방법의 약 20%로 줄이고, 저니키 모멘트 추출에 필요한 곱셈 연산을 25%로 감소시킨다. 또한, 저니키 모멘트를 특징 벡터로 이용하는 시스템 구현 시 필요한 메모리 요구량도 기존 방법의 25%만을 필요로 한다. 제안하는 방법은 회전 모멘트, 의사 저니키 모멘트, ART(Angular Radial Transform) 등의 계산에도 같은 방식으로 적용될 수 있다.

실시간 2차원 Separable 메디안 필터 (Real-time 2-D Separable Median Filter)

  • Jae Gil Jeong
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.321-330
    • /
    • 2002
  • 2차원 메디안필터는 정지영상 및 동영상 신호처리 분야에 많이 활용되고 있다. 최근의 급속한 VLSI기술의 발전은 적절한 비용으로 실시간 2차원 메디안 필터의 구현을 가능하게 하여 주고 있다. 효율적인 VLSI구현을 위해서는 적은 양의 메모리 사용, 규칙적인 계산, 지역 데이터 전달 등의 특성을 갖는 알고리즘과 VLSI 구조가 필수적이다. 본 논문에서는 위와 같은 특성을 갖는 새로운 실시간 2차원 메디안필터의 VLSI구조를 제안하였다. 이를 위하여 메디안필터링 알고리즘을 분석하여 메디안 필터링 알고리즘에 내재되어 있는 병렬처리 특성, 특히 파이프라인 가능성을 최대한 활용할 수 있도록 하였다. 또한 Separable 2차원 메디안 필터링 알고리즘을 사용하여 하드웨어 복잡성을 크게 감소시켰다. Separable 2차원 메디안필터는 기존의 메디안필터와 거의 유사한 성능을 보여주었으며 bit-slice pipeline median searching 알고리즘은 기존의 메디안 필터에서 문제가 되었던 window의 크기에 따라 하드웨어 복잡성이 크게 증가하는 문제를 해결하여 window 크기에 관계없이 2차원 실시간 메디안 필터의 VLSI 구현을 가능하게 하여 주었다. C 언어를 이용한 행위레벨 시뮬레이션을 통하여 성능을 확인하고 분석하였다.

  • PDF

Development of PKNU3: A small-format, multi-spectral, aerial photographic system

  • Lee Eun-Khung;Choi Chul-Uong;Suh Yong-Cheol
    • 대한원격탐사학회지
    • /
    • 제20권5호
    • /
    • pp.337-351
    • /
    • 2004
  • Our laboratory originally developed the compact, multi-spectral, automatic aerial photographic system PKNU3 to allow greater flexibility in geological and environmental data collection. We are currently developing the PKNU3 system, which consists of a color-infrared spectral camera capable of simultaneous photography in the visible and near-infrared bands; a thermal infrared camera; two computers, each with an 80-gigabyte memory capacity for storing images; an MPEG board that can compress and transfer data to the computers in real-time; and the capability of using a helicopter platform. Before actual aerial photographic testing of the PKNU3, we experimented with each sensor. We analyzed the lens distortion, the sensitivity of the CCD in each band, and the thermal response of the thermal infrared sensor before the aerial photographing. As of September 2004, the PKNU3 development schedule has reached the second phase of testing. As the result of two aerial photographic tests, R, G, B and IR images were taken simultaneously; and images with an overlap rate of 70% using the automatic 1-s interval data recording time could be obtained by PKNU3. Further study is warranted to enhance the system with the addition of gyroscopic and IMU units. We evaluated the PKNU 3 system as a method of environmental remote sensing by comparing each chlorophyll image derived from PKNU 3 photographs. This appraisement was backed up with existing study that resulted in a modest improvement in the linear fit between the measures of chlorophyll and the RVI, NDVI and SAVI images stem from photographs taken by Duncantech MS 3100 which has same spectral configuration with MS 4000 used in PKNU3 system.

다중 스케일 얼굴 영역 딕셔너리의 적대적 증류를 이용한 얼굴 초해상화 (Face Super-Resolution using Adversarial Distillation of Multi-Scale Facial Region Dictionary)

  • 조병호;박인규;홍성은
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.608-620
    • /
    • 2021
  • 최근 딥러닝 기반의 얼굴 초해상화 연구는 일반적인 영상에 대한 초해상화 연구와 달리 인간의 얼굴이 가지는 구조적 혹은 의미론적인 특성을 반영한 안면 랜드마크 정보, 주요 영역 딕셔너리와 같은 사전 및 참조 정보를 사용하여 우수한 초해상화 결과를 보였다. 그러나 얼굴에 특화된 사전 정보를 사용할 시 추가적인 처리 소요 시간과 메모리를 요구하는 단점이 존재한다. 본 논문은 앞서 언급한 한계점을 극복하고자 지식 증류 기법을 활용한 효율적인 초해상화 모델을 제안한다. 주요 얼굴 영역 기반의 딕셔너리 정보를 사용하는 선생 모델에 지식 증류 기법을 적용하여 추론 시 랜드마크 정보와 부가적인 딕셔너리 사용이 필요 없는 학생 모델을 구축하였다. 제안하는 학생 모델은 특징맵 기반의 적대적 지식 증류를 통해 얼굴 주요 영역 딕셔너리를 가지고 있는 선생 모델로부터 학습을 진행하였다. 본 논문은 제안하는 학생 모델의 실험 결과를 통해 정량 및 정성적으로 우수함을 보이며 선생 모델의 연산량에 비해 90% 이상 절감되는 효율성을 증명한다.

자율주행 제어를 위한 향상된 주변환경 인식 알고리즘 (Improved Environment Recognition Algorithms for Autonomous Vehicle Control)

  • 배인환;김영후;김태경;오민호;주현수;김슬기;신관준;윤선재;이채진;임용섭;최경호
    • 자동차안전학회지
    • /
    • 제11권2호
    • /
    • pp.35-43
    • /
    • 2019
  • This paper describes the improved environment recognition algorithms using some type of sensors like LiDAR and cameras. Additionally, integrated control algorithm for an autonomous vehicle is included. The integrated algorithm was based on C++ environment and supported the stability of the whole driving control algorithms. As to the improved vision algorithms, lane tracing and traffic sign recognition were mainly operated with three cameras. There are two algorithms developed for lane tracing, Improved Lane Tracing (ILT) and Histogram Extension (HIX). Two independent algorithms were combined into one algorithm - Enhanced Lane Tracing with Histogram Extension (ELIX). As for the enhanced traffic sign recognition algorithm, integrated Mutual Validation Procedure (MVP) by using three algorithms - Cascade, Reinforced DSIFT SVM and YOLO was developed. Comparing to the results for those, it is convincing that the precision of traffic sign recognition is substantially increased. With the LiDAR sensor, static and dynamic obstacle detection and obstacle avoidance algorithms were focused. Therefore, improved environment recognition algorithms, which are higher accuracy and faster processing speed than ones of the previous algorithms, were proposed. Moreover, by optimizing with integrated control algorithm, the memory issue of irregular system shutdown was prevented. Therefore, the maneuvering stability of the autonomous vehicle in severe environment were enhanced.

H.264/AVC 복호기를 위한 효율적인 인트라 예측기 설계 (Efficient Intra Predictor Design for H.264/AVC Decoder)

  • 김옥;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.175-178
    • /
    • 2009
  • H.264/AVC는 ITU-T와 ISO/IEC의 최신 동영상 압축 코덱 규격으로 MPEG-2보다 2배 이상의 압축률과 고화질로 최근 그 적용 영역을 넓혀 가고 있다. 본 논문에서는 H.264/AVC에서 압축 성능을 높이기 위해 사용된 기법중 하나인 인트라 예측에 대해 설명하고 인트라 예측 모드 연산을 효율적으로 수행하기 위한 인트라 예측기의 구조를 제안하다. 제안된 인트라 예측기는 공통 연산기와 전처리 연산기를 사용하여 연산량을 줄이고, 효율적인 레지스터를 사용하여 외부 메모리와의 접근을 최소화 하였다. 제안된 인트라 예측기는 Verilog-HDL을 이용하여 설계하였으며 적합한 테스트 벡터를 이용하여 검증 되었다. 제안된 인트라 예측기는 기존에 비해 약 60%의 향상된 결과를 얻었다.

  • PDF

Precision comparison of 3D photogrammetry scans according to the number and resolution of images

  • Park, JaeWook;Kim, YunJung;Kim, Lyoung Hui;Kwon, SoonChul;Lee, SeungHyun
    • International journal of advanced smart convergence
    • /
    • 제10권2호
    • /
    • pp.108-122
    • /
    • 2021
  • With the development of 3D graphics software and the speed of computer hardware, it is an era that can be realistically expressed not only in movie visual effects but also in console games. In the production of such realistic 3D models, 3D scans are increasingly used because they can obtain hyper-realistic results with relatively little effort. Among the various 3D scanning methods, photogrammetry can be used only with a camera. Therefore, no additional hardware is required, so its demand is rapidly increasing. Most 3D artists shoot as many images as possible with a video camera, etc., and then calculate using all of those images. Therefore, the photogrammetry method is recognized as a task that requires a lot of memory and long hardware operation. However, research on how to obtain precise results with 3D photogrammetry scans is insufficient, and a large number of photos is being utilized, which leads to increased production time and data capacity and decreased productivity. In this study, point cloud data generated according to changes in the number and resolution of photographic images were produced, and an experiment was conducted to compare them with original data. Then, the precision was measured using the average distance value and standard deviation of each vertex of the point cloud. By comparing and analyzing the difference in the precision of the 3D photogrammetry scans according to the number and resolution of images, this paper presents a direction for obtaining the most precise and effective results to 3D artists.

Design of visitor counting system using edge computing method

  • Kim, Jung-Jun;Kim, Min-Gyu;Kim, Ju-Hyun;Lee, Man-Gi;Kim, Da-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.75-82
    • /
    • 2022
  • 우리 주위에 다양한 전시관, 쇼핑몰, 테마파크 등이 있으며 실제 전시하고 있는 전시물, 콘텐츠에 대한 관심도, 흥미도에 대한 분석은 설문 정도로만 이루어지고 있다. 이러한 설문은 주로 피설문자의 주관적인 기억에 의존하고 있어서 잘못된 통계 결과를 얻을 수 있는 문제가 있다. 따라서 방문객의 동선 추적과 수를 카운팅 하여 흥미가 떨어지는 전시 공간 파악이 가능하며 이를 통해 교체가 필요한 전시물에 대해 정량적 자료로 사용이 가능하다. 본 논문에서는 딥러닝 기반의 인공지능 알고리즘을 이용하여 방문객을 인식하고, 인식된 방문객에 아이디를 할당하여 이를 지속적으로 추적하는 방식으로 동선을 파악한다. 이때 방문객이 카운팅 라인을 통과하게 되면 그 수를 카운팅 하고, 데이터는 서버에 전송하여 통합 관리할 수 있도록 시스템을 설계하였다.

2D-MELPP: A two dimensional matrix exponential based extension of locality preserving projections for dimensional reduction

  • Xiong, Zixun;Wan, Minghua;Xue, Rui;Yang, Guowei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.2991-3007
    • /
    • 2022
  • Two dimensional locality preserving projections (2D-LPP) is an improved algorithm of 2D image to solve the small sample size (SSS) problems which locality preserving projections (LPP) meets. It's able to find the low dimension manifold mapping that not only preserves local information but also detects manifold embedded in original data spaces. However, 2D-LPP is simple and elegant. So, inspired by the comparison experiments between two dimensional linear discriminant analysis (2D-LDA) and linear discriminant analysis (LDA) which indicated that matrix based methods don't always perform better even when training samples are limited, we surmise 2D-LPP may meet the same limitation as 2D-LDA and propose a novel matrix exponential method to enhance the performance of 2D-LPP. 2D-MELPP is equivalent to employing distance diffusion mapping to transform original images into a new space, and margins between labels are broadened, which is beneficial for solving classification problems. Nonetheless, the computational time complexity of 2D-MELPP is extremely high. In this paper, we replace some of matrix multiplications with multiple multiplications to save the memory cost and provide an efficient way for solving 2D-MELPP. We test it on public databases: random 3D data set, ORL, AR face database and Polyu Palmprint database and compare it with other 2D methods like 2D-LDA, 2D-LPP and 1D methods like LPP and exponential locality preserving projections (ELPP), finding it outperforms than others in recognition accuracy. We also compare different dimensions of projection vector and record the cost time on the ORL, AR face database and Polyu Palmprint database. The experiment results above proves that our advanced algorithm has a better performance on 3 independent public databases.

영시를 통한 대학 교양 영어 교육 방안 연구: 로버트 프로스트의 「꺼져라, 꺼져라-」를 중심으로 (A Study on the Teaching Method of University General English with Poetry: Robert Frost's "Out, Out-")

  • 김혜연
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.403-413
    • /
    • 2021
  • 본 논문은 영시를 통한 대학 교양 영어 교육의 필요성과, 구체적인 교육 방안을 모색하고, 로버트 프로스트의 「꺼져라, 꺼져라-」를 중심으로 구체적인 교수법 모델을 제공한다. 영시는 학습자 중심의 영어 교육이 중시되고, 읽기, 말하기, 듣기, 쓰기 4영역의 통합 학습 과정이 중시되며, 전공 공부와 취업으로의 연계를 목표로 하는 대학 교양 영어 수업에서 중요한 텍스트가 될 수 있다. 영시의 시각적 이미지, 리듬, 라임, 반복 등의 시적 기교는 언어에 대한 암기 학습 능력 향상과 음성, 구어적 능력 향상과 밀접한 관계가 있기 때문이다. 또한 본 연구에서는 수능 영어에 익숙한 국내 대학교 1학년 학생들에게 가장 적절한 시 선정 기준을 제시하고, 읽기 전 활동, 읽기 활동, 읽기 후 활동으로 나누어 교수법을 제시한다. 그리고 이러한 교수법이 3시간 수업의 대학 교양 영어 수업에서 어떻게 구체적으로 적용될 수 있는지 프로스트의 「꺼져라, 꺼져라-」를 중심으로 제시한다. 그리고 이러한 '탈 활자적' 텍스트를 통한 영어 학습이 학습자 중심의 지속 가능한 학습 모델이 될 수 있다는 점을 밝히고자 한다.