• 제목/요약/키워드: object pooling

검색결과 25건 처리시간 0.02초

Content-Aware Convolutional Neural Network for Object Recognition Task

  • Poernomo, Alvin;Kang, Dae-Ki
    • International journal of advanced smart convergence
    • /
    • 제5권3호
    • /
    • pp.1-7
    • /
    • 2016
  • In existing Convolutional Neural Network (CNNs) for object recognition task, there are only few efforts known to reduce the noises from the images. Both convolution and pooling layers perform the features extraction without considering the noises of the input image, treating all pixels equally important. In computer vision field, there has been a study to weight a pixel importance. Seam carving resizes an image by sacrificing the least important pixels, leaving only the most important ones. We propose a new way to combine seam carving approach with current existing CNN model for object recognition task. We attempt to remove the noises or the "unimportant" pixels in the image before doing convolution and pooling, in order to get better feature representatives. Our model shows promising result with CIFAR-10 dataset.

몰포러지 물체인식 알고리즘 (Morphological Object Recognition Algorithm)

  • 최종호
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.175-180
    • /
    • 2018
  • 본 논문에서는 몰포러지 연산만을 적용하여 특징을 추출하고, 물체를 인식하는 알고리즘을 제안하였다. 특징추출에서 사용한 몰포러지 연산은 에로전과 다이레이션, 에로전과 다이레이션을 연계한 오프닝과 크로우징, 몰포러지 연산을 이용한 에지 및 스케리톤 검출 연산 등이다. 특징을 기반으로 물체를 인식하는 과정에서는 차원을 축소하기 위해서 풀링 연산을 사용하였다. 다양한 형태소 중에서 $3{\times}3$ Rhombus, $3{\times}3$ Square, $5{\times}5$ Circle 형태소를 임의로 선정하여 몰포러지 연산을 수행하였다. 무작위 인터넷 영상을 대상으로 행한 실험을 통해 물체인식 분야에서 유용한 알고리즘으로 적용될 수 있다는 것을 확인하였다.

고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘 연구 (Study of Improved CNN Algorithm for Object Classification Machine Learning of Simple High Resolution Image)

  • 이협건;김영운
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.41-49
    • /
    • 2023
  • CNN(Convolutional Neural Network) 알고리즘은 인공신경망 구현에 활용되는 대표적인 알고리즘으로 기존 FNN(Fully connected multi layered Neural Network)의 문제점인 연산의 급격한 증가와 낮은 객체 인식률을 개선하였다. 그러나 IT 기기들의 급격한 발달로 최근 출시된 스마트폰 및 태블릿의 카메라에 촬영되는 이미지들의 최대 해상도는 108MP로 약 1억 8백만 화소이다. 특히 CNN 알고리즘은 고해상도의 단순 이미지를 학습 및 처리에 많은 비용과 시간이 요구된다. 이에 본 논문에서는 고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘을 제안한다. 제안하는 알고리즘은 고해상도의 이미지들의 학습모델 생성 시간을 감소하기 위해 CNN 알고리즘의 풀링계층의 Max Pooling 알고리즘 연산을 위한 인접 행렬 값을 변경한다. 변경한 행렬 값마다 4MP, 8MP, 12MP의 고해상도 이미지들의 처리할 수 있는 학습 모델들을 구현한다. 성능평가 결과, 제안하는 알고리즘의 학습 모델의 생성 시간은 12MP 기준 약 36.26%의 감소하고, 학습 모델의 객체 분류 정확도와 손실률은 기존 모델 대비 약 1% 이내로 오차 범위 안에 포함되어 크게 문제가 되지 않는다. 향후 본 연구에서 사용된 학습 데이터보다 다양한 이미지 종류 및 실제 사진으로 학습 모델을 구현한 실질적인 검증이 필요하다.

오브젝트 풀링을 이용한 FPS 디펜스 게임 개발 (Development of FPS Defense Game Using Object Pooling)

  • 임원규;안성옥;김수균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.77-78
    • /
    • 2019
  • 게임엔진을 이용한 FPS 디펜스 게임은 유니티3D 엔진을 사용하여 개발 하였으며 1인칭 시점으로 제한시간동안 몰려오는 적군을 막아내며 목표물을 지키는 게임이다. 많은 오브젝트를 관리하기 위해서 오브젝트 풀링을 사용하여 오브젝트가 생성-제거의 반복시 메모리에 부담을 주게되는 것을 씬 시작시 가용할 오브젝트를 불러온 뒤에 필요시에만 사용 하는 방법으로 메모리의 부담을 적게 하였고 플레이 기록을 랭킹으로 하여 사용자 간에 경쟁심을 유발 할 수 있도록 하였다.

  • PDF

객체 검출을 위한 트랜스포머와 공간 피라미드 풀링 기반의 YOLO 네트워크 (Transformer and Spatial Pyramid Pooling based YOLO network for Object Detection)

  • 권오준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.113-116
    • /
    • 2021
  • 일반적으로 딥러닝 기반의 객체 검출(Object Detection)기법은 합성곱 신경망(Convolutional Neural Network, CNN)을 통해 입력된 영상의 특징(Feature)을 추출하여 이를 통해 객체 검출을 수행한다. 최근 자연어 처리 분야에서 획기적인 성능을 보인 트랜스포머(Transformer)가 영상 분류, 객체 검출과 같은 컴퓨터 비전 작업을 수행하는데 있어 경쟁력이 있음이 드러나고 있다. 본 논문에서는 YOLOv4-CSP의 CSP 블록을 개선한 one-stage 방식의 객체 검출 네트워크를 제안한다. 개선된 CSP 블록은 트랜스포머(Transformer)의 멀티 헤드 어텐션(Multi-Head Attention)과 CSP 형태의 공간 피라미드 풀링(Spatial Pyramid Pooling, SPP) 연산을 기반으로 네트워크의 Backbone과 Neck에서의 feature 학습을 돕는다. 본 실험은 MSCOCO test-dev2017 데이터 셋으로 평가하였으며 제안하는 네트워크는 YOLOv4-CSP의 경량화 모델인 YOLOv4s-mish에 대하여 평균 정밀도(Average Precision, AP)기준 2.7% 향상된 검출 정확도를 보인다.

  • PDF

효율적인 온라인 게임 서버를 위한 객체풀링 기법에 관한 연구 (A Study of Object Pooling Scheme for Efficient Online Gaming Server)

  • 김혜영;함대현;김문성
    • 한국게임학회 논문지
    • /
    • 제9권6호
    • /
    • pp.163-170
    • /
    • 2009
  • 대부분의 온라인 게임서버 엔진에서의 Accept()사용한 Looping방식의 동적인 메모리 할당 방식의 사용은 다수의 클라이언트를 동시에 수용하고 진행해야하는 온라인 게임 상의 로그인 서버엔진에 많은 부하와 함께 병목현상을 유발하게 된다. 따라서 본 논문에서는 온라인상에서의 효율적인 게임서버를 위해 정적인 메모리 할당기법을 사용하여 메모리 단편화를 최소화하고, 클라이언트의 접속 시 세션연결 및 클라이언트 객체의 초기화를 위해 발생하는 부하를 최소화하기 위한 AcceptEx()를 사용한 풀링기법과 정적메모리를 생성하여 동적 할당처럼 포인터로 할당하는 메모리 풀링 기법을 합친 객체 풀링기법을 제안하고, 제안 기법을 적용한 게임엔진을 설계하여 구현한 후, 성능평가를 통해 제안한 기법의 효율성을 보였다.

  • PDF

한국어 음성데이터를 이용한 일본어 음향모델 성능 개선 (An Enhancement of Japanese Acoustic Model using Korean Speech Database)

  • 이민규;김상훈
    • 한국음향학회지
    • /
    • 제32권5호
    • /
    • pp.438-445
    • /
    • 2013
  • 본 논문은 일본어 음성인식기 신규 개발을 위해 초기에 부족한 일본어 음성데이터를 보완하는 방법이다. 일본어 발음과 한국어 발음이 유사한 특성을 근거로 한국어 음성 데이터를 이용한 일본어 음향모델 성능개선 방법에 대하여 기술하였다. 이종언어 간 음성 데이터를 섞어서 훈련하는 방법인 Cross-Language Transfer, Cross-Language Adaptation, Data Pooling Approach등 방법을 설명하고, 각 방법들의 시뮬레이션을 통해 현재 보유하고 있는 일본어 음성데이터 양에 적절한 방법을 선정하였다. 기존의 방법들은 훈련용 음성데이터가 크게 부족한 환경에서의 효과는 검증되었으나, 목적 언어의 데이터가 어느 정도 확보된 상태에서는 성능 개선 효과가 미비하였다. 그러나 Data Pooling Approach의 훈련과정 중 Tyied-List를 목적 언어로만으로 구성 하였을 때, ERR(Error Reduction Rate)이 12.8 %로 성능이 향상됨을 확인하였다.

YOLO 기반의 광학 음악 인식 기술 및 가상현실 콘텐츠 제작 방법 (YOLO based Optical Music Recognition and Virtual Reality Content Creation Method)

  • 오경민;홍요섭;백건영;전찬준
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.80-90
    • /
    • 2021
  • 딥러닝에 기반한 광학 음악 인식 기술(Optical Music Recognition, OMR)을 사용하여 도출된 결과를 가상현실 (Virtual Reality, VR) 게임에 적용시킨 것을 제안한다. 딥러닝 모델은 YOLO v5를 사용했으며 검출되지 않은 객체를 검출하기 위해 Hough transform 사용, 보표 크기 수정 등을 수행한다. 출력된 결과 파일을 사용하여 VR 게임에서 BPM, 최대 콤보 수, 음정과 박자를 분석하여 사용하고 리소스 관리를 위한 Object Pooling 기술을 통해 노트가 밀리는 현상을 방지한다. 광학 음악 인식 기술을 통해 나온 음악 요소로 VR 게임을 제작하여 VR 콘텐츠 제공과 함께 광학 음악 인식의 활용성을 넓히는 것을 확인하였다.

광적응 효과와 시각 집중 효과를 이용한 새로운 객관적 영상 화질 측정 용 하이브리드 가중치 풀링 기법 (A New Hybrid Weight Pooling Method for Object Image Quality Assessment with Luminance Adaptation Effect and Visual Saliency Effect)

  • ;김동현;최증원;정태충;배성호
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.827-835
    • /
    • 2019
  • 완전 참조 영상 화질(full-reference image quality assessment, FR-IQA)측정의 풀링 과정에 있어서, 한 영상의 전역 화질은 각 국부 패치의 측정된 화질값들로부터 측정된다. 그러나 한 영상의 전체 화질 값을 예측함에 있어서 국부 패치의 종류, 왜곡 타입, 왜곡의 인지 민감도, 국부 패치의 관심 집중(saliency) 정도에 따라 국부 패치가 전체 영상에 기여하는 왜곡의 정도가 다를 수 있다. 그 결과, 계산된 국부 패치 화질값에 대한 가중치 풀링 방법이 기존 FR-IQA 방법에서 고려되었다. 본 논문은 기존 FR-IQA 방법에서 고려되지 않은 시각인지시스템의 특성인, 광적응 효과 와 시각 관심 집중 효과를 고려한 새로운 가중치 풀링 방법을 제안한다. 실험 결과, 기존 FR-IQA 방법에 적용될 경우 예측 성능을 향상시킴을 확인하였으며, 이는 제안하는 가중치 풀링 방법은 사람의 시각인지 특성을 효과적으로 반영하기 때문으로 사료된다.

영상수준과 픽셀수준 분류를 결합한 영상 의미분할 (Semantic Image Segmentation Combining Image-level and Pixel-level Classification)

  • 김선국;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제21권12호
    • /
    • pp.1425-1430
    • /
    • 2018
  • In this paper, we propose a CNN based deep learning algorithm for semantic segmentation of images. In order to improve the accuracy of semantic segmentation, we combined pixel level object classification and image level object classification. The image level object classification is used to accurately detect the characteristics of an image, and the pixel level object classification is used to indicate which object area is included in each pixel. The proposed network structure consists of three parts in total. A part for extracting the features of the image, a part for outputting the final result in the resolution size of the original image, and a part for performing the image level object classification. Loss functions exist for image level and pixel level classification, respectively. Image-level object classification uses KL-Divergence and pixel level object classification uses cross-entropy. In addition, it combines the layer of the resolution of the network extracting the features and the network of the resolution to secure the position information of the lost feature and the information of the boundary of the object due to the pooling operation.