• 제목/요약/키워드: 풀링

검색결과 89건 처리시간 0.022초

GP-GPU를 이용한 보행자 추론 CNN (Pedestrian Inference Convolution Neural Network Using GP-GPU)

  • 정준모
    • 전기전자학회논문지
    • /
    • 제21권3호
    • /
    • pp.244-247
    • /
    • 2017
  • 본 논문에서는 GP-GPU를 활용한 보행자 추론 컨볼루션 뉴럴 네트워크를 구현했다. CNN은 구조를 정한 후, 학습에서 얻은 가중치를 이용해 기존 연구인 256개의 스레드를 가지는 GP-GPU를 활용해 추론을 수행했다. 학습에는 Inter i7-4470 CPU와 Matlab을 사용했다. Dataset은 Daimler Pedestrian Dataset을 사용했다. GP-GPU는 PCIe를 이용해 PC로부터 제어를 받으며, FPGA로 동작한다. 각 레이어의 depth와 size에 따라 스레드를 할당했다. 풀링 레이어의 경우는 over warpping pooling을 사용했기 때문에 횡영역과 종영역에 추가적인 연산을 수행했다. 한 번의 추론에는 약 12ms가 걸린다.

몰포러지 물체인식 알고리즘 (Morphological Object Recognition Algorithm)

  • 최종호
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.175-180
    • /
    • 2018
  • 본 논문에서는 몰포러지 연산만을 적용하여 특징을 추출하고, 물체를 인식하는 알고리즘을 제안하였다. 특징추출에서 사용한 몰포러지 연산은 에로전과 다이레이션, 에로전과 다이레이션을 연계한 오프닝과 크로우징, 몰포러지 연산을 이용한 에지 및 스케리톤 검출 연산 등이다. 특징을 기반으로 물체를 인식하는 과정에서는 차원을 축소하기 위해서 풀링 연산을 사용하였다. 다양한 형태소 중에서 $3{\times}3$ Rhombus, $3{\times}3$ Square, $5{\times}5$ Circle 형태소를 임의로 선정하여 몰포러지 연산을 수행하였다. 무작위 인터넷 영상을 대상으로 행한 실험을 통해 물체인식 분야에서 유용한 알고리즘으로 적용될 수 있다는 것을 확인하였다.

몰포러지 신경망 기반 딥러닝 시스템 (Deep Learning System based on Morphological Neural Network)

  • 최종호
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.92-98
    • /
    • 2019
  • 본 논문에서는 몰포러지 연산을 기본으로 하는 몰포러지 신경망(MNN: Morphological Neural Network) 기반 딥러닝 시스템을 제안하였다. 딥러닝에 사용되는 레이어는 몰포러지 레이어, 풀링 레이어, ReLU 레이어, Fully connected 레이어 등이다. 몰포러지 레이어에서 사용되는 연산은 에로전, 다이레이션, 에지검출 등이다. 본 논문에서 새롭게 제안한 MNN은 기존의 CNN(Convolutional Neural Network)을 이용한 딥러닝 시스템과는 달리 히든 레이어의 수와 각 레이어에 적용되는 커널 수가 제한적이다. 레이어 단위 처리시간이 감소하고, VLSI 칩 설계가 용이하다는 장점이 있으므로 모바일 임베디드 시스템에 딥러닝을 다양하게 적용할 수 있다. MNN에서는 제한된 수의 커널로 에지와 형상검출 등의 연산을 수행하기 때문이다. 데이터베이스 영상을 대상으로 행한 실험을 통해 MNN의 성능 및 딥러닝 시스템으로의 활용 가능성을 확인하였다.

팽창된 합성곱 계층 연산 풀링을 이용한 멀티 모달 네트워크 성능 향상 방법 (Improved Multi-modal Network Using Dilated Convolution Pyramid Pooling)

  • 박준영;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.84-86
    • /
    • 2018
  • 요즘 자율주행과 같은 최신 기술의 발전과 더불어 촬영된 영상 장면에 대한 깊이있는 이해가 필요하게 되었다. 특히, 기계학습 기술이 발전하면서 카메라로 찍은 영상에 대한 의미론적 분할 기술에 대한 연구도 활발히 진행되고 있다. FuseNet은 인코더-디코더 구조를 이용하여 장면 내에 있는 객체에 대한 의미론적 분할 기술을 적용할 수 있는 신경망 모델이다. FuseNet은 오직 RGB 입력을 받는 기존의 FCN보다 깊이정보까지 활용하여 RGB 정보를 기반으로 추출한 특징지도와의 요소합 연산을 통해 멀티 모달 구조를 구현했다. 의미론적 분할 연구에서는 객체의 전역 컨텍스트가 고려되는 것이 중요한데, 이를 위해 여러 계층을 깊게 쌓으면 연산량이 많아지는 단점이 있다. 이를 극복하기 위해서 기존의 합성곱 방식을 벗어나 새롭게 제안된 팽창 합성곱 연산(Dilated Convolution)을 이용하면 객체의 수용 영역이 효과적으로 넓어지고 연산량이 적어질 수 있다. 본 논문에서는 컨볼루션 연산의 새로운 방법론적 접근 중 하나인 팽창된 합성곱 연산을 이용해 의미론적 분할 연구에서 새로운 멀티 모달 네트워크의 성능 향상 방법을 적용하여 계층을 더 깊게 쌓지 않더라도 파라미터의 증가 없이 해상도를 유지하면서 네트워크의 전체 성능을 향상할 수 있는 최적화된 방법을 제안한다.

  • PDF

영상 화질 평가 딥러닝 모델 재검토: 스트라이드 컨볼루션이 풀링보다 좋은가? (Revisiting Deep Learning Model for Image Quality Assessment: Is Strided Convolution Better than Pooling?)

  • 우딘 에이에프엠 사합;정태충;배성호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.29-32
    • /
    • 2020
  • Due to the lack of improper image acquisition process, noise induction is an inevitable step. As a result, objective image quality assessment (IQA) plays an important role in estimating the visual quality of noisy image. Plenty of IQA methods have been proposed including traditional signal processing based methods as well as current deep learning based methods where the later one shows promising performance due to their complex representation ability. The deep learning based methods consists of several convolution layers and down sampling layers for feature extraction and fully connected layers for regression. Usually, the down sampling is performed by using max-pooling layer after each convolutional block. We reveal that this max-pooling causes information loss despite of knowing their importance. Consequently, we propose a better IQA method that replaces the max-pooling layers with strided convolutions to down sample the feature space and since the strided convolution layers have learnable parameters, they preserve optimal features and discard redundant information, thereby improve the prediction accuracy. The experimental results verify the effectiveness of the proposed method.

  • PDF

지식 기반 다중 대화 시스템을 위한 주의 집중 지식 선택 모델 (Attentive Knowledge Selection Model for Knowledge-Grounded Multi-turn Dialogue System)

  • 이도행;장영진;황금하;오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-364
    • /
    • 2021
  • 지식 기반 다중 대화 시스템은 지식 정보를 포함한 응답을 생성하는 대화 시스템이다. 이 시스템은 응답 생성에 필요한 지식 정보를 찾아내는 지식 선택 작업과 찾아낸 지식 정보를 바탕으로 문맥을 고려한 응답을 생성하는 응답 생성 작업으로 구성된다. 본 논문에서는 지식 선택 작업을 기계독해 프레임워크에 적용하여 해결하는 방법을 제안한다. 지식 선택 작업은 여러 개의 발화로 이루어진 대화 기록을 바탕으로 지식 문서 내에 존재하는 지식을 찾아내는 작업이다. 본 논문에서는 대화 기록 모델링 계층을 활용해 마지막 발화와 관련 있는 대화 기록을 찾아내고, 주의 집중 풀링 계층을 활용해 긴 길이의 지식을 효과적으로 추출하는 방법을 제안한다. 실험 결과, 목적지향 지식 문서 기반 대화 데이터 셋인 Doc2dial 데이터의 지식 선택 작업에서 F1 점수 기준 76.52%, EM 점수 기준 66.21%의 성능을 기록해 비교 모델 보다 높은 성능을 기록하는 것을 확인할 수 있었다.

  • PDF

계산 속도와 왜곡 강인성을 동시 고려한 이미지 품질 평가 (Image Quality Assessment Considering both Computing Speed and Robustness to Distortions)

  • 김석원;홍성우;진정찬;김영진
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.992-1004
    • /
    • 2017
  • 이미지 품질을 정확히 평가하기 위해 이미지 평가 도구는 인간 시각 시스템을 반영해야 한다. 즉, 이미지의 구조, 색, 명암 비 등 여러 가지 요소들을 고려하여 평가해야 한다. 또한 스마트 폰과 같은 모바일 임베디드 기기의 폭넓은 사용에 따라 빠른 수행 속도를 갖는 것이 중요하다. 본 논문에서는 인간 시각 만족과 빠른 계산속도 달성을 동시에 얻기 위하여 색 유사도, 변화율 유사도, 위상 유사도를 상승적으로 결합하였고 최적화된 이미지 풀링 및 양자화 기반으로 설계하였다. 제안하는 기법은 기존에 존재하는 13개의 기법과 비교하였고 네 가지 검증 도구를 사용하여 성능을 검증하였다. 실험 결과 세 검증 도구에서 가장 우수한 성능을 보였고 한 검증 도구에서 기존 최고 기법인 VSI에 이어 두 번째로 좋은 성능을 보였으며 실행 속도는 VSI에 대해 평균 약 20% 개선된 결과를 얻었다. 또한 기존의 기법들 보다 더 인간 시각 시스템과 제안 기법의 품질 평가 값의 연관성이 크게 존재함을 확인하였다.

자바기반 WAP 상의 우선순위 트랜잭션 계층의 설계 및 구현 (Design and Implementation of a Java-Based WAP Transaction Layer with Priority Policy)

  • 이준규;임경수;안순신
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권2호
    • /
    • pp.244-251
    • /
    • 2003
  • 인터넷과 무선 이동통신 둥이 실생활에 보편화되면서 두 기술을 접목한 WAP(Wireless Application Protocol)[1]이 등장하였고, 다수의 사용자 요구를 동시에 효율적으로 처리하면 서 다양한 무선 단말기로부터 요청을 신속하게 처리할 수 있는 WAP 게이트웨이(WAP gateway)에 대한 연구가 여러 연구 그룹에서 수행되고 있으며, 이에 대한 효율적인 처리가 필수적이다. WAP 스택[2]은 이러한 연구 중의 가장 기본적인 기술이다. 본 논문에서는 Java의 기본적인 서비스인 멀티쓰레드를 이용하고, 컨테이너 유효 리소스의 효율적 관리를 위해 접속 풀링(connection peeling) 기능을 적용하여 WAP container를 구현하며, 우선순위 정책에 기반한 WAP Protocol의 WTP(Wireless Transaction Protocol)[3] 계층 및 UDP(User Datagram Protocol)[4] 계층을 설계하고 구현함으로 우선순위가 높은 트랜잭션들에 대해 기존 시스템보다 신속히 처리할 수 있는 기능을 구현하였고 모의 실험을 통해 그 효율성을 입증하였다.

벤처기업의 성장 촉진을 위한 벤처부채의 가능성과 도입방안 (The Possibility and the Way to Introduce of Venture Debt to Encourage Growth of Ventures)

  • 홍종수;나수미;박재성
    • 벤처창업연구
    • /
    • 제15권4호
    • /
    • pp.17-25
    • /
    • 2020
  • 벤처부채는 벤처의 스케일업 촉진을 위한 대표적인 자금공급 수단이다. 성장 단계에서 대규모 자금 공급이 필요한 벤처기업은 지분 희석 없이 벤처부채를 지렛대로 성장을 가속화할 수 있고, 벤처캐피탈은 투자 기업의 성장이 가속화됨으로써 신속히 투자자금을 회수할 수 있다. 은행은 벤처부채의 공급을 통해 대출에 편중된 자산운용을 다양화할 수 있고 자산수익률도 제고할 수 있다. 해외 실리콘밸리은행의 사례와 같이 벤처부채 공급을 위해서는 부채자본 공급자인 은행과 지분자본을 공급하는 벤처캐피탈의 긴밀한 협력이 전제되어야 한다. 이를 위한 시장 조성 방안으로 "신용위험 분담형 벤처대출"과 "벤처대출 풀링"을 제안한다. 전자는 모태펀드와 정책보증과 같은 정책금융기관이 벤처대출에 내재한 위험을 선별하거나 우선 인수함으로써 은행의 벤처투자 시장 참여를 촉진하며, 후자는 은행과 창업벤처전문 사모펀드가 공동으로 벤처대출을 증권화함으로써 은행의 개별적인 벤처대출 실행에 따른 부담을 감소시킨다.

스트림 데이터 학습을 위한 예측적 컨볼루션 신경망 (Predictive Convolutional Networks for Learning Stream Data)

  • 허민오;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.614-618
    • /
    • 2016
  • 인터넷 상 데이터와 스마트 디바이스가 증가함에 따라 순차적으로 유입되는 스트림 형식의 데이터가 늘어나고 있다. 잠재적인 빅데이터인 스트림 데이터를 다루기 위해서는 온라인 학습이 가능해야 한다. 이에 본 고에서는 스트림 데이터 학습을 위한 새로운 모델인 예측적 컨볼루션 신경망과 온라인 학습방법을 제안한다. 이 모델은 탐지와 풀링을 반복하는 컨볼루션 연산을 통해 탐지 패턴을 계층화하여 상위 계층이 될수록 긴 길이의 패턴의 정보를 다루도록 한다. 본 모델의 기초적 검증을 위해 스마트폰으로 2달간 수집한 GPS 데이터를 이산화하여 관측데이터로 삼았다. 이를 제안모델을 통해 학습하여 계층을 따라 추상화된 정보로부터 복원한 데이터와 관측데이터를 비교하여, 긴 시간의 패턴을 다루면서도 관측 수준의 데이터를 복원하는 것을 확인하였다.