• 제목/요약/키워드: matrix learning

검색결과 354건 처리시간 0.037초

임베디드 보드에서의 CNN 모델 압축 및 성능 검증 (Compression and Performance Evaluation of CNN Models on Embedded Board)

  • 문현철;이호영;김재곤
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.200-207
    • /
    • 2020
  • CNN 기반 인공신경망은 영상 분류, 객체 인식, 화질 개선 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 많은 응용에서 딥러닝(Deep Learning) 모델의 복잡도 및 연산량이 방대해짐에 따라 IoT 기기 및 모바일 환경에 적용하기에는 제한이 따른다. 따라서 기존 딥러닝 모델의 성능을 유지하면서 모델 크기를 줄이는 인공신경망 압축 기법이 연구되고 있다. 본 논문에서는 인공신경망 압축기법을 통하여 원본 CNN 모델을 압축하고, 압축된 모델을 임베디드 시스템 환경에서 그 성능을 검증한다. 성능 검증을 위해 인공지능 지원 맞춤형 칩인 QCS605를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축 CNN 모델의 분류성능과 추론시간을 비교 분석한다. 본 논문에서는 이미지 분류 CNN 모델인 MobileNetV2, ResNet50 및 VGG-16에 가지치기(pruning) 및 행렬분해의 인공신경망 압축 기법을 적용하였고, 실험결과에서 압축된 모델이 원본 모델 분류 성능 대비 2% 미만의 손실에서 모델의 크기를 1.3 ~ 11.2배로 압축했을 뿐만 아니라 보드에서 추론시간과 메모리 소모량을 각각 1.2 ~ 2.1배, 1.2 ~ 3.8배 감소함을 확인했다.

인공지능(Artificial Intelligence)과 대학수학교육 (Artificial Intelligence and College Mathematics Education)

  • 이상구;이재화;함윤미
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제34권1호
    • /
    • pp.1-15
    • /
    • 2020
  • 첨단 정보통신기술(ICT)인 인공지능(AI), 사물인터넷(IoT), 빅데이터(Big Data) 등이 사회와 경제 전반에 융합돼 혁신적인 변화가 일어나는 요즘, 헬스케어, 지능형 로봇, 가정용 인공지능 시스템(스마트홈), 공유자동차 등은 이미 우리 생활에 깊이 영향을 미치고 있다. 이미 오래전부터 공장에서는 로봇이 사람 대신 일을 하고 있으며(FA, OA), 인공지능 의사도 병원에서 활동을 하고 있고(Dr. Watson), 인공지능 스피커(기가지니)와 인공지능 비서인 구글 어시스턴트가 자연어생성을 하며 우리를 돕고 있다. 이제 인공지능을 이해하는 것은 필수가 되었으며, 인공지능을 이해하기 위해서 수학의 지식은 선택이 아니라 필수가 되었다. 따라서 이런 일들을 가능하게 해주는 수학지식을 설명하는 역할이 수학자들에게 주어졌다. 이에 본 연구진은 인공지능과 머신러닝(Machine Learning, 기계학습)을 이해하기 위해 필요한 수학 개념을 우리의 실정에 맞게 한 학기(또는 두 학기) 분량으로 정리하여, 무료 전자교과서 "인공지능을 위한 기초수학"을 집필하고, 인공지능 분야에 관심이 있는 다양한 전공의 대학생과 대학원생을 대상으로 하는 강좌를 개설하였다. 본 논문에서는 그 개발과정과 운영사례를 공유한다. http://matrix.skku.ac.kr/math4ai/

신경회로망에 의한 의료영상 질환인식 (Disease Recognition on Medical Images Using Neural Network)

  • 이준행;이흥만;김태식;이상복
    • 한국방사선학회논문지
    • /
    • 제3권1호
    • /
    • pp.29-39
    • /
    • 2009
  • 본 논문에서는 신경회로망을 이용한 의료영상의 질환부위 인식방법을 제안하였다. 질환부위 인식을 위한 신경회로망은 입력층, 은닉층, 출력층으로 구성하여 적응 오차 역전파 알고리즘으로 학습하였다. 신경회로망에 입력된 의료영상의 특징 파라미터는 웨이브릿 변환에 의하여 분해된 저주파 영역을 행렬식으로 표현하여 특성 다항식의 계수값(n+1)개로 하였다. 추출된 특징 파라미터는 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용하였다. 제안된 방법의 타당성을 입증하기 위해서 실험에 사용된 입력 의료영상을 가지고 모사실험을 통해 질환부위의 인식률을 평가하였다. 실험 결과 4레벨 DWT로 변환된 저주파영역 행렬의 특성 다항식 계수를 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용했을 때 최적의 학습 횟수를 보였다. 신경회로망의 학습은 적응 오차 역전파 알고리즘을 사용하였고, 학습계수를 0.01, 모우멘텀을 0.95로 하였을 때, 위영상에 대해서는 55회, 가슴영상은 55회, CT영상은 46회, 초음파영상은 55회 그리고 혈관영상에 대해서는 157회 등의 최적의 학습 횟수를 보이며 100%의 인식률을 보였다.

  • PDF

지도학습 오토인코더를 이용한 전문어의 범용어 공간 매핑 방법론 (Domain-Specific Terminology Mapping Methodology Using Supervised Autoencoders)

  • 윤병호;김준우;김남규
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.93-110
    • /
    • 2023
  • 최근 비정형 자료인 텍스트를 벡터로 변환하고 이를 통해 다양한 목적으로 방대한 양의 자연어를 분석하는 시도가 이루어지고 있다. 특히 코퍼스 규모가 제한적일 수밖에 없는 전문적인 도메인의 텍스트에 대해서도 분석 수요가 급증하면서, 해당 전문 분야의 문서를 범용 문서와 함께 분석하기 위한 연구가 활발하게 이루어지고 있다. 특정 전문어를 해당 전문어 코퍼스 외부의 일반적인 범용어와 함께 분석하기 위해서는, 전문어 임베딩 공간을 범용어 임베딩 공간과 일치시키는 것이 필요하다. 기존에는 변환 행렬 또는 매핑 함수 등을 통해 전문어 코퍼스로부터 얻은 전문어 임베딩 값을 범용어 임베딩 공간으로 변환, 일치시키려는 시도가 있었지만, 변환 행렬을 기반으로 하는 선형 변환은 국지적인 범위에서만 근사적인 변환 효과가 있다는 일반적인 선형 변환의 한계를 극복하지 못했다. 이러한 선형 변환의 한계를 극복하기 위해 최근에는 다양한 형태의 비선형적인 변환 방법이 제안되고 있으며, 본 연구에서는 오토인코더(Autoencoder)와 회귀 모델을 동시에 학습하는 종단형 학습을 통해 전문어 임베딩 공간을 범용어 임베딩 공간으로 변환하여 임베딩 공간을 일치시키는 모델을 제안한다. 실제 "보건의료" 분야의 R&D 문서에 대해 임베딩 변환 실험을 진행한 결과, 제안 방법론이 기존의 오토인코더를 활용한 방법 대비 변환 정확도 측면에서 우수한 성능을 보임을 확인하였다.

재순환 버퍼 RLS 알고리즘에서 가중치 갱신을 이용한 개선된 수렴 특성에 관한 연구 (A study on the Improved Convergence Characteristic over Weight Updating of Recycling Buffer RLS Algorithm)

  • 나상동
    • 한국통신학회논문지
    • /
    • 제25권5B호
    • /
    • pp.830-841
    • /
    • 2000
  • We extend the sue of the method of least square to develop a recursive algorithm for the design of adaptive transversal filters such that, given the least-square estimate of this vector of the filter at iteration n-1, we may compute the updated estimate of this vector at iteration a upon the arrival of new data. We begin the development of the RLS algorithm by reviewing some basic relations that pertain to the method of least squares. Then, by exploiting a relation in matrix algebra known as the matrix inversion lemma, we develop the RLS algorithm. An important feature of the RLS algorithm is that it utilizes information contained in the input data, extending back to the instant of time when the algorithm is initiated. In this paper, we propose new tap weight updated RLS algorithm in adaptive transversal filter with data-recycling buffer structure. We prove that convergence speed of learning curve of RLS algorithm with data-recycling buffer is faster than it of exiting RL algorithm to mean square error versus iteration number. Also the resulting rate of convergence is typically an order of magnitude faster than the simple LMS algorithm. We show that the number of desired sample is portion to increase to converge the specified value from the three dimension simulation result of mean square error according to the degree of channel amplitude distortion and data-recycle buffer number. This improvement of convergence character in performance, is achieved at the (B+1)times of convergence speed of mean square error increase in data recycle buffer number with new proposed RLS algorithm.

  • PDF

MIA를 이용한 관광.휴양관련 픽토그램의 인지효과 평가 (The Multiple Index Approach for the Evaluation of Tourism and Recreation Related Pictograms)

  • 김정민;유기준
    • 한국환경생태학회지
    • /
    • 제20권3호
    • /
    • pp.319-330
    • /
    • 2006
  • 본 연구는 픽토그램(공공안내 그림표지)중 관광과 휴양활동에 관련된 픽토그램에 대한공공의 이해정도를 측정하여 픽토그램의 식별가능성과 인지효과를 탐색하기 위한 목적으로 수행되었다. 이를 위해 한국표준기준으로 채택된 300개의 픽토그램 중 25개 픽토그램을 우선 조사대상으로 선정하여 관광 전공 대학생 64명을 표본으로 Multiple Index Approach(MIA)에 의한 실험조사를 실시하였다. 조사결과, 25개 픽토그램에 대한 전반적 이해도는 65.82%로 나타났으나 인지 수준에 있어 픽토그램별로 차이가 많이 나타났다. 정답률이 높은 픽토그램의 경우 주관적 확신성과 주관적 적합성 모두 높게 나타났고, 오답률이 높았던 픽토그램의 경우에는 양자 모두 낮은수치를 보였다. 또한 주관적 확신성과 주관적 적합성에 대한 매트릭스 분석 결과 14개의 픽토그램이 인지효과가 높은 픽토그램군에 속하였으며, 그 외 11개 픽토그램은 향후 학습에 의한 인지도 증진 노력이나 디자인의 개선이 요망되는 픽토그램군으로 분류되었다.

GPU 가속기를 통한 비트 연산 최적화 및 DNN 응용 (Bit Operation Optimization and DNN Application using GPU Acceleration)

  • 김상혁;이재흥
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1314-1320
    • /
    • 2019
  • 본 논문에서는 소프트웨어 환경에서 비트연산을 최적화 하고 DNN으로 응용하는 방법을 제안한다. 이를 위해 비트연산 최적화를 위한 패킹 함수와 DNN으로 응용을 위한 마스킹 행렬 곱 연산을 제안한다. 패킹 함수의 경우는 32bit의 실제 가중치값을 2bit로 변환하는 연산을 수행한다. 연산을 수행할 땐, 임계값 비교 연산을 통해 2bit 값으로 변환한다. 이 연산을 수행하면 4개의 32bit값이 1개의 8bit 메모리에 들어가게 된다. 마스킹 행렬 곱 연산의 경우 패킹된 가중치 값과 일반 입력 값을 곱하기 위한 특수한 연산으로 이루어져 있다. 그리고 각각의 연산은 GPU 가속기를 이용해 병렬로 처리되게 하였다. 그 결과 HandWritten 데이터 셋에 환경에서 32bit DNN 모델에 비해 약 16배의 메모리 절약을 볼 수 있었다. 그럼에도 정확도는 32bit 모델과 비슷한 1% 이내의 차이를 보였다.

공분산과 모듈로그램을 이용한 콘볼루션 신경망 기반 양서류 울음소리 구별 (Convolutional neural network based amphibian sound classification using covariance and modulogram)

  • 고경득;박상욱;고한석
    • 한국음향학회지
    • /
    • 제37권1호
    • /
    • pp.60-65
    • /
    • 2018
  • 본 논문에서는 양서류 울음소리 구별을 CNN(Convolutional Neural Network)에 적용하기 위한 방법으로 공분산 행렬과 모듈로그램(modulogram)을 제안한다. 먼저, 멸종 위기 종을 포함한 양서류 9종의 울음소리를 자연 환경에서 추출하여 데이터베이스를 구축했다. 구축된 데이터를 CNN에 적용하기 위해서는 길이가 다른 음향신호를 정형화하는 과정이 필요하다. 음향신호를 정형화하기 위해서 분포에 대한 정보를 나타내는 공분산 행렬과 시간에 대한 변화를 내포하는 모듈로그램을 추출하여, CNN의 입력으로 사용했다. CNN은 convolutional layer와 fully-connected layer의 수를 변경해 가며 실험하였다. 추가적으로, CNN의 성능을 비교하기 위해 기존에 음향 신호 분석에서 쓰이는 알고리즘과 비교해보았다. 그 결과, convolutional layer가 fully-connected layer보다 성능에 큰 영향을 끼치는 것을 확인했다. 또한 CNN을 사용하였을 때 99.07 % 인식률로, 기존에 음향분석에 쓰이는 알고리즘 보다 높은 성능을 보인 것을 확인했다.

도심 영상에서의 비음수행렬분해를 이용한 차량 인식 (Vehicle Recognition using NMF in Urban Scene)

  • 반재민;이병래;강현철
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.554-564
    • /
    • 2012
  • 차량인식은 차량 후보영역 검출단계와 검출된 후보 영역에서 특징을 기반으로 차량을 검증하는 차량 검증단계로 나누어진다. 선형 변환 방식의 특징은 차원 감소 효과와 통계적인 특징을 지니게 되어, 이동이나 회전에 강인한 특성을 갖는다. 선형 변환 방식 중 비음수행렬분해(Non-negative Matrix Factorization, NMF)는 부분 기반 표현 방식으로 차량의 국소적인 특징을 기저벡터로 사용하여 희소성을 갖는 특징을 추출할 수 있기 때문에 도심영상에서 발생하는 차폐 영역에 따른 인식률 저하를 방지할 수 있다. 본 논문에서는 차량 인식에 적합한 NMF 특징 추출 방법을 제안하고, 인식률을 검증하였다. 또한 희소성 제약 조건을 이용하여 기저 벡터에 희소성을 가지는 SNMF(Sparse NMF)와 LVQ2(Learning Vector Quantization) 신경 회로망을 결합하여 차폐 영역에 대한 차량 인식 효율을 기존의 NMF를 이용한 방법과 비교하였다. NMF를 이용하는 특징은 차량이 혼재되어 차폐 영역이 빈번히 발생하는 도심에서도 강건한 특징임을 보였다.

디지털 영상 픽셀값의 경사도를 이용한 Downscaling Forgery 검출 (Downscaling Forgery Detection using Pixel Value's Gradients of Digital Image)

  • 이강현
    • 전자공학회논문지
    • /
    • 제53권2호
    • /
    • pp.47-52
    • /
    • 2016
  • 스마트 기기와 소형 디스플레이에 사용되는 디지털 영상은 다운스케일링 (Downscaling)된 영상이 사용된다. 본 논문에서는 영상 픽셀값의 경사도에 따른 특징벡터를 이용한 다운스케일링 포저리 (Forgery) 영상 검출 알고리즘을 제안한다. 제안된 알고리즘에서, 원영상의 픽셀값 경사도로부터 자기회귀 (AR: Autoregressive) 계수를 계산한다. 이는 다운스케일링 포저리 영상 검출기의 SVM (Support Vector Machine) 분류를 위한 학습에 사용된다. 제안된 다운스케일링 검출 알고리즘은 동일 10-Dim. 특징벡터의 MFR (Median Filter Residual) 스킴과 686-Dim.의 SPAM (Subtractive Pixel Adjacency Matrix) 스킴과 비교하여 다운스케일링 90% 영상 포저리에서 성능이 우수하며, 평균필터링 ($3{\times}3$) 영상과 미디언필터링 ($3{\times}3$) 영상에서 높은 검출율을 보여 주었다. 특히, 평균필터링과 미디언필터링 영상에서는 성능평가 전체 항목에서 민감도 (Sensitivity; TP: True Positive rate)와 1-특이도 (1-Specificity; FP: False Positive rate)의 AUC (Area Under Curve)가 모두 1에 수렴하여 'Excellent (A)' 등급임을 확인하였다.