• 제목/요약/키워드: CNN structure

검색결과 178건 처리시간 0.024초

컨볼루션 신경망 기반 홍채 병변 분류 알고리즘 설계 (Convolutional neural network-based iris lesion classification algorithm)

  • 서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.295-296
    • /
    • 2021
  • 홍채 진단학에서 홍채는 색과 홍채 구조의 변화에 따라 인간 조직, 장기들의 비정상적인 변화가 생길시 홍채지도상 해당 영역에 변화가 발생한다. 이를 통해 비정상적인 변화가 생긴 장기의 상태를 판단하거나 선천적으로 가지고 있는 병변의 유무를 판단할 수 있다. 본 논문에서는 다양한 딥러닝 신경망 중 이미지를 이용하여 학습을 진행하는데 강점을 가지고 있는 컨볼루션 신경망을 이용하여 홍채상에 나타난 병변을 분류하는 신경망 알고리즘을 설계할 것이다.

  • PDF

Low Resolution Infrared Image Deep Convolution Neural Network for Embedded System

  • Hong, Yong-hee;Jin, Sang-hun;Kim, Dae-hyeon;Jhee, Ho-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.1-8
    • /
    • 2021
  • 본 논문은 저해상도 적외선영상을 사양이 낮은 임베디드 시스템에서 추론 가능하도록 강화된 VGG 스타일과 Global Average Pooling 조합으로 정확도를 증가시키면서 연산량을 최소화하는 딥러닝 컨볼루션 신경망을 이용한 저해상도 적외선 표적 분류 방법을 제안한다. 제안한 알고리즘은 OKTAL-SE로 생성한 합성영상 클래스 9개 3,723,328개를 분류하였다. 최초 임베디드 추론 가능하도록 파라메터 수가 최소화된 최대풀링 레이어 기준 입력단 8개와 출력단 8개 조합에 비해 강화된 VGG 스타일을 적용한 입력단 4개와 출력단 16개 필터수 조합을 이용하여 연산량은 약 34% 감소시켰으며, 정확도는 약 2.4% 증가시켜 최종 정확도 96.1%을 획득하였다. 추가로 C 코드로 포팅하여 수행시간을 확인하였으며, 줄어든 연산량 만큼 수행 시간이 약 32% 줄어든 것을 확인할 수 있었다.

계층적 보조 경계 추출을 이용한 단일 영상의 초해상도 기법 (Single Image Super Resolution using sub-Edge Extraction based on Hierarchical Structure)

  • 한현호
    • 디지털정책학회지
    • /
    • 제1권2호
    • /
    • pp.53-59
    • /
    • 2022
  • 본 논문에서는 단일 영상을 기반으로 초해상도를 생성하는 과정에서 계층 구조를 거쳐 추출된 보조 경계 특징을 이용한 방법을 제안하였다. 초해상도의 품질을 향상시키기 위해서는 영상 내 경계 영역을 선명하게 표현하면서도 각 영역의 형태를 명확하게 구분하여야 한다. 제안하는 방법은 초해상도 과정에서 품질을 결정하는 중요한 요인인 경계 영역을 입력 영상의 구조적 형태를 유지하면서 개선된 초해상도 결과를 생성하기 위해 딥러닝 기반의 초해상도 방법에서 영상의 경계 영역 정보를 보조적으로 활용하는 구조를 사용하였다. 딥러닝 기반의 초해상도를 수행하기 위한 그룹 컨볼루션 구조에 더해 보조 경계 추출을 위한 고주파 대역의 정보를 기반으로 별도의 계층적 구조의 경계 누적 추출 과정을 수행하여 이를 보조 특징으로써 활용하는 방법을 제안하였다. 실험 결과 기존 초해상도 대비 PSNR과 SSIM에서 약 1%의 성능 향상을 보였다.

합성곱 순환 신경망 구조를 이용한 지진 이벤트 분류 기법 (Earthquake events classification using convolutional recurrent neural network)

  • 구본화;김관태;장수;고한석
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.592-599
    • /
    • 2020
  • 본 논문은 다양한 지진 이벤트 분류를 위해 지진 데이터의 정적인 특성과 동적인 특성을 동시에 반영할 수 있는 합성곱 순환 신경망(Convolutional Recurrent Neural Net, CRNN) 구조를 제안한다. 중규모 지진뿐만 아니라 미소 지진, 인공 지진을 포함한 지진 이벤트 분류 문제를 해결하려면 효과적인 특징 추출 및 분류 방법이 필요하다. 본 논문에서는 먼저 주의 기반 합성곱 레이어를 통해 지진 데이터의 정적 특성을 추출 하게 된다. 추출된 특징은 다중 입력 단일 출력 장단기메모리(Long Short-Term Memory, LSTM) 네트워크 구조에 순차적으로 입력되어 다양한 지진 이벤트 분류를 위한 동적 특성을 추출하게 되며 완전 연결 레이어와 소프트맥스 함수를 통해 지진 이벤트 분류를 수행한다. 국내외 지진을 이용한 모의 실험 결과 제안된 모델은 다양한 지진 이벤트 분류에 효과적인 모습을 보여 주었다.

LSTM Network with Tracking Association for Multi-Object Tracking

  • Farhodov, Xurshedjon;Moon, Kwang-Seok;Lee, Suk-Hwan;Kwon, Ki-Ryong
    • 한국멀티미디어학회논문지
    • /
    • 제23권10호
    • /
    • pp.1236-1249
    • /
    • 2020
  • In a most recent object tracking research work, applying Convolutional Neural Network and Recurrent Neural Network-based strategies become relevant for resolving the noticeable challenges in it, like, occlusion, motion, object, and camera viewpoint variations, changing several targets, lighting variations. In this paper, the LSTM Network-based Tracking association method has proposed where the technique capable of real-time multi-object tracking by creating one of the useful LSTM networks that associated with tracking, which supports the long term tracking along with solving challenges. The LSTM network is a different neural network defined in Keras as a sequence of layers, where the Sequential classes would be a container for these layers. This purposing network structure builds with the integration of tracking association on Keras neural-network library. The tracking process has been associated with the LSTM Network feature learning output and obtained outstanding real-time detection and tracking performance. In this work, the main focus was learning trackable objects locations, appearance, and motion details, then predicting the feature location of objects on boxes according to their initial position. The performance of the joint object tracking system has shown that the LSTM network is more powerful and capable of working on a real-time multi-object tracking process.

WFSO 알고리즘을 이용한 인공 신경망과 합성곱 신경망의 학습 (Training Artificial Neural Networks and Convolutional Neural Networks using WFSO Algorithm)

  • 장현우;정성훈
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.969-976
    • /
    • 2017
  • 본 논문에서는 최적화 알고리즘으로 개발된 WFSO(Water Flowing and Shaking Optimization) 알고리즘을 사용한 인공신경망 과합성공 신경망의 학습 방법을 제안한다. 최적화 알고리즘은 다수의 후보 해를 기반으로 탐색해 나가기 때문에 일반적으로 속도가 느린 단점이 있으나 지역 최소값에 거의 빠지지 않고 병렬화가 용이하며 미분 불가능한 활성화함수를 갖는 인공신경망 학습도 가능하고 구조와 가중치를 동시에 최적화 할 수 있는 장점이 있다. 본 논문에서는 WFSO 알고리즘을 인공신경망 학습에 적용하는 방법을 설명하고 다층 인공신경망과 합성곱 신경망에서 오류역전파 알고리즘과 성능을 비교한다.

영상수준과 픽셀수준 분류를 결합한 영상 의미분할 (Semantic Image Segmentation Combining Image-level and Pixel-level Classification)

  • 김선국;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제21권12호
    • /
    • pp.1425-1430
    • /
    • 2018
  • In this paper, we propose a CNN based deep learning algorithm for semantic segmentation of images. In order to improve the accuracy of semantic segmentation, we combined pixel level object classification and image level object classification. The image level object classification is used to accurately detect the characteristics of an image, and the pixel level object classification is used to indicate which object area is included in each pixel. The proposed network structure consists of three parts in total. A part for extracting the features of the image, a part for outputting the final result in the resolution size of the original image, and a part for performing the image level object classification. Loss functions exist for image level and pixel level classification, respectively. Image-level object classification uses KL-Divergence and pixel level object classification uses cross-entropy. In addition, it combines the layer of the resolution of the network extracting the features and the network of the resolution to secure the position information of the lost feature and the information of the boundary of the object due to the pooling operation.

2.5D human pose estimation for shadow puppet animation

  • Liu, Shiguang;Hua, Guoguang;Li, Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권4호
    • /
    • pp.2042-2059
    • /
    • 2019
  • Digital shadow puppet has traditionally relied on expensive motion capture equipments and complex design. In this paper, a low-cost driven technique is presented, that captures human pose estimation data with simple camera from real scenarios, and use them to drive virtual Chinese shadow play in a 2.5D scene. We propose a special method for extracting human pose data for driving virtual Chinese shadow play, which is called 2.5D human pose estimation. Firstly, we use the 3D human pose estimation method to obtain the initial data. In the process of the following transformation, we treat the depth feature as an implicit feature, and map body joints to the range of constraints. We call the obtain pose data as 2.5D pose data. However, the 2.5D pose data can not better control the shadow puppet directly, due to the difference in motion pattern and composition structure between real pose and shadow puppet. To this end, the 2.5D pose data transformation is carried out in the implicit pose mapping space based on self-network and the final 2.5D pose expression data is produced for animating shadow puppets. Experimental results have demonstrated the effectiveness of our new method.

Correcting Misclassified Image Features with Convolutional Coding

  • 문예지;김나영;이지은;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.11-14
    • /
    • 2018
  • The aim of this study is to rectify the misclassified image features and enhance the performance of image classification tasks by incorporating a channel- coding technique, widely used in telecommunication. Specifically, the proposed algorithm employs the error - correcting mechanism of convolutional coding combined with the convolutional neural networks (CNNs) that are the state - of- the- arts image classifier s. We develop an encoder and a decoder to employ the error - correcting capability of the convolutional coding. In the encoder, the label values of the image data are converted to convolutional codes that are used as target outputs of the CNN, and the network is trained to minimize the Euclidean distance between the target output codes and the actual output codes. In order to correct misclassified features, the outputs of the network are decoded through the trellis structure with Viterbi algorithm before determining the final prediction. This paper demonstrates that the proposed architecture advances the performance of the neural networks compared to the traditional one- hot encoding method.

  • PDF

딥러닝 및 영상처리 기술을 활용한 콘크리트 균열 검출 방법 (A Method for Detecting Concrete Cracks using Deep-Learning and Image Processing)

  • 정서영;이슬기;박찬일;조수영;유정호
    • 대한건축학회논문집:구조계
    • /
    • 제35권11호
    • /
    • pp.163-170
    • /
    • 2019
  • Most of the current crack investigation work consists of visual inspection using simple measuring equipment such as crack scale. These methods involve the subjection of the inspector, which may lead to differences in the inspection results prepared by the inspector, and may lead to a large number of measurement errors. So, this study proposes an image-based crack detection method to enhance objectivity and efficiency of concrete crack investigation. In this study, YOLOv2 was used to determine the presence of cracks in the image information to ensure the speed and accuracy of detection for real-time analysis. In addition, we extracted shapes of cracks and calculated quantitatively, such as width and length using various image processing techniques. The results of this study will be used as a basis for the development of image-based facility defect diagnosis automation system.