• 제목/요약/키워드: CNN structure

검색결과 178건 처리시간 0.021초

수정된 카오스 신경망을 이용한 무제약 서체 숫자 인식 (Recognition of Unconstrained Handwritten Numerals using Modified Chaotic Neural Networks)

  • 최한고;김상희;이상재
    • 융합신호처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.44-52
    • /
    • 2001
  • 본 논문은 수정된 카오틱 신경망(MCNN)을 이용하여 완전 무제약 서체 숫자 인식을 다루고 있다. 카오틱 신경망(CNN)의 동적 특성과 학습과정을 강화함으로써 복잡한 패턴인식 문제를 해결할 수 있는 유용한 신경망으로 수정하였다. MCNN은 신경망 구조와 뉴런 자체가 높은 차수의 비선형 동적특성을 갖고 있으므로 복잡한 서체 숫자를 분류할 수 있는 적합한 신경망이다. 숫자 확인은 원래의 숫자 이미지로부터 특징을 추출하고 MCNN에 근거한 분류기를 이용하여 숫자를 인식한다. MCNN 분류기의 성능은 Canada, Montreal의 Concordia 대학의 숫자 데이터 베이스로 평가하였다. 인식성능의 상대적인 비교를 위해 MCNN 분류기는 리커런트 신경망(RNN) 분류기와 비교하였다. 실험결과에 의하면 인식율은 98.0%이었으며, 이는 MCNN 분류기가 같은 데이터 베이스에 대해 발표되었던 다른 분류기와 RNN 분류기보다 성능이 우수함을 나타낸다.

  • PDF

Fast R-CNN을 이용한 객체 인식 기반의 도로 노면 파손 탐지 기법 (Road Surface Damage Detection based on Object Recognition using Fast R-CNN)

  • 심승보;전찬준;류승기
    • 한국ITS학회 논문지
    • /
    • 제18권2호
    • /
    • pp.104-113
    • /
    • 2019
  • 도로 관리 주체는 도로 파손을 보수하기 위해 적지 않은 비용을 투입한다. 이러한 파손은 자연 요인과 노후화로 인하여 필연적으로 발생을 하는데, 효율적인 보수를 위한 유지보수 기술이 필요하다. 이런 수요에 대응하기 위해 여러 가지 기술들이 개발되고 적용되고 있지만, 최근 들어서는 차량용 블랙박스 형태로 수집한 영상 정보를 바탕으로 도로 노면 파손 유지 보수기술이 개발되고 있다. 이 파손 영역을 추출하는 방법에는 여러 가지가 있지만, 본 논문에서는 최근 활발히 연구되고 있는 심층 신경망 구조의 영상인식 기술에 대해 논하고자 한다. 특히 영역 기반의 합성곱 알고리즘을 이용하여 영상 내에서 도로 파손 유무와 그 영역을 추정할 수 있는 새로운 심층 신경망을 소개한다. 이를 개발하기 위해 실제 주행을 통해서 600여장의 영상 데이터를 수집하였고, 이를 활용하여 학습을 수행하였다. 그 결과 기존 모델과 성능을 비교하여 10.67% 향상된 신경망을 개발하였다.

사물인식을 위한 딥러닝 모델 선정 플랫폼 (Deep Learning Model Selection Platform for Object Detection)

  • 이한솔;김영관;홍지만
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.66-73
    • /
    • 2019
  • 최근 컴퓨터 비전을 활용한 사물인식 기술이 센서 기반 사물인식 기술을 대체할 기술로 주목을 받고 있다. 센서 기반 사물인식 기술은 일반적으로 고가의 센서를 필요로 하기 때문에 기술이 상용화되기 어렵다는 문제가 있었다. 반면 컴퓨터 비전을 활용한 사물인식 기술은 고가의 센서 대신 비교적 저렴한 카메라를 사용할 수 있다. 동시에 CNN이 발전하면서 실시간 사물인식이 가능해진 이후 IoT, 자율주행자동차 등 타 분야에 활발하게 도입되고 있다. 그러나 사물 인식 모델을 상황에 알맞게 선택하고 학습시키기 위해서는 딥러닝에 대한 전문적인 지식을 요구하기 때문에 비전문가가 사물 인식 모델을 사용하기에는 어려움이 따른다. 따라서 본 논문에서는 딥러닝 기반 사물인식 모델들의 구조와 성능을 분석하고, 사용자가 원하는 조건의 최적의 딥러닝 기반 사물 인식 모델을 스스로 선정할 수 있는 플랫폼을 제안한다. 또한 통계에 기반한 사물 인식 모델 선정이 필요한 이유를 실험을 통해 증명한다.

효율적인 객체 검출을 위해 Attention Process를 적용한 경량화 모델에 대한 연구 (A Study on Lightweight Model with Attention Process for Efficient Object Detection)

  • 박찬수;이상훈;한현호
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.307-313
    • /
    • 2021
  • 본 논문에서는 기존 객체 검출 방법 대비 매개변수를 감소시킨 경량화 네트워크를 제안하였다. 현재 사용되는 검출 모델의 경우 정확도 향상을 위해 네트워크 복잡도를 크게 늘렸다. 따라서, 제안하는 네트워크는 EfficientNet을 특징 추출 네트워크로 사용하였으며, 후속 레이어는 저수준 세부 특징과 고수준의 의미론적 특징을 활용하기 위해 피라미드 구조로 형성하였다. 피라미드 구조 사이에 attention process를 적용하여 예측에 불필요한 노이즈를 억제하였다. 네트워크의 모든 연산 과정은 depth-wise 및 point-wise 컨볼루션으로 대체하여 연산량을 최소화하였다. 제안하는 네트워크는 PASCAL VOC 데이터셋으로 학습 및 평가하였다. 실험을 통해 융합된 특징은 정제 과정을 거쳐 다양한 객체에 대해 견고한 특성을 보였다. CNN 기반 검출 모델과 비교하였을 때 적은 연산량으로 검출 정확도가 향상되었다. 향후 연구로 객체의 크기에 맞게 앵커의 비율을 조절할 필요성이 사료된다.

자동 잔향 편집을 위한 컬러 및 깊이 정보 기반 실내 장면 분류 (Indoor Scene Classification based on Color and Depth Images for Automated Reverberation Sound Editing)

  • 정민혁;유용현;박성준;황승준;백중환
    • 한국정보통신학회논문지
    • /
    • 제24권3호
    • /
    • pp.384-390
    • /
    • 2020
  • 영화나 VR 콘텐츠 제작 시 음향에 잔향 효과를 주는 것은 현장감과 생동감을 느끼게 하는데 매우 중요한 요소이다. 공간에 따른 음향의 잔향 시간은 RT60(Reverberation Time 60dB)이라는 표준에서 권고된다. 본 논문에서는 음향 편집 시 자동 잔향 편집을 위한 장면 인식 기법을 제안한다. 이를 위해 컬러 이미지와 예측된 깊이 이미지를 동일한 모델에 독립적으로 학습하는 분류 모델을 설계하였다. 실내 장면 분류는 내부 구조가 유사한 클래스가 존재하여 컬러 정보 학습만으로는 인식률의 한계가 존재한다. 공간의 깊이 정보를 사용하기 위해 딥러닝 기반의 깊이 정보 추출 기술을 사용하였다. RT60을 기반으로 총 10개의 장면 클래스를 구성하고 모델 학습 및 평가를 진행하였다. 최종적으로 제안하는 SCR+DNet(Scene Classification for Reverb+Depth Net) 분류기는 92.4%의 정확도로 기존의 CNN 분류기들보다 더 높은 성능을 달성하였다.

딥러닝기반 토마토 병해 진단 서비스 연구 (A Study on the Deep Learning-Based Tomato Disease Diagnosis Service)

  • 조유진;신창선
    • 스마트미디어저널
    • /
    • 제11권5호
    • /
    • pp.48-55
    • /
    • 2022
  • 토마토 작물은 병해에 노출이 쉽고 단시간에 퍼지므로 병해에 대한 늦은 조치로 인한 피해는 생산량과 매출에 직접적인 영향을 끼친다. 따라서, 토마토의 병해에 대해 누구나 현장에서 간편하고 정확하게 진단하여 조기 예방을 가능하게 하는 서비스가 요구된다. 본 논문에서는 사전에 ImageNet 전이 학습된 딥러닝 기반 모델을 적용하여 토마토의 9가지 병해 및 정상인 경우의 클래스를 분류하고 서비스를 제공하는 시스템을 구성한다. Plant Village 데이터 셋으로부터 토마토 병해 및 정상을 분류한 잎의 이미지 셋을 합성곱을 사용하여 조금 더 가벼운 신경망을 구축한 딥러닝 기반 CNN구조를 갖는 MobileNet, ResNet의 입력을 사용한다. 2가지 제안 모델의 학습을 통해 정확도와 학습속도가 빠른 MobileNet를 사용하여 빠르고 편리한 서비스를 제공할 수 있다.

CNN 기술을 사용한 지능형 CCTV 개발 (Development of Intelligent CCTV System Using CNN Technology)

  • 김도은;공희진;우지후;이재문;황기태;정인환
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.99-105
    • /
    • 2023
  • 이 논문은 IOT 기기인 라즈베리파이와 인공지능 기술을 이용하여 지능형 CCTV를 설계하고 시제품을 실험적으로 개발하였다. CCTV 화면에 있는 사람 수를 탐지하기 위하여 Object Detection 기술을 사용하였으며, 긴급 상황 탐지를 위하여 OpenPose에서 제공하는 Action Detection 기술을 사용하였다. 제안된 시스템은 CCTV, 서버 그리고 클라이언트 구조이고 CCTV는 라즈베리파이와 USB 카메라를 사용하였고, 서버는 리눅스를 사용하였고, 클라이언트는 아이폰을 사용하여 구현하였다. 각 서브 시스템간에 통신은 MQTT 프로토콜을 사용하여 구현하였다. 프로토타입으로 개발된 시스템은 초당 2.7프레임의 이미지를 전송할 수 있었고 초당 0.2 프레임에 대하여 이미지로부터 긴급 상황을 탐지할 수 있었다.

Optimizing CNN Structure to Improve Accuracy of Artwork Artist Classification

  • Ji-Seon Park;So-Yeon Kim;Yeo-Chan Yoon;Soo Kyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.9-15
    • /
    • 2023
  • 컴퓨터 비전 분류 연구에서 합성곱 신경망 (Convolutional Neural Network)은 탁월한 이미지 분류성능을 보여준다. 이에 영감을 받아 예술 관련 이미지 분류 작업에 대한 적용 가능성을 분석해 본다. 본 논문에서는 예술 작품 아티스트 분류의 정확도를 향상시키기 위해 최적화된 합성곱 신경망 구조를 제안한다. 미세 조정 범위 시나리오와 완전연결층 조정 시나리오를 세운 뒤 그에 따른 예술 작품 아티스트 분류의 정확도를 측정했다. 즉, 학습 컨볼루션 레이어(Convolution layer) 수와 완전연결층 수 등 ResNet50 모델의 구조를 변경하며 예술 작품 아티스트 분류의 정확도가 향상되도록 최적화했다. 본 논문에서 제안하는 합성곱 신경망 구조는 기존 예술 작품 아티스트 분류에서 쓰이던 AlexNet 모델을 1-GPU 버전으로 수정한 CaffeNet 모델보다 더 높은 정확도를 실험결과에서 증명한다.

Nanotechnology in early diagnosis of gastro intestinal cancer surgery through CNN and ANN-extreme gradient boosting

  • Y. Wenjing;T. Yuhan;Y. Zhiang;T. Shanhui;L. Shijun;M. Sharaf
    • Advances in nano research
    • /
    • 제15권5호
    • /
    • pp.451-466
    • /
    • 2023
  • Gastrointestinal cancer (GC) is a prevalent malignant tumor of the digestive system that poses a severe health risk to humans. Due to the specific organ structure of the gastrointestinal system, both endoscopic and MRI diagnoses of GIC have limited sensitivity. The primary factors influencing curative efficacy in GIC patients are drug inefficacy and high recurrence rates in surgical and pharmacological therapy. Due to its unique optical features, good biocompatibility, surface effects, and small size effects, nanotechnology is a developing and advanced area of study for the detection and treatment of cancer. Because of its deep location and complex surgery, diagnosing and treating gastrointestinal cancer is very difficult. The early diagnosis and urgent treatment of gastrointestinal illness are enabled by nanotechnology. As diagnostic and therapeutic tools, nanoparticles directly target tumor cells, allowing their detection and removal. XGBoost was used as a classification method known for achieving numerous winning solutions in data analysis competitions, to capture nonlinear relations among many input variables and outcomes using the boosting approach to machine learning. The research sample included 300 GC patients, comprising 190 males (72.2% of the sample) and 110 women (27.8%). Using convolutional neural networks (CNN) and artificial neural networks (ANN)-EXtreme Gradient Boosting (XGBoost), the patients mean± SD age was 50.42 ± 13.06. High-risk behaviors (P = 0.070), age at diagnosis (P = 0.037), distant metastasis (P = 0.004), and tumor stage (P = 0.015) were shown to have a statistically significant link with GC patient survival. AUC was 0.92, sensitivity was 81.5%, specificity was 90.5%, and accuracy was 84.7 when analyzing stomach picture.

군집신경망과 확률신경망 이론을 이용한 연약지반의 측방유동 평가 모델 (Evaluation Model for Lateral Flow on Soft Ground Using Commitee and Probabilistic Neural Network Theory)

  • 김영상;주노아;이종재
    • 한국지반공학회논문집
    • /
    • 제23권7호
    • /
    • pp.65-76
    • /
    • 2007
  • 최근 급속한 경제발전과 지역산업의 성장으로 인하여 많은 물류이동 발생과 함께 연약지반에 도로를 건설하는 경우가 많아지면서 연약지반 상에 축조된 지반구조물과 관련한 제반 문제점들이 대두되고 있다. 특히 말뚝 기초 형식의 교대나 건축물을 연약지반에 시공할 경우 비정상적인 측방유동에 의한 변위가 기초지반에 발생하여 상부 구조물의 안정성과 사용성에 많은 문제를 야기하고 있다. 측방유동은 말뚝의 파손원인과 측방변위에 대한 상관관계 연구, 연약지반 상에 설치된 말뚝의 변형과 모멘트에 대한 연구, 수치해석법을 이용한 연약지반상의 성토에 따른 측방변위 특성 및 현장계측을 통한 측방변위 특성 등 많은 연구가 수행되어지고 있으나 측방유동현상은 지금까지도 그 역학적 메커니즘이 정량적으로 파악하기 어렵고, 측방유동에 대한 합리적인 설계법이 확립되어 있지 않는 실정이다. 본 연구에서는 국내 및 일본 측방유동 발생 사례를 바탕으로 효과적이고 보다 정확한 측방유동 판정을 위하여 확률신경망과 군집신경망이론을 이용한 평가모델을 구축하고 기존의 측방유동 판정식과 비교하였다. 연구결과 제안된 확률신경망과 군집신경망 모델들의 측방유동 판정 성공률이 기존의 판정식들에 비해 매우 높은 정확도를 가지며 효과적인 것으로 나타났다.