• 제목/요약/키워드: Deep Learning Model

검색결과 2,744건 처리시간 0.026초

변형 VGG 모델의 전처리를 이용한 부품도면 문자 인식 성능 개선 (Performance Improvement of Optical Character Recognition for Parts Book Using Pre-processing of Modified VGG Model)

  • 신희란;이상협;박장식;송종관
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.433-438
    • /
    • 2019
  • 본 논문에서는 기계 서비스 부품 도면에서 숫자를 인식하기 위하여 입력 영상에 대한 전처리와 딥러닝 모델을 제안한다. 서비스 부품 도면의 숫자를 인식하는데 있는 지시선과 도형에 의한 오검출 또는 오인식을 개선하기 위하여 수학적 형태학 필터링 전처리를 한다. 숫자 인식을 위하여 VGG-16 모델을 축소 변형한 7 개의 계층을 가지는 VGG 모델을 적용함으로써 인식 성능을 개선한다. 서비스 부품 도면의 숫자 인식 실험 결과, 제안하는 방법이 인식률 95.57%, 정확도는 92.82%로 종래의 방법에 현저히 개선된 결과를 얻었다.

Comparison of Pre-processed Brain Tumor MR Images Using Deep Learning Detection Algorithms

  • Kwon, Hee Jae;Lee, Gi Pyo;Kim, Young Jae;Kim, Kwang Gi
    • Journal of Multimedia Information System
    • /
    • 제8권2호
    • /
    • pp.79-84
    • /
    • 2021
  • Detecting brain tumors of different sizes is a challenging task. This study aimed to identify brain tumors using detection algorithms. Most studies in this area use segmentation; however, we utilized detection owing to its advantages. Data were obtained from 64 patients and 11,200 MR images. The deep learning model used was RetinaNet, which is based on ResNet152. The model learned three different types of pre-processing images: normal, general histogram equalization, and contrast-limited adaptive histogram equalization (CLAHE). The three types of images were compared to determine the pre-processing technique that exhibits the best performance in the deep learning algorithms. During pre-processing, we converted the MR images from DICOM to JPG format. Additionally, we regulated the window level and width. The model compared the pre-processed images to determine which images showed adequate performance; CLAHE showed the best performance, with a sensitivity of 81.79%. The RetinaNet model for detecting brain tumors through deep learning algorithms demonstrated satisfactory performance in finding lesions. In future, we plan to develop a new model for improving the detection performance using well-processed data. This study lays the groundwork for future detection technologies that can help doctors find lesions more easily in clinical tasks.

Sentiment Analysis to Evaluate Different Deep Learning Approaches

  • Sheikh Muhammad Saqib ;Tariq Naeem
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.83-92
    • /
    • 2023
  • The majority of product users rely on the reviews that are posted on the appropriate website. Both users and the product's manufacturer could benefit from these reviews. Daily, thousands of reviews are submitted; how is it possible to read them all? Sentiment analysis has become a critical field of research as posting reviews become more and more common. Machine learning techniques that are supervised, unsupervised, and semi-supervised have worked very hard to harvest this data. The complicated and technological area of feature engineering falls within machine learning. Using deep learning, this tedious process may be completed automatically. Numerous studies have been conducted on deep learning models like LSTM, CNN, RNN, and GRU. Each model has employed a certain type of data, such as CNN for pictures and LSTM for language translation, etc. According to experimental results utilizing a publicly accessible dataset with reviews for all of the models, both positive and negative, and CNN, the best model for the dataset was identified in comparison to the other models, with an accuracy rate of 81%.

Deep Learning-based Delinquent Taxpayer Prediction: A Scientific Administrative Approach

  • YongHyun Lee;Eunchan Kim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.30-45
    • /
    • 2024
  • This study introduces an effective method for predicting individual local tax delinquencies using prevalent machine learning and deep learning algorithms. The evaluation of credit risk holds great significance in the financial realm, impacting both companies and individuals. While credit risk prediction has been explored using statistical and machine learning techniques, their application to tax arrears prediction remains underexplored. We forecast individual local tax defaults in Republic of Korea using machine and deep learning algorithms, including convolutional neural networks (CNN), long short-term memory (LSTM), and sequence-to-sequence (seq2seq). Our model incorporates diverse credit and public information like loan history, delinquency records, credit card usage, and public taxation data, offering richer insights than prior studies. The results highlight the superior predictive accuracy of the CNN model. Anticipating local tax arrears more effectively could lead to efficient allocation of administrative resources. By leveraging advanced machine learning, this research offers a promising avenue for refining tax collection strategies and resource management.

A Deep Learning Model for Extracting Consumer Sentiments using Recurrent Neural Network Techniques

  • Ranjan, Roop;Daniel, AK
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.238-246
    • /
    • 2021
  • The rapid rise of the Internet and social media has resulted in a large number of text-based reviews being placed on sites such as social media. In the age of social media, utilizing machine learning technologies to analyze the emotional context of comments aids in the understanding of QoS for any product or service. The classification and analysis of user reviews aids in the improvement of QoS. (Quality of Services). Machine Learning algorithms have evolved into a powerful tool for analyzing user sentiment. Unlike traditional categorization models, which are based on a set of rules. In sentiment categorization, Bidirectional Long Short-Term Memory (BiLSTM) has shown significant results, and Convolution Neural Network (CNN) has shown promising results. Using convolutions and pooling layers, CNN can successfully extract local information. BiLSTM uses dual LSTM orientations to increase the amount of background knowledge available to deep learning models. The suggested hybrid model combines the benefits of these two deep learning-based algorithms. The data source for analysis and classification was user reviews of Indian Railway Services on Twitter. The suggested hybrid model uses the Keras Embedding technique as an input source. The suggested model takes in data and generates lower-dimensional characteristics that result in a categorization result. The suggested hybrid model's performance was compared using Keras and Word2Vec, and the proposed model showed a significant improvement in response with an accuracy of 95.19 percent.

딥 러닝을 이용한 고속도로 교통사고 건수 예측모형 개발에 관한 연구 (A Study for Development of Expressway Traffic Accident Prediction Model Using Deep Learning)

  • 류종득;박상민;박성호;권철우;윤일수
    • 한국ITS학회 논문지
    • /
    • 제17권4호
    • /
    • pp.14-25
    • /
    • 2018
  • 최근 빅데이터 시대의 도래와 함께 교통사고와 관련된 요인을 설명하기 용이해졌다. 이에따라 최신 분석 기법을 적용하여 교통사고 자료를 분석하고 시사점을 도출할 필요가 있다. 본 연구의 목적은 고속도로 교통사고 자료를 이용하여 고속도로의 주요 분석 단위인 콘존의 교통사고 건수를 예측하기 위하여 음이항 회귀모형과 딥 러닝을 이용한 기법을 적용하고 예측 성능을 비교하였다. 예측 성능 비교 결과, 딥 러닝 모형의 MOE들이 음이항 회귀모형에 비해 다소 우수한 것으로 나타났으나, MAD 기준으로 차이는 미미한 것으로 나타났다. 하지만 딥 러닝을 이용할 경우 다른 독립변수들을 추가하는 것이 용이하고, 모형의 구조 등을 변경할 경우 예측 신뢰도를 더욱 증가시킬 수 있을 것으로 판단된다.

딥러닝 모형을 이용한 신호교차로 대기행렬길이 예측 (Predicting a Queue Length Using a Deep Learning Model at Signalized Intersections)

  • 나다혁;이상수;조근민;김호연
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.26-36
    • /
    • 2021
  • 본 연구는 영상검지기에서 수집되는 정보를 활용하여 딥러닝 기반으로 대기행렬길이를 예측하는 모형을 개발하였다. 그리고 통계적 기법인 다중회귀 모형을 추정하여 평균절대오차와 평균제곱근오차의 두 지표를 이용하여 비교·평가하였다. 다중회귀분석 결과, 시간, 요일, 점유율, 버스 교통량이 유효한 변수로 도출되었고, 이 중에서 독립변수들의 종속변수에 대한 영향력은 점유율이 가장 큰 것으로 나타났다. 딥러닝 최적 모형은 은닉층이 4겹, Look Back이 6으로 결정되었고, 평균절대오차와 평균제곱근오차가 6.34와 8.99로 나타났다. 그리고 두 모형을 평가한 결과, 다중회귀 모형과 딥러닝 모형의 평균절대오차는 각각 13.65와 6.44, 평균제곱근오차는 각각 19.10과 9.11로 계산되었다. 이는 딥러닝 모형이 다중회귀 모형과 비교하여 평균절대오차가 52.8%, 평균제곱근오차는 52.3% 감소된 결과이다.

훈련자료 내 재배지역의 비율에 따른 딥러닝 모델의 성능 평가 (Performance Evaluation of Deep Learning Model according to the Ratio of Cultivation Area in Training Data)

  • 성선경;최재완
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1007-1014
    • /
    • 2022
  • 차세대중형위성(Compact Advanced Satellite 500, CAS500)은 식생, 산림, 농업 등의 분야를 포함한 다양한 목적을 위하여 사용될 수 있으며, 다양한 영역에 대한 빠른 위성영상의 취득이 가능할 것으로 기대되고 있다. 차세대중형위성을 통하여 취득된 위성영상을 농업분야에서 활용하기 위해서는 위성영상 기반 작물재배지역 추출 기법에 대한 개발이 필요하다. 특히, 최근 들어 딥러닝 분야에 대한 연구가 활발해짐에 따라서, 작물재배지역 추출을 위한 딥러닝 모델의 개발 및 훈련자료 생성에 관한 연구가 필요한 실정이다. 본 연구에서는 PlanetScope 위성영상과 팜맵을 이용하여 합천군 지역의 양파 및 마늘 재배지역을 분류하고자 하였다. 특히, 효과적인 모델의 학습을 위하여 작물재배지역의 비율에 따른 모델 성능을 분석하고자 하였다. 실험에 사용한 딥러닝 모델은 Fully Convolutional Densely Connected Convolutional Network (FC-DenseNet)을 작물재배지역 분류의 목적에 맞도록 재구성하여 활용하였다. 실험결과, 훈련자료 내 작물재배지역의 비율이 딥러닝 모델의 성능에 영향을 미치는 것을 확인하였다.

이미지와 PPG 데이터를 사용한 멀티모달 딥 러닝 기반의 운전자 졸음 감지 모델 (Driver Drowsiness Detection Model using Image and PPG data Based on Multimodal Deep Learning)

  • 최형탁;백문기;강재식;윤승원;이규철
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.45-57
    • /
    • 2018
  • 주행 중에 발생하는 졸음은 큰 사고로 직결될 수 있는 매우 위험한 운전자 상태이다. 졸음을 방지하기 위하여 운전자의 상태를 파악하는 전통적인 졸음 감지 방법들이 존재하지만 운전자들이 가지는 개개인의 특성을 모두 반영한 일반화 된 운전자 상태 인식에는 한계가 있다. 최근에는 운전자의 상태를 인식하기 위한 딥 러닝기반의 상태인식 연구들이 제안되었다. 딥 러닝은 인간이 아닌 기계가 특징을 추출하여 보다 일반화된 인식모델을 도출할 수 있는 장점이 있다. 본 연구에서는 운전자의 상태를 파악하기 위해 이미지와 PPG를 동시에 학습하여 기존 딥 러닝 방식보다 정확한 상태 인식 모델을 제안한다. 본 논문은 운전자의 이미지와 PPG 데이터가 졸음 감지에 어떤 영향을 미치는지, 함께 사용되었을 때 학습 모델의 성능을 향상시키는지 실험을 통해 확인하였다. 이미지만을 사용했을 때 보다 이미지와 PPG를 함께 사용하였을 때 3%내외의 정확도 향상을 확인했다. 또한, 운전자의 상태를 세 가지로 분류하는 멀티모달 딥 러닝 기반의 모델을 96%의 분류 정확도를 보였다.

3D 딥러닝 기술 동향 (Recent R&D Trends for 3D Deep Learning)

  • 이승욱;황본우;임성재;윤승욱;김태준;최진성;박창준
    • 전자통신동향분석
    • /
    • 제33권5호
    • /
    • pp.103-110
    • /
    • 2018
  • Studies on artificial intelligence have been developed for the past couple of decades. After a few periods of prosperity and recession, a new machine learning method, so-called Deep Learning, has been introduced. This is the result of high-quality big- data, an increase in computing power, and the development of new algorithms. The main targets for deep learning are 1D audio and 2D images. The application domain is being extended from a discriminative model, such as classification/segmentation, to a generative model. Currently, deep learning is used for processing 3D data. However, unlike 2D, it is not easy to acquire 3D learning data. Although low-cost 3D data acquisition sensors have become more popular owing to advances in 3D vision technology, the generation/acquisition of 3D data remains a very difficult problem. Moreover, it is not easy to directly apply an existing network model, such as a convolution network, owing to the variety of 3D data representations. In this paper, we summarize the 3D deep learning technology that have started to be developed within the last 2 years.