• 제목/요약/키워드: 딥러닝분석

검색결과 1,114건 처리시간 0.025초

CNN기반 상품분류 딥러닝모델을 위한 학습데이터 영향 실증 분석 (Empirical Study on Analyzing Training Data for CNN-based Product Classification Deep Learning Model)

  • 이나경;김주연;심준호
    • 한국전자거래학회지
    • /
    • 제26권1호
    • /
    • pp.107-126
    • /
    • 2021
  • 전자상거래에서 상품 정보에 따른 신속하고 정확한 자동 상품 분류는 중요하다. 최근의 딥러닝 기술 발전은 자동 상품 분류에도 적용이 시도되고 있다. 성능이 우수한 딥러닝 모델개발에 있어, 학습 데이터의 품질과 모델에 적합한 데이터 전처리는 중요하다. 본 연구에서는, 텍스트 상품 데이터를 기반으로 카테고리를 자동 유추할 때, 데이터의 전처리 정도에 따른 영향력과 학습 데이터 선택 범위 영향력을 CNN모델을 사례 모델로 이용하여 비교 분석한다. 실험 분석에 사용한 데이터는 실제 데이터를 사용하여 연구 결과의 실증을 담보하였다. 본 연구가 도출한 실증 분석 및 결과는 딥러닝 상품 분류 모델 개발 시 성능 향상을 위한 레퍼런스로서 의의가 있다.

딥러닝 활성화 데이터 압축을 위한 연속 길이 부호화 방법 (Run-Length Coding for deep-learning activation data compression)

  • 김성제;이승호;홍민수;정진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.98-99
    • /
    • 2020
  • 최근 다양한 응용 분야에서 딥러닝을 적용한 사례가 나오고 있으며, 딥러닝 네트워크 경량화 또는 압축 기법을 적용해 정확도는 최대한 유지하면서 에너지 효율을 개선하려는 연구도 활발하게 이루어지고 있다. 이에 본 논문에서는 딥러닝 추론 과정에서 중간 데이터로 도출되는 활성화 데이터의 압축을 위해 연속 길이 부호화 방법을 적용해보고 압축률과 개선점에 대해 분석 한다.

  • PDF

수문시계열 분석을 위한 딥러닝 알고리즘 LSTM의 적용성 및 한계 (Applicability & Limitation of a Deep-Learning Algorithm, LSTM for Hydrologic Time-series Analysis)

  • 이기하;정성호;이대업
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.32-32
    • /
    • 2019
  • 본 연구에서는 다양한 시계열 예측에서 우수한 성과를 보이고 있는 딥러닝 알고리즘 LSTM(Long & Short Term Memory) 모형의 수문시계열 분석에 있어서의 적용성을 검토하고, 모형의 활용가능성과 한계점을 제시하는 것을 목적으로 한다. 이를 위해 물리적 강우-유출 모형과의 비교 검토, 일반하천 및 감조하천에서의 수위 예측, 월강수량 및 댐방류량을 활용한 갈수량 예측 등에 LSTM 모형을 적용하고, 결과분석을 통해 모형의 장 단점을 요약하였다. 상기 목적을 위한 모형적용 결과, LSTM 모형은 수문시계열 예측에 있어 우수한 예측능력을 보이고 있으며, 이는 양적/질적 수문자료가 충분히 확보되었지만, 수문해석 모형구축에 제약이 있는 유역에 대해서 보완적 수단으로 사용이 가능할 것으로 판단된다.

  • PDF

이미지 분류를 위한 딥러닝 기반 CNN모델 전이 학습 비교 분석 (CNN model transition learning comparative analysis based on deep learning for image classification)

  • 이동준;전승제;이동휘
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.370-373
    • /
    • 2022
  • 최근 Tensorflow나 Pytorch, Keras 같은 여러가지의 딥러닝 프레임워크 모델들이 나왔다. 또한 이미지 인식에 Tensorflow, Pytorch, Keras 같은 프레임 워크를 이용하여 CNN(Convolutional Neural Network)을 적용시켜 이미지 분류에서의 최적화 모델을 주로 이용한다. 본 논문에서는 딥러닝 이미지 인식분야에서 가장 많이 사용하고 있는 파이토치와 텐서플로우의 프레임 워크를 CNN모델에 학습을 시킨 결과를 토대로 두 프레임 워크를 비교 분석하여 이미지 분석할 때 최적화 된 프레임워크를 도출하였다.

  • PDF

딥러닝 모델(BERT)과 감정 어휘 사전을 결합한 음원 가사 감정 분석 (Analysis of Emotions in Lyrics by Combining Deep Learning BERT and Emotional Lexicon)

  • 윤경섭;오종민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.471-474
    • /
    • 2022
  • 음원 스트리밍 서비스 시장은 지속해서 성장해왔다. 그중 최근에 가장 성장세가 돋보이는 서비스는 Spotify와 Youtube music이다. 두 서비스의 추천시스템은 사용자가 좋아할 만한 음악을 계속해서 추천해 줌으로써 많은 사랑을 받고 있다. 추천시스템 성능은 추천에 활용할 수 있는 변수(Feature) 수에 비례한다고 볼 수 있다. 최대한 많은 정보를 알아야 사용자가 원하는 추천이 가능하기 때문이다. 본 논문에서는 기존에 존재하는 감정분류 방법론인 사전기반과 딥러닝 BERT를 사용한 머신기반 방법론을 적절하게 결합하여 장점을 유지하면서 단점을 보완한 하이브리드 감정 분석 모델을 제안함으로써 가사에서 느껴지는 감정 비율을 분석한다. 감정 비율을 음원 가중치 변수로 사용하면 감정 정보를 포함한 고도화된 추천을 기대할 수 있다.

  • PDF

딥러닝 기반 한글 전자 필기 연습 및 분석 앱 개발에 대한 연구 (A Study on Hangeul Mobile Handwriting Practice and Analyzing Application Development Based on Deep Learning)

  • 고주은;오지은;민경원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.322-325
    • /
    • 2022
  • 전 세계적으로 코로나바이러스가 유행함에 따라 비대면 활동을 비롯하여 전자 필기 이용 및 상품 소비가 증가하였다. 전자 필기에 대한 수요가 늘어남에 따라 전자 필기 글씨체 교정에 대한 관심 또한 증가하는 추세이다. 본 논문에서는 전자 필기 이미지에서 음절과 음소 영역을 추출하여 글씨를 분석하고, 이를 사용하여 사용자의 손글씨에서 개선점을 찾아낼 수 있는 딥러닝 알고리즘을 제안한다. 제안한 알고리즘을 통해 사용자가 원하는 전자 필기 글씨체를 효과적으로 습득할 수 있도록 사용자 글씨에 대해 구체적인 피드백을 제공하는 딥러닝 기반 태블릿 PC 용 한글 전자 필기 연습 및 분석 앱에 대한 연구를 소개하였다.

보행자검출을 통한 상권 분석 알고리즘 (Algorithm for the Analysis of business district using Pedestrian-Detection)

  • 이승익
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.83-89
    • /
    • 2021
  • 본 논문에서는 특정지역의 보행자들의 검출을 통한 분석으로, 특정시간 동안의 보행자 수를 분석해 원하는 지역의 상권을 과학적이고 체계적으로 분석하여 사업을 하고자 하는 수요자에 대한 서비스 제공을 목적으로 하는 알고리즘을 제안한다. 본 논문을 통해 특정지역에 분포해 있는 다양한 영상획득 장치를 통해 우선 영상에서의 보행자 수를 딥러닝 기법중 하나인 YOLO를 통해 검출하여 알고리즘을 이용하여 분석하고, 관심지역에서 획득된 영상을 활용하여, 분당 한 장의 영상정보를 활용하여 딥러닝 네트워크를 활용하여 보행자수를 파악한 후 특정지역 및 시간대별로 보행자수를 분석하여 상권분석을 체계적이고 객관적으로 수행하는 알고리즘을 제안하였다. 제안한 방법을 통해 보다 객관적인 상권을 분석하여 다양한 방법을 통해 사용자가 원하는 지역의 상권 분석을 위한 모델을 제안하였다.

병원 외래환자수의 예측을 위한 시계열 데이터처리 딥러닝 시스템 (Time Series Data Processing Deep Learning system for Prediction of Hospital Outpatient Number)

  • 조준모
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.313-318
    • /
    • 2021
  • 딥러닝 기술의 도래로 인하여 수많은 산업과 일반적인 응용에 적용됨으로써 우리의 생활에 큰 영향을 발휘하고 있다. 특정한 분야의 문제를 해결하기 위해서는 그 문제에 적합한 딥러닝 모델을 작성해야 한다. 근래에는 COVID-19 사태로 인하여 다양한 문제들을 딥러닝으로 해결하고자 하는 사례들이 늘고 있다. 이러한 일환으로 본 논문에서는 갑자기 급증할 수 있는 병원의 외래환자들을 미리 예측을 위한 시계열의 딥러닝 모델을 제시하고자 한다. 제시하는 딥러닝 모델은 주피터 노트북에서 케라스로 작성하였다. 예측결과는 실제 데이터와 그래프로 비교하며 유효성 데이터를 활용하여 과소적합과 과대적합의 여부를 손실률로 분석할 수 있도록 하였다.

Analysis of trends in deep learning and reinforcement learning

  • Dong-In Choi;Chungsoo Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.55-65
    • /
    • 2023
  • 본 논문에서는 딥러닝 및 강화학습 연구에 대해 KeyBERT(Keyword extraction with Bidirectional Encoder Representations of Transformers) 알고리즘 기반의 토픽 추출 및 토픽 출현 빈도 분석으로 급변하는 딥러닝 관련 연구 동향 분석을 파악하고자 한다. 딥러닝 알고리즘과 강화학습에 대한 논문초록을 크롤링하여 전반기와 후반기로 나누고, 전처리를 진행한 후 KeyBERT를 사용해 토픽을 추출한다. 그 후 토픽 출현 빈도로 동향 변화에 대해 분석한다. 분석된 알고리즘 모두 전반기와 후반기에 대한 뚜렷한 동향 변화가 나타났으며, 전반기에 비해 후반기에 들어 어느 주제에 대한 연구가 활발한지 확인할 수 있었다. 이는 KeyBERT를 활용한 토픽 추출 후 출현 빈도 분석으로 연구 동향변화 분석이 가능함을 보였으며, 타 분야의 연구 동향 분석에도 활용 가능할 것으로 예상한다. 또한 딥러닝의 동향을 제공함으로써 향후 딥러닝의 발전 방향에 대한 통찰력을 제공하며, 최근 주목 받는 연구 주제를 알 수 있게 하여 연구 주제 및 방법 선정에 직접적인 도움을 준다.

특징 최소화와 데이터 선별을 활용한 영화 관객수 예측 (Prediction of Number of Movie Audience Using Feature Minimization and Data Selection)

  • 양영보;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2019
  • 빅데이터 분석을 위해 많이 사용하고 있는 기계학습 알고리즘들 중 딥러닝 알고리즘이 많이 활용되고 있으며 분류와 예측에 높은 정확도를 나타내고 있다. 딥러닝 알고리즘의 적용에 따른 많은 장단점들이 있지만, 단점은 분석에 사용되는 특징들이 너무 많다는 것과 분석 모델을 만드는데 사용되는 알고리즘도 여러 가지를 적용하다 보니 분석 시간이 오래 걸린다는 것이다. 이런 단점들은 업무를 파악하면 특징을 최소화할 수 있고 필요로 하는 정보만 선별해서 대표적인 딥러닝 알고리즘 하나에 분석을 하게 되면 분석 시간을 단축시킬 수 있다. 이 실험은 [1], [2]에서 연구한 영화 관객수 예측 모델을 4개의 특징으로 최소화하고 선별된 데이터를 인공신경망 알고리즘 하나로 예측 모델을 생성하였을 때 유의미한 정보를 도출해 낼 수 있는지를 알아보기 위한 것이다. 실험결과는 최종 관객수를 1명 단위까지 정확하게 예측하지는 못했지만 비슷한 수준의 관객수 정보를 예측하였다. 학문적인 접근으로 보았을 때 예측 정확도가 높지 않으면 사용이 불가능한 모델이라고 판단할 수 있지만, 기업 입장으로 접근해 보았을 때 예측 정보가 [1]. [2] 연구 결과에 비해 부족한 수준은 아니다. 총 소요된 시간은 기획 3일, 데이터 수집 및 모델 개발 5일, 분석 시간 10분으로 개발 시간 단축, 업무 효율성 향상, 비용 절감을 기대할 수 있다.