• 제목/요약/키워드: Long Short Term Memory (LSTM)

검색결과 500건 처리시간 0.032초

통합 CNN, LSTM, 및 BERT 모델 기반의 음성 및 텍스트 다중 모달 감정 인식 연구 (Enhancing Multimodal Emotion Recognition in Speech and Text with Integrated CNN, LSTM, and BERT Models)

  • 에드워드 카야디;한스 나타니엘 하디 수실로;송미화
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.617-623
    • /
    • 2024
  • 언어와 감정 사이의 복잡한 관계의 특징을 보이며, 우리의 말을 통해 감정을 식별하는 것은 중요한 과제로 인식된다. 이 연구는 음성 및 텍스트 데이터를 모두 포함하는 다중 모드 분류 작업을 통해 음성 언어의 감정을 식별하기 위해 속성 엔지니어링을 사용하여 이러한 과제를 해결하는 것을 목표로 한다. CNN(Convolutional Neural Networks)과 LSTM(Long Short-Term Memory)이라는 두 가지 분류기를 BERT 기반 사전 훈련된 모델과 통합하여 평가하였다. 논문에서 평가는 다양한 실험 설정 전반에 걸쳐 다양한 성능 지표(정확도, F-점수, 정밀도 및 재현율)를 다룬다. 이번 연구 결과는 텍스트와 음성 데이터 모두에서 감정을 정확하게 식별하는 두 모델의 뛰어난 능력을 보인다.

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도 되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

Flood prediction in the Namgang Dam basin using a long short-term memory (LSTM) algorithm

  • Lee, Seungsoo;An, Hyunuk;Hur, Youngteck;Kim, Yeonsu;Byun, Jisun
    • 농업과학연구
    • /
    • 제47권3호
    • /
    • pp.471-483
    • /
    • 2020
  • Flood prediction is an important issue to prevent damages by flood inundation caused by increasing high-intensity rainfall with climate change. In recent years, machine learning algorithms have been receiving attention in many scientific fields including hydrology, water resources, natural hazards, etc. The performance of a machine learning algorithm was investigated to predict the water elevation of a river in this study. The aim of this study was to develop a new method for securing a large enough lead time for flood defenses by predicting river water elevation using the a long- short-term memory (LSTM) technique. The water elevation data at the Oisong gauging station were selected to evaluate its applicability. The test data were the water elevation data measured by K-water from 15 February 2013 to 26 August 2018, approximately 5 years 6 months, at 1 hour intervals. To investigate the predictability of the data in terms of the data characteristics and the lead time of the prediction data, the data were divided into the same interval data (group-A) and time average data (group-B) set. Next, the predictability was evaluated by constructing a total of 36 cases. Based on the results, group-A had a more stable water elevation prediction skill compared to group-B with a lead time from 1 to 6 h. Thus, the LSTM technique using only measured water elevation data can be used for securing the appropriate lead time for flood defense in a river.

LSTM-VAE를 활용한 기계시설물 장치의 이상 탐지 시스템 (Anomaly Detection System in Mechanical Facility Equipment: Using Long Short-Term Memory Variational Autoencoder)

  • 서재홍;박준성;유준우;박희준
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.581-594
    • /
    • 2021
  • Purpose: The purpose of this study is to compare machine learning models for anomaly detection of mechanical facility equipment and suggest an anomaly detection system for mechanical facility equipment in subway stations. It helps to predict failures and plan the maintenance of facility. Ultimately it aims to improve the quality of facility equipment. Methods: The data collected from Daejeon Metropolitan Rapid Transit Corporation was used in this experiment. The experiment was performed using Python, Scikit-learn, tensorflow 2.0 for preprocessing and machine learning. Also it was conducted in two failure states of the equipment. We compared and analyzed five unsupervised machine learning models focused on model Long Short-Term Memory Variational Autoencoder(LSTM-VAE). Results: In both experiments, change in vibration and current data was observed when there is a defect. When the rotating body failure was happened, the magnitude of vibration has increased but current has decreased. In situation of axis alignment failure, both of vibration and current have increased. In addition, model LSTM-VAE showed superior accuracy than the other four base-line models. Conclusion: According to the results, model LSTM-VAE showed outstanding performance with more than 97% of accuracy in the experiments. Thus, the quality of mechanical facility equipment will be improved if the proposed anomaly detection system is established with this model used.

에너지인터넷에서 1D-CNN과 양방향 LSTM을 이용한 에너지 수요예측 (Prediction for Energy Demand Using 1D-CNN and Bidirectional LSTM in Internet of Energy)

  • 정호철;선영규;이동구;김수현;황유민;심이삭;오상근;송승호;김진영
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.134-142
    • /
    • 2019
  • 에너지인터넷 기술의 발전과 다양한 전자기기의 보급으로 에너지소비량이 패턴이 다양해짐에 따라 수요예측에 대한 신뢰도가 감소하고 있어 발전량 최적화 및 전력공급 안정화에 문제를 야기하고 있다. 본 연구에서는 고신뢰성을 갖는 수요예측을 위해 딥러닝 기법인 Convolution neural network(CNN)과 Bidirectional Long Short-Term Memory(BLSTM)을 융합한 1Dimention-Convolution and Bidirectional LSTM(1D-ConvBLSTM)을 제안하고, 제안한 기법을 활용하여 시계열 에너지소비량대한 소비패턴을 효과적으로 추출한다. 실험 결과에서는 다양한 반복학습 횟수와 feature map에 대해서 수요를 예측하고 적은 반복학습 횟수로도 테스트 데이터의 그래프 개형을 예측하는 것을 검증한다.

Prediction of the DO concentration using the machine learning algorithm: case study in Oncheoncheon, Republic of Korea

  • Lim, Heesung;An, Hyunuk;Choi, Eunhyuk;Kim, Yeonsu
    • 농업과학연구
    • /
    • 제47권4호
    • /
    • pp.1029-1037
    • /
    • 2020
  • The machine learning algorithm has been widely used in water-related fields such as water resources, water management, hydrology, atmospheric science, water quality, water level prediction, weather forecasting, water discharge prediction, water quality forecasting, etc. However, water quality prediction studies based on the machine learning algorithm are limited compared to other water-related applications because of the limited water quality data. Most of the previous water quality prediction studies have predicted monthly water quality, which is useful information but not enough from a practical aspect. In this study, we predicted the dissolved oxygen (DO) using recurrent neural network with long short-term memory model recurrent neural network long-short term memory (RNN-LSTM) algorithms with hourly- and daily-datasets. Bugok Bridge in Oncheoncheon, located in Busan, where the data was collected in real time, was selected as the target for the DO prediction. The 10-month (temperature, wind speed, and relative humidity) data were used as time prediction inputs, and the 5-year (temperature, wind speed, relative humidity, and rainfall) data were used as the daily forecast inputs. Missing data were filled by linear interpolation. The prediction model was coded based on TensorFlow, an open-source library developed by Google. The performance of the RNN-LSTM algorithm for the hourly- or daily-based water quality prediction was tested and analyzed. Research results showed that the hourly data for the water quality is useful for machine learning, and the RNN-LSTM algorithm has potential to be used for hourly- or daily-based water quality forecasting.

장단기 메모리를 이용한 노인 낙상감지시스템의 정규화에 대한 연구 (Study of regularization of long short-term memory(LSTM) for fall detection system of the elderly)

  • 정승수;김남호;유윤섭
    • 한국정보통신학회논문지
    • /
    • 제25권11호
    • /
    • pp.1649-1654
    • /
    • 2021
  • 본 논문에서는 고령자의 낙상상황을 감지할 수 있는 텐서플로우 장단기 메모리 기반 낙상감지 시스템의 정규화에 대하여 소개한다. 낙상감지는 고령자의 몸에 부착한 3축 가속도 센서 데이터를 사용하며, 총 7가지의 행동 패턴들에 대하여 학습하며, 각각 4가지는 일상생활에서 일어나는 패턴이고, 나머지 3가지는 낙상에 대한 패턴이다. 학습시에는 손실함수(loss function)를 효과적으로 줄이기 위하여 정규화 과정을 진행하며, 정규화 과정은 데이터에 대하여 최대최소 정규화, 손실함수에 대하여 L2 정규화 과정을 진행한다. 3축 가속도 센서를 이용하여 구한 다양한 파라미터에 대하여 정규화 과정의 최적의 조건을 제시한다. 낙상 검출율면에서 SVM을 이용하고 정규화 127과 정규화율 λ 0.00015일 때 Sensitivity 98.4%, Specificity 94.8%, Accuracy 96.9%로 가장 좋은 모습을 보였다.

A Novel RGB Channel Assimilation for Hyperspectral Image Classification using 3D-Convolutional Neural Network with Bi-Long Short-Term Memory

  • M. Preethi;C. Velayutham;S. Arumugaperumal
    • International Journal of Computer Science & Network Security
    • /
    • 제23권3호
    • /
    • pp.177-186
    • /
    • 2023
  • Hyperspectral imaging technology is one of the most efficient and fast-growing technologies in recent years. Hyperspectral image (HSI) comprises contiguous spectral bands for every pixel that is used to detect the object with significant accuracy and details. HSI contains high dimensionality of spectral information which is not easy to classify every pixel. To confront the problem, we propose a novel RGB channel Assimilation for classification methods. The color features are extracted by using chromaticity computation. Additionally, this work discusses the classification of hyperspectral image based on Domain Transform Interpolated Convolution Filter (DTICF) and 3D-CNN with Bi-directional-Long Short Term Memory (Bi-LSTM). There are three steps for the proposed techniques: First, HSI data is converted to RGB images with spatial features. Before using the DTICF, the RGB images of HSI and patch of the input image from raw HSI are integrated. Afterward, the pair features of spectral and spatial are excerpted using DTICF from integrated HSI. Those obtained spatial and spectral features are finally given into the designed 3D-CNN with Bi-LSTM framework. In the second step, the excerpted color features are classified by 2D-CNN. The probabilistic classification map of 3D-CNN-Bi-LSTM, and 2D-CNN are fused. In the last step, additionally, Markov Random Field (MRF) is utilized for improving the fused probabilistic classification map efficiently. Based on the experimental results, two different hyperspectral images prove that novel RGB channel assimilation of DTICF-3D-CNN-Bi-LSTM approach is more important and provides good classification results compared to other classification approaches.

순환 신경망 모델을 이용한 소형어선의 운동응답 예측 연구 (Study on the Prediction of Motion Response of Fishing Vessels using Recurrent Neural Networks)

  • 서장훈;박동우;남동
    • 해양환경안전학회지
    • /
    • 제29권5호
    • /
    • pp.505-511
    • /
    • 2023
  • 본 논문에서는 소형어선의 운동 응답을 예측하기 위해 딥러닝 모델을 구축하였다. 크기가 다른 두 소형어선을 대상으로 유체동역학 성능을 평가하여 데이터세트를 확보하였다. 딥러닝 모델은 순환 신경망 기법의 하나인 장단기 메모리 기법(LSTM, Long Short-Term Memory)을 사용하였다. 딥러닝 모델의 입력 데이터는 6 자유도 운동 및 파고의 시계열 데이터를 사용하였으며, 출력 라벨로는 6 자유도 운동의 시계열 데이터로 선정하였다. 최적 LSTM 모델 구축을 위해 hyperparameter 및 입력창 길이의 영향을 평가하였다. 구축된 LSTM 모델을 통해 입사파 방향에 따른 시계열 운동 응답을 예측하였다. 예측된 시계열 운동 응답은 해석 결과와 전반적으로 잘 일치함을 확인할 수 있었다. 시계열의 길이가 길어짐에 따라서 예측값과 해석 결과의 차이가 발생하는데, 이는 장기 데이터에 따른 훈련 영향도가 감소 됨에 따라 나타난 것으로 확인할 수 있다. 전체 예측 데이터의 오차는 약 85% 이상의 데이터가 10% 이내의 오차를 보였으며, 소형어선의 시계열 운동 응답을 잘 예측함을 확인하였다. 구축된 LSTM 모델은 소형어선의 모니터링 및 경보 시스템에 활용될 수 있을 것으로 기대한다.