• Title/Summary/Keyword: Deep-Learning

Search Result 5,580, Processing Time 0.035 seconds

Study on the improvement of precision and application of STIV using deep learning (딥러닝을 통한 STIV(영상유속계)의 정밀도 및 적용성 향상에 관한 연구)

  • Jeong, Jae Hoon;Kim, Yeon Joong;Hasegawa, Makoto;Yoon, Joug Sung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.78-78
    • /
    • 2021
  • 영상유속분석법은 비접촉식으로 유속을 측정하는 방법으로 특히 홍수시 하천의 표면유속을 안전하게 계측할 수 있어서 경제적이고 안전한 하천유속 측정 방법 중 하나이다. STIV는 영상의 휘도 정보를 시간 방향으로 나열하여 작성된 STI(Space-Time Image)에 나타나는 패턴의 기울기를 이용하여 유속을 산정하는 방법이다. 특히 STIV(Space-Time Image Velocimetry)는 기존 입자군의 상호상관법에 기초한 입자영상유속계와 달리 표식자의 유무와 상관없이 유속을 측정할 수 있어 적용성과 안정성이 확보된다. 하지만 영상의 상태가 불량한 경우 정확한 유속 측정이 난해하며 야간에는 별도의 조명 추가 및 태풍과 같은 악기상에서는 빗방울이 카메라에 맺히거나 수면의 진동, 구조물의 진동에 의한 영상의 상태가 불량하게 되어 측정 정도가 떨어진다. 이처럼 영상을 이용한 유속 계측에 있어 다양한 연구 및 기술개발이 요구되는 시점이다. 따라서 본 연구에서는 영상을 이용한 정확한 유속측정을 위해 STIV와 인공지능을 융합하여 정확한 유속 평가를 목적으로 한다. 우선 기존 STI에 의한 기울기 추정방법을 확장하여 딥러닝(CNN)에 의한 기울기 추정방법을 도입하였다. CNN은 일반적으로 이미지의 특성을 추출하는데 유용한 방법으로서 STI의 2차원 Fourier변환 이미지를 사용하여 패턴의 기울기를 감지하도록 학습하였고 적용 결과 기울기에 대한 인식율은 매우 양호하였으며 이를 이용한 실제 관측 영상에 적용한 결과 유속에 대한 정밀도도 매우 양호하게 나타났다. 또한 딥러닝을 적용한 STIV는 노이즈(진동, 화면 불량 등)가 있는 영상에서도 안정적으로 유속을 산정할 수 있으며 전파유속계를 이용한 실제 하천의 표면유속 관측치와 비교 검토 결과 매우 양호하게 유속을 평가하고 있는 것으로 나타났다.

  • PDF

Untact-based elevator operating system design using deep learning of private buildings (프라이빗 건물의 딥러닝을 활용한 언택트 기반 엘리베이터 운영시스템 설계)

  • Lee, Min-hye;Kang, Sun-kyoung;Shin, Seong-yoon;Mun, Hyung-jin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.161-163
    • /
    • 2021
  • In an apartment or private building, it is difficult for the user to operate the elevator button in a similar situation with luggage in both hands. In an environment where human contact must be minimized due to a highly infectious virus such as COVID-19, it is inevitable to operate an elevator based on untact. This paper proposes an operating system capable of operating the elevator by using the user's voice and image processing through the user's face without pressing the elevator button. The elevator can be operated to a designated floor without pressing a button by detecting the face of a person entering the elevator by detecting the person's face from the camera installed in the elevator, matching the information registered in advance. When it is difficult to recognize a person's face, it is intended to enhance the convenience of elevator use in an untouched environment by controlling the floor of the elevator using the user's voice through a microphone and automatically recording access information.

  • PDF

Prediction System of Running Heart Rate based on FitRec (FitRec 기반 달리기 심박수 예측 시스템)

  • Kim, Jinwook;Kim, Kwanghyun;Seon, Joonho;Lee, Seongwoo;Kim, Soo-Hyun;Kim, Jin-Young
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.22 no.6
    • /
    • pp.165-171
    • /
    • 2022
  • Human heart rate can be used to measure exercise intensity as an important indicator. If heart rate can be predicted, exercise can be performed more efficiently by regulating the intensity of exercise in advance. In this paper, a FitRec-based prediction model is proposed for estimating running heart rate for users. Endomondo data is utilized for training the proposed prediction model. The processing algorithms for time-series data, such as LSTM(long short term memory) and GRU(gated recurrent unit), are employed to compare their performance. On the basis of simulation results, it was demonstrated that the proposed model trained with running exercise performed better than the model trained with several cardiac exercises.

Construction of Artificial Intelligence Training Platform for Machine Learning Based on Web Radiology_CDM (Web Radiology_CDM기반 기계학습을 위한 인공지능 학습 플랫폼 구축)

  • Noh, Si-Hyeong;Kim, SeungJin;Kim, Ji-Eon;Lee, Chungsub;Kim, Tae-Hoon;Kim, KyungWon;Kim, Tae-Gyu;Yoon, Kwon-Ha;Jeong, Chang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.487-489
    • /
    • 2020
  • 인공지능 기술을 도입한 의료분야에서 진단 및 예측과 연계한 임상의사결정지원 시스템(CDSS)에 관련된 연구가 활발하게 진행되고 있다. 특히, 인공지능 기술 적용에 가장 많은 이슈를 일으키고 있는 의료영상기반의 질환진단연구가 다양한 제품으로 출시되고 있는 실정이다. 그러나 의료영상 데이터는 일관되지 않은 데이터들로 이루어져 있으며, 그것을 정제하여 연구에 사용하기 위해서는 상당한 시간이 필요한 것이 현실이다. 본 논문에서는 익명화된 데이터를 정제하여 인공지능 연구에 사용할 수 있는 표준화된 데이터 셋을 만들고, 그 데이터를 기반으로 인공지능 알고리즘 개발 연구를 지원하기 위한 원스톱 인공지능학습 플랫폼에 대하여 기술한다. 이를 위해 전체 인공지능 연구프로세스를 보이고 이에 따라 학습을 위한 데이터셋 생성과 인공지능 학습학습용 플랫폼에서 수행되는 수행 과정을 결과로 보인다 제안한 플랫폼을 통해 다양한 영상기반 인공지능 연구에 활용될 것으로 기대하고 있다.

A Study on the building Dataset of Similar Case Matching in Legal Domain using Deep Learning Algorithm (딥러닝 알고리즘을 이용한 유사 판례 매칭 데이터셋 구축 방안 연구)

  • Kang, Ye-Jee;Kang, Hye-Rin;Park, Seo-Yoon;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.72-76
    • /
    • 2021
  • 판례는 일반인 또는 법률 전문가가 사건에 참조하기 위해 가장 먼저 참고할 수 있는 재판의 선례이다. 하지만 이러한 판례의 유용성에도 불구하고 현 대법원 판례 검색 시스템은 판례 검색에 용이하지 않다. 왜냐하면 법률 전문 지식이 없는 일반인은 검색 의도에 부합하는 검색 결과를 정확히 도출하는 데 어려움이 있으며, 법률 전문가는 검색에 많은 시간과 비용이 들게 되기 때문이다. 이미 해외에서는 유사 케이스 매칭 데이터셋을 구축하여 일반인과 전문가로 하여금 유사 판례 검색을 용이하게 할 뿐만 아니라 여러 자연어 처리 태스크에도 활용하고 있다. 하지만 국내에는 법률 AI와 관련하여 오직 법률과 관련한 세부 태스크 수행에 초점을 맞춘 연구가 많으며, 리소스로서의 유사 케이스 매칭 데이터셋은 구축되어 있지 않다. 이에 본 논문에서는 리소스로서의 판례 데이터셋을 위해 딥러닝 알고리즘 중 문서의 의미를 반영할 수 있는 Doc2Vec 임베딩 모델과 SBERT 임베딩 모델을 적용하여 판례 문서 간 유사도를 측정·비교하였다. 그 결과 SBERT 모델을 통해 도출된 유사 판례가 문서 간 내용적 유사성이 높게 나타났으며, 이를 통해 SBERT 모델을 이용하여 유사 판례 매칭 기초 데이터셋을 구축하였다.

  • PDF

Temporal Analysis of Agricultural Reservoir Water Surface Area using Remote Sensing and CNN (위성영상 및 CNN을 활용한 소규모 농업용 저수지의 수표면적 시계열 분석)

  • Yang, Mi-Hye;Nam, Won-Ho;Lee, Hee-Jin;Kim, Taegon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.118-118
    • /
    • 2021
  • 최근 지구 온난화 현상으로 인한 기후변화로 이상기후 현상이 발생하고 있으며 이로 인해 장기적으로 폭염의 빈도 및 강도 상승에 따른 가뭄 피해 우려가 증가하고 있다. 농업 가뭄은 강수량 부족, 토양 수분 부족, 저수량 부족 등 농업분야에 영향을 주는 인자들과 관련되어 있어 농작물 생육 및 수확량 감소를 야기한다. 우리나라는 논농사가 주를 이루고 있어 국내 농업 가뭄은 주수원공인 농업용 저수지의 가용저수용량으로 판단 가능하다. 따라서 안정적인 농업용수 공급을 위해 수리시설물의 모니터링, 공급량 등의 분석이 이루어져야 하며, 농업 가뭄에 대비하기 위해 농업용 저수지의 가용저수용량 파악이 필요하다. 수자원 분야에서 지점자료의 시·공간적 한계점을 보완하기 위해 인공위성 자료를 활용한 연구가 활발히 이루어지고 있으며, 본 연구에서는 위성영상 자료 및 딥러닝 기반 알고리즘을 적용하여 농업용 저수지 수표면 탐지 및 시계열 분석을 목적으로 한다. 위성영상 자료는 5일 주기 및 10 m 공간해상도를 가진 Sentinel-2 위성영상 자료를 활용하고자 하였으며, 딥러닝에 적용하기 위하여 100장 이상의 영상 이미지를 구축하였다. 딥러닝 기반 알고리즘으로는 Convolutional Neural Network (CNN)을 활용하였으며, CNN은 주로 이미지 분류나 객체 검출 문제를 해결하기 위해 제안된 모델로 최근 픽셀 단위로 분류가 가능한 알고리즘이 개발되어 높은 정확도의 수표면 탐지가 가능할 것으로 판단된다. 따라서 본 연구에서는 CNN 기반 수표면 탐지 알고리즘을 개발하여 Sentinel-2 영상 기준 경기도 안성시를 대상으로 소규모 농업용 저수지의 수표면적에 대한 시계열 데이터를 분석하고자 한다.

  • PDF

Design of Smart Glasses Platform walking guide for the visually impaired (시각장애인을 위한 보행 안내 스마트 안경 플랫폼 설계)

  • Lee, Jaebeom;Jang, Jongwook;Jang, Sungjin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.320-322
    • /
    • 2021
  • As the world's elderly population increases, the proportion of visually impaired is also increasing, and there are still many restrictions on the use of outside activities, such as safety problems and lack of guidance information. To solve this problem, research on smart devices such as smart glasses with optical character recognition (OCR) function is being actively conducted. In this paper, we propose a system that recognizes obstacles ahead and informs information by voice, and also guides the way to the destination. Using the deep learning object recognition model Yolo, it let them to recognize the risk factors as obstacles such as stairs and Larva cones. and it also deliver the information with a voice. so you can expect that the visually impaired can do a lot of different activity even more now that system takes the visually impaired to the destination by using the directions API, voice recognition, TTS library.

  • PDF

Dialect classification based on the speed and the pause of speech utterances (발화 속도와 휴지 구간 길이를 사용한 방언 분류)

  • Jonghwan Na;Bowon Lee
    • Phonetics and Speech Sciences
    • /
    • v.15 no.2
    • /
    • pp.43-51
    • /
    • 2023
  • In this paper, we propose an approach for dialect classification based on the speed and pause of speech utterances as well as the age and gender of the speakers. Dialect classification is one of the important techniques for speech analysis. For example, an accurate dialect classification model can potentially improve the performance of speaker or speech recognition. According to previous studies, research based on deep learning using Mel-Frequency Cepstral Coefficients (MFCC) features has been the dominant approach. We focus on the acoustic differences between regions and conduct dialect classification based on the extracted features derived from the differences. In this paper, we propose an approach of extracting underexplored additional features, namely the speed and the pauses of speech utterances along with the metadata including the age and the gender of the speakers. Experimental results show that our proposed approach results in higher accuracy, especially with the speech rate feature, compared to the method only using the MFCC features. The accuracy improved from 91.02% to 97.02% compared to the previous method that only used MFCC features, by incorporating all the proposed features in this paper.

TextNAS Application to Multivariate Time Series Data and Hand Gesture Recognition (textNAS의 다변수 시계열 데이터로의 적용 및 손동작 인식)

  • Kim, Gi-duk;Kim, Mi-sook;Lee, Hack-man
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.518-520
    • /
    • 2021
  • In this paper, we propose a hand gesture recognition method by modifying the textNAS used for text classification so that it can be applied to multivariate time series data. It can be applied to various fields such as behavior recognition, emotion recognition, and hand gesture recognition through multivariate time series data classification. In addition, it automatically finds a deep learning model suitable for classification through training, thereby reducing the burden on users and obtaining high-performance class classification accuracy. By applying the proposed method to the DHG-14/28 and Shrec'17 datasets, which are hand gesture recognition datasets, it was possible to obtain higher class classification accuracy than the existing models. The classification accuracy was 98.72% and 98.16% for DHG-14/28, and 97.82% and 98.39% for Shrec'17 14 class/28 class.

  • PDF

Recurrent Neural Network Model for Predicting Tight Oil Productivity Using Type Curve Parameters for Each Cluster (군집 별 표준곡선 매개변수를 이용한 치밀오일 생산성 예측 순환신경망 모델)

  • Han, Dong-kwon;Kim, Min-soo;Kwon, Sun-il
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.297-299
    • /
    • 2021
  • Predicting future productivity of tight oil is an important task for analyzing residual oil recovery and reservoir behavior. In general, productivity prediction is made using the decline curve analysis(DCA). In this study, we intend to propose an effective model for predicting future production using deep learning-based recurrent neural networks(RNN), LSTM, and GRU algorithms. As input variables, the main parameters are oil, gas, water, which are calculated during the production of tight oil, and the type curve calculated through various cluster analyzes. the output variable is the monthly oil production. Existing empirical models, the DCA and RNN models, were compared, and an optimal model was derived through hyperparameter tuning to improve the predictive performance of the model.

  • PDF