• 제목/요약/키워드: Improved deep learning

검색결과 558건 처리시간 0.029초

Proper Noun Embedding Model for the Korean Dependency Parsing

  • Nam, Gyu-Hyeon;Lee, Hyun-Young;Kang, Seung-Shik
    • Journal of Multimedia Information System
    • /
    • 제9권2호
    • /
    • pp.93-102
    • /
    • 2022
  • Dependency parsing is a decision problem of the syntactic relation between words in a sentence. Recently, deep learning models are used for dependency parsing based on the word representations in a continuous vector space. However, it causes a mislabeled tagging problem for the proper nouns that rarely appear in the training corpus because it is difficult to express out-of-vocabulary (OOV) words in a continuous vector space. To solve the OOV problem in dependency parsing, we explored the proper noun embedding method according to the embedding unit. Before representing words in a continuous vector space, we replace the proper nouns with a special token and train them for the contextual features by using the multi-layer bidirectional LSTM. Two models of the syllable-based and morpheme-based unit are proposed for proper noun embedding and the performance of the dependency parsing is more improved in the ensemble model than each syllable and morpheme embedding model. The experimental results showed that our ensemble model improved 1.69%p in UAS and 2.17%p in LAS than the same arc-eager approach-based Malt parser.

Performance Comparison of Korean Dialect Classification Models Based on Acoustic Features

  • Kim, Young Kook;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.37-43
    • /
    • 2021
  • 말소리의 음향 특징을 이용하여 화자에 대한 중요한 사회, 언어학적 정보를 얻을 수 있는데 그 중 한 가지 핵심 특징은 방언이다. 화자의 방언 사용은 컴퓨터와의 상호작용을 방해하는 주요 요소이다. 방언은 발화의 음소, 음절, 단어, 문장 및 구와 같이 다양한 수준에서 구분할 수 있지만 이를 하나하나 식별하여 방언을 구분하기는 어렵다. 이에 본 논문에서는 음성 데이터의 특성 중 MFCC만 사용하는 경량화된 한국어 방언 분류 모델을 제안한다. 한국인 대화 음성 데이터를 통해 MFCC 특징을 활용하는 최적의 방법을 연구하고, 8가지 머신 러닝 및 딥러닝 분류 모델에서 경기/서울, 강원, 충청, 전라, 경상 5개의 한국어 방언 분류 성능을 비교한다. MFCC를 정규화하는 방법으로 대부분의 분류 모델에서 성능을 향상시켰으며, MFCC를 정규화하기 전 분류 모델의 최고 성능과 비교하여 정확도는 1.07%, F1-score는 2.04% 향상된 성능을 기록하였다.

대조적 학습을 활용한 주요 프레임 검출 방법 (Key Frame Detection Using Contrastive Learning)

  • 박경태;김원준;이용;장래영;최명석
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.897-905
    • /
    • 2022
  • 비디오 영상 내 주요 프레임(Key Frame) 검출은 컴퓨터 비전 분야에서 꾸준히 연구되고 있는 분야 중 하나이다. 최근 심층학습(Deep Learning) 기술의 발전으로 비디오 영상에서의 주요 프레임 검출 성능이 향상 되었으나, 다양한 종류의 영상 콘텐츠 및 복잡한 배경으로 인해 여전히 효과적인 학습이 어려운 문제점이 있다. 본 논문에서는 대조적 학습(Contrastive Learning)과 메모리 뱅크(Memory Bank)를 통해 영상의 주요 프레임을 검출하는 새로운 방법을 제안한다. 제안하는 방법은 입력 프레임과 같은 영상 내 이웃하는 프레임 간 차이와 다른 영상 내 프레임과의 차이를 기반으로 특징 추출 신경망을 학습한다. 이와 같은 대조적 학습을 통해 메모리 뱅크에 주요 프레임을 저장 및 갱신하여 영상의 중복성을 효과적으로 제거한다. 비디오 영상 데이터셋에서의 실험 결과를 통해 제안하는 방법의 성능을 검증하였다.

딥러닝 기반 국내 지반의 지지층 깊이 예측 (Deep Learning based Estimation of Depth to Bearing Layer from In-situ Data)

  • 장영은;정재호;한진태;유용균
    • 한국지반공학회논문집
    • /
    • 제38권3호
    • /
    • pp.35-42
    • /
    • 2022
  • 지반조사방법 중 표준관입시험 결과인 N치를 통해 알 수 있는 지반 지지층의 깊이는 각종 지반 구조물의 설계를 위한 기본적인 지반 정보를 제공하는 중요한 지표이다. 이러한 지반조사 결과는 시간과 비용 측면을 고려해 간헐적으로 수행될 수밖에 없으며, 그 결과는 현장 지반의 대표성을 갖게 된다. 그러나 지반 내에는 다양한 지층 변동성 및 불확실성이 존재하므로 간헐적인 현장조사를 통해 지반의 특성을 모두 파악하는 것은 어렵다. 따라서 시추공 정보로부터 미계측 지점을 예측하기 위한 방법들이 제시되어 왔으며, 대표적인 방법으로는 공간보간기법인 크리깅(Krigging), 역거리가중법(IDW)등이 있다. 최근에는 보간기법의 정확성을 높이기 위해 지반분야와 딥러닝 기술을 접목한 연구들이 수행되고 있다. 본 연구에서는 약 2만 2천공의 지반조사 결과를 바탕으로 딥러닝과 공간보간기법으로 지반 지지층 깊이 예측을 위한 비교 연구를 수행하였다. 이를 위해 딥러닝 알고리즘인 완전연결 네트워크와 포인트넷 방법, 공간보간기법으로는 IDW를 사용하였다. 각 분석 모델의 지지층 예측 결과 중 오차의 평균은 IDW가 3.01m 였으며, 완전연결 네트워크 및 포인트넷이 각 3.22m와 2.46m 였다. 결과의 표준편차는 IDW가 3.99였으며, 완전연결네트워크와 포인트넷이 3.95와 3.54로 나타났다. 연구 결과 3차원 정보에 특화된 포인트넷 구조를 적용한 네트워크가 IDW 및 완전연결 네트워크에 비해 개선된 결과를 나타냈다.

Gated Recurrent Unit Architecture for Context-Aware Recommendations with improved Similarity Measures

  • Kala, K.U.;Nandhini, M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.538-561
    • /
    • 2020
  • Recommender Systems (RecSys) have a major role in e-commerce for recommending products, which they may like for every user and thus improve their business aspects. Although many types of RecSyss are there in the research field, the state of the art RecSys has focused on finding the user similarity based on sequence (e.g. purchase history, movie-watching history) analyzing and prediction techniques like Recurrent Neural Network in Deep learning. That is RecSys has considered as a sequence prediction problem. However, evaluation of similarities among the customers is challenging while considering temporal aspects, context and multi-component ratings of the item-records in the customer sequences. For addressing this issue, we are proposing a Deep Learning based model which learns customer similarity directly from the sequence to sequence similarity as well as item to item similarity by considering all features of the item, contexts, and rating components using Dynamic Temporal Warping(DTW) distance measure for dynamic temporal matching and 2D-GRU (Two Dimensional-Gated Recurrent Unit) architecture. This will overcome the limitation of non-linearity in the time dimension while measuring the similarity, and the find patterns more accurately and speedily from temporal and spatial contexts. Experiment on the real world movie data set LDOS-CoMoDa demonstrates the efficacy and promising utility of the proposed personalized RecSys architecture.

심층 신경망 기반 대화처리 기술 동향 (Trends in Deep-neural-network-based Dialogue Systems)

  • 권오욱;홍택규;황금하;노윤형;최승권;김화연;김영길;이윤근
    • 전자통신동향분석
    • /
    • 제34권4호
    • /
    • pp.55-64
    • /
    • 2019
  • In this study, we introduce trends in neural-network-based deep learning research applied to dialogue systems. Recently, end-to-end trainable goal-oriented dialogue systems using long short-term memory, sequence-to-sequence models, among others, have been studied to overcome the difficulties of domain adaptation and error recognition and recovery in traditional pipeline goal-oriented dialogue systems. In addition, some research has been conducted on applying reinforcement learning to end-to-end trainable goal-oriented dialogue systems to learn dialogue strategies that do not appear in training corpora. Recent neural network models for end-to-end trainable chit-chat systems have been improved using dialogue context as well as personal and topic information to produce a more natural human conversation. Unlike previous studies that have applied different approaches to goal-oriented dialogue systems and chit-chat systems respectively, recent studies have attempted to apply end-to-end trainable approaches based on deep neural networks in common to them. Acquiring dialogue corpora for training is now necessary. Therefore, future research will focus on easily and cheaply acquiring dialogue corpora and training with small annotated dialogue corpora and/or large raw dialogues.

안개영상의 의미론적 분할 및 안개제거를 위한 심층 멀티태스크 네트워크 (Deep Multi-task Network for Simultaneous Hazy Image Semantic Segmentation and Dehazing)

  • 송태용;장현성;하남구;연윤모;권구용;손광훈
    • 한국멀티미디어학회논문지
    • /
    • 제22권9호
    • /
    • pp.1000-1010
    • /
    • 2019
  • Image semantic segmentation and dehazing are key tasks in the computer vision. In recent years, researches in both tasks have achieved substantial improvements in performance with the development of Convolutional Neural Network (CNN). However, most of the previous works for semantic segmentation assume the images are captured in clear weather and show degraded performance under hazy images with low contrast and faded color. Meanwhile, dehazing aims to recover clear image given observed hazy image, which is an ill-posed problem and can be alleviated with additional information about the image. In this work, we propose a deep multi-task network for simultaneous semantic segmentation and dehazing. The proposed network takes single haze image as input and predicts dense semantic segmentation map and clear image. The visual information getting refined during the dehazing process can help the recognition task of semantic segmentation. On the other hand, semantic features obtained during the semantic segmentation process can provide cues for color priors for objects, which can help dehazing process. Experimental results demonstrate the effectiveness of the proposed multi-task approach, showing improved performance compared to the separate networks.

딥러닝 기반 BIM 부재 자동분류 학습모델의 성능 향상을 위한 Ensemble 모델 구축에 관한 연구 (Advanced Approach for Performance Improvement of Deep Learningbased BIM Elements Classification Model Using Ensemble Model)

  • 김시현;이원복;유영수;구본상
    • 한국BIM학회 논문집
    • /
    • 제12권2호
    • /
    • pp.12-25
    • /
    • 2022
  • To increase the usability of Building Information Modeling (BIM) in construction projects, it is critical to ensure the interoperability of data between heterogeneous BIM software. The Industry Foundation Classes (IFC), an international ISO format, has been established for this purpose, but due to its structural complexity, geometric information and properties are not always transmitted correctly. Recently, deep learning approaches have been used to learn the shapes of the BIM elements and thereby verify the mapping between BIM elements and IFC entities. These models performed well for elements with distinct shapes but were limited when their shapes were highly similar. This study proposed a method to improve the performance of the element type classification by using an Ensemble model that leverages not only shapes characteristics but also the relational information between individual BIM elements. The accuracy of the Ensemble model, which merges MVCNN and MLP, was improved 0.03 compared to the existing deep learning model that only learned shape information.

영상정보를 활용한 소셜 미디어상에서의 가짜 뉴스 탐지: 유튜브를 중심으로 (Fake News Detection on Social Media using Video Information: Focused on YouTube)

  • 장윤호;최병구
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.87-108
    • /
    • 2023
  • Purpose The main purpose of this study is to improve fake news detection performance by using video information to overcome the limitations of extant text- and image-oriented studies that do not reflect the latest news consumption trend. Design/methodology/approach This study collected video clips and related information including news scripts, speakers' facial expression, and video metadata from YouTube to develop fake news detection model. Based on the collected data, seven combinations of related information (i.e. scripts, video metadata, facial expression, scripts and video metadata, scripts and facial expression, and scripts, video metadata, and facial expression) were used as an input for taining and evaluation. The input data was analyzed using six models such as support vector machine and deep neural network. The area under the curve(AUC) was used to evaluate the performance of classification model. Findings The results showed that the ACU and accuracy values of three features combination (scripts, video metadata, and facial expression) were the highest in logistic regression, naïve bayes, and deep neural network models. This result implied that the fake news detection could be improved by using video information(video metadata and facial expression). Sample size of this study was relatively small. The generalizablity of the results would be enhanced with a larger sample size.

영상 폐색영역 검출 및 해결을 위한 딥러닝 알고리즘 적용 가능성 연구 (A Study on the Applicability of Deep Learning Algorithm for Detection and Resolving of Occlusion Area)

  • 배경호;박홍기
    • 한국산학기술학회논문지
    • /
    • 제20권11호
    • /
    • pp.305-313
    • /
    • 2019
  • 최근 드론을 이용한 공간정보 구축이 활성화되면서 공간정보 산업발전에 많은 기여를 하고 있다. 하지만 드론 공간정보는 카메라의 중심투영에 의한 발생하는 폐색영역 뿐 아니라 가로수, 보행자, 현수막과 같은 적치물에 의한 폐색 영역이 필연적으로 발생한다. 이러한 폐색영역을 효율적으로 해결하기 위한 다양한 방안이 연구되고 있다. 본 연구에서는 폐색영역 해결을 위해 원초적인 재촬영이 아닌 딥러닝 알고리즘을 적용하기 위한 다양한 알고리즘별 조사 및 비교 연구를 수행하였다. 그 결과, 객체 검출 알고리즘인 HOG부터 기계학습 방법인 SVM, 딥러닝 방식인 DNN, CNN, RNN까지 다양한 모델들이 개발 및 적용되고 있으며, 이 중 영상의 분류, 검출에 가장 보편적이고 효율적인 알고리즘은 CNN 기법임을 확인하였다. 향후 AI 기반의 자동 객체 탐지와 분류는 공간정보 분야에서 각광받는 최신 과학기술이다. 이를 위해 다양한 알고리즘에 대한 검토와 적용은 중요하다. 따라서, 본 연구에서 제시하는 알고리즘별 적용 가능성은 자동으로 드론 영상의 폐색영역을 탐지하고 해결할 수 있어 공간정보 구축의 시간, 비용, 인력에 대한 효율성 향상에 기여할 것으로 판단된다.