• 제목/요약/키워드: End-to-end learning

검색결과 1,128건 처리시간 0.026초

End to End 딥러닝 기반의 자율주행을 위한 실세계 환경을 반영한 가상 주행 데이터 수집 및 활용 (Collecting and utilizing virtual driving data reflecting real-world environment for autonomous driving based on End to End deep learning)

  • 김준태;배창석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.394-397
    • /
    • 2018
  • 최근 인공지능 연구가 활발하게 진행이 되면서 여러 기업에서 자율 주행연구도 활발하게 진행되고 있다. 하지만 실제 상황에서 자동차 주행 데이터를 얻기에는 여러 위험사항들과 경제적인 낭비가 있다. 그렇기 때문에 게임 상에서 데이터를 수집하고 딥러닝을 이용해 학습을 하기로 했다. 본 논문에서는 실제 세계와 유사한 환경을 가지고 있는 자동차 게임을 이용하여 자율 주행을 시도 했다. 자율 주행 시 많이 쓰이는 End to End 방법으로 데이터를 수집하면 두 가지 데이터가 저장된다. 하나는 이미지 데이터고 두 번째는 방향키 데이터다. 이러한 데이터들을 numpy 타입으로 40분간 데이터를 수집한 후 딥러닝에 많이 쓰이는 tensorflow를 사용하여 구현한 CNN을 이용하여 학습이 되는 것을 확인을 하고 91.9%의 정확도를 얻었다. 이를 기반으로 실세계에서의 사용 가능성을 확인했다.

복사 방법론과 입력 추가 구조를 이용한 End-to-End 한국어 문서요약 (End-to-end Korean Document Summarization using Copy Mechanism and Input-feeding)

  • 최경호;이창기
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.503-509
    • /
    • 2017
  • 본 논문에서는 copy mechanism과 input feeding 추가한 RNN search 모델을 end-to-end 방식으로 한국어 문서요약에 적용하였다. 또한 시스템의 입출력으로 사용하는 데이터를 음절단위, 형태소단위, hybrid 단위의 토큰화 형식으로 처리하여 수행한 각각의 성능을 구하여, 모델과 토큰화 형식에 따른 문서요약 성능을 비교한다. 인터넷 신문기사를 수집하여 구축한 한국어 문서요약 데이터 셋(train set 30291 문서, development set 3786 문서, test set 3705문서)으로 실험한 결과, 형태소 단위로 토큰화 하였을 때 우수한 성능을 확인하였으며, GRU search에 input feeding과 copy mechanism을 추가한 모델이 ROUGE-1 35.92, ROUGE-2 15.37, ROUGE-L 29.45로 가장 높은 성능을 보였다.

Modeling of AutoML using Colored Petri Net

  • Yo-Seob, Lee
    • International Journal of Advanced Culture Technology
    • /
    • 제10권4호
    • /
    • pp.420-426
    • /
    • 2022
  • Developing a machine learning model and putting it into production goes through a number of steps. Automated Machine Learning(AutoML) appeared to increase productivity and efficiency by automating inefficient tasks that occur while repeating this process whenever machine learning is applied. The high degree of automation of AutoML models allows non-experts to use machine learning models and techniques without the need to become machine learning experts. Automating the process of applying machine learning end-to-end with AutoML models has the added benefit of creating simpler solutions, generating these solutions faster, and often generating models that outperform hand-designed models. In this paper, the AutoML data is collected and AutoML's Color Petri net model is created and analyzed based on it.

딥러닝을 사용하는 IoT빅데이터 인프라에 필요한 DNA 기술을 위한 분산 엣지 컴퓨팅기술 리뷰 (Distributed Edge Computing for DNA-Based Intelligent Services and Applications: A Review)

  • ;조위덕
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권12호
    • /
    • pp.291-306
    • /
    • 2020
  • 오늘날 데이터 네트워크 AI (DNA) 기반 지능형 서비스 및 애플리케이션은 비즈니스의 삶의 질과 생산성을 향상시키는 새로운 차원의 서비스를 제공하는 것이 현실이 되었다. 인공지능(AI)은 IoT 데이터(IoT 장치에서 수집한 데이터)의 가치를 높이며, 사물 인터넷(IoT)은 AI의 학습 및 지능 기능을 촉진한다. 딥러닝을 사용하여 대량의 IoT 데이터에서 실시간으로 인사이트를 추출하려면 데이터가 생성되는 IoT 단말 장치에서의 처리능력이 필요하다. 그러나 딥러닝에는 IoT 최종 장치에서 사용할 수 없는 상당 수의 컴퓨팅 리소스가 필요하다. 이러한 문제는 처리를 위해 IoT 최종 장치에서 클라우드 데이터 센터로 대량의 데이터를 전송함으로써 해결되었다. 그러나 IoT 빅 데이터를 클라우드로 전송하면 엄청나게 높은 전송 지연과 주요 관심사인 개인 정보 보호 문제가 발생한다. 분산 컴퓨팅 노드가 IoT 최종 장치 가까이에 배치되는 엣지 컴퓨팅은 높은 계산 및 짧은 지연 시간 요구 사항을 충족하고 사용자의 개인 정보를 보호하는 실행 가능한 솔루션이다. 본 논문에서는 엣지 컴퓨팅 내에서 딥러닝을 활용하여 IoT 최종 장치에서 생성된 IoT 빅 데이터의 잠재력을 발휘하는 현재 상태에 대한 포괄적인 검토를 제공한다. 우리는 이것이 DNA 기반 지능형 서비스 및 애플리케이션 개발에 기여할 것이라고 본다. 엣지 컴퓨팅 플랫폼의 여러 노드에서 딥러닝 모델의 다양한 분산 교육 및 추론 아키텍처를 설명하고 엣지 컴퓨팅 환경과 네트워크 엣지에서 딥러닝이 유용할 수 있는 다양한 애플리케이션 도메인에서 딥러닝의 다양한 개인 정보 보호 접근 방식을 제공한다. 마지막으로 엣지 컴퓨팅 내에서 딥러닝을 활용하는 열린 문제와 과제에 대해 설명한다.

A TabNet - Based System for Water Quality Prediction in Aquaculture

  • Nguyen, Trong–Nghia;Kim, Soo Hyung;Do, Nhu-Tai;Hong, Thai-Thi Ngoc;Yang, Hyung Jeong;Lee, Guee Sang
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.39-52
    • /
    • 2022
  • In the context of the evolution of automation and intelligence, deep learning and machine learning algorithms have been widely applied in aquaculture in recent years, providing new opportunities for the digital realization of aquaculture. Especially, water quality management deserves attention thanks to its importance to food organisms. In this study, we proposed an end-to-end deep learning-based TabNet model for water quality prediction. From major indexes of water quality assessment, we applied novel deep learning techniques and machine learning algorithms in innovative fish aquaculture to predict the number of water cells counting. Furthermore, the application of deep learning in aquaculture is outlined, and the obtained results are analyzed. The experiment on in-house data showed an optimistic impact on the application of artificial intelligence in aquaculture, helping to reduce costs and time and increase efficiency in the farming process.

Continual learning을 이용한 한국어 상호참조해결의 도메인 적응 (Domain adaptation of Korean coreference resolution using continual learning)

  • 최요한;조경빈;이창기;류지희;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.320-323
    • /
    • 2022
  • 상호참조해결은 문서에서 명사, 대명사, 명사구 등의 멘션 후보를 식별하고 동일한 개체를 의미하는 멘션들을 찾아 그룹화하는 태스크이다. 딥러닝 기반의 한국어 상호참조해결 연구들에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후 멘션 탐지와 상호참조해결을 동시에 수행하는 End-to-End 모델이 주로 연구가 되었으며, 최근에는 스팬 표현을 사용하지 않고 시작과 끝 표현식을 통해 상호참조해결을 빠르게 수행하는 Start-to-End 방식의 한국어 상호참조해결 모델이 연구되었다. 최근에 한국어 상호참조해결을 위해 구축된 ETRI 데이터셋은 WIKI, QA, CONVERSATION 등 다양한 도메인으로 이루어져 있으며, 신규 도메인의 데이터가 추가될 경우 신규 데이터가 추가된 전체 학습데이터로 모델을 다시 학습해야 하며, 이때 많은 시간이 걸리는 문제가 있다. 본 논문에서는 이러한 상호참조해결 모델의 도메인 적응에 Continual learning을 적용해 각기 다른 도메인의 데이터로 모델을 학습 시킬 때 이전에 학습했던 정보를 망각하는 Catastrophic forgetting 현상을 억제할 수 있음을 보인다. 또한, Continual learning의 성능 향상을 위해 2가지 Transfer Techniques을 함께 적용한 실험을 진행한다. 실험 결과, 본 논문에서 제안한 모델이 베이스라인 모델보다 개발 셋에서 3.6%p, 테스트 셋에서 2.1%p의 성능 향상을 보였다.

  • PDF

딥러닝을 활용한 무선 전송 및 접속 기술 동향 (Research Trends on Wireless Transmission and Access Technologies Using Deep Learning)

  • 김근영;명정호;서지훈
    • 전자통신동향분석
    • /
    • 제33권5호
    • /
    • pp.13-23
    • /
    • 2018
  • Deep learning is a promising solution to a number of complex problems based on its inherent capability to approximate almost all types of functions without the demand for handcrafted feature extraction. New wireless transmission and access schemes based on deep learning are being increasingly proposed as substitutes for existing approaches, providing a lower complexity and better performance gain. Among such schemes, a communications system is viewed as an end-to-end autoencoder. The learning process applied in autoencoders can automatically deal with some nonlinear or unknown properties in communications systems. Deep learning can also be used to optimize each processing block for required tasks such as channel decoding, signal detection, and multiple access. On top of recent related research trends, we suggest appropriate research approaches for communications systems to adopt deep learning.

전력산업 경쟁 환경에서의 요금부하모델 수립을 위한 부하기기의 학습곡선 분석 (Analysis on learning curves of end-use appliances for the establishment of price-sensitivity load model in competitive electricity market)

  • 황성욱;김정훈;송경빈;최준영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 A
    • /
    • pp.386-388
    • /
    • 2001
  • The change of the electricity charge from cost base to price base due to the introduction of the electricity market competition causes consumer to choose a variety of charge schemes and a portion of loads to be affected by this change. Besides, it is required the index that consolidate the price volatility experienced on the power exchange with gaming and strategic bidding by suppliers to increase profits. Therefore, in order to find a mathematical model of the sensitively-responding-to-price loads, the price-sensitive load model is needed. And the development of state-of-the-art technologies affects the electricity price, so the diffusion of high-efficient end-uses and these price affect load patterns. This paper shows the analysis on learning curves algorithms which is used to investigate the correlation of the end-uses' price and load patterns.

  • PDF

신기술 보급 및 DSM 정책이 부하기기 학습곡선에 미치는 영향 (The Influence of Introducing New Technologies and DSM Strategies on End-Use Learning Curves)

  • 황성욱;김정훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.435-437
    • /
    • 2001
  • The change of the electricity charge from cost base to price base due to the introduction of the electricity market competition causes consumer to choose a variety of charge schemes and a portion of loads to be affected by this change. Besides, it is required the index that consolidate the price volatility experienced on the power exchange with gaming and strategic bidding by suppliers to increase profits. Therefore, in order to find a mathematical model of the sensitively-responding-to-price loads, the price-sensitive load model is needed. And the development of state-of-the-art technologies affects the electricity price, so the diffusion of high-efficient end-uses and these price affect load patterns. This paper shows the analysis on learning curves algorithms which is used to investigate the correlation of the end-uses' price and load patterns.

  • PDF

Lexicon transducer를 적용한 conformer 기반 한국어 end-to-end 음성인식 (Conformer with lexicon transducer for Korean end-to-end speech recognition)

  • 손현수;박호성;김규진;조은수;김지환
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.530-536
    • /
    • 2021
  • 최근 들어 딥러닝의 발달로 인해 Hidden Markov Model(HMM)을 사용하지 않고 음성 신화와 단어를 직접 매핑하여 학습하는 end-to-end 음성인식 방법이 각광을 받고 있으며 그 중에서도 conformer가 가장 좋은 성능을 보이고 있다. 하지만 end-to-end 음성인식 방법은 현재 시점에서 어떤 자소 또는 단어가 나타날지에 대한 확률에 대해서만 초점을 두고 있다. 그 이후의 디코딩 과정은 현재 시점에서 가장 높은 확률을 가지는 자소를 출력하거나 빔 탐색을 사용하며 이러한 방식은 모델이 출력하는 확률 분포에 따라 최종 결과에 큰 영향을 받게 된다. 또한 end-to-end 음성인식방식은 전통적인 음성인식 방법과 비교 했을 때 구조적인 문제로 인해 외부 발음열 정보와 언어 모델의 정보를 사용하지 못한다. 따라서 학습 자료에 없는 발음열 변환 규칙에 대한 대응이 쉽지 않다. 따라서 본 논문에서는 발음열 정보를 담고 있는 Lexicon transducer(L transducer)를 이용한 conformer의 디코딩 방법을 제안한다. 한국어 데이터 셋 270 h에 대해 자소 기반 conformer의 빔 탐색 결과와 음소 기반 conformer에 L transducer를 적용한 결과를 비교 평가하였다. 학습자료에 등장하지 않는 단어가 포함된 테스트 셋에 대해 자소 기반 conformer는 3.8 %의 음절 오류율을 보였으며 음소 기반 conformer는 3.4 %의 음절 오류율을 보였다.