• 제목/요약/키워드: heterogeneous data learning

검색결과 99건 처리시간 0.024초

두 이종 혼합 모형에서의 수정된 경사 하강법 (Adaptive stochastic gradient method under two mixing heterogenous models)

  • 문상준;전종준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1245-1255
    • /
    • 2017
  • 온라인 학습은 자료가 실시간으로 혹은 배치 단위로 축적되는 상황에서 주어진 목적함수의 해를 계산하는 방법을 말한다. 온라인 학습 알고리즘 중 배치를 이용한 확률적 경사 하강법 (stochastic gradient decent method)은 가장 많이 사용되는 방법 중 하나다. 이 방법은 구현이 쉬울 뿐만 아니라 자료가 동질적인 분포를 따른다는 가정 하에서 그 해의 성질이 잘 연구되어 있다. 하지만 자료에 특이값이 있거나 임의의 배치가 확률적으로 이질적 성질을 가질 때, 확률적 경사 하강법이 주는 해는 큰 편이를 가질 수 있다. 본 연구에서는 이러한 비정상 배치 (abnormal batch) 있는 자료 하에서 효과적으로 온라인 학습을 수행할 수 있는 수정된 경사 하강 알고리즘 (modified gradient decent algorithm)을 제안하고, 그 알고리즘을 통해 계산된 해의 수렴성을 밝혔다. 뿐만 아니라 간단한 모의실험을 통해 제안한 방법의 이론적 성질을 실증하였다.

딥 러닝 기반의 이기종 무선 신호 구분을 위한 데이터 수집 효율화 기법 (An Efficient Data Collection Method for Deep Learning-based Wireless Signal Identification in Unlicensed Spectrum)

  • 최재혁
    • 전기전자학회논문지
    • /
    • 제26권1호
    • /
    • pp.62-66
    • /
    • 2022
  • 최근 데이터 기반의 딥러닝 기술을 적용하여 비면허 대역의 다양한 통신 신호를 분류하는 연구가 활발히 수행되고 있다. 하지만, 복잡한 신경망 모델 사용을 기반으로 이뤄진 이러한 접근법은 높은 연산 능력을 필요로 하게 되어, 자원 제약적인 무선 인터페이스 및 사물인터넷(Internet of Things) 장비에서는 사용이 제약된다. 본 연구에서는 비면허 대역의 무선 이기종 기술을 인지하기 위한 데이터 기반의 접근 방법을 살펴보고, 신호의 특징 추출 및 데이터화의 효율화 문제를 다룬다. 구체적으로, 비면허 대역의 다른 종류의 무선 통신 기술을 구분하기 위해 수신 신호 강도 측정을 기반으로 한 시계열 데이터를 이용해 합성곱 신경망(Convolutional Neural Network, CNN) 모델을 학습시켜 신호를 분류하는 방법을 살펴본다. 이 과정에서 동일한 구조의 신경망 모델의 경량화를 위한 효율적 신호의 시계열 데이터 정보 수집시 주파수 대역의 특징을 함께 특징화하는 방법을 제안하고, 그 효과를 평가한다. Bluetooth 호환의 Ubertooth 장비를 이용한 실측 기반의 실험 결과는 제안된 샘플링 기법이 동일한 신경망에 대해서 10% 수준의 샘플링 데이터 이용만으로도 동일한 정확도를 유지함을 보여준다.

지반의 불균질성을 고려한 GPR 신호의 자동탐지모델 성능 비교 (Comparison of performance of automatic detection model of GPR signal considering the heterogeneous ground)

  • 이상연;송기일;강경남;류희환
    • 한국터널지하공간학회 논문집
    • /
    • 제24권4호
    • /
    • pp.341-353
    • /
    • 2022
  • 도심지에는 많은 지중 매설관이 설치되어 있으며, 이러한 지중 관로의 위치(깊이, 방향 등)은 굴착을 수행하기 전에 특정되어야 한다. 지중 매설관을 탐지하기 위해 다양한 지구물리학적인 방법을 사용할 수 있으나, 지반의 불균질성으로 인해 정확한 위치정보를 파악하는 것은 어렵다. 다양한 비파괴 탐사 방법 중 GPR (ground penetrating radar)는 고속으로 실험이 가능하며, 다른 탐사 방법에 비해 상대적으로 저렴한 탐사비용 등의 장점을 갖는다. 그러나 GPR의 탐사 데이터는 해석이 직관적이지 않아 상당한 전문적 지식이 요구된다. 최근 딥러닝을 이용한 탐사 데이터의 자동판독 기술에 대한 연구가 증가하고 있으나, 매설물의 위치를 정확히 알고 있는 탐사 데이터가 부족하여 학습모델 구축에 어려움이 있다. 이를 해결하기 위해 본 연구에서는 이러한 문제를 FDTD (finite difference time domain)수치해석을 통해 해결하고 자동탐지 학습 모델의 성능을 향상시키기 위한 기초연구를 수행하였다. 첫째, 단일유전율로 구성된 균질지반을 구성하고 해석을 수행하였다. 불균질 지반의 경우 프랙탈 기법을 이용하여 모델을 구성하고 해석을 수행하였다. 둘째, 합성곱 신경망을 이용하여 딥러닝 학습을 수행하였다. Model-A는 균질 지반 해석 데이터만 이용하여 학습을 수행하였으며, Model-B는 균질 및 불균질 지반 해석 데이터를 이용하여 학습을 수행하였다. 그 결과 Model-B가 Model-A보다 탐지성능이 우수한 것을 확인하였다. 이는 자동탐지 모델의 학습 시, 지반의 불균질성을 포함하여 학습을 수행하면 탐지 모델의 성능이 개선됨을 의미한다.

A review on deep learning-based structural health monitoring of civil infrastructures

  • Ye, X.W.;Jin, T.;Yun, C.B.
    • Smart Structures and Systems
    • /
    • 제24권5호
    • /
    • pp.567-585
    • /
    • 2019
  • In the past two decades, structural health monitoring (SHM) systems have been widely installed on various civil infrastructures for the tracking of the state of their structural health and the detection of structural damage or abnormality, through long-term monitoring of environmental conditions as well as structural loadings and responses. In an SHM system, there are plenty of sensors to acquire a huge number of monitoring data, which can factually reflect the in-service condition of the target structure. In order to bridge the gap between SHM and structural maintenance and management (SMM), it is necessary to employ advanced data processing methods to convert the original multi-source heterogeneous field monitoring data into different types of specific physical indicators in order to make effective decisions regarding inspection, maintenance and management. Conventional approaches to data analysis are confronted with challenges from environmental noise, the volume of measurement data, the complexity of computation, etc., and they severely constrain the pervasive application of SHM technology. In recent years, with the rapid progress of computing hardware and image acquisition equipment, the deep learning-based data processing approach offers a new channel for excavating the massive data from an SHM system, towards autonomous, accurate and robust processing of the monitoring data. Many researchers from the SHM community have made efforts to explore the applications of deep learning-based approaches for structural damage detection and structural condition assessment. This paper gives a review on the deep learning-based SHM of civil infrastructures with the main content, including a brief summary of the history of the development of deep learning, the applications of deep learning-based data processing approaches in the SHM of many kinds of civil infrastructures, and the key challenges and future trends of the strategy of deep learning-based SHM.

이기종 컴퓨팅을 활용한 환율 예측 뉴럴 네트워크 구현 (Implementation of Exchange Rate Forecasting Neural Network Using Heterogeneous Computing)

  • 한성현;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권11호
    • /
    • pp.71-79
    • /
    • 2017
  • 본 논문에서는 이기종 컴퓨팅을 활용한 환율 예측 뉴럴 네트워크를 구현했다. 환율 예측에는 많은 양의 데이터가 필요하다. 그에 따라 이러한 데이터를 활용할 수 있는 뉴럴 네트워크를 사용했다. 뉴럴 네트워크는 크게 학습과 검증의 두 과정을 거친다. 학습은 CPU를 활용했다. 검증에는 Verilog HDL로 작성된 RTL을 FPGA에서 동작 시켰다. 해당 뉴럴 네트워크의 구조는 입력 뉴런 네 개, 히든 뉴런 네 개, 출력 뉴런 한 개를 가진다. 입력 뉴런에는 미국 1달러, 일본 100엔, EU 1유로, 영국 1파운드의 원화 가치를 사용했다. 입력 뉴런들을 통해 캐나다 1달러의 원화가치를 예측 했다. 환율을 예측 하는 순서는 입력, 정규화, 고정 소수점 변환, 뉴럴 네트워크 순방향, 부동 소수점 변환, 역정규화, 출력 과정을 거친다. 2016년 11월의 환율을 예측한 결과 0.9원에서 9.13원 사이의 오차 금액이 발생했다. 환율 이외의 다른 데이터를 추가해 뉴런의 개수를 늘린다면 더 정확한 환율 예측이 가능할 것으로 예상된다.

머신러닝을 위한 온톨로지 기반의 Raw Data 전처리 기법 (Pre-processing Method of Raw Data Based on Ontology for Machine Learning)

  • 황치곤;윤창표
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.600-608
    • /
    • 2020
  • 머신러닝은 학습 데이터로부터 목적함수를 구성하고, 테스트 데이터를 통해 목적함수의 확인함으로써 발생하는 데이터에 대한 예측을 수행한다. 머신러닝에서 입력데이터는 전처리 과정을 통해 정규화 과정을 거친다. 이런 정규화는 입력데이터의 평균과 표준편차를 이용하여 표준화하거나, 수치 데이터가 아닌 nominal value는 one-hot 코드 형태로 변환하는 방식을 이용한다. 그러나 이 전처리 과정만으로 문제를 해결할 수 없다. 이러한 이유로 본 논문에서 입력데이터의 정규화를 위해 온톨로지를 이용하는 방법을 제안한다. 이를 위한 테스트 데이터는 모바일 기기로부터 수집된 와이파이 장치의 RSSI값을 이용하고, 수집된 데이터의 노이즈와 이질적 문제는 온톨로지를 이용하여 정제하는 방법을 제시한다.

Examining Generalizability of Kang's (1999) Model of Structural Relationships between ESL Learning Strategy Use and Language Proficiency

  • 강성우
    • 영어어문교육
    • /
    • 제7권2호
    • /
    • pp.55-75
    • /
    • 2002
  • The present study examined whether Kang's (1999) model of the relationships among language learning strategy use and language proficiency for the Asian students could be applied to a more heterogeneous group. In Kang's study, he collected information of language learning strategies of 957 foreign students learning English as a second language in American colleges through a questionnaire. He also measured the subjects' language proficiency with the Institutional Testing Program TOEFL (Test of English as a Foreign Language). This study analyzed the same data without the limitation of cultural identity. Structural equation modeling was used to model the relationships among strategy use and language proficiency. Then, the model of the present study was descriptively compared with Kang's (1999) model for the Asian students. The overall flow of the relationship paths appeared to vary very little across the two models, which would have indicated that the generalizability of Kang's (1999) model could be extended more than originally examined. (156)

  • PDF

The Clustered Patterns of Engagement in MOOCs and Their Effects on Teaching Presence and Learning Persistence

  • Kim, Hannah;Lee, Jeongmin;Jung, Yeonji
    • International Journal of Contents
    • /
    • 제16권4호
    • /
    • pp.39-49
    • /
    • 2020
  • The goal of this research was to understand the patterns of multidimensional engagement in MOOCs. An email with an online survey link was sent to enrollees in an MOOC course. The survey included 35 questions asking about engagement, teaching presence, and learning persistence. The items were validated in the literature, revised for the MOOC setting, reviewed by four professionals in the field of educational technology, and used in the study. A heterogeneous group of 170 individuals gathered through convenience sampling participated in the study. With cluster analysis of the engagement data, three groups were identified: Cluster1, 2, and 3. Cluster 1 scored high on behavioral, emotional, and cognitive engagement. Cluster 2 scored high on behavioral aspects but low on emotional and cognitive engagement. Cluster 3 scored low on behavioral and cognitive engagement but high on emotional aspects. The study addressed cluster-specific learner characteristics and differences in perceived teaching presence and learning persistence. Design strategies pertaining to each cluster were further discussed. These strategies may guide instructors and practitioners in the design and management of MOOCs and should be further validated through future studies.

사용자 참여형 웨어러블 디바이스 데이터 전송 연계 및 딥러닝 대사증후군 예측 모델 (Deep Learning Algorithm and Prediction Model Associated with Data Transmission of User-Participating Wearable Devices)

  • 이현식;이웅재;정태경
    • 한국산업정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.33-45
    • /
    • 2020
  • 본 논문은 최근 다양한 종류의 웨어러블 디바이스가 헬스케어 도메인에 급증하여 사용되고 있는 상황에서 최신 첨단 기술이 실제 메디컬 환경에서 개인의 질병예측이라는 관점을 바라본다. 사용자 참여형 웨어러블 디바이스를 통하여 임상 데이터와 유전자 데이터, 라이프 로그 데이터를 병합하여 데이터를 수집, 처리, 전송하는 과정을 걸쳐 딥뉴럴 네트워크의 환경에서 학습모델의 제시와 피드백 모델을 연결하는 과정을 제시한다. 이러한 첨단 의료 현장에서 일어나는 메디컬 IT의 임상시험 절차를 걸친 실제 현장의 경우 대사 증후군에 의한 특정 유전자가 질병에 미치는 영향을 측정과 더불어 임상 정보와 라이프 로그 데이터를 병합하여 서로 각기 다른 이종 데이터를 처리하면서 질병의 특이점을 확인하게 된다. 즉, 이종 데이터의 딥뉴럴 네트워크의 객관적 적합성과 확실성을 증빙하게 되고 이를 통한 실제 딥러닝 환경에서의 노이즈에 따른 성능 평가를 실시한다. 이를 통해 자동 인코더의 경우의 1,000 EPOCH당 변화하는 정확도와 예측치가 변수의 증가 값에 수차례 선형적으로 변화하는 현상을 증명하였다.

Structural live load surveys by deep learning

  • Li, Yang;Chen, Jun
    • Smart Structures and Systems
    • /
    • 제30권2호
    • /
    • pp.145-157
    • /
    • 2022
  • The design of safe and economical structures depends on the reliable live load from load survey. Live load surveys are traditionally conducted by randomly selecting rooms and weighing each item on-site, a method that has problems of low efficiency, high cost, and long cycle time. This paper proposes a deep learning-based method combined with Internet big data to perform live load surveys. The proposed survey method utilizes multi-source heterogeneous data, such as images, voice, and product identification, to obtain the live load without weighing each item through object detection, web crawler, and speech recognition. The indoor objects and face detection models are first developed based on fine-tuning the YOLOv3 algorithm to detect target objects and obtain the number of people in a room, respectively. Each detection model is evaluated using the independent testing set. Then web crawler frameworks with keyword and image retrieval are established to extract the weight information of detected objects from Internet big data. The live load in a room is derived by combining the weight and number of items and people. To verify the feasibility of the proposed survey method, a live load survey is carried out for a meeting room. The results show that, compared with the traditional method of sampling and weighing, the proposed method could perform efficient and convenient live load surveys and represents a new load research paradigm.