• 제목/요약/키워드: matrix learning

검색결과 354건 처리시간 0.021초

멀티코어 인메모리 환경에서 트랜잭션을 처리하기 위한 효율적인 HTM 기법 (Efficient Hardware Transactional Memory Scheme for Processing Transactions in Multi-core In-Memory Environment)

  • 장연우;강문환;윤민;장재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권8호
    • /
    • pp.466-472
    • /
    • 2017
  • 하드웨어 트랜잭셔널 메모리(HTM)는 트랜잭션 처리를 위한 병렬 프로그래밍 패러다임을 크게 바꾸었으며, 최근 Intel에서 TSX를 제안함에 따라 HTM에 기반한 다수의 연구들이 수행되었다. 그러나 기존 연구들은 트랜잭션 처리에서 하나의 원인에 대한 충돌 예측만을 지원하며, 모든 워크로드에 대해 획일화된 TSX 환경을 제공한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 멀티코어 인메모리 환경에서 트랜잭션을 처리하기 위한 효율적인 HTM 기법을 제안한다. 첫째, 제안하는 기법은 과거 트랜잭션 처리 정보를 수집한 매트릭스를 이용하여, HTM 실패시의 대비책 경로로써 STM 혹은 single lock을 선택한다. 둘째, 머신러닝 알고리즘 기반 재시도 정책을 제공함으로써, 워크로드 특성에 맞는 효율적인 트랜잭션 처리를 수행한다. 마지막으로 STAMP를 이용한 성능평가를 통해, 제안하는 기법이 기존 연구에 비해 10~20%의 성능 향상이 있음을 보인다.

CUDA 및 분할-정복 기반의 효율적인 다차원 척도법 (An Efficient Multidimensional Scaling Method based on CUDA and Divide-and-Conquer)

  • 박성인;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.427-431
    • /
    • 2010
  • 다차원 척도법(multidimensional scaling)은 고차원의 데이터를 낮은 차원의 공간에 매핑(mapping)하여 데이터 간의 유사성을 표현하는 방법이다. 이는 주로 자질 선정 및 데이터를 시각화하는 데 이용된다. 그러한 다차원 척도법 중, 전통 다차원 척도법(classical multidimensional scaling)은 긴 수행 시간과 큰 공간을 필요로 하기 때문에 객체의 수가 많은 경우에 대해 적용하기 어렵다. 이는 유클리드 거리(Euclidean distance)에 기반한 $n{\times}n$ 상이도 행렬(dissimilarity matrix)에 대해 고유쌍 문제(eigenpair problem)를 풀어야 하기 때문이다(단, n은 객체의 개수). 따라서, n이 커질수록 수행 시간이 길어지며, 메모리 사용량 증가로 인해 적용할 수 있는 데이터 크기에 한계가 있다. 본 논문에서는 이러한 문제를 완화하기 위해 GPGPU 기술 중 하나인 CUDA와 분할-정복(divide-and-conquer)기법을 활용한 효율적인 다차원 척도법을 제안하며, 다양한 실험을 통해 제안하는 기법이 객체의 개수가 많은 경우에 매우 효율적일 수 있음을 보인다.

문서 분류의 개선을 위한 단어-문자 혼합 신경망 모델 (Hybrid Word-Character Neural Network Model for the Improvement of Document Classification)

  • 홍대영;심규석
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1290-1295
    • /
    • 2017
  • 문서의 텍스트를 바탕으로 각 문서가 속한 분류를 찾아내는 문서 분류는 자연어 처리의 기본 분야 중 하나로 주제 분류, 감정 분류 등 다양한 분야에 이용될 수 있다. 문서를 분류하기 위한 신경망 모델은 크게 단어를 기본 단위로 다루는 단어 수준 모델과 문자를 기본 단위로 다루는 문자 수준 모델로 나누어진다. 본 논문에서는 문서를 분류하는 신경망 모델의 성능을 향상시키기 위하여 문자 수준과 단어 수준의 모델을 혼합한 신경망 모델을 제안한다. 제안하는 모델은 각 단어에 대하여 문자 수준의 신경망 모델로 인코딩한 정보와 단어들의 정보를 저장하고 있는 단어 임베딩 행렬의 정보를 결합하여 각 단어에 대한 특징 벡터를 만든다. 추출된 단어들에 대한 특징 벡터를 바탕으로, 주의(attention) 메커니즘을 이용한 순환 신경망을 단어 수준과 문장 수준에 각각 적용하는 계층적 신경망 구조를 통해 문서를 분류한다. 제안한 모델에 대하여 실생활 데이터를 바탕으로 한 실험으로 효용성을 검증한다.

대용량 컴뮤트 타임 임베딩을 위한 연산 속도 개선 방식 제안 (Proposing the Methods for Accelerating Computational Time of Large-Scale Commute Time Embedding)

  • 한희일
    • 전자공학회논문지
    • /
    • 제52권2호
    • /
    • pp.162-170
    • /
    • 2015
  • 컴뮤트 타임 임베딩을 구현하려면 그래프 라플라시안 행렬의 고유값과 고유벡터를 구하여야 하는데, $o(n^3)$의 계산량이 요구되어 대용량 데이터에는 적용하기 어려운 문제가 있다. 이를 줄이기 위하여 표본화 과정을 통하여 크기가 줄어든 그래프 라플라시안 행렬에서 구한 다음, 원래의 고유값과 고유벡터를 근사화시키는 Nystr${\ddot{o}}$m 기법을 주로 채택한다. 이 과정에서 많은 오차가 발생하는데, 이를 개선하기 위하여 본 논문에서는 그래프 라플라시안 대신에 가중치 행렬을 표본화하고 이로부터 구한 고유값과 고유벡터를 그래프 라플라시안의 고유값과 고유벡터로 변환하는 기법을 이용하여 대용량 데이터로 구성된 스펙트럴 그래프를 근사적으로 컴뮤트 타임 임베딩하는 기법을 제안한다. 하지만, 이 방식도 스펙트럼 분해를 계산하여야 하므로 데이터의 크기가 증가하면 적용하기 어려운 문제가 발생한다. 이의 대안으로, 스펙트럼 분해를 계산하지 않고도 데이터 집합의 크기에 영향을 받지 않으면서 컴뮤트 타임을 근사적으로 계산하는 방식을 구현하고 이들의 특성을 실험적으로 분석한다.

난방시스템 최적 셋백온도 적용시점 예측을 위한 인공신경망모델 개발 (Development of Artificial Neural Network Model for Predicting the Optimal Setback Application of the Heating Systems)

  • 백용규;윤연주;문진우
    • KIEAE Journal
    • /
    • 제16권3호
    • /
    • pp.89-94
    • /
    • 2016
  • Purpose: This study aimed at developing an artificial neural network (ANN) model to predict the optimal start moment of the setback temperature during the normal occupied period of a building. Method: For achieving this objective, three major steps were conducted: the development of an initial ANN model, optimization of the initial model, and performance tests of the optimized model. The development and performance testing of the ANN model were conducted through numerical simulation methods using transient systems simulation (TRNSYS) and matrix laboratory (MATLAB) software. Result: The results analysis in the development and test processes revealed that the indoor temperature, outdoor temperature, and temperature difference from the setback temperature presented strong relationship with the optimal start moment of the setback temperature; thus, these variables were used as input neurons in the ANN model. The optimal values for the number of hidden layers, number of hidden neurons, learning rate, and moment were found to be 4, 9, 0.6, and 0.9, respectively, and these values were applied to the optimized ANN model. The optimized model proved its prediction accuracy with the very storing statistical correlation between the predicted values from the ANN model and the simulated values in the TRNSYS model. Thus, the optimized model showed its potential to be applied in the control algorithm.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

온라인 방과후학교 프로그램 도입에 대한 수도권과 비수도권 간 인식차이 분석: 초등학교 교사들의 인식을 중심으로 (A study on primary school teachers' needs of Online After-School management)

  • 황두희;김진희
    • 디지털융복합연구
    • /
    • 제18권5호
    • /
    • pp.1-8
    • /
    • 2020
  • 본 연구는 교사관점에서 초등학교의 지역 위치에 따른 온라인 방과후학교에 대한 요구차이를 파악하여 지역간 우선적으로 추진해야 하는 정책적 사안에 대한 요구도를 도출함으로써, 온라인 방과후학교 프로그램 도입을 위한 단초를 마련하고자 한다. 이를 위한 논의를 체계화하기 위하여 방과후학교 운영 경험이 있는 교사들을 대상으로 설문조사를 실시(n=155)하였다. 이후, 교사가 인식하고 있는 요구와 우선순위를 IPA모형 매트릭스로 분석하였다. 분석결과를 요약하면, 수도권의 경우 '온라인기반교육환경', '행정 운영 효율성', '전문강사 수급'의 대한 요구가 높았다. 반면 비수도권의 경우, '전문 강사 수급', '우수 콘텐츠', '온라인기반교육환경'이 높은 수준의 향상 요구도를 나타내고 있다. 본 연구 결과는 향후 온라인 방과후학교 도입 시, 실질적이면서도 실천가능한 정책을 입안·추진하는데 시사점을 제시할 것이며, 지역별 방과후학교 온라인 프로그램 운영 활성화 및 운영체제 개선을 위한 기초 자료로 참고할 수 있을 것으로 기대한다.

주산기 뇌손상의 신경병리적 기전 (Neuropathological Mechanisms of Perinatal Brain Injury)

  • 송주영;김진상
    • The Journal of Korean Physical Therapy
    • /
    • 제15권4호
    • /
    • pp.199-207
    • /
    • 2003
  • 신생아의 정상적인 발달을 저해하고 조기 사망의 주된 원인이 되고 있는 주산기 뇌손상에 관한 신경병리적 기전을 살펴보고자 하였다. 발달하고 있는 과정에서의 주산기 뇌손상은 주로 저산소성-허혈성 뇌손상과 출혈성 뇌손상에 의한 경우가 많다. 저산소성-허혈성 뇌손상과 관련하여 에너지 부전, 세포흥분독성, 미성숙 백질의 선택적 취약성을 고려해 볼 수 있다. 첫번째, 세포호흡에 관여하는 미토콘드리아의 손상과 관련하여 즉각적인 병리와 함께 지연된 양상의 손상을 보인다. 미토콘드리아의 호흡률이 감소하고 칼슘이온의 농도가 상승하여 세포 괴사 및 세포사멸 과정이 진행된다. 두번째, 흥분성 아미노산과 관련하여 미성숙한 뇌에는 NMDA 수용기-채널 복합체의 기능이 매우 풍부하고, phosphoinositide 가수분해가 높아서 흥분독성에 상당히 취약하다. 세 번째, 수초 형성에 중요한 역할을 하는 희돌기교세포가 주산기 뇌손상 특히, 저산소성-허혈성 손상에 취약하다. 희돌기교세포는 글루타메이트에 의한 자유유리기과 사이토카인 손상에 취약하다. 뇌출혈과 관련하여, 미성숙한 뇌는 뇌실 주위에 혈관층이 풍부하나 매우 약한 상태로 재관류 혹은 혈류의 증가로 인해 쉽게 파열된다. 특히 32주 이내인 경우 이러한 손상으로 인해 뇌실주위 백질연화증이 초래된다.

  • PDF

Deep Belief Network를 이용한 뇌파의 음성 상상 모음 분류 (Vowel Classification of Imagined Speech in an Electroencephalogram using the Deep Belief Network)

  • 이태주;심귀보
    • 제어로봇시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.59-64
    • /
    • 2015
  • In this paper, we found the usefulness of the deep belief network (DBN) in the fields of brain-computer interface (BCI), especially in relation to imagined speech. In recent years, the growth of interest in the BCI field has led to the development of a number of useful applications, such as robot control, game interfaces, exoskeleton limbs, and so on. However, while imagined speech, which could be used for communication or military purpose devices, is one of the most exciting BCI applications, there are some problems in implementing the system. In the previous paper, we already handled some of the issues of imagined speech when using the International Phonetic Alphabet (IPA), although it required complementation for multi class classification problems. In view of this point, this paper could provide a suitable solution for vowel classification for imagined speech. We used the DBN algorithm, which is known as a deep learning algorithm for multi-class vowel classification, and selected four vowel pronunciations:, /a/, /i/, /o/, /u/ from IPA. For the experiment, we obtained the required 32 channel raw electroencephalogram (EEG) data from three male subjects, and electrodes were placed on the scalp of the frontal lobe and both temporal lobes which are related to thinking and verbal function. Eigenvalues of the covariance matrix of the EEG data were used as the feature vector of each vowel. In the analysis, we provided the classification results of the back propagation artificial neural network (BP-ANN) for making a comparison with DBN. As a result, the classification results from the BP-ANN were 52.04%, and the DBN was 87.96%. This means the DBN showed 35.92% better classification results in multi class imagined speech classification. In addition, the DBN spent much less time in whole computation time. In conclusion, the DBN algorithm is efficient in BCI system implementation.

Detecting response patterns of zooplankton to environmental parameters in shallow freshwater wetlands: discovery of the role of macrophytes as microhabitat for epiphytic zooplankton

  • Choi, Jong-Yun;Kim, Seong-Ki;Jeng, Kwang-Seuk;Joo, Gea-Jae
    • Journal of Ecology and Environment
    • /
    • 제38권2호
    • /
    • pp.133-143
    • /
    • 2015
  • Freshwater macrophytes improve the structural heterogeneity of microhabitats in water, often providing an important habitat for zooplankton. Some studies have focused on the overall influence of macrophytes on zooplankton, but the effects of macrophyte in relation to different habitat characteristics of zooplankton (e.g., epiphytic and pelagic) have not been intensively studied. We hypothesized that different habitat structures (i.e., macrophyte habitat) would strongly affect zooplankton distribution. We investigated zooplankton density and diversity, macrophyte characteristics (dry weight and species number), and environmental parameters in 40 shallow wetlands in South Korea. Patterns in the data were analyzed using a self-organizing map (SOM), which extracts information through competitive and adaptive properties. A total of 20 variables (11 environmental parameters and 9 zooplankton groups) were patterned onto the SOM. Based on a U-matrix, 3 clusters were identified from the model. Zooplankton assemblages were positively related to macrophyte characteristics (i.e., dry weight and species number). In particular, epiphytic species (i.e., epiphytic rotifers and cladocerans) exhibited a clear relationship with macrophyte characteristics, while large biomass and greater numbers of macrophyte species supported high zooplankton assemblages. Consequently, habitat heterogeneity in the macrophyte bed was recognized as an important factor to determine zooplankton distribution, particularly in epiphytic species. The results indicate that macrophytes are critical for heterogeneity in lentic freshwater ecosystems, and the inclusion of diverse plant species in wetland construction or restoration schemes is expected to generate ecologically healthy food webs.