• 제목/요약/키워드: Embedding dimension

검색결과 75건 처리시간 0.02초

약물-표적 단백질 연관관계 예측모델을 위한 쌍 기반 뉴럴네트워크 (Pairwise Neural Networks for Predicting Compound-Protein Interaction)

  • 이문환;김응희;김홍기
    • 인지과학
    • /
    • 제28권4호
    • /
    • pp.299-314
    • /
    • 2017
  • In-silico 기반의 약물-표적 단백질 연관관계 예측은 신약 탐색 단계에서 매우 중요하다. 그러나 기존의 예측모델은 입력 값이 고정적이며 표적 단백질의 특질 값이 가공된 데이터로 한정됨으로써 예측 모델의 확장성과 유연성이 부족하다. 본 논문에서는 약물-표적 단백질 연관관계를 예측하는 확장 가능한 형태의 머신러닝 모델을 소개한다. 확장 가능한 머신러닝 모델의 핵심 아이디어는 쌍기반의 뉴럴 네트워크로써, 약물과 단백질의 미가공 데이터를 사용하여 특질을 추출하고 특질 값을 각각의 뉴럴 네트워크 레이어에 입력한다. 이 방법은 추가적인 지식없이 자동적으로 약물과 단백질의 특질을 추출한다. 또한 쌍기반 레이어는 특질 값을 풍부한 저차원의 벡터로 향상 시킴으로써 입력 값의 차이로 인한 편향 학습을 방지한다. PubChem BioAssay(PCBA) 데이터 셋에 기반한 5-폴드 교차 검증법을 통하여 제안한 모델의 성능을 평가했으며, 이전의 모델보다 우월한 성능을 보였다.

환율예측을 위한 신호처리분석 및 인공신경망기법의 통합시스템 구축 (A Hybrid System of Joint Time-Frequency Filtering Methods and Neural Network Techniques for Foreign Exchange Rate Forecasting)

  • 신택수;한인구
    • 지능정보연구
    • /
    • 제5권1호
    • /
    • pp.103-123
    • /
    • 1999
  • Input filtering as a preprocessing method is so much crucial to get good performance in time series forecasting. There are a few preprocessing methods (i.e. ARMA outputs as time domain filters, and Fourier transform or wavelet transform as time-frequency domain filters) for handling time series. Specially, the time-frequency domain filters describe the fractal structure of financial markets better than the time domain filters due to theoretically additional frequency information. Therefore, we, first of all, try to describe and analyze specially some issues on the effectiveness of different filtering methods from viewpoint of the performance of a neural network based forecasting. And then we discuss about neural network model architecture issues, for example, what type of neural network learning architecture is selected for our time series forecasting, and what input size should be applied to a model. In this study an input selection problem is limited to a size selection of the lagged input variables. To solve this problem, we simulate on analyzing and comparing a few neural networks having different model architecture and also use an embedding dimension measure as chaotic time series analysis or nonlinear dynamic analysis to reduce the dimensionality (i.e. the size of time delayed input variables) of the models. Throughout our study, experiments for integration methods of joint time-frequency analysis and neural network techniques are applied to a case study of daily Korean won / U. S dollar exchange returns and finally we suggest an integration framework for future research from our experimental results.

  • PDF

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.

결함 노드를 갖는 (n,K)-스타 그래프에서의 링 임베딩 (Ring Embedding in (n.K) Star Graphs with Faulty Nodes)

  • 장정환;김진수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권1호
    • /
    • pp.22-34
    • /
    • 2002
  • 본 논문에서는 최근에 제안된 (n,K)-스타 그래프에서 결함 노드를 포함하는 경우의 링 임베딩 문제를 다룬다. 그래프 자체의 계층적 특성을 이용한 일련의 차원 확장 및 결함 노드의 분산 전략 을 효율적으로 이용하여 n-3개의 이하의 결함 노드만을 포함하고, $n-k{\geq}2$를 만족한는(n.k)-스타 그래프에서 고장 노드들만 제외시킨 최대 크기의 링을 임베딩할 수 있음을 보이고해당 임베딩 알고리즘을 제시한다. 본 논문에서 다루고 있는 사이클 특성과 관련된 림 임베딩 연구는 병렬 처리 분야에서의 멀티캐스팅 등 과 같이 내재된 사이클 특성을 활용하는 분야에 응용이 가능하다.

A Novel Approach of Feature Extraction for Analog Circuit Fault Diagnosis Based on WPD-LLE-CSA

  • Wang, Yuehai;Ma, Yuying;Cui, Shiming;Yan, Yongzheng
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권6호
    • /
    • pp.2485-2492
    • /
    • 2018
  • The rapid development of large-scale integrated circuits has brought great challenges to the circuit testing and diagnosis, and due to the lack of exact fault models, inaccurate analog components tolerance, and some nonlinear factors, the analog circuit fault diagnosis is still regarded as an extremely difficult problem. To cope with the problem that it's difficult to extract fault features effectively from masses of original data of the nonlinear continuous analog circuit output signal, a novel approach of feature extraction and dimension reduction for analog circuit fault diagnosis based on wavelet packet decomposition, local linear embedding algorithm, and clone selection algorithm (WPD-LLE-CSA) is proposed. The proposed method can identify faulty components in complicated analog circuits with a high accuracy above 99%. Compared with the existing feature extraction methods, the proposed method can significantly reduce the quantity of features with less time spent under the premise of maintaining a high level of diagnosing rate, and also the ratio of dimensionality reduction was discussed. Several groups of experiments are conducted to demonstrate the efficiency of the proposed method.

t-SNE에 대한 요약 (A review on the t-distributed stochastic neighbors embedding)

  • 김기풍;김충락
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.167-173
    • /
    • 2023
  • 본 논문에서는 고차원의 자료를 저차원으로 변환시켜 시각화하는 다양한 방법들을 소개하였다. 차원 축소는 크게 선형 방법과 비선형 방법으로 나눌 수 있는데 선형 방법으로 주성분 분석, 다차원 척도 등을 간략하게 소개하였고 비선형 방법으로 커널 주성분 분석, 자기조직도, 국소 선형 사상, Isomap, 국소 다차원 척도 등을 간략하게 소개하였으며, 가장 최근에 제안되었으며 매우 널리 사용되고 있지만 통계학 분야에는 비교적 생소한 t-SNE에 대하여 자세히 소개하였다. t-SNE를 이용한 간단한 예제를 제시하고 t-SNE의 장단점을 지적한 최근 연구 논문을 소개하고 제시된 향후 연구 과제들을 살펴보았다.

지도학습 기반의 차원축소 모델을 이용한 특허 빅데이터 예측에 관한 연구 (A Study on prediction of patent big data using supervised learning with dimension reduction model)

  • 이주현;이준석;강지호;박상성;장동식;홍성욱;김선영
    • 디지털산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.41-49
    • /
    • 2019
  • Patents are system to promote the development of industry by disclosing technology. The importance of recent patent is being emphasized. For this reason, companies apply for many patents. And they analyze the patent. Patent analysis helps to protect and foster their technology. Previously this method has been carried out by experts. Expert-based patent analysis, however, has the disadvantage of being time-consuming and expensive. Consequently, we try to solve this problems by developing prediction model. Therefore, this paper proposes a data-based patent analysis method using quantitative indicator and textual information. We confirmed the practical applicability of the proposed method through 1,831 autonomous vehicle patents. As a result, it was possible to confirmed that safety and lane detection related technologies are important.

포켈스 소자를 이용한 PD 신호의 검출 및 비선형적 해석에 관한 연구 (A possible application of the PD detection technique using electro-optic Pockels cell with nonlinear characteristic analysis on the PD signals)

  • 임윤석;강원종;장용무;구자윤
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 C
    • /
    • pp.1850-1852
    • /
    • 2000
  • In this paper, new Partial Discharge (PD) detection technique using Pockels cell was proposed and considerable apparent chaotic characteristics were discussed. For this purpose, PD was generated from needle-plane electrode in air and detected by optical measuring system using Pockels cell, based on Mach-Zehnder interferometer, consisting of He-Ne laser, single mode optical fiber, 50/50 beam splitter and photo detector. A qualitative analysis was carried out by drawing Return map for the normalized time series of the detected PD signals. The results are as follows:(a) Fixed points, between 0.7 and 1.0, are appeared clearly in the right upper area of the return map as the increase in the number of obtained data.(b) Considerable periodicity have been remarked even though exact period and length can not be determined.(c) The self-similarity can be also observed inasmuch as the late paths do not follow the previous ones. Accordingly, exact quantitative analysis such as embedding dimension, fractal dimension, and Lyapunov exponents should be carried out for deducing the quantitative properties regarding PD phenomena.

  • PDF

어트랙터 사분면법을 이용한 비철금속의 초정밀 절삭특성 평가에 관한 연구 (The Study on Ultra-Precision Cutting Characteristics Evaluation of Non-Ferrous Metals Using Attractor Quadrant Method)

  • 고준빈;김건희;윤인식
    • 한국정밀공학회지
    • /
    • 제20권6호
    • /
    • pp.20-26
    • /
    • 2003
  • This study proposes the construction of attractor quadrant method for high-precision cutting characteristics evaluation of non-ferrous metals. Also this paper aims to find the optimal cutting conditions of diamond turning machine by measuring surface form and roughness to perform the cutting experiment of non-ferrous metals, which are aluminum, with diamond tool. As well, according to change cutting conditions such as feed rate, using diamond turning machine to Perform cutting Processing, by measuring cutting force and surface roughness and according to cutting conditions the aluminum about cutting properties. Trajectory changes in the attractor indicated a substantial difference in fractal characteristics and attractor quadrant characteristics. In quantitative quadrant feature extraction, 1,309 point in the case of A17075 (one quadrant) and 1,406 point (one quadrant) in the case of brass were proposed on the basis of attractor reconstruction. Proposed attractor quadrant method can be used for high-precision cutting characteristics evaluation of non-ferrous metals.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.