• 제목/요약/키워드: Context Vector

검색결과 140건 처리시간 0.028초

사용자 데모를 이용한 관계적 개체 기반 정책 학습 (Learning Relational Instance-Based Policies from User Demonstrations)

  • 박찬영;김현식;김인철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.363-369
    • /
    • 2010
  • 데모-기반 학습은 사용자가 직접 작업을 시연함으로써 로봇에게 쉽게 새로운 작업지식을 가르칠 수 있다는 장점이 있다. 하지만 기존의 많은 데모-기반 학습법들은 상태공간과 정책들을 표현하기 위해 속성-값 벡터 모델을 이용하였다. 속성-값 벡터 모델의 제한성으로 인해, 이들은 학습과정의 효율성도 낮고 학습된 정책의 재사용성도 낮았다. 본 논문에서는 기존의 속성-값 모델 대신 관계적 모델을 이용하는 새로운 데모-기반 작업 학습법을 제안한다. 이 방법에서는 사용자 데모 기록에서 추출한 훈련 예들에 관계적 개체-기반 학습법을 적용함으로써, 동일 작업영역내의 다른 유사한 작업들에도 활용하기 용이한 관계적 개체-기반 정책을 유도한다. 이 관계적 정책은 (상태, 목표) 쌍으로 표현되는 임의의 한 상황에 대해 이것에 대응하는 하나의 실행동작을 결정해주는 역할을 한다. 본 논문에서는 데모-기반 관계적 정책 학습법에 대해 자세히 소개한 후, 로봇 시뮬레이터를 이용한 실험을 통해 이 학습법의 효과를 분석해본다.

머신러닝 기법을 활용한 암호화폐 유통 가격 예측 연구 (A Study on Predicting Cryptocurrency Distribution Prices Using Machine Learning Techniques)

  • 김한민;김호익
    • 유통과학연구
    • /
    • 제17권11호
    • /
    • pp.93-101
    • /
    • 2019
  • Purpose: Blockchain technology suggests ways to solve the problems in the existing industry. Among them, Cryptocurrency system, which is an element of Blockchain technology, is a very important factor for operating Blockchain. While Blockchain cryptocurrency has attracted attention, studies on cryptocurrency prices have been mainly conducted, however previous studies mainly conducted on Bitcoin prices. On the other hand, in the context of the creation and trading of various cryptocurrencies based on the Blockchain system, little research has been done on cryptocurrencies other than Bitcoin. Hence, this study attempts to find variables related to the prices of Dash, Litecoin, and Monero cryptocurrencies using machine learning techniques. We also attempt to find differences in the variables related to the prices for each cryptocurrencies and to examine machine learning techniques that can provide better performance. Research design, data, and methodology: This study performed Dash, Litecoin, and Monero price prediction analysis of cryptocurrency using Blockchain information and machine learning techniques. We employed number of transactions in Blockchain, amount of generated cryptocurrency, transaction fees, number of activity accounts in Blockchain, Block creation difficulty, block size, umber of created blocks as independent variables. This study tried to ensure the reliability of the analysis results through 10-fold cross validation. Blockchain information was hierarchically added for price prediction, and the analysis result was measured as RMSE and MAPE. Results: The analysis shows that the prices of Dash, Litecoin and Monero cryptocurrency are related to Blockchain information. Also, we found that different Blockchain information improves the analysis results for each cryptocurrency. In addition, this study found that the neural network machine learning technique provides better analysis results than support-vector machine in predicting cryptocurrency prices. Conclusion: This study concludes that the information of Blockchain should be considered for the prediction of the price of Dash, Litecoin, and Monero cryptocurrency. It also suggests that Blockchain information related to the price of cryptocurrency differs depending on the type of cryptocurrency. We suggest that future research on various types of cryptocurrencies is needed. The findings of this study can provide a theoretical basis for future cryptocurrency research in distribution management.

웹서비스와 스마트폰앱을 이용한 연안해양모델 예측자료의 시각화시스템 구현 (Geovisualization of Coastal Ocean Model Data Using Web Services and Smartphone Apps)

  • 김형우;구본호;우승범;이호상;이양원
    • Spatial Information Research
    • /
    • 제22권2호
    • /
    • pp.63-71
    • /
    • 2014
  • 최근 해양레포츠 산업이 블루오션으로 떠오르고 있는데, 해양레포츠는 조류, 수온, 염도 등과 같은 다양한 환경조건에 영향을 받기 때문에 관측자료 뿐만 아니라 모델 예측자료도 매우 필요한 정보이다. 본 연구에서는 연안해양모델인 FVCOM(Finite Volume Coastal Ocean Model)에서 산출된 예측자료를 웹 및 스마트폰을 통해 제공하는 시각화시스템을 구현하였다. 이를 위하여 FVCOM 자료에 내삽과 샘플링 등의 전처리를 하여, 조위, 수온, 염도의 래스터 이미지와 조류(유속, 유향)의 벡터 데이터베이스를 구축하였고, 스프링 프레임워크(Spring Framework)를 활용하여 REST(Representational State Transfer) 기반의 API(Application Programming Interface)를 제공하는 웹서비스를 구축하였다. 또한 데이터베이스 자료를 데스크톱 및 이기종의 스마트폰에 탑재시킴으로써 크로스플랫폼(cross-platform) 시각화 환경을 실현하였다.

온라인 상품 카테고리 내 주요 가격대 식별 (Identifying the Main Price Ranges of Online Product Category)

  • 김준우;임광혁
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.733-741
    • /
    • 2012
  • 최근 많은 소비자들이 관심 있는 물품 카테고리에 대한 정보를 얻기 위한 목적으로 종합 쇼핑몰이나 가격 비교 사이트를 방문하고 있다. 하지만, 이러한 웹 사이트들은 종종 이들에게 많은 상품들과 판매자가 포함된 지나치게 방대한 정보를 제공하여 소비자들의 구매 결정을 효과적으로 지원하지 못한다. 따라서 현대 온라인 쇼핑 에이전트들은 검색된 정보를 사용자들에게 제공하기 전에 보다 지능적인 방법으로 이를 가공할 필요가 있다. 본 논문은 특정 물품 카테고리 내에서 많은 상품들이 분포하고 있는 주요 가격대를 식별하는 방법을 제안하고자 한다. 이를 위해 한 개 카테고리 내 상품의 가격들을 벡터로 표현하고, 여기에 k-means 군집 분석을 적용하여 서로 비슷한 가격 벡터들을 포함하는 군집을 형성한 다음, 각 군집에서 주요 가격대를 추출하는 방법을 적용하였다. 일반적으로 가격은 소비자들의 구매 결정에서 가장 중요한 요인 중 하나이기 때문에, 추출된 주요 가격대들은 온라인 쇼핑 이용자들이 효과적으로 상품을 검색하는데 도움이 될 것으로 기대된다.

Web 2.0 기반 국가기준점 어플리케이션 설계 (An Application for Management of National Geodetic Control Points on the Web 2.0)

  • 김태우;김정욱;서용철
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.79-84
    • /
    • 2009
  • 삼각점, 수준점 등 국내에서 위치를 결정하는데 기본이 되는 모든 기준점은 공간정보의 기준이자 기반이 되기 때문에, 합리적이고 효율적이며, 지속적으로 관리되어야 한다. 한편 IT 및 통신기술이 발달함에 따라 공간정보를 다루는 모든 기술이 함께 발전하고 있으며, 모바일 디바이스의 대중화와 웹 2.0 환경이 구축됨에 따라 기준점의 관리를 실시간으로 가능케 하는 기술이 요구되고 있다. 이는 사용자의 편의를 보장하고 과학적이며 체계적인 기준점 관리를 도모한다. 본 연구에서는 웹 2.0 환경 하에서 Ajax 기반의 웹 어플리케이션을 설계하여 실시간으로 갱신되는 기준점 정보의 원활한 소통을 지원하고, 영상정보를 함께 제공함으로써 사용자 접근성을 강화하는 기술을 개발하였다.

  • PDF

텍스트 마이닝과 기계 학습을 이용한 국내 가짜뉴스 예측 (Fake News Detection for Korean News Using Text Mining and Machine Learning Techniques)

  • 윤태욱;안현철
    • Journal of Information Technology Applications and Management
    • /
    • 제25권1호
    • /
    • pp.19-32
    • /
    • 2018
  • Fake news is defined as the news articles that are intentionally and verifiably false, and could mislead readers. Spread of fake news may provoke anxiety, chaos, fear, or irrational decisions of the public. Thus, detecting fake news and preventing its spread has become very important issue in our society. However, due to the huge amount of fake news produced every day, it is almost impossible to identify it by a human. Under this context, researchers have tried to develop automated fake news detection method using Artificial Intelligence techniques over the past years. But, unfortunately, there have been no prior studies proposed an automated fake news detection method for Korean news. In this study, we aim to detect Korean fake news using text mining and machine learning techniques. Our proposed method consists of two steps. In the first step, the news contents to be analyzed is convert to quantified values using various text mining techniques (Topic Modeling, TF-IDF, and so on). After that, in step 2, classifiers are trained using the values produced in step 1. As the classifiers, machine learning techniques such as multiple discriminant analysis, case based reasoning, artificial neural networks, and support vector machine can be applied. To validate the effectiveness of the proposed method, we collected 200 Korean news from Seoul National University's FactCheck (http://factcheck.snu.ac.kr). which provides with detailed analysis reports from about 20 media outlets and links to source documents for each case. Using this dataset, we will identify which text features are important as well as which classifiers are effective in detecting Korean fake news.

대화 시스템을 위한 사용자 발화 문장의 감정 분류 (Emotion Classification of User's Utterance for a Dialogue System)

  • 강상우;박홍민;서정연
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.459-480
    • /
    • 2010
  • 대화 시스템은 사용자의 의도를 파악하기 위해 발화 문장으로부터 다양한 형태론적 분석을 시도한다. 하지만 사용자는 발화 문장에 포함된 사전적 의미를 통해 의도를 전달할 뿐만 아니라 현재 감정 상태에 따라서 사전적 의미와는 다른 의도를 표현하거나 동일한 의미를 갖는 발화에서 다양한 의도를 표현한다. 따라서 대화에서 사용자의 감정을 파악하는 것은 사용자의 의도를 다양한 방향으로 분석할 수 있게 한다. 본 연구는 기계 학습 방법을 사용하여 사용자 발화 문장에 자동으로 감정 범주를 할당하는 방법을 제안한다. 일반적 감정 범주를 정의하기 위해 세부적인 감정 모델로 인정받고 있는 Plutchick의 감정 모델을 사용하여 9개 감정 범주를 재 정의하고 감정 분류를 위한 자질 집합을 문장 자질과 선험적 자질 그리고 문맥 자질로 구분하였다. 실험을 통하여 3가지 자질들의 최적 조합을 구성하고 감정의 자동 분류를 위해 SVM 분류기를 사용하였다. 실험 결과에서 제안 시스템은 비교 시스템에 비해 15% 높은 62.8%의 F1-평가치 성능을 나타냄으로서 제안된 방법이 감정 분류에 효과적임을 증명한다.

  • PDF

Self-Supervised Document Representation Method

  • Yun, Yeoil;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.187-197
    • /
    • 2020
  • 최근 신경망 기반의 학습 알고리즘인 딥 러닝 기술의 발전으로 인해 텍스트의 문맥을 고려한 문서 임베딩 모델이 다양하게 고안되었으며, 특히 대량의 텍스트 데이터를 사용하여 학습을 수행한 사전 학습 언어 모델을 사용하여 분석 문서의 벡터를 추론하는 방식의 임베딩이 활발하게 연구되고 있다. 하지만 기존의 사전 학습 언어 모델을 사용하여 새로운 텍스트에 대한 임베딩을 수행할 경우 해당 텍스트가 가진 고유한 정보를 충분히 활용하지 못한다는 한계를 가지며, 이는 특히 텍스트가 가진 토큰의 수에 큰 영향을 받는 것으로 알려져 있다. 이에 본 연구에서는 다수의 토큰을 포함한 장문 텍스트의 정보를 최대한 활용하여 해당 텍스트의 벡터를 도출할 수 있는 자기 지도 학습 기반의 사전 학습 언어 모델 미세 조정 방법을 제안한다. 또한, 제안 방법론을 실제 뉴스 기사에 적용하여 문서 벡터를 도출하고 이를 활용하여 뉴스의 카테고리 분류 실험을 수행하는 외부적인 임베딩 평가를 수행함으로써, 제안 방법론과 기존 문서 임베딩 모델과의 성능을 평가하였다. 그 결과 제안 방법론을 통해 도출된 벡터가 텍스트의 고유 정보를 충분히 활용함으로써, 문서의 특성을 더욱 정확하게 표현할 수 있음을 확인하였다.

단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 (Document Classification using Recurrent Neural Network with Word Sense and Contexts)

  • 주종민;김남훈;양형정;박혁로
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권7호
    • /
    • pp.259-266
    • /
    • 2018
  • 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.

독립적인 질의 경로들을 사용하여 이질적인 문서들을 검색하는 XML 문서 검색 모델 (XML Document Retrieval Models for Heterogeneous Data Set using Independent Regular paths)

  • 유신재;민경섭;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.140-152
    • /
    • 2003
  • XML 문서는 태그를 가지고 있고 이 태그가 중첩됨에 따라 구조를 나타낼 수 있다. XML 문서가 DTD를 가지지 않거나 여러 곳에서 XML 문서를 모았을 때 그 구조는 비정규적 일 수 있다. 사용자는 이러한 비정규적인 구조에 대해 잘 알기 어려우며 설사 잘 알고 있다고 하더라도 실수하기 쉽다. 특히 비정규적인 구조를 가지는 문서들에 대해 정확한 구조질의를 작성하는 것은 더욱 어렵다. 따라서 사용자는 구조가 없거나 있다 하더라도 적은 양의 구조정보 만을 기술하는 일반적인 질의를 작성하게 된다. 이런 환경에서 구조 정보를 이용하여 문서의 순위결정에 이용하고 사용자 구조 질의와 문서 구조간의 차이에 대해 보상해 주는 검색 모델을 제안한다. 질의 처리를 단순화하기 위하여 질의 경로간의 독립을 가정하였다 이 가정은 질의 언어의 표현능력의 저하를 가져올 수 있는데 이를 해결하는 질의 모델도 제시한다. 지금까지 어떤 문서를 위한 테스트 컬랙션이 없었기 때문에 TIPSTER 컬랙션에서 일부 문서를 추출하여 작은 테스트 컬랙션을 만들고 여기에 구조가 없는 질의를 수행하여 제시한 검색 모델의 유용성을 보였다. 실험 결과 벡터 모델에 비하여 평균 67%의 정확률 개선효과를 얻을 수 있었다.