• 제목/요약/키워드: matrix learning

검색결과 351건 처리시간 0.22초

The Method for Generating Recommended Candidates through Prediction of Multi-Criteria Ratings Using CNN-BiLSTM

  • Kim, Jinah;Park, Junhee;Shin, Minchan;Lee, Jihoon;Moon, Nammee
    • Journal of Information Processing Systems
    • /
    • 제17권4호
    • /
    • pp.707-720
    • /
    • 2021
  • To improve the accuracy of the recommendation system, multi-criteria recommendation systems have been widely researched. However, it is highly complicated to extract the preferred features of users and items from the data. To this end, subjective indicators, which indicate a user's priorities for personalized recommendations, should be derived. In this study, we propose a method for generating recommendation candidates by predicting multi-criteria ratings from reviews and using them to derive user priorities. Using a deep learning model based on convolutional neural network (CNN) and bidirectional long short-term memory (BiLSTM), multi-criteria prediction ratings were derived from reviews. These ratings were then aggregated to form a linear regression model to predict the overall rating. This model not only predicts the overall rating but also uses the training weights from the layers of the model as the user's priority. Based on this, a new score matrix for recommendation is derived by calculating the similarity between the user and the item according to the criteria, and an item suitable for the user is proposed. The experiment was conducted by collecting the actual "TripAdvisor" dataset. For performance evaluation, the proposed method was compared with a general recommendation system based on singular value decomposition. The results of the experiments demonstrate the high performance of the proposed method.

Sidewalk Gaseous Pollutants Estimation Through UAV Video-based Model

  • Omar, Wael;Lee, Impyeong
    • 대한원격탐사학회지
    • /
    • 제38권1호
    • /
    • pp.1-20
    • /
    • 2022
  • As unmanned aerial vehicle (UAV) technology grew in popularity over the years, it was introduced for air quality monitoring. This can easily be used to estimate the sidewalk emission concentration by calculating road traffic emission factors of different vehicle types. These calculations require a simulation of the spread of pollutants from one or more sources given for estimation. For this purpose, a Gaussian plume dispersion model was developed based on the US EPA Motor Vehicle Emissions Simulator (MOVES), which provides an accurate estimate of fuel consumption and pollutant emissions from vehicles under a wide range of user-defined conditions. This paper describes a methodology for estimating emission concentration on the sidewalk emitted by different types of vehicles. This line source considers vehicle parameters, wind speed and direction, and pollutant concentration using a UAV equipped with a monocular camera. All were sampled over an hourly interval. In this article, the YOLOv5 deep learning model is developed, vehicle tracking is used through Deep SORT (Simple Online and Realtime Tracking), vehicle localization using a homography transformation matrix to locate each vehicle and calculate the parameters of speed and acceleration, and ultimately a Gaussian plume dispersion model was developed to estimate the CO, NOx concentrations at a sidewalk point. The results demonstrate that these estimated pollutants values are good to give a fast and reasonable indication for any near road receptor point using a cheap UAV without installing air monitoring stations along the road.

Association Rule Mining and Collaborative Filtering-Based Recommendation for Improving University Graduate Attributes

  • Sheta, Osama E.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.339-345
    • /
    • 2022
  • Outcome-based education (OBE) is a tried-and-true teaching technique based on a set of predetermined goals. Program Educational Objectives (PEOs), Program Outcomes (POs), and Course Outcomes (COs) are the components of OBE. At the end of each year, the Program Outcomes are evaluated, and faculty members can submit many recommended measures which dependent on the relationship between the program outcomes and its courses outcomes to improve the quality of program and hence the overall educational program. When a vast number of courses are considered, bad actions may be proposed, resulting in unwanted and incorrect decisions. In this paper, a recommender system, using collaborative filtering and association rules algorithms, is proposed for predicting the best relationship between the program outcomes and its courses in order to improve the attributes of the graduates. First, a parallel algorithm is used for Collaborative Filtering on Data Model, which is designed to increase the efficiency of processing big data. Then, a parallel similar learning outcomes discovery method based on matrix correlation is proposed by mining association rules. As a case study, the proposed recommender system is applied to the Computer Information Systems program, College of Computer Sciences and Information Technology, Al-Baha University, Saudi Arabia for helping Program Quality Administration improving the quality of program outcomes. The obtained results revealed that the suggested recommender system provides more actions for boosting Graduate Attributes quality.

New Cellular Neural Networks Template for Image Halftoning based on Bayesian Rough Sets

  • Elsayed Radwan;Basem Y. Alkazemi;Ahmed I. Sharaf
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.85-94
    • /
    • 2023
  • Image halftoning is a technique for varying grayscale images into two-tone binary images. Unfortunately, the static representation of an image-half toning, wherever each pixel intensity is combined by its local neighbors only, causes missing subjective problem. Also, the existing noise causes an instability criterion. In this paper an image half-toning is represented as a dynamical system for recognizing the global representation. Also, noise is reduced based on a probabilistic model. Since image half-toning is considered as 2-D matrix with a full connected pass, this structure is recognized by the dynamical system of Cellular Neural Networks (CNNs) which is defined by its template. Bayesian Rough Sets is used in exploiting the ideal CNNs construction that synthesis its dynamic. Also, Bayesian rough sets contribute to enhance the quality of the halftone image by removing noise and discovering the effective parameters in the CNNs template. The novelty of this method lies in finding a probabilistic based technique to discover the term of CNNs template and define new learning rules for CNNs internal work. A numerical experiment is conducted on image half-toning corrupted by Gaussian noise.

지연혼합에서의 초기 값으로 고유벡터를 이용하는 암묵신호분리 (Blind Signal Separation Using Eigenvectors as Initial Weights in Delayed Mixtures)

  • 박장식;손경식;박근수
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.14-20
    • /
    • 2006
  • 본 논문에서는 지연혼합에서의 암묵신호분리를 위해 분리행렬의 초기 값을 설정하는 방법을 제안한다. 혼합신호의 상호상관행렬에 대한 고유분리를 분석한 후, 고유벡터의 지연정보를 이용하여 초기 값으로 설정한다. 제안하는 방법을 기존의 주파수영역 독립성분분석 (FDICA: Frequency domain independent component analysis)에 초기 값으로 설정하여 분리 성능을 향상시킨다. 컴퓨터 시뮬레이션을 통해 제안하는 방법이 신호대간섭비 (SIR: Signal to Interference Ratio)가 우수하고 학습곡선의 수렴속도가 개선됨을 보인다.

효율적인 학습규칙의 신경망 기반 독립성분분석을 이용한 영상신호의 분리 및 특징추출 (Separations and Feature Extractions for Image Signals Using Independent Component Analysis Based on Neural Networks of Efficient Learning Rule)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제13권2호
    • /
    • pp.200-208
    • /
    • 2003
  • 본 연구에서는 효율적인 학습규칙의 신경망 기반 독립성분분석기법을 이용한 영상신호의 분리와 특징추출을 제안하였다. 제안된 학습규칙은 할선법과 모멘트를 이용한 조합형 고정점 학습알고리즘이다. 여기서 할선법은 독립성분 상호간의 정보를 최소화하기 위한 목적함수의 최적화 과정에서 요구되는 1차 미분에 따른 계산을 간략화하기 위함이고, 모멘트는 최적화 과정에서 발생하는 발진을 억제하여 보다 빠른 학습을 위함이다. 제안된 기법을 $512\times512$의 픽셀을 가지는 10개의 영상을 대상으로 임의의 혼합행렬에 따라 발생되는 혼합영상의 분리에 적용한 결과, 뉴우턴법에 기초한 기존의 알고리즘과 할선법만에 기초한 알고리즘보다 각각 우수한 분리률과 빠른 분리속도가 있음을 확인하였다. 또한 $256\times256$ 픽셀의 10개 지문상과 $480\times225$ 픽셀의 지폐영상에서 선택된 각각 10,000개의 3가지 영상패치들을 대상으로 적용한 결과, 제안된 기법은 뉴우턴법이나 할선법의 알고리즘보다도 빠른 특징추출 속도가 있음을 확인하였다. 한편 추출된 $16\times16$ 펙셀의 160개 독립성분 기저벡터 각각은 영상 각각에 포함된 공간적인 주파수 특성과 방향성을 가지는 경계 특성이 잘 드러나는 국부적인 특징들임을 확인하였다.

관광객 공유한 사진 및 머신 러닝을 활용한 도시 색채 특성 분석 연구 - 중국 대리시를 대상으로 - (Research on Characterizing Urban Color Analysis based on Tourists-Shared Photos and Machine Learning - Focused on Dali City, China -)

  • 인샤오옌;정태열
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.39-50
    • /
    • 2024
  • 색채는 중요한 시각적 요소로서 도시 이미지와 사람들의 인식 형성에 중요한 영향을 미친다. 도시환경에서 색채를 정량적으로 분석하는 작업은 복잡한 과정을 필요로 하여 과거에는 실행하기가 어려웠다. 그러나 최근 머신 러닝 기술의 급속한 발전으로 관광객이 공유한 사진을 이용하여 도시 색채를 분석하는 것이 가능해졌다. 본 연구는 중국의 인기 관광지인 대리시를 사례로 선정하여 관광객이 공유한 대리시의 사진을 수집하였으며, 머신 러닝 기술을 결합하여 대규모 도시 색채를 측정하는 방법을 탐색하였다. 구체적으로는 먼저 DeepLabv3+ 모델을 사용하여 ADE20k 데이터 셋을 기반으로 관광객이 공유한 사진의 의미 분할을 수행하여 사진에서 인공 요소를 분리했다. 다음으로 K-means 클러스터링 알고리즘을 사용하여 대리시의 인공 요소의 주요 색상을 추출하고, 이러한 색상 간의 상관관계를 분석하기 위해 인접 매트릭스를 구축했다. 연구 결과에 따르면 대리시의 인공 요소의 주요 색상은 주황-회색이 가장 높은 비율을 차지한다. 또한, 회색 계열의 색상이 다른 색상과 자주 조합되어 사용되는 경향이 있다. 분석에 따르면 대리시의 인공 요소의 색채 특성은 지역의 민족 문화와 불교 문화의 영향을 받는 것으로 나타났다. 본 연구는 색채 분석을 위한 새로운 접근 방법을 제공하며, 연구 결과는 대리시가 관광객의 기대에 부합하는 도시 색채 이미지를 형성하는 데 도움이 될 뿐만 아니라 향후 대리시의 색채 계획을 위한 참고 자료를 제공하고자 한다.

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

PFCM 클러스터링 기법의 개선 (Improvement of the PFCM(Possibilistic Fuzzy C-Means) Clustering Method)

  • 허경용;최세운;우영운
    • 한국정보통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.177-185
    • /
    • 2009
  • 클러스터링은 주어진 데이터 포인트들을 주어진 개수의 그룹으로 나누는 비지도 학습의 한 방법이다. 클러스터링의 방법 중 하나로 널리 알려진 퍼지 클러스터링은 하나의 포인트가 모든 클러스터에 서로 다른 정도로 소속될 수 있도록 함으로써 하나의 클러스터에만 속할 수 있도록 하는 K-means와 같은 방법에 비해 자연스러운 클러스터 형태의 유추가 가능하고, 잡음에 강한 장점이 있다. 이 논문에서는 기존의 퍼지 클러스터링 방법 중 소속도(membership)와 전형성(typicality)을 동시에 계산해 낼 수 있는 Possibilistic Fuzzy C-Means(PFCM) 방법에 Gath-Geva(CG)의 방법을 적용하여 PFCM을 개선한다. 제안한 방법은 PFCM 장점을 그대로 가지면서도, GG의 거리 척도에 의해 클러스터들 사이의 경계를 강조함으로써 분류 목적에 적합한 소속도를 계산할 수 있으며 전형성은 가우스 형태의 분포에서 생성된 포인트들의 분포 함수를 정확하게 모사함으로써 확률 밀도 추정의 방법으로도 사용될 수 있다. 또한 GG 방법은 Gustafson-Kessel 방법과 달리 클러스터에 포함된 포인트의 개수가 확연히 차이나는 경우에도 정확한 결과를 얻을 수 있다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.