• Title/Summary/Keyword: 행렬 학습

Search Result 179, Processing Time 0.05 seconds

Precision Switching for Efficient Matrix Factorization in Recommender Systems (추천 시스템에서의 효율적인 행렬 분해 모델을 위한 정밀도 변환 기법)

  • Yu, Jae-Seo;Ko, Yun-Yong;Bae, Hong-Kyun;Kang, Seokwon;Yu, Yongseung;Park, Yongjun;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.314-315
    • /
    • 2021
  • 최근 딥러닝 분야에서 모델 학습을 가속화하기 위해, 실수 표현 시 사용하는 비트 수를 줄이는 양자화 연구가 활발히 진행되고 있다. 본 논문은 추천 시스템 모델 중 하나인 행렬 분해 모델(Matrix Factorization, MF)에 대한 양자화 수행 시, 발생할 수 있는 학습 정확도 손실을 방지하기 위한 정밀도 변환 방안을 제시한다. 우리는 실세계 데이터셋을 이용한 실험을 통해, 제안 방안이 적용된 MF 모델은 양자화 기법이 적용되지 않은 모델과 비슷한 추천 정확도를 보이며, 약 30% 개선된 속도로 학습됨을 확인할 수 있었다.

Development of a Matrix-focused Instructional Materials for Personal Education for the Gifted Middle School Students of Computer Science (중등 정보과학 영재 사사지도 행렬중심 교수학습 자료 개발)

  • Lee, Hyung-Bong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.16 no.12
    • /
    • pp.139-155
    • /
    • 2011
  • In recent years, parents of students and government have been taking a growing interest in education for the gifted students and there are many research reports about the gifted education. Most of the reports, however, focuses on the conceptional feature of the gifted education program such as organization, operation, management, evaluation, etc,. In other words, there are very few researches on instructional materials for gifted students even though the materials is a critical factor for successful education programs. So, this paper introduces a lecture notes used in a personal education for gifted students to contribute in developing education contents in computer science area. The instructional materials titled as "The Necessity and Application of Matrix in Computer Science" is based on linear equation to usher the students into creative problem recognition and groping for solutions. Also, the instructional materials is useful for students to understand the tight mathematics-computer science relationship and the basic concept of liner algebra.

Sparse Document Data Clustering Using Factor Score and Self Organizing Maps (인자점수와 자기조직화지도를 이용한 희소한 문서데이터의 군집화)

  • Jun, Sung-Hae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.2
    • /
    • pp.205-211
    • /
    • 2012
  • The retrieved documents have to be transformed into proper data structure for the clustering algorithms of statistics and machine learning. A popular data structure for document clustering is document-term matrix. This matrix has the occurred frequency value of a term in each document. There is a sparsity problem in this matrix because most frequencies of the matrix are 0 values. This problem affects the clustering performance. The sparseness of document-term matrix decreases the performance of clustering result. So, this research uses the factor score by factor analysis to solve the sparsity problem in document clustering. The document-term matrix is transformed to document-factor score matrix using factor scores in this paper. Also, the document-factor score matrix is used as input data for document clustering. To compare the clustering performances between document-term matrix and document-factor score matrix, this research applies two typed matrices to self organizing map (SOM) clustering.

Independent Component Analysis Based on Neural Networks Using Secant Method and Moment (할선법과 모멘트에 의한 신경망 기반 독립성분분석)

  • 오정은;김아람;조용현
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.325-329
    • /
    • 2002
  • 본 연구에서는 할선법과 모멘트를 조합한 학습알고리즘의 신경망 기반 독립성분분석 기법을 제안하였다. 제안된 알고리즘은 할선법과 모멘트에 기초를 둔 고정점 알고리즘의 독립성분분석 기법이다. 여기서 할선법은 독립성분 상호간의 정보를 최소화하기 위해 negentropy를 최대화는 과정에서 요구되는 1차 미분에 따른 계산량을 줄이기 위함이고, 모멘트는 최대화 과정에서 발생하는 발진을 억제하여 보다 빠른 학습을 위함이다. 제안된 기법을 256×256 픽셀의 8개 지문영상에서 임의 혼합행렬에 따라 발생되는 혼합지문들을 각각 대상으로 시뮬레이션한 결과, 할선법만에 기초한 기법보다 우수한 분리성능과 빠른 학습속도가 있음을 확인하였다.

  • PDF

Query-Based Summarization using Non-negative Matrix Factorization (비음수 행렬 인수분해를 이용한 질의 기반의 문서 요약)

  • Park Sun;Lee Ju-Hong;Ahn Chan-Min;Park Tae-Su;Kim Deok-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.394-396
    • /
    • 2006
  • 기존 질의기반의 문서요약은 질의와 문서간의 사전 학습으로 요약의 질을 높이거나, 문서의 고유 구조(inherent structure)를 반영하여 요약의 정확도를 높이기 위하여 문서를 그래프로 변환한다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약 할 수 있다.

  • PDF

Performance Improvement of Independent Component Analysis Using Hybrid Fixed Point Algorithm (조합형 Fixed Point 알고리즘을 이용한 독립성분분석의 성능개선)

  • Min, Seong-Jae;Park, Yong-Soo;Cho, Yong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1033-1036
    • /
    • 2002
  • 본 연구에서는 Newton 기법과 모멘트에 기초를 둔 fixed point 알고리즘의 신경망 기반 독립성분분석기법을 제안하였다. 여기서 Newton 기법은 함수의 접선에 기초를 둔 해를 구하는 방법으로 역혼합행렬의 빠른 경신을 위함이고, 모멘트는 접선을 구하는 과정에서 함수의 기울기변화 계산으로 발생하는 발진을 줄여 좀 더 빠른 학습을 위함이다. 제안된 기법을 $256{\times}256$ 픽셀(pixel)의 12개 지문영상으로부터 임의의 혼합행렬에 따라 발생되는 영상들을 각각 대상으로 시뮬레이션 한 결과, 기존의 Fixed point 알고리즘에 의한 결과보다 우수한 분리성능과 빠른 학습속도가 있음을 확인하였다.

  • PDF

Improving on Matrix Factorization for Recommendation Systems by Using a Character-Level Convolutional Neural Network (문자 수준 컨볼루션 뉴럴 네트워크를 이용한 추천시스템에서의 행렬 분해법 개선)

  • Son, Donghee;Shim, Kyuseok
    • KIISE Transactions on Computing Practices
    • /
    • v.24 no.2
    • /
    • pp.93-98
    • /
    • 2018
  • Recommendation systems are used to provide items of interests for users to maximize a company's profit. Matrix factorization is frequently used by recommendation systems, based on an incomplete user-item rating matrix. However, as the number of items and users increase, it becomes difficult to make accurate recommendations due to the sparsity of data. To overcome this drawback, the use of text data related to items was recently suggested for matrix factorization algorithms. Furthermore, a word-level convolutional neural network was shown to be effective in the process of extracting the word-level features from the text data among these kinds of matrix factorization algorithms. However, it involves a large number of parameters to learn in the word-level convolutional neural network. Thus, we propose a matrix factorization algorithm which utilizes a character-level convolutional neural network with which to extract the character-level features from the text data. We also conducted a performance study with real-life datasets to show the effectiveness of the proposed matrix factorization algorithm.

기계학습을 이용한 수출 컨테이너의 무게그룹 분류

  • Gang, Jae-Ho;Gang, Byeong-Ho;Ryu, Gwang-Ryeol;Kim, Gap-Hwan
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.05a
    • /
    • pp.77-86
    • /
    • 2005
  • 컨테이너 터미널에서는 장치장으로 반입되는 수출 컨테이너의 무게를 몇 단계 그룹으로 나누고 각 무게그룹 별로 모아서 장치한다. 이는 수출 컨테이너를 선박에 싣는 적하 작업 시 선박의 안정성을 위하여 무거운 무게그룹의 컨테이너들을 장치장에서 먼저 반출하여 선박의 바닥 쪽에 놓기 위함이다. 하지만 반입되는 컨테이너의 무게그룹을 결정할 때 사용하는 운송사로부터 받은 무게정보는 부정확한 경우가 많아 하나의 스택(stack)에 서로 다른 무게그룹에 속하는 컨테이너들이 섞이게 된다. 이로 인하여 무거운 무게그룹의 컨테이너를 반출할 때 해당 컨테이너의 상단에 놓여진 보다 가벼운 무게그룹의 컨테이너들을 임시로 옮겨야 하는 재취급(rehandling, reshuffling)이 발생하게 된다. 적하작업 시 장치장에서 재취급이 빈번히 발생하면 작업이 지연되므로 터미널 생산성 향상을 위해서는 재취급 발생을 가급적 줄여야 한다. 본 논문에서는 기계학습 기법을 적용하여 반입 컨테이너의 무게그룹을 보다 정확히 추정하는 방안을 제안한다. 또한 탐색을 통하여 분류기 생성에 관여하는 비용행렬(cost matrix)을 조정함으로써 재취급 발생을 줄일 수 있는 분류기(classifier)를 생성하는 방안을 함께 소개한다. 실험 결과 본 논문에서 제안하는 방안 적용 시 재취급 발생을 $5{\sim}7%$ 정도 줄일 수 있음을 예상할 수 있었다.

  • PDF

Applying Coarse-to-Fine Curriculum Learning Mechanism to the multi-label classification task (다중 레이블 분류 작업에서의 Coarse-to-Fine Curriculum Learning 메카니즘 적용 방안)

  • Kong, Heesan;Park, Jaehun;Kim, Kwangsu
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.29-30
    • /
    • 2022
  • Curriculum learning은 딥러닝의 성능을 향상시키기 위해 사람의 학습 과정과 유사하게 일종의 'curriculum'을 도입해 모델을 학습시키는 방법이다. 대부분의 연구는 학습 데이터 중 개별 샘플의 난이도를 기반으로 점진적으로 모델을 학습시키는 방안에 중점을 두고 있다. 그러나, coarse-to-fine 메카니즘은 데이터의 난이도보다 학습에 사용되는 class의 유사도가 더욱 중요하다고 주장하며, 여러 난이도의 auxiliary task를 차례로 학습하는 방법을 제안했다. 그러나, 이 방법은 혼동행렬 기반으로 class의 유사성을 판단해 auxiliary task를 생성함으로 다중 레이블 분류에는 적용하기 어렵다는 한계점이 있다. 따라서, 본 논문에서는 multi-label 환경에서 multi-class와 binary task를 생성하는 방법을 제안해 coarse-to-fine 메카니즘 적용을 위한 방안을 제시하고, 그 결과를 분석한다.

  • PDF

A Resampling Method for Small Sample Size Problems in Face Recondition (얼굴인식해석의 Small Sample Size 문제 해결을 위한 Resampling 방법)

  • Oh, Jae-Hyun;Kwak, No-Jun;Choi, Tae-Young
    • Proceedings of the KIEE Conference
    • /
    • 2008.04a
    • /
    • pp.172-173
    • /
    • 2008
  • LDA를 이용한 얼굴 인식에서 발생하는 small sample sire 문제를 해결하기 위해서 regularization method를 주로 사용한다. 이 방법을 사용하게 되면 클래스 내 분산행렬의 특이성을 없앨 수 있지만, 클래스 내 분산행렬과 단위행렬 $\alpha$를 곱한 값을 더하는 과정에서 $\alpha$의 값을 임의적으로 정해주어야 되고 이 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 있다. Resampling 개념을 이용하여 학습 데이터의 수를 늘리게 되면 regularization method보다 개선된 인식률을 얻을 수 있다. 또한 경험적으로 $\alpha$값을 정해 주어야 하고, $\alpha$값에 따라 인식률의 변통이 생길 수 있는 단점이 개선되는 효과를 얻을 수 있다.

  • PDF