• 제목/요약/키워드: 행렬 학습

검색결과 180건 처리시간 0.024초

추천 시스템에서의 효율적인 행렬 분해 모델을 위한 정밀도 변환 기법 (Precision Switching for Efficient Matrix Factorization in Recommender Systems)

  • 유재서;고윤용;배홍균;강석원;유용승;박영준;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.314-315
    • /
    • 2021
  • 최근 딥러닝 분야에서 모델 학습을 가속화하기 위해, 실수 표현 시 사용하는 비트 수를 줄이는 양자화 연구가 활발히 진행되고 있다. 본 논문은 추천 시스템 모델 중 하나인 행렬 분해 모델(Matrix Factorization, MF)에 대한 양자화 수행 시, 발생할 수 있는 학습 정확도 손실을 방지하기 위한 정밀도 변환 방안을 제시한다. 우리는 실세계 데이터셋을 이용한 실험을 통해, 제안 방안이 적용된 MF 모델은 양자화 기법이 적용되지 않은 모델과 비슷한 추천 정확도를 보이며, 약 30% 개선된 속도로 학습됨을 확인할 수 있었다.

중등 정보과학 영재 사사지도 행렬중심 교수학습 자료 개발 (Development of a Matrix-focused Instructional Materials for Personal Education for the Gifted Middle School Students of Computer Science)

  • 이형봉
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.139-155
    • /
    • 2011
  • 최근 몇 년 사이, 학부모는 물론 국가 차원에서 영재 교육에 대한 관심이 높아짐에 따라 영재 교육에 관한 많은 연구들이 발표되고 있다. 그러나, 그들 대부분의 초점이 개괄적이고 총론적인 관점에서 영재 교육 프로그램의 구축, 운영, 관리, 평가 등에 있고, 정작 교육 프로그램의 성패와 직결되는 구체적인 교수학습 주제를 다루는 연구는 극히 드물다. 오늘날 영재교육의 필요성이나 효율성이 재론되고 있는 원인 중의 하나는바로 영재 교육의 특수성들이 고려된 영역별 훌륭한 교육 시나리오의 빈곤에 있음을 부인할 수 없다. 따라서, 이 연구에서는 중등 정보과학 영재 사사 지도과정에서 적용되었던 탐구 내용을 소개함으로써 정보분야 영재교육을 위한 교수학습 자료 개발에 작은 보탬이 되고자한다. '컴퓨터과학에서 행렬의 필요성과 활용'이란 주제의 이 교수학습 자료는 중등 수학의 1차 연립방정식 풀이 과정을 기반으로 창의적 문제 발견 및 해결을 유도하도록 구성되었고, 수학과 컴퓨터 과학과의 긴밀한 연계성 및 선형대수학의 기초 개념 이해에도 유익하다.

인자점수와 자기조직화지도를 이용한 희소한 문서데이터의 군집화 (Sparse Document Data Clustering Using Factor Score and Self Organizing Maps)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.205-211
    • /
    • 2012
  • 통계학과 기계학습의 다양한 기법을 이용하여 문서집합을 군집화하기 위해서는 우선 군집화분석에 적합한 데이터구조로 대상 문서집합을 변환해야 한다. 문서군집화를 위한 대표적인 구조가 문서-단어행렬이다. 각 문서에서 발생한 특정단어의 빈도값을 갖는 문서-단어행렬은 상당부분의 빈도값이 0인 희소성문제를 갖는다. 이 문제는 문서군집화의 성능에 직접적인 영향을 주어 군집화결과의 성능감소를 초래한다. 본 논문에서는 문서-단어행렬의 희소성문제를 해결하기 위하여 인자분석을 통한 인자점수를 이용하였다. 즉, 문서-단어행렬을 문서-인자점수행렬로 바꾸어 문서군집화의 입력데이터로 사용하였다. 대표적인 문서군집화 알고리즘인 자기조직화지도에 적용하여 문서-단어행렬과 문서-인자점수행렬에 대한 문서군집화의 결과들을 비교하였다.

할선법과 모멘트에 의한 신경망 기반 독립성분분석 (Independent Component Analysis Based on Neural Networks Using Secant Method and Moment)

  • 오정은;김아람;조용현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.325-329
    • /
    • 2002
  • 본 연구에서는 할선법과 모멘트를 조합한 학습알고리즘의 신경망 기반 독립성분분석 기법을 제안하였다. 제안된 알고리즘은 할선법과 모멘트에 기초를 둔 고정점 알고리즘의 독립성분분석 기법이다. 여기서 할선법은 독립성분 상호간의 정보를 최소화하기 위해 negentropy를 최대화는 과정에서 요구되는 1차 미분에 따른 계산량을 줄이기 위함이고, 모멘트는 최대화 과정에서 발생하는 발진을 억제하여 보다 빠른 학습을 위함이다. 제안된 기법을 256×256 픽셀의 8개 지문영상에서 임의 혼합행렬에 따라 발생되는 혼합지문들을 각각 대상으로 시뮬레이션한 결과, 할선법만에 기초한 기법보다 우수한 분리성능과 빠른 학습속도가 있음을 확인하였다.

  • PDF

비음수 행렬 인수분해를 이용한 질의 기반의 문서 요약 (Query-Based Summarization using Non-negative Matrix Factorization)

  • 박선;이주홍;안찬민;박태수;김덕환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.394-396
    • /
    • 2006
  • 기존 질의기반의 문서요약은 질의와 문서간의 사전 학습으로 요약의 질을 높이거나, 문서의 고유 구조(inherent structure)를 반영하여 요약의 정확도를 높이기 위하여 문서를 그래프로 변환한다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약 할 수 있다.

  • PDF

조합형 Fixed Point 알고리즘을 이용한 독립성분분석의 성능개선 (Performance Improvement of Independent Component Analysis Using Hybrid Fixed Point Algorithm)

  • 민성재;박용수;조용현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1033-1036
    • /
    • 2002
  • 본 연구에서는 Newton 기법과 모멘트에 기초를 둔 fixed point 알고리즘의 신경망 기반 독립성분분석기법을 제안하였다. 여기서 Newton 기법은 함수의 접선에 기초를 둔 해를 구하는 방법으로 역혼합행렬의 빠른 경신을 위함이고, 모멘트는 접선을 구하는 과정에서 함수의 기울기변화 계산으로 발생하는 발진을 줄여 좀 더 빠른 학습을 위함이다. 제안된 기법을 $256{\times}256$ 픽셀(pixel)의 12개 지문영상으로부터 임의의 혼합행렬에 따라 발생되는 영상들을 각각 대상으로 시뮬레이션 한 결과, 기존의 Fixed point 알고리즘에 의한 결과보다 우수한 분리성능과 빠른 학습속도가 있음을 확인하였다.

  • PDF

문자 수준 컨볼루션 뉴럴 네트워크를 이용한 추천시스템에서의 행렬 분해법 개선 (Improving on Matrix Factorization for Recommendation Systems by Using a Character-Level Convolutional Neural Network)

  • 손동희;심규석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권2호
    • /
    • pp.93-98
    • /
    • 2018
  • 추천시스템은 기업의 매출을 최대화 하기 위해, 사용자에게 관심도가 높은 제품을 제공해준다. 행렬 분해법은 추천시스템에서 자주 사용되는 방법으로 불완전한 사용자-제품 평점 행렬을 기반으로 한다. 하지만 제품과 사용자의 수가 점점 많아지면서, 데이터의 희소성문제로 인해 정확한 추천이 힘들어졌다. 이러한 문제점을 극복하기 위해, 제품과 관련된 텍스트 데이터를 사용하는 행렬 분해법 알고리즘이 최근에 제시되었다. 이런 행렬 분해법 알고리즘 중, 단어 수준 컨볼루션 뉴럴 네트워크를 사용하는 방법이 단어수준 특징들을 추출하여 텍스트 데이터를 효과적으로 반영한다. 하지만 단어수준 컨볼루션 뉴럴 네트워크에서는 학습해야 하는 파라미터의 수가 많다는 문제점이 있다. 그러므로 본 논문에서는 텍스트 데이터로부터 문자 수준 특징들을 뽑아 내기 위해 문자 수준 컨볼루션 뉴럴 네트워크를 사용하는 행렬분해법을 제안한다. 또한 제안하는 행렬 분해법의 성능을 검증하기 위해 실제 데이터를 이용하여 실험을 진행하였다.

기계학습을 이용한 수출 컨테이너의 무게그룹 분류

  • 강재호;강병호;류광렬;김갑환
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.77-86
    • /
    • 2005
  • 컨테이너 터미널에서는 장치장으로 반입되는 수출 컨테이너의 무게를 몇 단계 그룹으로 나누고 각 무게그룹 별로 모아서 장치한다. 이는 수출 컨테이너를 선박에 싣는 적하 작업 시 선박의 안정성을 위하여 무거운 무게그룹의 컨테이너들을 장치장에서 먼저 반출하여 선박의 바닥 쪽에 놓기 위함이다. 하지만 반입되는 컨테이너의 무게그룹을 결정할 때 사용하는 운송사로부터 받은 무게정보는 부정확한 경우가 많아 하나의 스택(stack)에 서로 다른 무게그룹에 속하는 컨테이너들이 섞이게 된다. 이로 인하여 무거운 무게그룹의 컨테이너를 반출할 때 해당 컨테이너의 상단에 놓여진 보다 가벼운 무게그룹의 컨테이너들을 임시로 옮겨야 하는 재취급(rehandling, reshuffling)이 발생하게 된다. 적하작업 시 장치장에서 재취급이 빈번히 발생하면 작업이 지연되므로 터미널 생산성 향상을 위해서는 재취급 발생을 가급적 줄여야 한다. 본 논문에서는 기계학습 기법을 적용하여 반입 컨테이너의 무게그룹을 보다 정확히 추정하는 방안을 제안한다. 또한 탐색을 통하여 분류기 생성에 관여하는 비용행렬(cost matrix)을 조정함으로써 재취급 발생을 줄일 수 있는 분류기(classifier)를 생성하는 방안을 함께 소개한다. 실험 결과 본 논문에서 제안하는 방안 적용 시 재취급 발생을 $5{\sim}7%$ 정도 줄일 수 있음을 예상할 수 있었다.

  • PDF

다중 레이블 분류 작업에서의 Coarse-to-Fine Curriculum Learning 메카니즘 적용 방안 (Applying Coarse-to-Fine Curriculum Learning Mechanism to the multi-label classification task)

  • 공희산;박재훈;김광수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.29-30
    • /
    • 2022
  • Curriculum learning은 딥러닝의 성능을 향상시키기 위해 사람의 학습 과정과 유사하게 일종의 'curriculum'을 도입해 모델을 학습시키는 방법이다. 대부분의 연구는 학습 데이터 중 개별 샘플의 난이도를 기반으로 점진적으로 모델을 학습시키는 방안에 중점을 두고 있다. 그러나, coarse-to-fine 메카니즘은 데이터의 난이도보다 학습에 사용되는 class의 유사도가 더욱 중요하다고 주장하며, 여러 난이도의 auxiliary task를 차례로 학습하는 방법을 제안했다. 그러나, 이 방법은 혼동행렬 기반으로 class의 유사성을 판단해 auxiliary task를 생성함으로 다중 레이블 분류에는 적용하기 어렵다는 한계점이 있다. 따라서, 본 논문에서는 multi-label 환경에서 multi-class와 binary task를 생성하는 방법을 제안해 coarse-to-fine 메카니즘 적용을 위한 방안을 제시하고, 그 결과를 분석한다.

  • PDF

얼굴인식해석의 Small Sample Size 문제 해결을 위한 Resampling 방법 (A Resampling Method for Small Sample Size Problems in Face Recondition)

  • 오재현;곽노준;최태영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.172-173
    • /
    • 2008
  • LDA를 이용한 얼굴 인식에서 발생하는 small sample sire 문제를 해결하기 위해서 regularization method를 주로 사용한다. 이 방법을 사용하게 되면 클래스 내 분산행렬의 특이성을 없앨 수 있지만, 클래스 내 분산행렬과 단위행렬 $\alpha$를 곱한 값을 더하는 과정에서 $\alpha$의 값을 임의적으로 정해주어야 되고 이 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 있다. Resampling 개념을 이용하여 학습 데이터의 수를 늘리게 되면 regularization method보다 개선된 인식률을 얻을 수 있다. 또한 경험적으로 $\alpha$값을 정해 주어야 하고, $\alpha$값에 따라 인식률의 변통이 생길 수 있는 단점이 개선되는 효과를 얻을 수 있다.

  • PDF