• 제목/요약/키워드: 벡터모델

검색결과 1,372건 처리시간 0.028초

Word2Vec과 앙상블 합성곱 신경망을 활용한 영화추천 시스템의 정확도 개선에 관한 연구 (A Study on the Accuracy Improvement of Movie Recommender System Using Word2Vec and Ensemble Convolutional Neural Networks)

  • 강부식
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.123-130
    • /
    • 2019
  • 웹 추천기법에서 가장 많이 사용하는 방식 중의 하나는 협업필터링 기법이다. 협업필터링 관련 많은 연구에서 정확도를 개선하기 위한 방안이 제시되어 왔다. 본 연구는 Word2Vec과 앙상블 합성곱 신경망을 활용한 영화추천 방안에 대해 제안한다. 먼저 사용자, 영화, 평점 정보에서 사용자 문장과 영화 문장을 구성한다. 사용자 문장과 영화 문장을 Word2Vec에 입력으로 넣어 사용자 벡터와 영화 벡터를 구한다. 사용자 벡터는 사용자 합성곱 모델에 입력하고, 영화 벡터는 영화 합성곱 모델에 입력한다. 사용자 합성곱 모델과 영화 합성곱 모델은 완전연결 신경망 모델로 연결된다. 최종적으로 완전연결 신경망의 출력 계층은 사용자 영화 평점의 예측값을 출력한다. 실험결과 전통적인 협업필터링 기법과 유사 연구에서 제안한 Word2Vec과 심층 신경망을 사용한 기법에 비해 본 연구의 제안기법이 정확도를 개선함을 알 수 있었다.

Bidirectional LSTM CRF 기반의 개체명 인식을 위한 단어 표상의 확장 (Expansion of Word Representation for Named Entity Recognition Based on Bidirectional LSTM CRFs)

  • 유홍연;고영중
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.306-313
    • /
    • 2017
  • 개체명 인식이란 문서 내에서 인명, 기관명, 지명, 시간, 날짜 등 고유한 의미를 가지는 개체명을 추출하여 그 종류를 결정하는 것을 말한다. 최근 개체명 인식 연구에서 가장 우수한 성능을 보여주고 있는 모델은 Bidirectional LSTM CRFs 모델이다. 이러한 LSTM 기반의 딥 러닝 모델은 입력이 되는 단어 표상에 의존적이다. 따라서 입력이 되는 단어를 잘 표현하기 위하여 단어 표상을 확장하는 방법에 대한 연구가 많이 진행되어지고 있다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs모델을 사용하고, 그 입력으로 사용되는 단어 표상을 확장하기 위해 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반에서 확장된 단어 임베딩 벡터, 그리고 개체명 사전 자질 벡터를 사용한다. 최종 단어 표상 확장 결과 사전 학습된 단어 임베딩 벡터만 사용한 것 보다 8.05%p의 성능 향상을 보였다.

속도제어를 위한 유도전동기 자속추정 시뮬레이터 적용에 관한 연구 (A Study on the Flux Estimation Simulator Application for the Induction Motor Speed Control)

  • 황락훈;나승권;최기호
    • 한국산학기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.1289-1301
    • /
    • 2011
  • 본 논문에서는 전 속도 영역에서 안정적인 자속추정이 가능한 유도전동기 자속추정방법을 제안 하였다. 제안된 방법은 전압, 전류, 속도 등의 정보를 통하여 자속각을 연산하는 유도전동기 직접벡터제어방식을 이용하였다. 유도전동기 벡터제어에 있어서 자속정보는 필수적이기 때문에 정확한 자속을 추정하기 위한 방법으로 저속영역에서 는 전류모델 자속 추정기를, 고속영역에서는 전압모델 자속 추정기를 각각 이용함으로써 전 속도영역에서 정확한 자속을 추정할 수 있었다. 또한 기본적인 속도, 전류, 자속제어기는 PI제어기를 이용하였으며, 각각의 적분에 의한 오차를 보상하기 위하여 Anti-windup PI 제어기를 추가하였다. 제시한 제어기의 타당성을 알아보고자 Matlab / simulink를 이용하여 전류모델, 전압모델 자속 추정기를 설계하여 정확한 자속추정이 이루어짐을 확인하였으며, 유도 전동기 벡터제어 시 간접벡터와 직접벡터방식의 파라미터 영향에 따른 분석을 통해 보다 정밀한 제어가 이루어짐을 확인하였다. 이와 같은 시뮬레이션 결과를 분석 하여 제시한 알고리즘의 타당성을 입증하였다.

간략화된 메쉬에서 보간된 법선 벡터의 분포를 이용한 3차원 모델 검색 (3D Model Retrieval using Distribution of Interpolated Normal Vectors on Simplified Mesh)

  • 김아미;송주환;권오봉
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1692-1700
    • /
    • 2009
  • 본 논문에서는 메쉬 법선 벡터들의 방향 분포를 3차원 모델의 특징 기술자로 제안한다. 특징 기술자로써 요구되는 회전 불변을 주성분 분석법(PCA)으로 처리하고 잡음첨가에 강건하도록 메쉬 간략화를 수행한다. 표면적이 작은 면에 대한 정보가 특징 기술자를 구성하는데 더 적게 반영되도록 법선 벡터의 분포를 각 다각형의 면적에 비례하게 표본을 뽑아 법선 벡터에 가중치를 적용하고 보간하여 변별력을 높인다. 모델간의 유사도는 특징 기술자의 거리를 정규화한 확률 밀도 히스토그램의 L1-norm으로 측정한다. 제안한 방법이 기존 방법에 비해 검색 순위 평균(ANMRR)으로 나타낸 검색 성능이 약 17.2%, 정량적 변별 척도로 나타낸 검색 성능이 최소 9.6%에서 최대 17.5%까지 향상되었음을 알 수 있었다.

  • PDF

Self-Attention 기반의 문장 임베딩을 이용한 효과적인 문장 유사도 기법 기반의 FAQ 시스템 (An Effective Sentence Similarity Measure Method Based FAQ System Using Self-Attentive Sentence Embedding)

  • 김보성;김주애;이정엄;김선아;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-363
    • /
    • 2018
  • FAQ 시스템은 주어진 질문과 가장 유사한 질의를 찾아 이에 대한 답을 제공하는 시스템이다. 질의 간의 유사도를 측정하기 위해 문장을 벡터로 표현하며 일반적으로 TFIDF, Okapi BM25와 같은 방법으로 계산한 단어 가중치 벡터를 이용하여 문장을 표현한다. 하지만 단어 가중치 벡터는 어휘적 정보를 표현하는데 유용한 반면 단어의 의미적인(semantic) 정보는 표현하기 어렵다. 본 논문에서는 이를 보완하고자 딥러닝을 이용한 문장 임베딩을 구축하고 단어 가중치 벡터와 문장 임베딩을 조합한 문장 유사도 계산 모델을 제안한다. 또한 문장 임베딩 구현 시 self-attention 기법을 적용하여 문장 내 중요한 부분에 가중치를 주었다. 실험 결과 제안하는 유사도 계산 모델은 비교 모델에 비해 모두 높은 성능을 보였고 self-attention을 적용한 실험에서는 추가적인 성능 향상이 있었다.

  • PDF

아이겐벡터 공간필터링을 이용한 도시주거범죄의 분석 (An Analysis of Urban Residential Crimes using Eigenvector Spatial Filtering)

  • 김영호
    • 한국경제지리학회지
    • /
    • 제12권2호
    • /
    • pp.179-194
    • /
    • 2009
  • 도시에서 범죄는 해당 지역 인구의 사회경제적 특징과 공간적 상호관계를 반영한다. 범죄의 피의자와 피해자 사이의 상호작용은 범죄패턴의 공간적 자기상관으로 나타난다. 이러한 범죄의 공간자기상관은 일반적인 최소자승모델에서 편향된 추정치를 제공하여 잘못된 해석으로 이어질 수 있다. 본 연구는 도시주거범죄로서 2000년에 오하이오주 콜럼버스에서 발생한 주거 강도와 절도를 분석 하였다. 특히 주거 범죄율의 공간적 분포패턴은 공간자기상관을 반영하는 아이겐벡터(Eigenvector)를 이용하여 최소자승모델로 분석 하였다. 아이겐 벡터를 이용한 공간자기상관의 필터링은 기존의 모델에서는 잔차에 남아있던 공간자기상관 요소를 설명하기 때문에, 더 효율적인 추정을 가능하게 하였다. 경제적 궁핍과 범죄의 기회가 주거범죄율을 추정하는데 통계적으로 유의미한 요인이었다.

  • PDF

압전 미세 외팔보 형 수중 음향 벡터센서의 작동 원리와 설계 기법 (Modeling of Sound-structure Interactions for Designing a Piezoelectric Micro-Cantilever Acoustic Vector Sensor)

  • 양성관;김준수;문원규
    • 한국음향학회지
    • /
    • 제34권2호
    • /
    • pp.108-116
    • /
    • 2015
  • 수중 음향 벡터센서는 음압 뿐 아니라 음파의 진행 방향에 관한 정보를 측정할 수 있는 센서이다. 본 논문에서는 미세 외팔보를 이용한 수중 음향 벡터 센서를 구현하기 위해 음향학적 이론을 바탕으로 음향과 기계 구조물의 상호작용을 이론적으로 정립하고자 하였다. 감응 방식으로 압전 효과를 이용한 두 가지 유니모프(unimorph)형태의 모델을 제시하였으며, 제시된 모델에 대하여 압전 미세 외팔보의 거동을 집중 질량 모델을 통해 음파가 임의의 주파수와 각도를 가지고 미세 외팔보로 입사할 때 나오는 신호의 크기를 구할 수 있는 전달함수를 유도하였다. 또한 이를 바탕으로 매우 얇고 유연한 구조물로 미세 외팔보를 설계하면 매질의 입자 속도에 관한 정보를 직접적으로 측정 가능한 센서로 활용할 수 있다는 것을 확인하였다.

에세이의 창의성 분류를 위한 어텐션과 역문서 빈도 기반의 자기부호화기 모델 (An AutoEncoder Model based on Attention and Inverse Document Frequency for Classification of Creativity in Essay)

  • 정세진;김덕기;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.624-629
    • /
    • 2022
  • 에세이의 창의성을 자동으로 분류하는 기존의 주요 연구는 말뭉치에서 빈번하게 등장하지 않는 단어에 초점을 맞추어 기계학습을 수행한다. 그러나 이러한 연구는 에세이의 주제와 상관없이 단순히 참신한 단어가 많아 창의적으로 분류되는 문제점이 발생한다. 본 논문에서는 어텐션(Attention)과 역문서 빈도(Inverse Document Frequency; IDF)를 이용하여 에세이 내용 전달에 있어 중요하면서 참신한 단어에 높은 가중치를 두는 문맥 벡터를 구하고, 자기부호화기(AutoEncoder) 모델을 사용하여 문맥 벡터들로부터 창의적인 에세이와 창의적이지 않은 에세이의 특징 벡터를 추출한다. 그리고 시험 단계에서 새로운 에세이의 특징 벡터와 비교하여 그 에세이가 창의적인지 아닌지 분류하는 딥러닝 모델을 제안한다. 실험 결과에 따르면 제안 방안은 기존 방안에 비해 높은 정확도를 보인다. 구체적으로 제안 방안의 평균 정확도는 92%였고 기존의 주요 방안보다 9%의 정확도 향상을 보였다.

  • PDF

목조 문화재 영상에서의 크랙을 감지하기 위한 임베딩 유사도 기반 딥러닝 모델 (An Embedding Similarity-based Deep Learning Model for Detecting Displacement in Cultural Asset Images)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.133-135
    • /
    • 2021
  • 본 논문에서는 목조 문화재 영상에서의 변위 현상 중 하나인 크랙이 발생하는 영역을 감지하기 위한 임베딩 유사도 기반 모델을 제안한다. 우선 변위가 존재하지 않는 정상으로만 구성된 학습 이미지는 사전 학습된 합성 곱 신경망을 통과하여 임베딩 벡터들을 추출한다. 그 이후 임베딩 벡터들을 가지고 정상 클래스에 대한 분포의 파라미터 값을 구한다. 실제 추론 과정에 사용되는 테스트 이미지에 대해서도 마찬가지로 임베딩 벡터를 구한다. 그런 다음 테스트 이미지의 임베딩 벡터와 이전에 구한 정상 클래스를 대표하는 가우시안 분포 정보와의 거리를 계산하여 이상치 맵을 생성하여 최종적으로 변위가 존재하는 영역을 감지한다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 문화재 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 우리가 제안한 임베딩 유사도 기반 모델이 목조 문화재에서 크랙이 발생하는 변위 영역을 잘 감지함을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재의 크랙 현상에 대한 변위 영역 검출에 있어서 매우 적합함을 보여준다.

  • PDF

문서 주제에 따른 문장 생성을 위한 LSTM 기반 언어 학습 모델 (LSTM based Language Model for Topic-focused Sentence Generation)

  • 김다해;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.17-20
    • /
    • 2016
  • 딥러닝 기법이 발달함에 따라 텍스트에 내재된 의미 및 구문을 어떠한 벡터 공간 상에 표현하기 위한 언어 모델이 활발히 연구되어 왔다. 이를 통해 자연어 처리를 기반으로 하는 감성 분석 및 문서 분류, 기계 번역 등의 분야가 진보되었다. 그러나 대부분의 언어 모델들은 텍스트에 나타나는 단어들의 일반적인 패턴을 학습하는 것을 기반으로 하기 때문에, 문서 요약이나 스토리텔링, 의역된 문장 판별 등과 같이 보다 고도화된 자연어의 이해를 필요로 하는 연구들의 경우 주어진 텍스트의 주제 및 의미를 고려하기에 한계점이 있다. 이와 같은 한계점을 고려하기 위하여, 본 연구에서는 기존의 LSTM 모델을 변형하여 문서 주제와 해당 주제에서 단어가 가지는 문맥적인 의미를 단어 벡터 표현에 반영할 수 있는 새로운 언어 학습 모델을 제안하고, 본 제안 모델이 문서의 주제를 고려하여 문장을 자동으로 생성할 수 있음을 보이고자 한다.

  • PDF