• 제목/요약/키워드: Vector space decomposition

검색결과 34건 처리시간 0.02초

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

웨이브릿 변환 영역의 칼라 및 질감 특징을 이용한 영상검색 (Image Retrieval Using Multiresoluton Color and Texture Features in Wavelet Transform Domain)

  • 천영덕;성중기;김남철
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.55-66
    • /
    • 2006
  • 본 논문에서는 웨이브릿 변환된 영역에서 추출된 다해상도 칼라 및 질감 특징의 효율적인 결합을 이용한 점진적 영상검색 기법을 제안한다. 칼라 특징으로 칼라 영상의 H(Hue)와 S(Saturation) 성분의 칼라 오토코렐로그램을 선택하였고, 질감 특징으로는 V(value) 성분의 BDIP와 BVLC 모멘트를 선택하였다 선택된 특징들에 대하여 웨이브릿 변환 영역의 각 분해 레벨로부터 다해상도 특징벡터들을 얻었다. 칼라와 질감 특징의 다해상도 특징벡터들은 특징들의 차원들과 표준 편차 벡터들에 의해 정규화되어 효율적으로 결합되었고, 저장 공간을 고려하여 각 대상 영상들의 특징벡터들은 효율적으로 양자화 되었으며 점진적 검색 기법을 적용하여 유사도 계산시 계산량을 줄였다. 제안한 방법은 칼라 히스토그램, 칼라 오토코렐로그램, SCD, CSD, 웨이브릿 모멘트, EHD, BDIPBVLC, 칼라 히스토그램과 웨이브릿 모멘트의 결합을 이용한 방법들보다 정확도 대 재현율 평가에서는 평균 $15\%,$ ANMRR 평가에서는 평균 0.2 향상된 성능을 나타내었다. 특히, 제안한 방법은 다양한 해상도를 가지는 영상 DB에서 더욱 우수한 성능을 나타내었다

기존선 철도차량을 이용한 철도교의 상호작용해석 (Vehicle-Bridge Interaction Analysis of Railway Bridges by Using Conventional Trains)

  • 조은상;김희주;황원섭
    • 대한토목학회논문집
    • /
    • 제29권1A호
    • /
    • pp.31-43
    • /
    • 2009
  • 본 논문에서는 다양한 차종의 영향을 반영할 수 있고, 차량과 교량의 연성 운동방정식을 구성하여 시간 단계별 직접해를 산정할 수 있는 수치해석기법을 제시하였다. 운동방정식의 해는 직접적분법인 Newmark ${\beta}$을 이용하여 해석 단계별로 구성된 유효강성행렬과 유효하중벡터를 바탕으로 정적평형방정식의 해를 구하는 원리와 동일하게 산정하였다. 또한 해석의 효율성을 증진시키기 위하여 유효강성행렬은 Skyline 법에 의해 재구성하였으며, Cholesky의 행렬 분해기법을 동시에 적용하여 직접적인 역행렬 계산에서 야기되는 오차의 발생을 최소화 하였다. 또한 기존선 철도차량인 새마을 PMC 열차와 디젤 견인 무궁화 열차에 대한 3차원 정밀수치해석 모델을 개발하였고, 각 차량은 차체와 전 후방 대차에 각각 6자유도씩 고려하여 총 18자유도로 수치모델을 작성하였다. 교량은 3차원 공간뼈대 요소를 이용하여 모델링하였고, 차륜과 레일 접촉면의 불규칙성은 미국의 FRA에서 규정하고 있는 연직방향 및 횡방향틀림에 대한 PSD 함수를 이용하여 궤도틀림을 수치적으로 구현하였다. 제시된 수치해석 기법은 12 m, 18 m형 판형교의 실측결과를 이용하여 타당성을 검증하였으며, 실측 및 수치해석결과는 교량의 1차 휨 고유진동수의 2.0배를 기준으로 Low pass filtering 하였다.