• 제목/요약/키워드: Vector representation

검색결과 289건 처리시간 0.026초

위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델 (A Semantic Text Model with Wikipedia-based Concept Space)

  • 김한준;장재영
    • 한국전자거래학회지
    • /
    • 제19권3호
    • /
    • pp.107-123
    • /
    • 2014
  • 텍스트마이닝 연구의 기본적인 난제는 기존 텍스트 표현모델이 자연어 문장으로 기술된 텍스트 데이터로부터 의미 또는 개념 정보를 표현하지 않는데 기인한다. 기존 텍스트 표현모델인 벡터공간 모델(vector space model), 불리언 모델(Boolean model), 통계 모델(statistical model), 텐서공간 모델(tensor space model) 등은 'Bag-of-Words' 방식에 바탕을 두고 있다. 이러한 텍스트 모델들은 텍스트에 포함된 단어와 그것의 출현 횟수만으로 텍스트를 표현하므로, 단어의 함축 의미, 단어의 순서 및 텍스트의 구조를 전혀 표현하지 못한다. 대부분의 텍스트 마이닝 기술은 대상 문서를 'Bag-of-Words' 방식의 텍스트 모델로 표현함을 전제로 하여 발전하여 왔다. 하지만 오늘날 빅데이터 시대를 맞이하여 방대한 규모의 텍스트 데이터를 보다 정밀하게 분석할 수 있는 새로운 패러다임의 표현모델을 요구하고 있다. 본 논문에서 제안하는 텍스트 표현모델은 개념공간을 문서 및 단어와 동등한 매핑 공간으로 상정하여, 그 세 가지 공간에 대한 연관 관계를 모두 표현한다. 개념공간의 구성을 위해서 위키피디어 데이터를 활용하며, 하나의 개념은 하나의 위키피디어 페이지로부터 정의된다. 결과적으로 주어진 텍스트 문서집합을 의미적으로 해석이 가능한 3차 텐서(3-order tensor)로 표현하게 되며, 따라서 제안 모델을 텍스트 큐보이드 모델이라 명명한다. 20Newsgroup 문서집합을 사용하여 문서 및 개념 수준의 클러스터링 정확도를 평가함으로써, 제안 모델이 'Bag-of-Word' 방식의 대표적 모델인 벡터공간 모델에 비해 우수함을 보인다.

비트맵과 벡터방식을 혼합한 새로운 이미지 편집기 (New Image Editor based on Combination of Bitmap and Vector Method)

  • 김진호;이규남;나인호
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.288-293
    • /
    • 2002
  • 이미지 데이터는 표현 방식에 따라서 비트맵과 벡터 방식으로 나누어진다. 비트맵 방식은 이미지 데이터를 픽셀이라는 2차원 맵으로 구성한 것이며, 벡터방식은 주어진 2차원 또는 3차원 공간에 선이나 형상을 그리기 위해 일련의 명령어나 수학적 표현으로 나타낸 것이다. 따라서 서로 다른 방식의 이미지를 제작 및 편집하고 자 하는 경우에는 각기 다근 응용프로그램을 사용해야 하는 문제점이 있다. 본 논문에서는 비트맵과 벡터 방식을 혼합하여 하나의 응용프로그램에서 이미지의 제작 및 편집이 가능한 이미지 편집 도구의 설계 및 구현 방법에 대하여 기술하였다.

비트맵과 벡터방식을 혼합한 이미지 편집도구 구현에 관한 연구 (A Study on Implementation of Image Editing Tool based on Combining of Bitmap and Vector Image)

  • 김진호;이규남;나인호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.165-168
    • /
    • 2001
  • 이미지 데이터는 표현 방식에 따라서 비트맵과 벡터 방식으로 나누어진다. 비트맵 방식은 이미지 데이터를 픽셀이라는 2차원 맵으로 구성한 것이며, 벡터방식은 주어진 2차원 또는 3차원 공간에 선이나 형상을 그리기 위해 일련의 명령어나 수학적 표현으로 나타낸 것이다. 따라서 서로 다른 방식의 이미지를 제작 및 편집하고자 하는 경우에는 각기 다른 응용프로그램을 사용해야 문제점이 있다. 본 논문에서는 비트맵과 벡터 방식의 혼합을 기반으로 하여 하나의 응용프로그램에서 이미지의 제작 및 편집이 가능한 이미지 편집 도구의 설계 및 구현 방법에 대하여 기술하였다.

  • PDF

Hyperspectral Image Classification via Joint Sparse representation of Multi-layer Superpixles

  • Sima, Haifeng;Mi, Aizhong;Han, Xue;Du, Shouheng;Wang, Zhiheng;Wang, Jianfang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.5015-5038
    • /
    • 2018
  • In this paper, a novel spectral-spatial joint sparse representation algorithm for hyperspectral image classification is proposed based on multi-layer superpixels in various scales. Superpixels of various scales can provide complete yet redundant correlated information of the class attribute for test pixels. Therefore, we design a joint sparse model for a test pixel by sampling similar pixels from its corresponding superpixels combinations. Firstly, multi-layer superpixels are extracted on the false color image of the HSI data by principal components analysis model. Secondly, a group of discriminative sampling pixels are exploited as reconstruction matrix of test pixel which can be jointly represented by the structured dictionary and recovered sparse coefficients. Thirdly, the orthogonal matching pursuit strategy is employed for estimating sparse vector for the test pixel. In each iteration, the approximation can be computed from the dictionary and corresponding sparse vector. Finally, the class label of test pixel can be directly determined with minimum reconstruction error between the reconstruction matrix and its approximation. The advantages of this algorithm lie in the development of complete neighborhood and homogeneous pixels to share a common sparsity pattern, and it is able to achieve more flexible joint sparse coding of spectral-spatial information. Experimental results on three real hyperspectral datasets show that the proposed joint sparse model can achieve better performance than a series of excellent sparse classification methods and superpixels-based classification methods.

피셔 분별 사전학습을 이용해 개선된 Sparse 표현 기반 악성 종괴 검출 (Improvement of Sparse Representation based Classifier using Fisher Discrimination Dictionary Learning for Malignant Mass Detection)

  • 김성태;이승현;민현석;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제16권5호
    • /
    • pp.558-565
    • /
    • 2013
  • X-ray를 이용한 여성의 유방암 검사인 유방조영술은 유방암의 초기 단계에서의 진단을 위한 효과적인 방법이다. 컴퓨터 지원 검출(CAD) 시스템은 유방조영술을 통한 진단 시 의사가 놓치기 쉬운 유방암의 징후인 종괴의 검출을 도와 유방암 진단율을 높이는 수단이다. 종괴는 다양한 모양을 지니며 경계가 뚜렷하지 않기 때문에 검출이 어렵고 결과적으로 비-종괴 영역을 포함한 많은 수의 종괴 후보영역이 CAD 시스템에서 검출된다. 따라서 CAD 시스템 설계 시 검출된 많은 수의 종괴 후보영역으로부터 실제 악성 종괴 영역을 분류할 수 있도록 우수한 성능의 분류기가 요구된다. 본 논문에서는 피셔 분별 사전학습을 통해 개선된 Sparse 표현(SR) 기반 분류방법을 제안한다. 개선된 SR 기반 분류기가 기존의 CAD 시스템에서 주로 사용되어온 Support Vector Machine (SVM) 분류기 보다 우수함을 비교실험을 통해 확인했다.

도심 영상에서의 비음수행렬분해를 이용한 차량 인식 (Vehicle Recognition using NMF in Urban Scene)

  • 반재민;이병래;강현철
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.554-564
    • /
    • 2012
  • 차량인식은 차량 후보영역 검출단계와 검출된 후보 영역에서 특징을 기반으로 차량을 검증하는 차량 검증단계로 나누어진다. 선형 변환 방식의 특징은 차원 감소 효과와 통계적인 특징을 지니게 되어, 이동이나 회전에 강인한 특성을 갖는다. 선형 변환 방식 중 비음수행렬분해(Non-negative Matrix Factorization, NMF)는 부분 기반 표현 방식으로 차량의 국소적인 특징을 기저벡터로 사용하여 희소성을 갖는 특징을 추출할 수 있기 때문에 도심영상에서 발생하는 차폐 영역에 따른 인식률 저하를 방지할 수 있다. 본 논문에서는 차량 인식에 적합한 NMF 특징 추출 방법을 제안하고, 인식률을 검증하였다. 또한 희소성 제약 조건을 이용하여 기저 벡터에 희소성을 가지는 SNMF(Sparse NMF)와 LVQ2(Learning Vector Quantization) 신경 회로망을 결합하여 차폐 영역에 대한 차량 인식 효율을 기존의 NMF를 이용한 방법과 비교하였다. NMF를 이용하는 특징은 차량이 혼재되어 차폐 영역이 빈번히 발생하는 도심에서도 강건한 특징임을 보였다.

Sparse-Neighbor 영상 표현 학습에 의한 초해상도 (Super Resolution by Learning Sparse-Neighbor Image Representation)

  • 엄경배;최영희;이종찬
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2946-2952
    • /
    • 2014
  • 표본 기반 초해상도(Super Resolution 이하 SR) 방법들 중 네이버 임베딩(Neighbor Embedding 이하 NE) 기법의 기본 원리는 지역적 선형 임베딩이라는 매니폴드 학습방법의 개념과 같다. 그러나, 네이버 임베딩은 국부 학습 데이터 집합의 크기가 너무 작기 때문에 이에 따른 빈약한 일반화 능력으로 인하여 알고리즘의 성능을 크게 저하시킨다. 본 논문에서는 이와 같은 문제점을 해결하기 위해서 일반화 능력이 뛰어난 Support Vector Regression(이하 SVR)을 이용한 Sparse-Neighbor 영상 표현 학습 방법에 기반한 새로운 알고리즘을 제안하였다. 저해상도 입력 영상이 주어지면 bicubic 보간법을 이용하여 확대된 영상을 얻고, 이 확대된 영상으로부터 패치를 얻은 후 저주파 패치인지 고주파 패치 인지를 판별한 후 각 영상 패치의 가중치를 얻은 후 두 개의 SVR을 훈련하였으며 훈련된 SVR을 이용하여 고해상도의 해당 화소 값을 예측하였다. 실험을 통하여 제안된 기법이 기존의 보간법 및 네이버 임베딩 기법 등에 비해 정량적인 척도 및 시각적으로 향상된 결과를 보여 주었다.

Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안 (Effective Korean sentiment classification method using word2vec and ensemble classifier)

  • 박성수;이건창
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.133-140
    • /
    • 2018
  • 감성 분석에서 정확한 감성 분류는 중요한 연구 주제이다. 본 연구는 최근 많은 연구가 이루어지는 word2vec과 앙상블 방법을 이용하여 효과적으로 한국어 리뷰를 감성 분류하는 방법을 제시한다. 연구는 20 만 개의 한국 영화 리뷰 텍스트에 대해, 품사 기반 BOW 자질과 word2vec를 사용한 자질을 생성하고, 두 개의 자질 표현을 결합한 통합 자질을 생성했다. 감성 분류를 위해 Logistic Regression, Decision Tree, Naive Bayes, Support Vector Machine의 단일 분류기와 Adaptive Boost, Bagging, Gradient Boosting, Random Forest의 앙상블 분류기를 사용하였다. 연구 결과로 형용사와 부사를 포함한 BOW자질과 word2vec자질로 구성된 통합 자질 표현이 가장 높은 감성 분류 정확도를 보였다. 실증결과, 단일 분류기인 SVM이 가장 높은 성능을 나타내었지만, 앙상블 분류기는 단일 분류기와 비슷하거나 약간 낮은 성능을 보였다.

최소 표현 라플라스 변환에 기초한 단계형 확률변수의 시뮬레이션에 관한 연구 (Simulation of the Phase-Type Distribution Based on the Minimal Laplace Transform)

  • 김선교
    • 한국시뮬레이션학회논문지
    • /
    • 제33권1호
    • /
    • pp.19-26
    • /
    • 2024
  • 단계형 확률분포는 마코프 체인이 특정 상태로 흡수되는 시점까지 거쳐가는 여러 단계에서 체재하는 시간들의 합으로 정의되며 대기행렬 시스템과 신뢰성 분석 모형 등에 광범위하게 사용된다. 연속적 단계형 분포의 경우 흡수 상태로 진입하기까지 거쳐가는 각각의 단계에서의 체재 시간이 지수분포를 따르므로 연속적 단계형 분포는 다양한 지수분포들의 합 또는 볼록 결합으로 나타낼 수 있다. 단계형 분포를 생성하는 가장 일반적이면서도 직관적인 방법은 마코비안 표현방법이라 불리는 초기 확률벡터와 전이 생성행렬에 의해 주어지는 조건부 확률을 이용하는 것이다. 적률이 주어진 상황에서 단계형 변수를 생성하는 방법에 대한 기존의 연구들은 대부분 적률을 마코비안 표현방법으로 변환하는 것을 전제로 하고 있다. 본 연구에서는 적률을 마코비안 표현방법으로 변환하지 않고 확률 분포함수를 결정하여 단계형 확률변수를 생성하는 방법에 대해 살펴보고 마코프 표현을 사용하는 기존의 방법 대신에 조단 분해법과 최소 표현 라플라스 변환을 이용하여 2계 단계형 확률변수를 분포함수를 결정하는 공식과 절차를 제시한다. 이러한 접근 방법은 고차원의 단계형 확률분포를 이용하여 대기행렬의 시뮬레이션을 하는 경우에 마코비안 표현방법의 전이행렬을 결정하여 변수를 생성하는 경우보다 효율적이다.

GeoGebra를 활용한 역동적인 시각적 표상에 기반한 이차곡선 지도 방안 (Instruction method for Quadratic Curve Based on Dynamic Visual Representation by applying GeoGebra)

  • 양성현;강옥기
    • 대한수학교육학회지:학교수학
    • /
    • 제13권3호
    • /
    • pp.447-468
    • /
    • 2011
  • 고등학교 수학교과과정에서 이차곡선에 관련된 단원의 지도는 다른 어떤 단원보다도 연결성이 고려된 지도가 필요한 단원이다. 다시 말해 대수적 접근 방식과 기하적 접근 방식이 동시에 병렬적으로 지도되어야 한다. 특히 대수적 조작력이 미흡한 하위권 학생들에게는 이차곡선에 대한 성질을 역동적으로 표현하는 시각적 표상을 심어주는 기하적 접근 방식이 더욱 중요하다. 이를 위하여 본 연구는 이차곡선의 지도에 있어서 GeoGebra에 기반한 역동적인 시각적 표상의 중요성을 제안하고자 현행 고등학교 '기하와 벡터' 10종의 교과서와 익힘책의 이차곡선 단원 중 포물선에 관련된 부분을 분석하여 시각적 표상을 극대화할 수 있는 지도 방안을 제안하는 실험적 수업을 진행하고 학생들의 표상의 변화를 분석하였다.

  • PDF