• 제목/요약/키워드: High-dimensional data

검색결과 1,531건 처리시간 0.036초

단일세포 RNA-SEQ의 유전자 발현 군집화를 위한 변이 자동인코더 기반의 차원감소와 군집화 (Variational Autoencoder Based Dimension Reduction and Clustering for Single-Cell RNA-seq Gene Expression)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제25권11호
    • /
    • pp.1512-1518
    • /
    • 2021
  • 단일세포 RNA-Seq 은 개별 세포의 유전자 발현을 제공하므로 세포마다 차등적인 고해상도 정보를 준다. 단일세포 RNA-Seq 자료에 대하여 군집화는 세포의 유형과 고수준의 생물 과정을 이해하기 위하여 수행된다. 매우 고차원이고 대용량인 단일세포 RNA-Seq을 효과적으로 처리하기 위하여, 본 논문은 변이 자동인코더를 사용하여 고차원의 자료공간을 저차원의 잠재공간으로 변환하여, 보다 정확한 군집화를 수행할 수 있는 특징공간을 만든다. 차원이 축소된 잠재공간에 다양한 군집화 방법을 적용하는 접근을 다양한 전통적인 단일세포 RNA-Seq 군집화 방법과 성능을 비교하였다. 군집화 실험을 통하여, 제안한 방법은 기존 방법들보다 다양한 군집화 성능기준에서 성능이 개선되었다.

Three-dimensional Map Construction of Indoor Environment Based on RGB-D SLAM Scheme

  • Huang, He;Weng, FuZhou;Hu, Bo
    • 한국측량학회지
    • /
    • 제37권2호
    • /
    • pp.45-53
    • /
    • 2019
  • RGB-D SLAM (Simultaneous Localization and Mapping) refers to the technology of using deep camera as a visual sensor for SLAM. In view of the disadvantages of high cost and indefinite scale in the construction of maps for laser sensors and traditional single and binocular cameras, a method for creating three-dimensional map of indoor environment with deep environment data combined with RGB-D SLAM scheme is studied. The method uses a mobile robot system equipped with a consumer-grade RGB-D sensor (Kinect) to acquire depth data, and then creates indoor three-dimensional point cloud maps in real time through key technologies such as positioning point generation, closed-loop detection, and map construction. The actual field experiment results show that the average error of the point cloud map created by the algorithm is 0.0045m, which ensures the stability of the construction using deep data and can accurately create real-time three-dimensional maps of indoor unknown environment.

최적화된 PRBFNNs 패턴분류기와 PCA알고리즘을 이용한 3차원 얼굴인식 알고리즘 설계 : 진화 알고리즘의 비교 해석 (Design of Three-dimensional Face Recognition System Using Optimized PRBFNNs and PCA : Comparative Analysis of Evolutionary Algorithms)

  • 오성권;오승훈;김현기
    • 한국지능시스템학회논문지
    • /
    • 제23권6호
    • /
    • pp.539-544
    • /
    • 2013
  • 본 논문에서는 다항식 기반 RBFNNs를 이용하여 3차원 얼굴인식 알고리즘을 설계하고 인식률을 산출하는 방법을 제시한다. 2차원 얼굴인식의 경우 얼굴 포즈, 조명 등과 같은 외부 환경에 의해 인식률이 저하된다. 이러한 단점을 보완하기 위해 3차원 영상을 획득하여 얼굴인식을 수행한다. 얼굴인식을 수행하기 전에 3D스캐너를 통해 얻은 얼굴영상의 포즈 보상을 실시하고 얼굴의 형상을 정면으로 향하게 한다. 그리고 Point Signature 기법을 이용하여 얼굴의 깊이 값을 추출하게 된다. 추출된 데이터는 고차원 데이터로서 학습 및 인식을 수행함에 있어 문제가 생길 수 있기 때문에 PCA알고리즘을 수행하여 차원을 축소한 데이터를 사용한다. 효율적인 학습을 위해 최적화 알고리즘을 통해 파라미터 최적화를 수행하며 PSO, DE, GA 알고리즘을 사용하여 인식 성능을 확인한다.

GB-색인: 고차원 데이타의 복합 유사 질의 및 적합성 피드백을 위한 색인 기법 (GB-Index: An Indexing Method for High Dimensional Complex Similarity Queries with Relevance Feedback)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.362-371
    • /
    • 2005
  • 멀티미디어 데이타베이스와 같은 고차원 응용에서 유사 색인과 검색은 어려운 문제이며, 특히, 다수의 특성을 함께 색인하는 경우에는 더욱 어렵다. 본 논문에서는 고차원 이미지 데이타베이스에서 복합 유사 질의 및 적합성 피드백을 효율적으로 처리하기 위한 새로운 색인 기법인 GB-색인을 제시한다. GB-색인은 각 특성 차원을 독립적으로 처리함으로써 다수의 특성과 다수의 질의 객체를 유연하게 제어한다. 아울러, 비트맵 색인을 통해 데이타베이스에 있는 모든 객체를 비트맵의 집합으로 표현하여 질의를 효율적으로 처리한다. GB-색인의 기술적인 주된 공헌은 다음과 같다: (1) 고차원 데이타를 위한 효율적인 색인, (2) 효율적인 복합 유사 질의 처리, (3) 적합성 피드백을 위한 분리형 질의의 효과적 처리. 실험 결과에 따르면 GB-색인은 순차 탐색 및 VA-파일에 비해 큰 성능 향상을 보였다.

운고계 관측자료의 대화형 3차원 시각화 (Interactive 3D Visualization of Ceilometer Data)

  • 이준혁;하완수;김용혁;이강훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권2호
    • /
    • pp.21-28
    • /
    • 2018
  • 본 논문은 운고계로부터 수집된 운고 자료와 후방산란 자료를 3차원 가상 공간에서 시각화 하는 대화형 기법을 제안한다. 운고계 관측자료는 시간과 공간 정보가 모두 연계된 다차원 대용량 정보이기 때문에 정적인 2차원 시각화 방법으로는 그 안에 내재된 전체 정보를 충분히 드러내기 어렵다. 본 논문의 시각화 방법은 실시간 3차원 렌더링 기술을 바탕으로 사용자가 원하는 대로 시점과 시야를 조절하면서 3차원 형상으로 표현된 운고계 관측자료의 전체적인 변화 양상과 국소적인 특징을 다각도로 관찰할 수 있도록 한다. 운고 및 운량 자료는 실제 지형 자료와 결합하여 다수의 구름이 지형 위에서 형성되고 소멸되는 사실적인 구름 애니메이션 형식으로 시각화 한다. 후방산란 자료는 시간과 고도에 따른 변화를 통합적으로 표현할 수 있는 3차원 지형 형태로 시각화 한다. 또한 검증하고자 하는 날짜, 지형의 상세도, 혹은 대기경계층 높이와 같은 보조자료 등을 선택할 수 있도록 함으로써 자료를 여러 관점에서 해석할 수 있도록 돕는다. 본 논문에서 제안하는 대화형 시각화 방법이 기상 자료의 분석과 검증에 활용될 수 있음을 보이기 위하여 전국 93개 관측 지점의 라이다식 운고계로부터 수집된 실제 자료를 바탕으로 다양한 실험을 수행하였다.

데이터 정보를 이용한 흑색 플라스틱 분류기 설계 (Design of Black Plastics Classifier Using Data Information)

  • 박상범;오성권
    • 전기학회논문지
    • /
    • 제67권4호
    • /
    • pp.569-577
    • /
    • 2018
  • In this paper, with the aid of information which is included within data, preprocessing algorithm-based black plastic classifier is designed. The slope and area of spectrum obtained by using laser induced breakdown spectroscopy(LIBS) are analyzed for each material and its ensuing information is applied as the input data of the proposed classifier. The slope is represented by the rate of change of wavelength and intensity. Also, the area is calculated by the wavelength of the spectrum peak where the material property of chemical elements such as carbon and hydrogen appears. Using informations such as slope and area, input data of the proposed classifier is constructed. In the preprocessing part of the classifier, Principal Component Analysis(PCA) and fuzzy transform are used for dimensional reduction from high dimensional input variables to low dimensional input variables. Characteristic analysis of the materials as well as the processing speed of the classifier is improved. In the condition part, FCM clustering is applied and linear function is used as connection weight in the conclusion part. By means of Particle Swarm Optimization(PSO), parameters such as the number of clusters, fuzzification coefficient and the number of input variables are optimized. To demonstrate the superiority of classification performance, classification rate is compared by using WEKA 3.8 data mining software which contains various classifiers such as Naivebayes, SVM and Multilayer perceptron.

Dual graph-regularized Constrained Nonnegative Matrix Factorization for Image Clustering

  • Sun, Jing;Cai, Xibiao;Sun, Fuming;Hong, Richang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권5호
    • /
    • pp.2607-2627
    • /
    • 2017
  • Nonnegative matrix factorization (NMF) has received considerable attention due to its effectiveness of reducing high dimensional data and importance of producing a parts-based image representation. Most of existing NMF variants attempt to address the assertion that the observed data distribute on a nonlinear low-dimensional manifold. However, recent research results showed that not only the observed data but also the features lie on the low-dimensional manifolds. In addition, a few hard priori label information is available and thus helps to uncover the intrinsic geometrical and discriminative structures of the data space. Motivated by the two aspects above mentioned, we propose a novel algorithm to enhance the effectiveness of image representation, called Dual graph-regularized Constrained Nonnegative Matrix Factorization (DCNMF). The underlying philosophy of the proposed method is that it not only considers the geometric structures of the data manifold and the feature manifold simultaneously, but also mines valuable information from a few known labeled examples. These schemes will improve the performance of image representation and thus enhance the effectiveness of image classification. Extensive experiments on common benchmarks demonstrated that DCNMF has its superiority in image classification compared with state-of-the-art methods.

1/1,000 수치지도의 수정을 위한 3차원 공간정보의 활용 방안 (Revision of 1/1,000 digital Map for Application of 3Dimensional Geospatial Data)

  • 이현직
    • 한국측량학회지
    • /
    • 제32권2호
    • /
    • pp.77-86
    • /
    • 2014
  • 최근 래스터 기반의 고품질, 고해상도 공간정보가 등장하면서 1/1,000 수치지도의 인지도와 활용도가 저하되고 있으며, 수정 및 갱신 주기가 불규칙하여 최신성 결여의 문제점을 안고 있다. 이에 본 연구에서는 3차원 공간정보와 1/1,000 수치지도의 연계성을 분석하고, 3차원 공간정보 성과품을 이용한 1/1,000 수치지도 수정 방안을 제시하였다. 본 연구 성과를 통해 제시된 1/1,000 수치지도 수정 방안 중 3차원 객체모델을 이용하여 인천과 부산광역시의 일부지역을 시범구축하고 3차원 객체모델을 이용한 1/1,000 수치지도 수정 방안의 정성적, 정량적 분석을 통하여 수정 가능성을 제시하였다.

고품질 지형공간정보를 이용한 홍수 시뮬레이션 (Flood Simulation by using High Quality Geo-spatial Information)

  • 이현직;홍성환
    • 대한공간정보학회지
    • /
    • 제18권3호
    • /
    • pp.97-104
    • /
    • 2010
  • 홍수 시뮬레이션에서 중요한 요소는 강우량, 강우강도 등의 수리 수문자료와 3차원 지형모델, 수리학적 홍수 계산 모형으로 이 중 어느 한 정보의 정확도 및 신뢰성이 낮게 되면 홍수범람 예측 정보의 정확도 및 신뢰성의 확보가 어렵게 된다. 이에 본 연구는 기존 수치지도 및 현황도로 제작한 지형모델과 항공 LiDAR 데이터로 제작된 3차원 지형모델에 대하여 기존의 설계빈도별 홍수위에 따른 침수취약지역을 비교하여 3차원 지형모델의 정확도 차이로 인한 문제점을 분석하여 홍수 시뮬레이션에 대한 LiDAR데이터의 활용성을 제시하고자 하였다.

그래프 LASSO에서 모형선택기준의 비교 (Comparison of model selection criteria in graphical LASSO)

  • 안형석;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.881-891
    • /
    • 2014
  • 그래프모형(graphical model)은 확률 변수들간의 조건부 독립성(conditional independence)을 시각적인 네트워크형태로 표현할 수 있기 때문에, 정보학 (bioinformatics)이나 사회관계망 (social network) 등 수많은 변수들이 서로 연결되어 있는 복잡한 확률 시스템에 대한 직관적인 도구로 활용될 수 있다. 그래프 LASSO (graphical least absolute shrinkage and selection operator)는 고차원의 자료에 대한 가우스 그래프 모형 (Gaussian graphical model)의 추정에서 과대적합 (overfitting)을 방지하는데에 효과적인 것으로 알려진 방법이다. 본 논문에서는 그래프 LASSO 추정에서 매우 중요한 문제인 모형선택에 대하여 고려한다. 특히 여러가지 모형선택기준을 모의실험을 통해 비교하며 실제 금융 자료를 분석한다.