• 제목/요약/키워드: unsupervised feature learning

검색결과 78건 처리시간 0.027초

자기 조직화 기법을 활용한 컬러 영상 배경 영역 추출 (Background Segmentation in Color Image Using Self-Organizing Feature Selection)

  • 신현경
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.407-412
    • /
    • 2008
  • 잡음이 심한 배경을 가진 영상 내부의 영역 분할 처리 과정은 해결하기 매우 어려운 문제로 인식되어 왔다. 그에 따라 이 문제를 해결하기 위한 기초적 방법론에 관한 연구 및 주어진 문제에 따라 실제적 적용을 위한 다양한 노력이 있어왔다. 본 논문에서는 영상 분할을 위한 새로운 접근법을 제시하는 것을 목적으로 하였다. 새로운 방법론으로서 기존의 관심 객체 분할의 반대인 배경 영역 분할이라는 새로운 관점을 연구의 중심으로 하였다. 기반 이론으로는 승자 독식 원리의 자기 학습 이론 알고리즘에서 특징 선택을 위한 자기 조직화를 분석하고 이를 문제 해결에 적용하였다. 실제적 영상 데이터를 통한 실험을 통해 배경 영역 분할을 적용한 영상 분할은 효과적으로 수행될 수 있음을 실험 결과로 제시해 보였다.

야외 RGB+D 데이터베이스 구축을 위한 깊이 영상 신뢰도 측정 기법 (Confidence Measure of Depth Map for Outdoor RGB+D Database)

  • 박재광;김선옥;손광훈;민동보
    • 한국멀티미디어학회논문지
    • /
    • 제19권9호
    • /
    • pp.1647-1658
    • /
    • 2016
  • RGB+D database has been widely used in object recognition, object tracking, robot control, to name a few. While rapid advance of active depth sensing technologies allows for the widespread of indoor RGB+D databases, there are only few outdoor RGB+D databases largely due to an inherent limitation of active depth cameras. In this paper, we propose a novel method used to build outdoor RGB+D databases. Instead of using active depth cameras such as Kinect or LIDAR, we acquire a pair of stereo image using high-resolution stereo camera and then obtain a depth map by applying stereo matching algorithm. To deal with estimation errors that inevitably exist in the depth map obtained from stereo matching methods, we develop an approach that estimates confidence of depth maps based on unsupervised learning. Unlike existing confidence estimation approaches, we explicitly consider a spatial correlation that may exist in the confidence map. Specifically, we focus on refining confidence feature with the assumption that the confidence feature and resultant confidence map are smoothly-varying in spatial domain and are highly correlated to each other. Experimental result shows that the proposed method outperforms existing confidence measure based approaches in various benchmark dataset.

자율주행을 위한 Self-Attention 기반 비지도 단안 카메라 영상 깊이 추정 (Unsupervised Monocular Depth Estimation Using Self-Attention for Autonomous Driving)

  • 황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.182-189
    • /
    • 2023
  • 깊이 추정은 차량, 로봇, 드론의 자율주행을 위한 3차원 지도 생성의 핵심 기술이다. 기존의 센서 기반 깊이 추정 방식은 정확도는 높지만 가격이 비싸고 해상도가 낮다. 반면 카메라 기반 깊이 추정 방식은 해상도가 높고 가격이 저렴하지만 정확도가 낮다. 본 연구에서는 무인항공기 카메라의 깊이 추정 성능 향상을 위해 Self-Attention 기반의 비지도 단안 카메라 영상 깊이 추정을 제안한다. 네트워크에 Self-Attention 연산을 적용하여 전역 특징 추출 성능을 향상시킨다. 또한 카메라 파라미터를 학습하는 네트워크를 추가하여 카메라 칼리브레이션이 안되어있는 이미지 데이터에서도 사용 가능하게 한다. 공간 데이터 생성을 위해 추정된 깊이와 카메라 포즈는 카메라 파라미터를 이용하여 포인트 클라우드로 변환되고, 포인트 클라우드는 Octree 구조의 점유 그리드를 사용하여 3D 맵으로 매핑된다. 제안된 네트워크는 합성 이미지와 Mid-Air 데이터 세트의 깊이 시퀀스를 사용하여 평가된다. 제안하는 네트워크는 이전 연구에 비해 7.69% 더 낮은 오류 값을 보여주었다.

확장된 RNN을 활용한 사람재인식 시스템에 관한 연구 (A Study on Person Re-Identification System using Enhanced RNN)

  • 최석규;허문걸
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.15-23
    • /
    • 2017
  • 사람의 빈번한 자세 변화, 그리고 background clutter과 occlusion으로 인해 Person Re-identificatio는 컴퓨터 비전 분야에서 가장 어려운 부분이다. 비겹침 카메라의 이미지는 어떤 사람을 다른 사람과 구별하기 어렵게 한다. 더욱 나은 성능 일치를 달성하기 위해 대부분의 방법은 특징 선택과 거리 메트릭을 개별적으로 사용한다. 그렇게 차별화된 표현과 적절한 거리를 얻을 수 있고, 사람과 중요한 특징의 무시 사이의 유사성을 설명할 수 있다. 이러한 상황은 우리가 이 문제를 다루는 새로운 방법을 고려하도록 한다. 본 논문에서는 Person Re-identification를 위한 3단 계층네트워크를 갖는 향상되고 반복적인 신경 회로망을 제안하였다. 특히 RNN(Revurrent Neural Network) 모델은 반복적인 EM(Expectation Maximum) 알고리즘과 3단 계층 네트워크를 포함하고, 차별적 특징과 지표 거리를 공동으로 학습한다. 반복적인 EM 알고리즘은 RNN 이전에 연속해 있는 CNN(Convoutional Neural Network)의 특징 추출 능력을 충분히 사용할 수 있다. 자율 학습을 통해 EM 프레임 워크는 패치의 레이블을 변경하고 더 큰 데이터 세트를 훈련할 수 있다. 네트워크를 더 잘 훈련시키기 위해 3단 계층 네트워크를 통해 CNN, RNN 및 풀링 계층이 공동으로 특징 추출을 할 수 있다. 실험 결과에 따르면 비전처리 분야에서 다른 연구자의 접근 방식과 비교할 때 이 방법은 경쟁력 있는 정확도를 얻을 수 있다. 이 방법에 대한 다른 요소의 영향은 향후 연구에서 분석되고 평가될 것이다.

Intelligent Hybrid Fusion Algorithm with Vision Patterns for Generation of Precise Digital Road Maps in Self-driving Vehicles

  • Jung, Juho;Park, Manbok;Cho, Kuk;Mun, Cheol;Ahn, Junho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.3955-3971
    • /
    • 2020
  • Due to the significant increase in the use of autonomous car technology, it is essential to integrate this technology with high-precision digital map data containing more precise and accurate roadway information, as compared to existing conventional map resources, to ensure the safety of self-driving operations. While existing map technologies may assist vehicles in identifying their locations via Global Positioning System, it is however difficult to update the environmental changes of roadways in these maps. Roadway vision algorithms can be useful for building autonomous vehicles that can avoid accidents and detect real-time location changes. We incorporate a hybrid architectural design that combines unsupervised classification of vision data with supervised joint fusion classification to achieve a better noise-resistant algorithm. We identify, via a deep learning approach, an intelligent hybrid fusion algorithm for fusing multimodal vision feature data for roadway classifications and characterize its improvement in accuracy over unsupervised identifications using image processing and supervised vision classifiers. We analyzed over 93,000 vision frame data collected from a test vehicle in real roadways. The performance indicators of the proposed hybrid fusion algorithm are successfully evaluated for the generation of roadway digital maps for autonomous vehicles, with a recall of 0.94, precision of 0.96, and accuracy of 0.92.

가버 웨이블릿 신경망 기반 적응 표정인식 시스템 (Adaptive Facial Expression Recognition System based on Gabor Wavelet Neural Network)

  • 이상완;김대진;김용수;변증남
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-7
    • /
    • 2006
  • 본 논문에서는 6개의 특징점을 이용하는 가버 웨이블릿 신경망 기반 적응 표정인식 시스템을 제안한다. 특징 추출부를 포함하는 초기 네트워크의 구성은 Levenberg-Marquardt 기반의 학습방법이 사용되며, 따라서 특징 추출부 결정에 있어서 경험적 요소를 배재시킬 수 있다. 또한 새로운 사용자에 대한 적응 네트워크를 구성하기 위해서 개선된 보상함수를 가지는 Q-학습과, 비지도 퍼지 신경망 모델을 사용하였다. Q-학습을 통해서는 개인 사용자에 대해 분리도가 좋은 특징벡터를 얻을 수 있는 가버필터 세트를 얻을 수 있으며, 퍼지 신경망을 통해서는 사용자의 얼굴변화에 맞게 인식기를 변화시킬 수 있다. 따라서 제안된 시스템은 사용자의 얼굴변화를 따라갈 수 있는 좋은 적응 성능을 보이고 있다.

Medical Image Analysis Using Artificial Intelligence

  • Yoon, Hyun Jin;Jeong, Young Jin;Kang, Hyun;Jeong, Ji Eun;Kang, Do-Young
    • 한국의학물리학회지:의학물리
    • /
    • 제30권2호
    • /
    • pp.49-58
    • /
    • 2019
  • Purpose: Automated analytical systems have begun to emerge as a database system that enables the scanning of medical images to be performed on computers and the construction of big data. Deep-learning artificial intelligence (AI) architectures have been developed and applied to medical images, making high-precision diagnosis possible. Materials and Methods: For diagnosis, the medical images need to be labeled and standardized. After pre-processing the data and entering them into the deep-learning architecture, the final diagnosis results can be obtained quickly and accurately. To solve the problem of overfitting because of an insufficient amount of labeled data, data augmentation is performed through rotation, using left and right flips to artificially increase the amount of data. Because various deep-learning architectures have been developed and publicized over the past few years, the results of the diagnosis can be obtained by entering a medical image. Results: Classification and regression are performed by a supervised machine-learning method and clustering and generation are performed by an unsupervised machine-learning method. When the convolutional neural network (CNN) method is applied to the deep-learning layer, feature extraction can be used to classify diseases very efficiently and thus to diagnose various diseases. Conclusions: AI, using a deep-learning architecture, has expertise in medical image analysis of the nerves, retina, lungs, digital pathology, breast, heart, abdomen, and musculo-skeletal system.

가속도 응답을 이용한 이상치 해석 기반 역사 구조 건전성 평가 기법 개발 (Structural Health Monitoring Methodology based on Outlier Analysis using Acceleration of Subway Stations)

  • 신정열;안태기;이창길;박승희
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2011년도 정기총회 및 추계학술대회 논문집
    • /
    • pp.281-286
    • /
    • 2011
  • Station structures, one of important infrastructures, which have been being operated since the 1970s, are especially vulnerable to even the medium-level earthquake and they could be damaged by long-term internal or external vibrations such as ambient vibrations. Recently, much attention has been paid to real-time monitoring of the fatal defect or long-term deterioration of civil infrastructures to ensure their safety and adequate performance throughout their life span. In this study, a structural health monitoring methodology using acceleration responses is proposed to evaluate the health-state of the station structures and to detect initial damage-stage. A damage index is developed using the acceleration data and it is applied to outlier analysis, one of unsupervised learning based pattern recognition methods. A threshold value for the outlier analysis is determined based on confidence level of the probabilistic distribution of the acceleration data. The probabilistic distribution is selected according to the feature of the collected data.

  • PDF

자기구성 신경회로망을 이용한 면삭밀링에서의 공구파단검출 (Tool Breakage Detection in Face Milling Using a Self Organized Neural Network)

  • 고태조;조동우
    • 대한기계학회논문집
    • /
    • 제18권8호
    • /
    • pp.1939-1951
    • /
    • 1994
  • This study introduces a new tool breakage detecting technology comprised of an unsupervised neural network combined with adaptive time series autoregressive(AR) model where parameters are estimated recursively at each sampling instant using a parameter adaptation algorithm based on an RLS(Recursive Least Square). Experiment indicates that AR parameters are good features for tool breakage, therefore it can be detected by tracking the evolution of the AR parameters during milling process. an ART 2(Adaptive Resonance Theory 2) neural network is used for clustering of tool states using these parameters and the network is capable of self organizing without supervised learning. This system operates successfully under the wide range of cutting conditions without a priori knowledge of the process, with fast monitoring time.

Multiresolution Independent Component Analysis for Iris Identification

  • Noh, Seung-In;Kwanghuk Pae;Lee, Chulhan;Kim, Jaihie
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1674-1677
    • /
    • 2002
  • In this paper, the new method to extract the features of iris signals is proposed; Multiresolution ICA (M-ICA) provides good properties to represent signals with time-frequency. The conventional methods were to use the technique of filter bank analysis, while ICA is unsupervised learning algorithm using high-order statistics. M-ICA could make use of strengths of learn- ing method and multiresolution. Also, we performed comparative studies of different feature extraction techniques applied to personal identification using iris pat- tern. To measure goodness of methods, we use Fisher’s discriminant ratio to quantify the class-separability of features generated by various techniques.

  • PDF