• 제목/요약/키워드: Representation Learning

검색결과 498건 처리시간 0.03초

피셔 분별 사전학습을 이용해 개선된 Sparse 표현 기반 악성 종괴 검출 (Improvement of Sparse Representation based Classifier using Fisher Discrimination Dictionary Learning for Malignant Mass Detection)

  • 김성태;이승현;민현석;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제16권5호
    • /
    • pp.558-565
    • /
    • 2013
  • X-ray를 이용한 여성의 유방암 검사인 유방조영술은 유방암의 초기 단계에서의 진단을 위한 효과적인 방법이다. 컴퓨터 지원 검출(CAD) 시스템은 유방조영술을 통한 진단 시 의사가 놓치기 쉬운 유방암의 징후인 종괴의 검출을 도와 유방암 진단율을 높이는 수단이다. 종괴는 다양한 모양을 지니며 경계가 뚜렷하지 않기 때문에 검출이 어렵고 결과적으로 비-종괴 영역을 포함한 많은 수의 종괴 후보영역이 CAD 시스템에서 검출된다. 따라서 CAD 시스템 설계 시 검출된 많은 수의 종괴 후보영역으로부터 실제 악성 종괴 영역을 분류할 수 있도록 우수한 성능의 분류기가 요구된다. 본 논문에서는 피셔 분별 사전학습을 통해 개선된 Sparse 표현(SR) 기반 분류방법을 제안한다. 개선된 SR 기반 분류기가 기존의 CAD 시스템에서 주로 사용되어온 Support Vector Machine (SVM) 분류기 보다 우수함을 비교실험을 통해 확인했다.

Sparse-Neighbor 영상 표현 학습에 의한 초해상도 (Super Resolution by Learning Sparse-Neighbor Image Representation)

  • 엄경배;최영희;이종찬
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2946-2952
    • /
    • 2014
  • 표본 기반 초해상도(Super Resolution 이하 SR) 방법들 중 네이버 임베딩(Neighbor Embedding 이하 NE) 기법의 기본 원리는 지역적 선형 임베딩이라는 매니폴드 학습방법의 개념과 같다. 그러나, 네이버 임베딩은 국부 학습 데이터 집합의 크기가 너무 작기 때문에 이에 따른 빈약한 일반화 능력으로 인하여 알고리즘의 성능을 크게 저하시킨다. 본 논문에서는 이와 같은 문제점을 해결하기 위해서 일반화 능력이 뛰어난 Support Vector Regression(이하 SVR)을 이용한 Sparse-Neighbor 영상 표현 학습 방법에 기반한 새로운 알고리즘을 제안하였다. 저해상도 입력 영상이 주어지면 bicubic 보간법을 이용하여 확대된 영상을 얻고, 이 확대된 영상으로부터 패치를 얻은 후 저주파 패치인지 고주파 패치 인지를 판별한 후 각 영상 패치의 가중치를 얻은 후 두 개의 SVR을 훈련하였으며 훈련된 SVR을 이용하여 고해상도의 해당 화소 값을 예측하였다. 실험을 통하여 제안된 기법이 기존의 보간법 및 네이버 임베딩 기법 등에 비해 정량적인 척도 및 시각적으로 향상된 결과를 보여 주었다.

고등학생들의 판 구조론에 대한 개념 분석 (The Analysis of High School Students' Conceptions on Plate Tectonics)

  • 이미숙;정진우;김형범
    • 한국지구과학회지
    • /
    • 제35권6호
    • /
    • pp.484-497
    • /
    • 2014
  • 이 연구는 판 구조론에 대한 학생들의 개념을 알아보는 것이다. 이를 위해 충청도에 위치한 고등학교 2학년 70명의 학생들을 대상으로 판 구조론에 대한 시각적 표상의 개념 검사를 실시하였으며, 이중 10명의 학생들을 대상으로 반구조화된 면담을 진행하였다. 연구 결과는 다음과 같다. 연구 참여자들은 판 구조론을 학습한 후에도 용어 및 색상의 의미, 판의 이동, 판의 경계, 용융의 위치 및 원인, 맨틀의 물리적 상태 및 판 운동의 원동력과 관련된 대안 개념을 가지고 있으며, 학생들이 가진 색상의 의미, 맨틀의 물리적 상태, 판 운동의 원동력 개념들은 유기적으로 관련되어 있었다. 또한 판 구조론 학습에 사용되는 시각적 표상은 용어, 판의 경계, 용융의 위치 및 맨틀의 물리적 특성에 대한 학생응답에 영향을 주었으며, 판 구조론 학습에서 학습자에게 대안 개념을 유발하는 시각적 표상의 요소들이 있는 것으로 나타났다.

A Novel Multiple Kernel Sparse Representation based Classification for Face Recognition

  • Zheng, Hao;Ye, Qiaolin;Jin, Zhong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권4호
    • /
    • pp.1463-1480
    • /
    • 2014
  • It is well known that sparse code is effective for feature extraction of face recognition, especially sparse mode can be learned in the kernel space, and obtain better performance. Some recent algorithms made use of single kernel in the sparse mode, but this didn't make full use of the kernel information. The key issue is how to select the suitable kernel weights, and combine the selected kernels. In this paper, we propose a novel multiple kernel sparse representation based classification for face recognition (MKSRC), which performs sparse code and dictionary learning in the multiple kernel space. Initially, several possible kernels are combined and the sparse coefficient is computed, then the kernel weights can be obtained by the sparse coefficient. Finally convergence makes the kernel weights optimal. The experiments results show that our algorithm outperforms other state-of-the-art algorithms and demonstrate the promising performance of the proposed algorithms.

Multi-feature local sparse representation for infrared pedestrian tracking

  • Wang, Xin;Xu, Lingling;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1464-1480
    • /
    • 2019
  • Robust tracking of infrared (IR) pedestrian targets with various backgrounds, e.g. appearance changes, illumination variations, and background disturbances, is a great challenge in the infrared image processing field. In the paper, we address a new tracking method for IR pedestrian targets via multi-feature local sparse representation (SR), which consists of three important modules. In the first module, a multi-feature local SR model is constructed. Considering the characterization of infrared pedestrian targets, the gray and edge features are first extracted from all target templates, and then fused into the model learning process. In the second module, an effective tracker is proposed via the learned model. To improve the computational efficiency, a sliding window mechanism with multiple scales is first used to scan the current frame to sample the target candidates. Then, the candidates are recognized via sparse reconstruction residual analysis. In the third module, an adaptive dictionary update approach is designed to further improve the tracking performance. The results demonstrate that our method outperforms several classical methods for infrared pedestrian tracking.

2-stage 마르코프 의사결정 상황에서 Successor Representation 기반 강화학습 알고리즘 성능 평가 (Evaluating a successor representation-based reinforcement learning algorithm in the 2-stage Markov decision task)

  • 김소현;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.910-913
    • /
    • 2021
  • Successor representation (SR) 은 두뇌 내 해마의 공간 세포가 인지맵을 구성하여 환경을 학습하고, 이를 활용하여 변화하는 환경에서 유연하게 최적 전략을 수립하는 기전을 모사한 강화학습 방법이다. 특히, 학습한 환경 정보를 활용, 환경 구조 안에서 목표가 변화할 때 강인하게 대응하여 일반 model-free 강화학습에 비해 빠르게 보상 변화에 적응하고 최적 전략을 찾는 것으로 알려져 있다. 본 논문에서는 SR 기반 강화학습 알고리즘이 보상의 변화와 더불어 환경 구조, 특히 환경의 상태 천이 확률이 변화하여 보상의 변화를 유발하는 상황에서 어떠한 성능을 보이는 지 확인하였다. 벤치마크 알고리즘으로 SR 의 특성을 목적 기반 강화학습으로 통합한 SR-Dyna 를 사용하였고, 환경 상태 천이 불확실성과 보상 변화가 동시에 나타나는 2-stage 마르코프 의사결정 과제를 실험 환경으로 사용하였다. 시뮬레이션 결과, SR-Dyna 는 환경 내 상태 천이 확률 변화에 따른 보상 변화에는 적절히 대응하지 못하는 결과를 보였다. 본 결과를 통해 두뇌의 강화학습과 알고리즘 강화학습의 차이를 이해하여, 환경 변화에 강인한 강화학습 알고리즘 설계를 기대할 수 있다.

그래프 기반 상태 표현을 활용한 작업 계획 알고리즘 개발 (Task Planning Algorithm with Graph-based State Representation)

  • 변성완;오윤선
    • 로봇학회논문지
    • /
    • 제19권2호
    • /
    • pp.196-202
    • /
    • 2024
  • The ability to understand given environments and plan a sequence of actions leading to goal state is crucial for personal service robots. With recent advancements in deep learning, numerous studies have proposed methods for state representation in planning. However, previous works lack explicit information about relationships between objects when the state observation is converted to a single visual embedding containing all state information. In this paper, we introduce graph-based state representation that incorporates both object and relationship features. To leverage these advantages in addressing the task planning problem, we propose a Graph Neural Network (GNN)-based subgoal prediction model. This model can extract rich information about object and their interconnected relationships from given state graph. Moreover, a search-based algorithm is integrated with pre-trained subgoal prediction model and state transition module to explore diverse states and find proper sequence of subgoals. The proposed method is trained with synthetic task dataset collected in simulation environment, demonstrating a higher success rate with fewer additional searches compared to baseline methods.

Learning Deep Representation by Increasing ConvNets Depth for Few Shot Learning

  • Fabian, H.S. Tan;Kang, Dae-Ki
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.75-81
    • /
    • 2019
  • Though recent advancement of deep learning methods have provided satisfactory results from large data domain, somehow yield poor performance on few-shot classification tasks. In order to train a model with strong performance, i.e. deep convolutional neural network, it depends heavily on huge dataset and the labeled classes of the dataset can be extremely humongous. The cost of human annotation and scarcity of the data among the classes have drastically limited the capability of current image classification model. On the contrary, humans are excellent in terms of learning or recognizing new unseen classes with merely small set of labeled examples. Few-shot learning aims to train a classification model with limited labeled samples to recognize new classes that have neverseen during training process. In this paper, we increase the backbone depth of the embedding network in orderto learn the variation between the intra-class. By increasing the network depth of the embedding module, we are able to achieve competitive performance due to the minimized intra-class variation.

무리수 단원에 대한 교과서 분석 연구: 과정과 대상의 관점으로 (A textbook analysis of irrational numbers unit: focus on the view of process and object)

  • 오국환;박정숙;권오남
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제56권2호
    • /
    • pp.131-145
    • /
    • 2017
  • The representation of irrational numbers has a key role in the learning of irrational numbers. However, transparent and finite representation of irrational numbers does not exist in school mathematics context. Therefore, many students have difficulties in understanding irrational numbers as an 'Object'. For this reason, this research explored how mathematics textbooks affected to students' understanding of irrational numbers in the view of process and object. Specifically we analyzed eight textbooks based on current curriculum and used framework based on previous research. In order to supplement the result derived from textbook analysis, we conducted questionnaires on 42 middle school students. The questions in the questionnaires were related to the representation and calculation of irrational numbers. As a result of this study, we found that mathematics textbooks develop contents in order of process-object, and using 'non repeating decimal', 'numbers cannot be represented as a quotient', 'numbers with the radical sign', 'number line' representation for irrational numbers. Students usually used a representation of non-repeating decimal, although, they used a representation of numbers with the radical sign when they operate irrational numbers. Consequently, we found that mathematics textbooks affect students to understand irrational numbers as a non-repeating irrational numbers, but mathematics textbooks have a limitation to conduce understanding of irrational numbers as an object.

Automatic Categorization of Islamic Jurisprudential Legal Questions using Hierarchical Deep Learning Text Classifier

  • AlSabban, Wesam H.;Alotaibi, Saud S.;Farag, Abdullah Tarek;Rakha, Omar Essam;Al Sallab, Ahmad A.;Alotaibi, Majid
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.281-291
    • /
    • 2021
  • The Islamic jurisprudential legal system represents an essential component of the Islamic religion, that governs many aspects of Muslims' daily lives. This creates many questions that require interpretations by qualified specialists, or Muftis according to the main sources of legislation in Islam. The Islamic jurisprudence is usually classified into branches, according to which the questions can be categorized and classified. Such categorization has many applications in automated question-answering systems, and in manual systems in routing the questions to a specialized Mufti to answer specific topics. In this work we tackle the problem of automatic categorisation of Islamic jurisprudential legal questions using deep learning techniques. In this paper, we build a hierarchical deep learning model that first extracts the question text features at two levels: word and sentence representation, followed by a text classifier that acts upon the question representation. To evaluate our model, we build and release the largest publicly available dataset of Islamic questions and answers, along with their topics, for 52 topic categories. We evaluate different state-of-the art deep learning models, both for word and sentence embeddings, comparing recurrent and transformer-based techniques, and performing extensive ablation studies to show the effect of each model choice. Our hierarchical model is based on pre-trained models, taking advantage of the recent advancement of transfer learning techniques, focused on Arabic language.