• 제목/요약/키워드: representation learning

검색결과 504건 처리시간 0.029초

의료 데이터의 자기지도학습 적용을 위한 pretext task 분석 (Pretext Task Analysis for Self-Supervised Learning Application of Medical Data)

  • 공희산;박재훈;김광수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.38-40
    • /
    • 2021
  • 의료 데이터 분야는 레코드 수는 많지만 응답값이 없기 때문에 인공지능을 적극적으로 활용하지 못하고 있다. 이러한 문제점을 해결하기 위해 자기지도학습(Self-Supervised learning)을 의료 분야에 적용하는 연구가 등장하고 있다. 자기지도학습은 model이 레이블링이 없는 데이터의 semantic 표현을 이해할 수 있도록 pretext task와 supervision을 학습한다. 그러나, 자기지도학습의 성능은 pretext task로 학습한 표현에 의존하므로 데이터의 특성에 적합한 pretext task를 정의할 필요가 있다. 따라서 본 논문에서는 의학 데이터 중 활용도가 높은 x-ray 이미지에 적용할 수 있는 pretext task를 실험적으로 탐색하고 그 결과를 분석한다.

  • PDF

물질의 입자적 성질에 대한 다중 표상 학습에서 외적 표상들 간의 연계와 통합을 촉진시키는 방안으로서의 그리기와 쓰기 (Drawing and Writing as Methods to Assist Students in Connecting and Integrating External Representations in Learning the Particulate Nature of Matter with Multiple Representations)

  • 강훈식;김보경;노태희
    • 한국과학교육학회지
    • /
    • 제25권4호
    • /
    • pp.533-540
    • /
    • 2005
  • 이 연구에서는 물질의 입자적 성질이 강조되는 화학 개념 학습에서 학생들에게 제공되는 다양한 외적 표상들 간의 연계와 통합을 촉진시키는 방법으로서의 그리기와 쓰기의 효과에 대해 알아보았다. 남녀공학 중학교 1학년 224명을 통제 집단, 그리기 집단, 쓰기 집단으로 배치한 후,'보일의 법칙'과 '샤를의 법칙'에 대하여 2차시 동안 수업을 하였다. 세 집단 모두 거시적인 현상을 실험을 통해 관찰하게 한 후, 통제 집단 에서는 시각적 정보와 언어적 정보를 동시에 제공하여 학습하게 하였고, 그리기 집단에서는 제공된 언어적 정보에 대한 정신 모형을 그림으로 그리게 한 후, 이를 시각적 정보와 비교하게 하였으며, 쓰기 집단에서는 시각적 정보에 대한 정신 모형을 글로 쓰게 한 후, 이를 언어적 정보와 비교하게 하였다. 이원 공변량 분석 결과, 쓰기 집단의 개념 이해도 점수가 통제 집단보다 유의미하게 높았으며, 그리기 집단은 통제 집단보다 통계적으로 높은 경향성을 보였다. 개념 이해도 점수에서 수업 처치와 공간 시각화 능력 사이의 상호 작용 효과는 없었다. 학생들의 수업 인식 검사 결과에서는 대부분의 학생들이 쓰기와 그리기 활동을 통해 개념 이해가 잘 되었다고 응답하였으며, 일부 학생들은 쓰기와 그리기가 재미있었다고 응답하기도 하였다. 이에 대한 교육학적 함의를 논의하였다.

5~6세 아동의 철자표상이 말소리분절 과제 수행에 미치는 영향 (Effects of the Orthographic Representation on Speech Sound Segmentation in Children Aged 5-6 Years)

  • 맹현수;하지완
    • 디지털융복합연구
    • /
    • 제14권6호
    • /
    • pp.499-511
    • /
    • 2016
  • 음운인식은 구어의 기본 단위인 말소리를 지각하고 조작하는 능력으로, 이것은 이후 문자습득에 영향을 주는 것으로 알려져 있다. 그러나 몇몇 연구에서는 문자의 기본 단위인 철자에 대한 지식이 반대로 음운인식에 영향을 준다고 주장한다. 본 연구에서는 5, 6세 아동을 대상으로 철자표상 과제와 말소리분절 과제를 실시한 후, 두 과제 수행력 간 상관관계, 철자표상 상위집단과 하위집단 간 말소리분절 과제의 정반응 점수, 그리고 오류유형을 비교 분석하였다. 그 결과 철자표상 과제와 말소리분절 과제 수행력은 자소-음소 일치 단어에서는 양의 상관, 불일치 단어에서는 음의 상관을 보였다. 자소-음소 일치 단어의 경우 두 집단 간 말소리분절 수행력에 차이가 없었지만, 자소-음소 불일치 단어의 경우 하위집단이 상위집단보다 말소리분절 수행력이 유의하게 좋았다. 두 집단 모두에서 가장 많이 나타난 오류는 철자화 오류였고, 이러한 경향은 상위집단에서 두드러졌다. 본 연구는 철자를 배우기 시작한 직후부터는 아동들이 말소리분절 과제 수행에 철자지식을 활용하고 있음을 시사한다.

인지언어 및 메타정의의 관점에서 수학 영재아의 문제해결 프로토콜 분석 (Analysis of Problem-Solving Protocol of Mathematical Gifted Children from Cognitive Linguistic and Meta-affect Viewpoint)

  • 도주원;백석윤
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제22권4호
    • /
    • pp.223-237
    • /
    • 2019
  • 수학적 과정에서 나타나는 언어 구문론적 표현 체계와 정의적 표현 체계 사이에는 긴밀한 상호 작용이 이루어진다. 한편, 수학적 개념 체계도 본질적으로 은유적이므로 언어적 표현을 통해 나타나는 수학적 개념 구조에 대한 분석은 수학 학습에 작용하는 인지 정의적 장애 요인의 근원을 밝히는데 도움이 될 수 있다. 이에 본 연구에서는 수학 영재아의 문제해결 프로토콜을 인지언어와 메타정의의 관점에서 분석하여 텍스트 및 은유의 기능적 특성과 메타정의의 기능적 특성 사이의 관계성을 파악하였다. 그 결과 문제해결의 성공 여부에 따라 수학 영재아의 인지적, 정의적 특성이 반영된 행위의 양상이 서로 다르게 나타났다. 성공적이지 못한 문제해결의 경우에는 성공적인 경우에 비해 내부 표현 체계로서의 은유를 활용하는 행위가 상대적으로 빈번하게 나타났다. 또한 은유의 인지언어학적 측면이 문제해결에 중요하게 작용하면서 동시에 은유라는 외적 표현에는 메타정의적 속성이 긴밀하게 관련되어 나타났다.

가려진 얼굴의 인식 (Recognition of Occluded Face)

  • 강현철
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.682-689
    • /
    • 2019
  • 부분 기반 영상 표현(part-based image representation)에서는 영상의 부분적인 모습을 기저 벡터로 표현하고 기저 벡터의 선형 조합으로 영상을 분해하며, 이 때 기저 벡터의 계수가 곧 물체의 부분적인 특징을 의미하게 된다. 본 논문에는 부분 기반 영상 표현 기법인 비음수 행렬 분해(non-negative matrix factorization, NMF)를 이용하여 얼굴 영상을 표현하고 신경망 기법을 적용하여 가려진 얼굴을 인식하는 얼굴 인식을 제안한다. 표준 비음수 행렬 분해, 투영 경사 비음수 행렬 분해, 직교 비음수 행렬 분해를 이용하여 얼굴 영상을 표현하였고, 각 기법의 성능을 비교하였다. 인식기로는 학습벡터양자화 신경망을 사용하였으며, 인식기에서의 거리 척도로는 유클리디언 거리를 사용하였다. 실험 결과, 전통적인 얼굴 인식 방법에 비하여 제안한 기법이 가려진 얼굴 인식에 보다 강인함을 보인다.

Representative Batch Normalization for Scene Text Recognition

  • Sun, Yajie;Cao, Xiaoling;Sun, Yingying
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2390-2406
    • /
    • 2022
  • Scene text recognition has important application value and attracted the interest of plenty of researchers. At present, many methods have achieved good results, but most of the existing approaches attempt to improve the performance of scene text recognition from the image level. They have a good effect on reading regular scene texts. However, there are still many obstacles to recognizing text on low-quality images such as curved, occlusion, and blur. This exacerbates the difficulty of feature extraction because the image quality is uneven. In addition, the results of model testing are highly dependent on training data, so there is still room for improvement in scene text recognition methods. In this work, we present a natural scene text recognizer to improve the recognition performance from the feature level, which contains feature representation and feature enhancement. In terms of feature representation, we propose an efficient feature extractor combined with Representative Batch Normalization and ResNet. It reduces the dependence of the model on training data and improves the feature representation ability of different instances. In terms of feature enhancement, we use a feature enhancement network to expand the receptive field of feature maps, so that feature maps contain rich feature information. Enhanced feature representation capability helps to improve the recognition performance of the model. We conducted experiments on 7 benchmarks, which shows that this method is highly competitive in recognizing both regular and irregular texts. The method achieved top1 recognition accuracy on four benchmarks of IC03, IC13, IC15, and SVTP.

멀티 뷰 기법 리뷰: 이해와 응용 (Multi-view learning review: understanding methods and their application)

  • 배강일;이영섭;임창원
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.41-68
    • /
    • 2019
  • 멀티 뷰 기법은 데이터를 다양한 관점에서 보려는 접근 방법이며 데이터의 다양한 정보를 통합하여 사용하려는 시도이다. 최근 많은 연구가 진행되고 있는 멀티 뷰 기법에서는 단일 뷰 만을 이용하여 모형을 학습시켰을 때 보다 좋은 성과를 보인 경우가 많았다. 멀티 뷰 기법에서 딥 러닝 기법의 도입으로 이미지, 텍스트, 음성, 영상 등 다양한 분야에서 좋은 성과를 보였다. 본 연구에서는 멀티 뷰 기법이 인간 행동 인식, 의학, 정보 검색, 표정 인식 분야에서 직면한 여러 가지 문제들을 어떻게 해결하고 있는지 소개하였다. 또한 전통적인 멀티 뷰 기법들을 데이터 차원, 분류기 차원, 표현 간의 통합으로 분류하여 멀티 뷰 기법의 데이터 통합 원리를 리뷰 하였다. 마지막으로 딥 러닝 기법 중 가장 범용적으로 사용되고 있는 CNN, RNN, RBM, Autoencoder, GAN 등이 멀티 뷰 기법에 어떻게 응용되고 있는지를 살펴보았다. 이때 CNN, RNN 기반 학습 모형을 지도학습 기법으로, RBM, Autoencoder, GAN 기반 학습 모형을 비지도 학습 기법으로 분류하여 이 방법들이 대한 이해를 돕고자 하였다.

생물 학습을 위한 고등학생 소집단과 교사의 면담에서 나타나는 상호작용 유형 분석 (The Patterns of Interaction in Teacher Interviewing with High School Students' Small Group for Biology Learning)

  • 김정민;송신철;심규철
    • 과학교육연구지
    • /
    • 제37권1호
    • /
    • pp.117-130
    • /
    • 2013
  • 본 연구는 고등학생들의 생물 학습 상황의 소집단 활동에서 나타나는 상호작용 유형을 분석하고자 하였다. 상호작용의 유형 분석은 소집단 활동을 위해 교사가 피드백을 제공하고자 하는 면담 과정을 통해 이루어졌다. 상호작용의 유형은 학생과 학생, 학생과 교사간 상호작용 수준에 따라 4가지로 분류되었는데 이는 소집단 내에서 교사와 소집단의 대표 학생 사이에서만 상호작용이 이루어지는 유형(LR, Leader Representation), 일부 학생과 교사의 상호작용이 이루어지고 있는 유형(PSI, Partial Students Interaction), 학생과 학생 사이에 상호작용이 활발히 일어나나 교사와는 대표 학생과 상호작용이 이루어지는 유형(SAI, Students Active Interaction), 구성원 모두가 활발히 상호작용을 하고 모든 학생들이 교사와도 상호작용을 하는 유형(TSAI, Teacher-students Active Interaction) 등이다. 고등학생들은 면담 과정이 거듭될수록 학생과 학생 사이에 상호작용이 활발하게 일어났으며, 학습에 대한 개념 이해가 부족한 초기 단계에서는 학생들 간에 복잡한 상호작용 양상이 나타나지만 개념의 이해가 완성되어 갈수록 점차 상호작용 유형이 간결하게 변화되어가는 특성을 보였다. 이로부터 생물 학습을 위한 소집단에서의 상호작용은 개념 이해가 부족한 학습자에게는 개념을 확인하고 이해할 수 있는 기회를 제공하며, 학습 개념을 상호 형성할 수 있는 긍정적 영향을 미칠 수 있을 것이다.

  • PDF

교수내용지식을 위한 하이브리드 지식 표현 기법 (A Hybrid Knowledge Representation Method for Pedagogical Content Knowledge)

  • 김용범;오필우;김영식
    • 인지과학
    • /
    • 제16권4호
    • /
    • pp.369-386
    • /
    • 2005
  • 지능형 교수 시스템(ITS: Intelligent Tutoring System)이 기존의 CAI의 제한적 기능을 극복하고, 내장한 지식베이스에 의해 다양한 학습자들의 변인들을 고려한 개별화된 학습 환경을 제공하지만, 교육현장에는 교수내용지식 표현 방법의 부재와 투자 비용의 비효율성으로 인하여 실제적인 개발물은 전무한 상태이다. 이러한 문제점을 해소하기 위하여 ITS에서의 지식표현 기법과 구축된 지식베이스의 재사용에 대한 연구가 필요하다. 교수내용지식의 특성을 고려하여 본 연구에서는 기존의 신경논리망의 한계점을 해결할 수 있도록 지식의 다중 결합체 구성, 이를 이용한 학습의 맥락 설명을 연구의 대상으로 삼았다. 또한 형성된 지식결합체는 군집화하여 지식베이스 객체로 사용하고, 결합체의 자기 학습에 의해 적응적인 지식베이스 객체로의 성장 가능성을 제고한다. 따라서 본 연구에서는 신경논리망의 논리추론, 그리고 인지구조에서 노드의 위상적 불변성을 근거로, 교수내용지식과 객체지향적 개념이 포함된 '확장된 개념의 신경논리망(X-Neuronet: eXtended Neural Logic Network)'을 제안하고, 이 기법에 대한 타당성을 검증하였다. X-Neuronet은 표현의 대상이 되는 지식을 관성과 가변성을 가지는 방향성 결합체로 정의하고, 표현을 위한 기본 개념, 노드의 처리와 연산을 위한 논리연산자, 노드값과 가중치의 결정, 노드활성을 위한 전파 규칙 학습 알고리즘 등을 제공한다.

  • PDF

기능성에 따른 프로그래밍 소스코드 분류를 위한 Deep Learning Model 연구 (A Study on Deep Learning model for classifying programs by functionalities)

  • 윤주성;이은헌;안진현;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.615-616
    • /
    • 2016
  • 최근 4차 산업으로 패러다임이 변화함에 따라 SW산업이 더욱 중요하게 되었다. 이에 따라 전 세계적으로 코딩 교육에 대한 수요도 증가하게 되었고 기업에서도 SW를 잘 만들기 위한 코드 관리 중요성도 증가하게 되었다. 많은 양의 프로그래밍 소스코드를 사람이 일일이 채점하고 관리하는 것은 사실상 불가능하기 때문에 이러한 문제를 해결할 수 있는 코드 평가 시스템이 요구되고 있다. 하지만 어떤 코드가 좋은 코드인지 코드를 어떻게 평가해야하는지에 대한 명확한 기준은 없으며 이에 대한 연구도 부족한 상황이다. 최근에 주목 받고 있는 Deep Learning 기술은 이미지 처리, 자연어 처리등 기존의 Machine Learning 알고리즘이 냈던 성과보다 훨씬 뛰어난 성과를 내고 있다. 하지만 Programming language 영역에서는 아직 깊이 연구된 바가 없다. 따라서 본 연구에서는 Deep Learning 기술로 알려진 Convolutional Neural Network의 변형된 형태엔 Tree-based Convolutional Neural Network를 사용하여 프로그래밍 소스코드를 분석, 분류하는 알고리즘 및 코드의 Representation Learning에 대한 연구를 진행함으로써 이러한 문제를 해결하고자 한다.