• 제목/요약/키워드: Computational intelligence

검색결과 320건 처리시간 0.024초

인공지능 교육 기반 초등학교 수업 사례 분석 (Case Analysis of Elementary School Classes based on Artificial Intelligence Education)

  • 이승민
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.377-383
    • /
    • 2021
  • 본 연구의 목적은 실제 학교 현장에서 AI 교육과 관련된 수업들의 사례를 분석하여, 초등학교 AI 교육의 방향을 제시하는 것이다. 이를 위해 AI 교육 기반의 초등학교 수업 사례로 19개의 수업을 수집하였다. 수업 사례를 분석한 결과에 따르면, AI를 학습내용과 방법의 혼합적 측면에서 수업을 설계하였음을 확인하였다. 성취기준과 학습목표를 분석한 결과, AI를 도구적 관점에서 활용한 8개 수업에서 기억, 이해, 적용에 관한 행동 동사가 발견되였다. 수업을 도입, 전개, 정리단계로 나누었을 때, AI 교육 요소는 전개 단계에서 가장 많이 나타났다. 한편 전개 단계에서 AI 교육 요소의 학습내용과 학습방법의 비율을 살펴보았을 때 학습방법으로서 AI 교육을 접근하는 학습시간이 압도적으로 높았다. 이를 토대로 다음과 같은 시사점을 도출하였다. 첫째, 학교, 학년 교육과정을 설계할 때, 학습 내용과 방법으로서의 AI를 포괄적으로 다룰 수 있도록 설계해야 한다. 둘째, AI에 대한 이해를 보완하기 위해 단기적으로는 실과 교과나 창의적 체험활동에서의 시수 확보가 요구되며, 장기적으로는 정보 교과의 확보가 필요하다.

  • PDF

의미간의 유사도 연구의 패러다임 변화의 필요성-인지 의미론적 관점에서의 고찰 (The Need for Paradigm Shift in Semantic Similarity and Semantic Relatedness : From Cognitive Semantics Perspective)

  • 최영석;박진수
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.111-123
    • /
    • 2013
  • 개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.

대학 내 조경전공 교육과정에 있어 새로운 컴퓨터 미디어 수업의 필요와 개선방향 (The Need and Improvement Direction of New Computer Media Classes in Landscape Architectural Education in University)

  • 나성진
    • 한국조경학회지
    • /
    • 제49권1호
    • /
    • pp.54-69
    • /
    • 2021
  • 2020년 문명사회의 전반적 생활 방식은 종이와 같은 소모성 아날로그 미디어에서 데이터 공유에 기반한 디지털 미디어로, 유선에 기반한 미디어에서 무선의 언택트 미디어로 뚜렷한 변화를 보인다. 본 연구는 이러한 사회 변화 양상을 바탕으로 조경학과 교육과정에서 컴퓨터 미디어의 교육과 활용이 시대의 변화에 적합하게 운용되고 있는지를 고찰하고, 4차 산업혁명 시대의 조경 교육을 위한 새로운 컴퓨터 수업의 방향을 제시하고자 한다. 조경은 도시를 연구 및 설계 대상으로 하는 분야로 사회 변화와 긴밀하게 연결되어 있다. 하지만 실리콘밸리를 기반으로 IT 혁명이 시작되고, 인공지능, 빅데이터, 자율주행차, 클라우드 네트워크, 사물인터넷 등 4차 산업혁명의 디지털 인프라가 현대 사회를 기술적으로, 사회적으로, 경제적으로 변화시키고 있는 데에 반해, 조경 교육이 그러한 변화를 적극적으로 수용하며 가시적인 차이를 만들고 있다고 보기에는 분명한 근거가 부족하다. 따라서 본 연구는 조경 교육에서 컴퓨터 테크놀로지와 뉴 미디어의 활용 현황을 돌아보고, 새로운 시대에 적합한 교육과정의 대안적 방향에 대해 논의했다. 우선 현대 조경 및 건축 전반의 컴퓨테이셔널 디자인의 동향에 대해 살펴 논의의 근거를 마련했다. 그리고 이를 바탕으로 국내외 조경학과 교육과정에서 컴퓨터 미디어 수업의 변화 양상과 현황을 선행 연구와 교과과정을 바탕으로 분석했다. 그 결과, 국외 조경학과의 경우 1994년의 연구와 2020년의 현황 사이에 컴퓨터 관련 과목의 수가 눈에 띄게 증가하고, 그 종류가 다양해진 반면, 국내 조경학과의 경우 일부 교과목이 변경된 것 외에 별다른 변화를 확인할 수 없었다. 이는 국내 조경 교육과정이 디지털 시대의 변화에 소극적으로 대처하고 있음을 시사한다. 마지막으로 이러한 논의를 바탕으로 4차 산업혁명 시대의 조경학과가 컴퓨터 미디어와 관련해 지향해야 할 새로운 교육과정에 대한 여러 실천적 대안을 검토했다.

인공지능 사고 함양을 위한 인공지능 빅 아이디어 기반 초등학교 수학 융합 수업 사례연구 (A case study of elementary school mathematics-integrated classes based on AI Big Ideas for fostering AI thinking)

  • 김초희;장혜원
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권2호
    • /
    • pp.255-272
    • /
    • 2024
  • 본 연구의 주요 목적은 인공지능 사고를 함양할 수 있는 수학 융합 수업을 설계하고 이를 적용함으로써 나타나는 초등학생들의 인공지능 사고를 분석하는 것이다. 이를 위해 미국의 AI4K12 Initiative가 개발한 인공지능 빅 아이디어의 학습목표(Learning Objective) 및 지속적 이해(Enduring Understanding)와 2015 개정 초등학교 수학과 교육과정 성취기준을 연계하여 인공지능 사고 함양을 위한 수학 융합 수업을 설계 및 실시하였다. 수학적 내용 수업 2개, 수학적 과정 수업 2개로, 수학적 내용 수업은 인공지능 빅 아이디어의 Perception-Processing, Learning-Nature of Learning과 연계하였으며 수학적 과정 수업은 Representation & Reasoning-Search, Representation & Reasoning-Reasoning과 연계하였다. 설계한 수업 중 Learning-Nature of Learning을 제외한 세 개의 수업을 대상 학년에 맞추어 K 초등학교 5학년 두 학급, 6학년 한 학급에 적용하였다. 수업 중 학생 담화 및 활동지, 수업 관찰 자료를 수집하였으며, 이를 컴퓨팅 사고 분류 체계를 기반으로 인공지능 사고 구성 요소를 추가하여 구성한 인공지능 사고 분석틀을 사용하여 분석하였다. 연구 결과, 인공지능 빅 아이디어가 인공지능 사고 함양을 위한 수학 융합 수업 설계 시 준거로서 기능할 수 있고 이를 통해 초등학생들에게도 인공지능 교육이 가능함을 확인할 수 있었다. 수학 융합 수업은 학생들의 다양한 인공지능 사고를 촉진할 수 있었는데, 구체적으로 수업 과정에서 데이터, 모델링과 시뮬레이션, 컴퓨팅 문제해결, 인공지능 사고 요소가 다양하게 나타난 것에 비해 시스템 사고 요소가 나타나는 빈도수는 상대적으로 적었다. 또한 입체도형 및 공간감각 등의 수학적 내용 요소와 수학 교과역량에 해당하는 수학적 과정 요소의 성취를 보여주었다. 요컨대 인공지능 빅 아이디어를 기반으로 한 수학 융합 수업은 초등학생들의 인공지능 개념 및 원리 이해와 수학적 내용 요소의 이해 및 과정 요소의 강화에 도움이 된다고 할 수 있다. 더욱이 학생들은 수업 중 기존 문제해결 방법의 구조적 일관성을 유지한 채 이를 새로운 문제해결로 확장하는 모습을 보여주었는데, 이러한 반응을 통해 인공지능 사고의 전이 가능성을 확인할 수 있었다. 본 연구 결과에 기초하여, 대상 학년과 빅 아이디어의 하위 요소를 확장함으로써 초등학생들의 다양한 인공지능 사고 요소를 함양하려는 수학 수업 설계를 통한 교수학적 노력 및 지속적인 연구가 필요하다.

복합 적층판의 딥러닝 기반 파괴 모드 결정 (Deep Learning-based Fracture Mode Determination in Composite Laminates)

  • 무하마드 무자밀 아자드;아타 우르 레만 샤;M.N. 프라브하카르;김흥수
    • 한국전산구조공학회논문집
    • /
    • 제37권4호
    • /
    • pp.225-232
    • /
    • 2024
  • 본 논문에서는 딥러닝을 활용하여 복합재 적층판의 파괴 모드를 결정하는 방법을 제안하였다. 수많은 엔지니어링 응용 분야에서 적층 복합재의 사용이 증가함에 따라 무결성과 성능을 보장하는 것이 중요해졌다. 그러나 재료의 이방성으로 인해 복잡하게 나타나는 파괴모드를 식별하는 것은 도메인 지식이 필요하고, 시간이 많이 드는 작업이다. 따라서 이러한 문제를 해결하기 위해 본 연구에서는 인공 지능(AI) 기술을 활용하여 적층 복합재의 파괴 모드 분석을 자동화하는 것을 목표로 하였다. 이 목표를 달성하기 위해 적층된 복합재에서 파손된 인장 시험편의 주사 전자 현미경(SEM) 이미지를 얻어 다양한 파괴 모드를 확보하였다. 이러한 SEM 이미지는 섬유 파손, 섬유 풀아웃, 혼합 모드 파괴, 매트릭스 취성 파손 및 매트릭스 연성 파손과 같은 다양한 파손 모드를 기준으로 분류하였다. 다음으로 모든 클래스의 집합 데이터를 학습, 테스트, 검증 데이터 세트로 구분하였다. 두 가지 딥 러닝 기반 사전 훈련 모델인 DenseNet과 GoogleNet을 이용해 각 파괴 모드에 대한 차별적 특징을 학습하도록 훈련하였다. DenseNet 및 GoogleNet 모델은 각각 (94.01% 및 75.49%) 및 (84.55% 및 54.48%)의 훈련 및 테스트 정확도를 보여주었다. 그런 다음 훈련된 딥 러닝 모델은 검증 데이터 세트를 활용해 검증하였다. 더 깊은 아키텍처로 인해 DenseNet 모델이 고품질 특징을 추출하여 84.44% 검증 정확도(GoogleNet 모델보다 36.84% 더 높음)를 얻을 수 있음을 확인하였다. 이는 DenseNet 모델이 높은 정밀도로 파괴 모드를 예측함으로써 적층 복합재의 파손 분석을 수행하는 데 효과적이라는 것을 알 수 있다.

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

글로벌 공급사슬에서 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼 구축 (Development of Agent-based Platform for Coordinated Scheduling in Global Supply Chain)

  • 이정승;최성우
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.213-226
    • /
    • 2011
  • 글로벌 공급사슬 환경에서 글로벌하게 분산 조달, 생산, 유통하게 됨에 따라 전체 공급사슬의 스케줄을 최적화하기 위해서 공급사슬상의 개별 기업 혹은 공장의 스케줄링 최적화뿐만 아니라 각 개별 기업 혹은 공장의 스케줄을 긴밀하게 연계하는 것이 필요하게 되었다. 이는 경쟁과 협력을 동시에 하는 개별 기업 혹은 공장을 개별 에이전트로 보고 각 에이전트간 커뮤니케이션을 통해 개별 에이전트가 관할하는 스케줄러의 스케줄을 조정함으로써 가능해진다. 하지만 전통적인 스케줄링 연구는 개별 스케줄러의 최적화에 집중되어 있고, 에이전트 연구는 스케줄링 도메인에 적용한 예가 제한적이며 이 예도 개별 스케줄러 내의 최적화에 적용하거나 실제 현장 문제가 아닌 실험실 문제 수준에 그치고 있다. 따라서 본 연구에서는 전체 글로벌 공급사슬 스케줄의 최적화를 위해 개별 기업 혹은 공장 스케줄러의 스케줄링을 연계하는 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼을 구축하였다. 글로벌 공급사슬에서 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼을 구축하기 위해 첫째, 경쟁협력 스케줄링 분류 체계를 확립하고, 둘째, 경쟁협력 스케줄링을 위한 에이전트를 설계하고, 셋째, 경쟁협력 스케줄링을 위한 지식기반 의사결정 모델을 개발한 후, 넷째 조선산업에 적용 가능한 프로토타입 시스템을 개발했다. 이를 통해 글로벌 공급사슬상의 전체 스케줄의 품질과 에이전트간 커뮤니케이션의 노력에 대한 균형점을 찾을 수 있다. 이를 통해 공급사슬내 개별 기업 혹은 공장의 부분 최적화를 극복할 수 있는 대안을 제시할 것으로 기대한다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.