• 제목/요약/키워드: 학습영상

검색결과 2,580건 처리시간 0.027초

실시간 얼굴인식 시스템을 위한 새로운 LINF 알고리즘의 제안 (The Suggestion of LINF Algorithm for a Real-time Face Recognition System)

  • 장혜경;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.79-86
    • /
    • 2005
  • 본 논문에서는 실시간 얼굴인식 시스템을 위한 새로운 LINF(Linear Independent Non-negative Factorization) 알고리즘을 제안한다. 시스템은 크게 얼굴추출 부분과 얼굴인식 부분으로 구성 되어 있으며, 얼굴추출 부분에는 차영상, 눈과 입의 영역 검출 그리고 정규화 방법을 사용하였고, 얼굴인식 부분에는 추출된 얼굴 후보 영역 영상에 LINF 를 적용하였다. 기존의 PCA(Principal Component Analysis)만을 사용한 인식시스템은 낮은 인식률을 보였으며, LDA(Linear Discriminants Analysis)만을 사용한 인식시스템에서는 학습데이터의 수에 비하여 영상의 화소 개수가 많은 경우 LDA를 그대로 적용하기 곤란하였다. 이러한 단점을 극복하기 위하여, 본 논문에서 제안하는 시스템은 기존의 고유얼굴과 달리 비음수 값을 갖는 행렬로 차원을 축소하여 LDA를 적용하였다. 제안한 시스템의 성능을 평가하기 위하여 자체 제작한 DAUface 데이터베이스와 영국 Cambridge 에 있는 AT&T 연구소에서 제공하는 ORL 데이터베이스를 가지고 실험을 하였다. 실험 결과, 제안된 방법이 PCA 방법과 LDA 방법, ICA(Independent Component Analysis) 방법, 그리고 PLMA(PCA-based LDA mixture algorithm)에 비해 인식률이 상당히 우수함을 알 수 있었다.

수업 평가와 반성 저널쓰기를 통한 예비 과학교사들의 수업 수행 능력 개선에 대한 연구 (A Study on the Improvement of Teaching Competence of Pre-service Science Teachers based on the Teaching Evaluation and Reflective Journal Writings on Science Class)

  • 김현정;홍훈기;전화영
    • 한국과학교육학회지
    • /
    • 제30권6호
    • /
    • pp.836-849
    • /
    • 2010
  • 본 연구에서는 수업 평가와 수업 동영상을 활용한 반성 저널쓰기를 통해 예비교사들의 수업 수행 능력이 어떻게 변화하는지를 알아보았다. 6명의 예비 과학교사들의 수업을 촬영하고, 각 수업을 평가하였으며, 이들이 작성한 수업 동영상, 반성 저널, 인터뷰, 수업 자료, 수업 평가 등을 수집하였다. 수업 평가 기준은 한국교육과정평가원에서 제시한 과학과 수업 평가 기준의 평가 요소 중 16개를 사용하였다. 연구 결과, 예비교사들은 대부분의 수업 평가 요소에서 수업시연 차시를 거듭할수록 수업 수행 능력이 향상되었다. '과학에서의 연계성 짓기'는 첫 수업에서 예비교사들이 가장 낮은 수행 능력을 보인 수업 요소로 차시를 거듭해도 크게 평가가 향상되지 않았으며, 실제 수업에선 생략되는 경우가 많았다. '유의미한 학습프로그램 설계하기'요소의 향상이 가장 적게 나타났으며, 예비교사들의 수업 수행 능력은 각 수업 평가 요소 별로 개인별 차이가 크게 나타났다. 예비교사들은 교육 실습 초기에 과학 수업에서 '과학개념의 이해'가 가장 중요하다고 생각했으나, 후반기에는 상호작용과 존중, 학생 행동 관리하기 등의 중요성을 인식하는 생각의 변화를 보여주었다. 예비교사들은 수업 평가와 동영상을 통한 반성 저널의 작성이 수업 준비와 개선에 도움이 된다고 인식하고 있었으며, 수업 수행 능력의 향상이 예비교사들의 교사로서의 진로 지향에 영향을 주는 것으로 나타났다.

Focal loss와 데이터 증강 기법을 이용한 콘크리트 박락 탐지 심층 신경망 알고리즘 (Deep learning algorithm of concrete spalling detection using focal loss and data augmentation)

  • 심승보;최상일;공석민;이성원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권4호
    • /
    • pp.253-263
    • /
    • 2021
  • 콘크리트 구조물은 노후화와 외부 환경에 의한 요인으로 훼손된다. 이 같은 훼손은 가장 먼저 균열로 나타나고 향후에는 박락으로도 진행된다. 이러한 콘크리트 손상은 구조물이 갖는 본래의 설계 지지력을 감소시키는 주된 원인으로 작용할 수 있어 구조물의 안정성에 부정적인 영향을 미친다. 이러한 종류의 손상이 지속되면 안전사고로도 이어질 가능성이 있어 적절한 보수와 보강이 필요하다. 이를 위해서는 구조물에 대한 정확하고 객관적인 상태 점검이 이루어져야 하며 손상 영역을 탐지할 수 있는 센서 기술 또한 필요하다. 따라서 본 논문에서는 박락을 탐지할 수 있는 딥러닝 기반의 영상처리 알고리즘을 제안했다. 연구 과정에서 298장의 박락 영상을 확보하였으며, 이 가운데 253장을 학습용으로 사용했고, 나머지 45장을 테스트용으로 사용하였다. 아울러 본 논문에서는 탐지 성능을 향상하기 위해 향상된 손실함수와 데이트 증강 기법을 적용하였다. 그 결과 콘크리트 박락의 탐지 성능이 80.19%의 평균 중첩 정확도로 나타났다. 본 논문에서는 딥러닝 기반의 영상 처리 기법을 통해 콘크리트 박락을 탐지하는 기술을 개발했고, 향상된 손실 함수와 데이터 증강 기법으로 성능을 향상시키는 방법을 제안했다. 이 같은 기술은 향후 구조물의 정확한 점검과 진단에 활용될 것으로 기대된다.

주행 안전을 위한 joint deep learning 기반의 도로 노면 파손 및 장애물 탐지 알고리즘 (Detection Algorithm of Road Damage and Obstacle Based on Joint Deep Learning for Driving Safety)

  • 심승보;정재진
    • 한국ITS학회 논문지
    • /
    • 제20권2호
    • /
    • pp.95-111
    • /
    • 2021
  • 인구의 감소 및 고령화 사회가 진행되면서 운전자의 평균 연령은 높아지게 된다. 그에 따라 잠재적인 사고의 위험성이 높은 고령 운전자들은 자율 주행형 개인 이동체가 필요하게 된다. 이러한 이동체가 도로 주행 중에 안전성을 확보하기 위하여 여러 장애물에 대응할 기술이 요구된다. 그 중에서도 주행 중에 마주할 수 있는 차량, 자전거, 사람과 같은 동적 장애물뿐만 아니라 도로 노면의 불량 상태와 같은 정적 장애물을 인식하는 기술이 가장 우선적으로 필요하다. 이를 위해서 본 논문에서는 두 종류의 장애물을 동시에 탐지할 수 있는 심층 신경망 알고리즘을 제안했다. 이 알고리즘을 개발하기 위해서 1,418장의 영상을 이용하여 7종의 동적 장애물에 표기한 annotation data와 도로 노면 파손을 표시한 label 영상을 확보했다. 이를 이용하여 학습한 결과, 46.22%의 평균 정확도로 동적 장애물을 탐지하고 74.71%의 mean intersection over union으로 도로 노면 파손을 탐지했다. 또한 한 장의 영상을 처리하는데 평균 소요시간은 89ms로 일반 차량보다 느린 개인 이동 차량에 사용하기 적합한 알고리즘을 개발했다. 향후 주행 중 마주할 있는 도로 장애물을 탐지하는 기술을 활용하여 개인 이동 차량의 주행 안전성이 향상되길 기대한다.

영상을 이용한 일본현대소설의 수업방안 - 소설이 원작인 영화작품을 중심으로 (A Study on Teaching Japanese Modern Novels by Audiovisual Materials - Focusing on the Films Based on Original Novels)

  • 김활란
    • 비교문화연구
    • /
    • 제43권
    • /
    • pp.241-264
    • /
    • 2016
  • 본고는 일본현대소설읽기라는 수업을 통해 대학의 교양문학수업이 앞으로 지향해야 할 수업 방안에 대해 모색하는 것이 목적이다. 최근에는 많은 국내외소설들이 영화나 드라마 등으로 만들어지고 있는 추세다. 원작소설이 영화로 만들어지면서 그 흥행의 영향으로 소설까지 베스트셀러에 오르기도 하는 등, 영상의 힘은 막강하다. 그래서 일본어소설읽기라는 교양과목 수업에서는 영상세대인 학생들의 소설에 대한 관심과 흥미를 높이기 위해서 일본현대소설을 영화화한 10개의 작품을 선택하여 한 학기동안 수업을 진행했다. 작품선정은 대부분 일본의 최고 권위 있는 문학상으로 순수문학분야의 작가들에게 주어지는 아쿠다가와상과 대중문학분야에 주어지는 나오키상, 그리고 일본서점직원들이 가장 팔고 싶은 책을 선정하여 주는 일본서점대상을 수상한 작품 중에서 선택했다. 그리고 수업에 참여했던 학습자들을 대상으로 수업에 대한 만족도에 대해 알아보기 위해 간단한 설문조사를 실시했다. 대부분의 학생들이 수업을 듣기 전에는 일본소설에 대한 관심이 그다지 많지 않았지만 이 수업을 통해 일본소설은 물론 일본영화와 일본문화에 대한 관심도 많이 생겨났다고 했다.

인공신경망을 이용한 KOMPSAT-3/3A/5 영상으로부터 자연림과 인공림의 분류 (Classification of Natural and Artificial Forests from KOMPSAT-3/3A/5 Images Using Artificial Neural Network)

  • 이용석;박숭환;정형섭;백원경
    • 대한원격탐사학회지
    • /
    • 제34권6_3호
    • /
    • pp.1399-1414
    • /
    • 2018
  • 자연림은 산림의 조성 과 보육 등에 인공적인 사람의 힘이 가해지지 않은 자연 상태의 산림이다. 반면 인공림은 사람이 조성 및 보육관리 하는 숲으로 목재생산, 자연재해 예방, 방풍 등의 목적을 가지는 산림이다. 인공림은 목재생산 등 인간이 목적을 가지고 관리하여 단위 면적당 더 많은 목재를 생산할 수 있는 경제적 장점도 가지고 있다. 자연림과 인공림의 구분은 산림 형태의 관리 방법과 목정이 상이하여 산림조사에서 기본적으로 조사하는 요소이며, 자연림과 인공림의 구분은 항공사진 판독과 현지조사 등의 절차를 통해 이루어진다. 본 연구에서는 자연림과 인공림의 분류에 KOMPSAT-3, 3A, 5 위성 영상데이터에 인공신경망(Artificial Neural Network: ANN)을 적용하여 자연림과 인공림의 분류도를 만들고, 산림청의 1/5,000임상도의 자연림과 인공림 분류도와 비교하여 평가하였다. 인공신경망을 이용한 산림의 자연림과 인공림 구분의 연구를 진행한 결과, 1/5,000 임상도와 비교했을 때, 학습결과 분류 전체 정확도는 77.03%이다. 영상의 획득 시기와 산림의 침엽수와 활엽수 등 기타요인이 인공신경망을 이용한 산림의 인공림과 자연림의 구분에 많은 영향을 미치는 것을 확인하였다.

글씨쓰기 명료도 평가의 정량적 영상처리 분석 (Quantitative image processing analysis for handwriting legibility evaluation)

  • 김은빈;이초희;김은영;이언석
    • 한국산학기술학회논문지
    • /
    • 제20권7호
    • /
    • pp.158-165
    • /
    • 2019
  • 선수능력의 발달 미흡과 신경학적 손상으로 인해 나타나는 쓰기 장애는 의미전달의 혼동을 줄 수 있고 가독성이 떨어지며 학습, 사회정서 문제 유발 가능성이 높다. 이에 문제 파악과 적시 개입을 위한 평가가 요구되고 있지만 임상에서는 수기에 의한 채점 방식을 채택하며 주관적인 평가에 따른 오류 가능성이 발생한다. 본 연구는 성인의 오프라인 필기체 문자를 영상처리를 통해 글자의 크기비율, 위치를 데이터화 하고 정량화 하며 수기 채점방식과의 비교, 분석을 통해 보다 객관적이고 정확하게 쓰기 수행을 평가하고자 하였다. 2018년 11월 12일부터 16일까지 신경학적 손상이 없는 성인 20명을 채택하여 10단어, 2 문장 자극을 평소 쓰기 습관을 유지한 후 연필을 사용해 따라 쓰며 쓰기 검사 데이터를 수집하였다. 본 연구에서 개발한 글씨 측정 알고리즘 결과 단어의 높이가 폭에 비해 1.2배 정도 크고 왼쪽 아래로 치우치는 경향을 보였으며 평균 9mm의 간격을 두고 띄어 썼다. Paired T test를 통한 수기와 본 시스템의 분석결과, 단어 검사와 문장 2의 검사는 고도의 상관관계를 보여 추후 검사 도구로써의 가능성을 보였다. 본 연구는 성인의 오프라인 필기체 문자를 영상처리를 통해 보다 객관적이고 정확하게 쓰기 수행을 평가하였으며 수행 규준을 위한 예비자료를 제공하였다. 향후 다양한 연령대의 쓰기 진단의 기초 자료로 제시될 수 있으며 아동의 경우 쓰기 장애 개입에 깊이 있게 활용될 수 있을 것이다.

머신러닝기반 간 경화증 진단을 위한 웹 서비스 개발 (Development of Web Service for Liver Cirrhosis Diagnosis Based on Machine Learning)

  • 노시형;김지언;이충섭;김태훈;김경원;윤권하;정창원
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.285-290
    • /
    • 2021
  • 의료분야에서 인공지능 기술을 도입한 질환 진단 및 예측 연구들이 활발하게 진행되고 있다. 의료영상기반의 인공지능 기술 적용에 가장 많이 활용되고 있는 질환 진단 및 예측에 대한 다양한 제품으로 출시되고 있다. 인공지능은 질병에 대한 진단, 양성과 악성으로 구분되는 질환의 구분, 질병의 위험도에 따른 구별이나 판독에 이용하기 위해 질환부위를 분리하는 등에 적용되고 있다. 최근에는 클라우드기술과 연계하여 서비스 제품으로 활용성이 높아지고 있다. 본 논문에서 다루는 질환 중에 간 질환은 통증이 적어 조기진단이 어려워 그 위험도가 매우 높은 질환이다. 이러한 질환 진단에 비침습적인 진단방법으로 의료영상기반으로 인공지능 기술을 도입하였다. 우리는 임상에서 가장 의미 있는 간 경화증 환자의 판독을 돕기 위한 웹 서비스 개발 내용을 기술한다. 그리고 웹서비스 프로세스를 보이고 각 프로세스의 구동 화면과 최종 결과화면을 보인다. 제안한 서비스를 통해 간 경화증을 조기에 진단하고, 빠른 치료를 통해 환자의 회복에 도움을 줄 수 있을 것으로 기대한다.

딥러닝 기반의 주행가능 영역 추출 모델에 관한 연구 (A Study on Model for Drivable Area Segmentation based on Deep Learning)

  • 전효진;조수선
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.105-111
    • /
    • 2019
  • 인공지능, 빅데이터, 자율주행 등 4차 산업혁명시대를 이끄는 핵심기술은 컴퓨팅 파워의 급속한 발전과 사물인터넷에 기반한 초연결 네트워크를 통해 구현되고 서비스된다. 본 논문에서는 자율주행을 위한 기본적인 기능으로 다양한 환경에서도 정확하게 주행가능한 영역을 인식하여 추출하는 인공지능 딥러닝 모델들을 구현하고, 그 결과를 비교, 분석한다. 주행가능한 영역을 추출하는 딥러닝 모델은 영상 분할 분야에서 성능이 우수하고 자율주행 연구에서 많이 사용하는 Deep Lab V3+와 Mask R-CNN을 활용하였다. 다양한 환경에서의 주행 정보를 위해 여러 가지 날씨 조건과 주 야간 환경에서의 주행 영상 및 이미지를 제공하는 BDD 데이터셋을 학습데이터로 사용하였다. 활용한 모델들의 실험 결과, DeepLab V3+는 48.97%의 IoU를 보였으며, Mask R-CNN은 68.33%의 IoU로 더 우수한 성능을 보였다. 또한, 구현한 모델로 추출된 주행가능 영역을 이미지에 표시하여 육안으로 검사한 결과, Mask R-CNN은 83%, Deep Lab V3+는 69% 정확도로 Mask R-CNN이 Deep Lab V3+ 보다 주행가능한 영역을 추출하는 분야에서는 더 성능이 높은 것으로 확인하였다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.