• 제목/요약/키워드: 영상 학습

검색결과 2,560건 처리시간 0.044초

셀룰라신경회로망의 연상메모리를 이용한 영상 패턴의 분류 및 인식 방법 (Image Pattern Classification and Recognition by using Associative Memories with Cellular Neural Networks)

  • 신윤철;박용훈;강훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.231-234
    • /
    • 2002
  • 셀룰라 신경회로망의 연상 메모리를 이용하여 시각적인 입력 데이터의 연산을 통하여 영상 패턴의 분류와 인식을 수행한다. 셀룰라 신경회로망은 일반적인 신경회로망과 같이 비선형 데이터의 실시간 처리가 가능하고, 세 포자동자와 같이 격자구조의 셀로 이루어져 인접한 셀과 직접 정보를 주고받는다. 응용 분야로는 최적화, 선형/비선형화, 연상 메모리, 패턴인식, 컴퓨터 비젼 등에 적용할 수 있다. 영상의 이미지 픽셀을 셀룰라 신경회로망의 셀에 대응하여 전체 이미지 영상을 모든 셀룰라 신경회로망의 셀에서 동시에 병렬로 처리할 수 있어 2-D 이미지 처리에 적합하다 본 논문은 셀룰라 신경회로망에 의한 연상 메모리 구조를 설계하고, 학습된 하중값 메모리에서 가장 적당한 하중값을 선택하여 학습된 영상과 정확히 일치하는 출력을 얻는 방법을 제시한다. 학습을 통한 연상 메모리 구현에는 각각의 뉴런에서 일정하지 않은 다른 템플릿을 사용한다. 각각의 템플릿은 뉴런들 간의 연결 하중값을 나타내고 학습011 따라 갱신된다. 학습방법으로는 템플릿 하중값 학습에 뉴런들 간의 연결 하중값을 조정하는 가장 단순한 규칙인 Hebb의 학습방법이 사용되었고 분류값 학습에 LMS 알고리즘이 사용되었다

  • PDF

중등학교 학내망에서 동영상 활용시 트래픽 분석 (A Traffic Analysis When Using Motion Images In The Secondary School Network)

  • 양경미;백화정;김성백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.943-946
    • /
    • 2004
  • 최근에 중등학교 학내 전산망에서 동영상 위주의 멀티미디어 학습 자료를 이용한 학습이 많아짐에 따라, 실제 수업 시간이나 자율 학습 시간에 동영상 학습 자료를 활용했을 때 트래픽 특성이 구체적으로 어떻게 나타나는 지를 정량적으로 규명하는 것이 요구된다. 이에 본 논문에서는 고등학교 1개교와 중학교 1개교에 대해 동영상 학습 자료를 이용한 학습 시 학내 전산망에서 나타나는 트래픽 특성을 트래픽 분석 도구를 이용하여 분석하였다. 특히, 학교 내에 자체 웹 서버의 유무, 컴퓨터 접속 대수 등을 주요 변인으로 하여 동영상 실행 시 나타나는 현상들에 대한 측정 결과들을 제시하였다. 측정 결과로부터 다음과 같은 특성들을 얻어낼 수 있었다. 첫째, 학교 내에 자체 웹 서버의 유무가 전송 트래픽 량에 상당한 영향을 주었다. 둘째, 동시 컴퓨터 접속 대수의 증가가 끊김 현상과 같은 트래픽 특성에 영향을 주었다. 이러한 측정 및 분석 결과를 볼 때, 적게는 수십 명 많게는 수백 명의 학생이 동시에 인터넷을 통해 학습을 한다면 학내 전산망의 구성 형태나 동시 접속자 수에 따라 원활한 학습을 가져오지 못하고 많은 문제를 가져 올 것으로 예상되었다.

  • PDF

일부 중학생의 심폐소생술에 관한 노래·동영상 자가 학습과 심폐소생술 동영상 자가 학습(VSI)과의 교육 효과 비교 (Comparison of Educational Effects between Song·Video Self Study of Cardiopulmonary Resuscitation(CPR) and Video Self Instruction(VSI) of CPR by Middle School Students)

  • 박대성
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.225-235
    • /
    • 2010
  • 본 연구는 심폐소생술 교육 경험이 없는 중학생의 심폐소생술에 관한 노래 동영상 자가 학습과 심폐소생술 동영상 자가 학습(VSI)과의 교육 효과를 파악함으로써, 중학생을 대상으로 효과적인 심폐소생술 교육방법을 위한 기초자료를 제공하고자 시도하였다. 연구의 대상자는 G광역시에 소재한 S중학교 3학년 학생을 대상으로 편의표집하여 총 68명으로 실험군 33명, 대조군 35명이 최종 실험처치까지 참여하였다. 조사기간은 2009년 4월 22일부터 23일까지 2일에 걸쳐서 자료를 수집하였다. 연구 결과는 중학생을 대상으로 한 심폐소생술에 관한 노래 동영상 자가 학습이 심폐소생술 동영상 자가 학습(VSI)보다 좋은 결과가 나왔다고는 볼 수는 없다. 하지만 교육 효과가 확인되었으므로 중학생을 대상으로 한 심폐소생술 교육에 있어 유용하게 활용 될 수 있을 것으로 사료된다.

적대적 생성 신경망을 활용한 과다 노출 영상 복원 방법 (Overexposure Image Restoration Using a Generative Adversarial Network)

  • 김태하;양성엽;강병근;이의진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.10-13
    • /
    • 2021
  • 본 논문에서는 과다 노출된 영상을 영상 간 변환(Image-to-Image Translation)을 위해 설계된 적대적 생성 신경망(Generative Adversarial Network)을 활용하여 복원하는 연구를 수행한다. 과다 노출 복원을 위한 기존의 연구에서 과다 노출 영역 판별, 밝기 회복, 색상 보정 과정을 거치는데, 영상 내 과다 노출 영역을 판별하는 과정에서 임의로 결정하는 파라미터에 의해 복원된 영상 결과가 달라지는 한계점을 극복하기 위해 종단간(End-to-End) 신경망을 학습시켜 과다 노출 영역을 별도의 파라미터 선택과 분할된 과정 없이 한 번에 복원하는 방법을 제안한다. 영상 간 변환 신경망 학습에 필요한 과다 노출 여부로 도메인이 분할된 데이터셋은 게임 소프트웨어를 활용하여 만들어 사용하였다. 본 연구에서는 신경망이 생성한 영상이 실제로 과다 노출 영역을 탐지하여 복원하는 것을 확인하였다. 그리고 과다 노출 영역을 탐지하여 복원하는 과정을 학습 단계별로 확인함으로써 신경망이 실제로 과다 노출 복원 과정을 학습함을 보였다.

  • PDF

360° 스트리밍 영상에서의 객체 인식 연구 (Object Recognition in 360° Streaming Video)

  • 윤정록;전성국;김회민;김운용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.317-318
    • /
    • 2019
  • 가상/증강현실로 대표되는 공간정보 기반 실감형 콘텐츠에 대한 관심이 증대되면서 객체인식 등의 지능형 공간인지 기술에 대한 연구가 활발히 진행되고 있다. 특히 HMD등의 영상 시각화 장치의 발달 및 5G 통신기술의 출현으로 인해 실시간 대용량 영상정보의 송, 수신 및 가시화 처리 기술의 기반이 구축됨에 따라, $360^{\circ}$ 스트리밍 영상정보 처리와 같은 고자유도 콘텐츠를 위한 관련 연구의 필요성이 증대되고 있다. 하지만 지능형 영상정보 처리의 대표적 연구인 딥 러닝(Deep Learning) 기반 객체 인식 기술의 경우 대부분 일반적인 평면 영상(Planar Image)에 대한 처리를 다루고 있고, 파노라마 영상(Panorama Image) 특히, $360^{\circ}$ 스트리밍 영상 처리를 위한 연구는 미비한 상황이다. 본 논문에서는 딥 러닝을 이용하여 $360^{\circ}$ 스트리밍 영상에서의 객체인식 연구 방법에 대해 서술한다. 이를 위해 $360^{\circ}$ 카메라 영상에서 딥 러닝을 위한 학습 데이터를 획득하고, 실시간 객체 인식이 가능한 YOLO(You Only Look Once)기법을 이용하여 학습을 한다. 실험 결과에서는 학습 데이터를 이용하여 $360^{\circ}$영상에서 객체 인식 결과와, 학습 횟수에 따른 객체 인식에 대한 결과를 보여준다.

  • PDF

외부 콘텐츠 소스를 활용한 OSMU 동영상 UCC 학습 콘텐츠 에디터 설계 (OSMU Video UCC Learning Content Authoring Tool Design Using Content Sources Created by Others)

  • 오정민;김경아;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.349-352
    • /
    • 2009
  • 최근 정보의 형태는 텍스트나 이미지 기반에서 벗어나 복합 멀티미디어, 즉 동영상 위주로 빠르게 이동하고 있다. 특히 사용자에 의해 제작되고 유통되는 동영상 UCC의 급격한 부상은 사용자의 정보 생산력과 정보 공유, 소비 형태를 능동적으로 변화시키고 있다. PC 뿐 아니라 IPTV에서도 주요 서비스 모델로 관심을 받는 동영상 UCC는 향후 지식 결부형 학습 콘텐츠로 옮아갈 것이라 예상되고 있으며 여기에는 수익 모델의 개발과 저작권 보호 이슈가 해결해야 할 선결 과제로 인식된다. 이에 본 논문은 방송 콘텐츠 제공 표준 기술인 TV-Anytime, 학습객체메타데이터인 LOM(Learning Object Metadata)을 기반으로 OSMU 동영상 UCC 학습 콘텐츠 서비스 모델을 위한 에디터를 설계하고 외부 콘텐츠 소스를 활용할 수 있는 콘텐츠 저작 시나리오에 기반한 메타데이터를 설계하였다. 이를 통해 사용자의 다양한 지식을 활용할 수 있는 UCC 학습 콘텐츠 서비스 모델 발굴과 콘텐츠의 확대 재생산에 있어서 적극적인 저작권 보호가 이루어질 것을 기대한다.

  • PDF

준지도학습의 이상행동감지에서의 이상행동종류별 균형의 중요성 분석 (Analyzing the Importance of Balanced Action Classes in Weakly Supervised Video Anomaly Detection)

  • 박태경;박현정;홍제형
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.145-148
    • /
    • 2022
  • 준지도학습 기반의 동영상 이상행동감지는 구하기 어려운 프레임 단위 레이블이 필요하지 않아 더 많은 동영상을 학습에 활용 가능한 장점이 있어 관련 연구가 활발히 진행되고 있다. 최근 제안된 기법들은 주로 UCF-Crime 이라는 실제 CCTV 동영상 데이터셋을 활용하고 있는데, 본 데이터셋은 학습 영상과 테스트 영상에서 이상행동 클래스 별 분포도가 균등하지 않다. 본 연구에서는 해당 불균형으로 인해 학습 모델이 특정 행동 클래스에 과적합될 수 있음을 보이며, 이러한 불균형을 해결하기 위해 Class-Balanced Multiple Instance Learning Loss 를 제안한다. 이를 통해 기존에 특정 클래스에 편중되었던 모델이 이상행동 종류에 좀 더 균등한 성능을 낼 수 있음을 보여준다. 특히 단순히 클래스별 정확도가 제로섬(zero sum)으로 증감하는 것이 아니라 전체적인 이상행동 판별 정확도 또한 향상됨을 실험 결과를 통해 확인할 수 있다.

  • PDF

Multi-scale CAM을 이용한 X-ray 이물질 분류 신경망 성능 향상에 대한 연구 (A Study on the Performance Improvement of X-ray Foreign Matter Classification Neural Networks Using Multi-scale CAM)

  • 이성주;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.307-310
    • /
    • 2021
  • X-ray 영상 검사·검출 문제에 기존 딥러닝 모델을 사용하려는 시도들이 존재해왔고, 합성곱 신경망의 강력한 표현력 덕분에 대체로 준수한 성능이 보장되었다. 그러나 문제의 특성에 따라 기대한 만큼의 분류 및 검출 성능이 나오지 않는 경우가 존재한다. 이는 1) 검출 대상의 스케일이 다양하거나, 2) X-ray 영상은 흑백 영상으로 미세한 특징을 학습하기 어렵거나, 3) 지도학습을 하기에는 학습 데이터의 양이 부족하기 때문인 것이 주요 원인들이다. 본 논문에서는 다양한 스케일의 특징맵을 추출하여 종합적으로 학습하는 신경망을 통해, '생선살 X-ray 영상' 데이터셋에서 '생선 가시' 이물질 class가 모델 내에서 어떻게 학습되는지를 살펴본다. 그리고 X-ray 영상의 경우, 이물질 class를 크기별로 새롭게 labeling하여 성능 개선이 일어날 수 있음을 보인다. 또한 Multi-scale CAM을 통해 class에 따른 활성화 정도를 시각화하여 모델을 직관적으로 분석할 수 있음을 보일 것이다.

  • PDF

퍼지 신경망을 이용한 얼굴 영상 검출 (Fuzzy Neural Networks for Face Detection)

  • 이창수;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.301-304
    • /
    • 2000
  • 본 논문에서는 디지털 영상에서 얼굴 영상 검출을 위해 픽셀의 퍼지 소속도를 이용하여 신경망으로 학습하는 퍼지 신경망을 이용한 얼굴영상 검출을 제안한다. 입력 영상의 피라미드 영상에서 추출된 20$\times$20 윈도우 템플릿 영상안의 각 픽셀의 소속도로 얼굴 영상 패턴을 학습하여 얼굴 영상을 검출하는 방법은 단순히 영상의 픽셀 값 하나씩만을 고려해서 각 픽셀의 소속도를 고려하여 수행하는 얼굴 영상 분할보다 얼굴 영상을 훨씬 더 정확하고 인식률이 높게 검출해 낼 수 있다.

  • PDF

영상영역 기반 퍼지 신경망을 이용한 얼굴 검출 (Region Based Fuzzy Neural Networks for Face Detection)

  • 이창수;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제11권1호
    • /
    • pp.39-44
    • /
    • 2001
  • 본 논문에서는 디지털 영상에서 얼굴 영상 검출을 위해 픽셀의 퍼지 소속도를 이용하여 신경망으로 학습하는 퍼지 신경망을 이용한 얼굴영상 검출을 제안한다. 입력 영상의 피라미드 영상에서 추출된 20$\times$20 윈도우 영상 안의 각 픽셀의 소속도로 얼굴 영상 패턴을 학습하여 얼굴 영상을 검출하는 방법은 단순히 영상의 픽셀 값 하나씩만을 고려해서 각 픽셀의 소속도를 고려하여 수행하는 얼굴 영상 분할보다 얼굴 영상을 더 정확하고 인식률이 높게 검출해 낼 수 있다.

  • PDF