• 제목/요약/키워드: 학습영상

검색결과 2,567건 처리시간 0.024초

블로그 포스팅을 이용한 방송 콘텐츠 영상의 타임라인 단위 태그 클라우드 생성 (Timeline Tag Cloud Generation for Broadcasting Contents using Blog Postings)

  • 손정우;김화숙;김선중;조기성
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.637-641
    • /
    • 2015
  • 최근 SNS, 블로그 등 사용자 참여형 인터넷 매체가 늘어나면서, 방송 콘텐츠에 대한 사용자의 재생산이 활발히 일어나고 있다. 특히, 드라마와 같은 장르에서는 배우가 착용한 옷, 시계 등에서부터, 자동차, 촬영 장소 등 다양한 종류의 정보들이 블로그를 통해 다른 사용자에게 전달되고 있다. 이러한 정보들은 방송 콘텐츠에 대한 직접적인 부가 정보가 되기 때문에, 이를 활용할 경우 양질의 서비스를 제공할 수 있다. 본 논문에서는 이를 위해, 블로그 포스팅을 이용하여 방송 콘텐츠의 특정 타임라인에 태그 클라우드를 생성하는 기술을 제안한다. 제안한 방법에서는 방송 콘텐츠에 대한 블로그 포스팅을 수집하고, 수집된 포스팅으로부터 이미지 주변 단어를 활용하여 태그 셋을 구축한다. 구축된 태그 클라우드는 방송 콘텐츠 프레임과의 이미지 매칭을 통해 특정 타임라인에 태깅된다. 실험에서는 이미지 매칭의 성능과 생성된 태깅된 태그 클라우드를 보임으로써 제안한 방법의 성능을 입증한다.

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF

ART2 알고리즘을 이용한 수화 인식 (Sign Language Recognition Using ART2 Algorithm)

  • 김광백;우영운
    • 한국정보통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.937-941
    • /
    • 2008
  • 수화는 청각 장애인에게 있어 중요한 의사소통 수단이며, 청각 장애인들은 수화를 통해 대인관계를 넓히며 또한 불편함 없는 일상생활이 가능하다. 그러나 최근 인터넷 통신의 발전으로 증가하고 있는 많은 화상 채팅 및 화상 통화서비스에서는 건청인과 청각 장애인 사이에 통역을 하는 시스템이 없어 청각 장애인들이 불편을 겪고 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 수화 인식기법을 제안하였다. 제안된 기법에서는 화상 카메라를 통해 얻어진 영상에서 각각 RGB, YUV, HSI 색상 정보를 이용하여 두 손의 위치를 추적하여 잡음을 제거 한 후, 두 손의 영역을 추출한다. 추출된 손의 영역은 잡음과 훼손에 강한 ART2 알고리즘을 이용하여 학습한 후 인식한다. 본 논문에서 제안된 수화 인식 방법을 실험한 결과, 수화에 사용된 지 숫자 1부터 10을 효율적으로 인식하는 것을 확인하였다.

HSI 정보와 퍼지 이진화 및 ART2 알고리즘을 이용한 신차량 번호판의 인식 (Recognition of a New Car License Plate Using HSI Information, Fuzzy Binarization and ART2 Algorithm)

  • 김광백;우영운;박충식
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.1004-1012
    • /
    • 2007
  • 본 논문에서는 HSI 정보와 신경 망의 비지도 학습 방법인 ART2 알고리즘을 이용하여 신 차량 번호판을 인식하는 방법을 제안한다. 제안된 방법은 차량의 영상에서 번호판 영역을 추출하는 부분과 추출된 번호판 영역의 문자를 인식하는 부분으로 구성된다. 본 논문에서는 차량 번호판 영역을 추출하기 위해 HSI 컬러 모형의 Hue 정보를 이용하여 차량 번호판 영역을 추출하고 개선된 퍼지 이진화 방법을 적용하여 추출된 차량 번호판 영역으로부터 문자를 포함한 특징영역을 이진화한 후에 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드를 인식하기 위해 잡음과 훼손에 비교적 강한 ART2 알고리즘을 적용한다. 제안된 방법의 차량 번호판 추출 및 인식성능을 평가하기 위하여 실제 비영업용 차량 번호판에 적용한 결과, 기존의 차량 번호판의 추출 방법보다 번호판 영역의 추출률이 개선되었다. 또한 ART2 알고리즘을 적용하여 신 차량 번호판을 인식하는 것이 효율적임을 확인하였다.

아동 그림 심리분석을 위한 인공지능 기반 객체 탐지 알고리즘 응용 (Application of object detection algorithm for psychological analysis of children's drawing)

  • 임지연;이성옥;김경표;유용균
    • 한국산업정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.1-9
    • /
    • 2021
  • 아동 그림은 내면의 감정을 표현할 수 있는 수단으로 아동 심리 진단에 널리 이용되고 있다. 본 논문에서는 아동 그림 분석에 적용할 수 있는 아동 그림 기반의 객체 탐지 알고리즘을 제안한다. 먼저 사진에서의 그림 영역을 추출하였고 데이터 라벨링 과정을 수행하였다. 이후 라벨링된 데이터 셋를 사용하여 Faster R-CNN 기반 객체 탐지모델을 학습하고 평가하였다. 탐지된 객체 결과를 기반으로 그림 면적 및 위치 또는 색상 정보를 계산하여 그림에 대한 기초정보를 쉽고 빠르게 분석할 수 있도록 설계하였다. 이를 통해 아동 그림을 이용한 심리분석에 있어 인공지능 기반 객체 탐지 알고리즘의 활용성을 보였다.

고성능 CNN 기반 지정맥 인증 시스템 구현 (Implementation of Finger Vein Authentication System based on High-performance CNN)

  • 김경래;최홍락;김경석
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.197-202
    • /
    • 2021
  • 지정맥을 이용한 생체인식기술은 높은 보안성, 편리성과 정확성으로 많은 관심을 받고 있으며 최근 딥러닝 기술의 발달로 인해 더욱 인증에 대한 인식 오류율 및 정확도가 향상되었다. 하지만 학습 데이터는 일정한 순서나 방법이 아닌 실제 데이터의 부분 집합으로, 결과가 일정하지 않아 데이터양과 인공신경망의 복잡도를 고려해야 한다. 본 논문에서는 지정맥 인식기의 높은 정확도와 인증 시스템 성능 향상을 위해 Inception-ResNet-v2의 딥러닝 모델을 활용하였으며 DenseNet-201의 딥러닝 모델과 성능을 비교 분석하였다. 시뮬레이션은 전북대의 MMCBNU_6000과 직접 촬영한 지정맥 영상을 사용하고 지정맥 인증 시스템에 이미지를 가공하는 과정은 없으며 생체인증 척도인 EER을 추출하여 성능 결과를 확인한다.

다중 스케일 얼굴 영역 딕셔너리의 적대적 증류를 이용한 얼굴 초해상화 (Face Super-Resolution using Adversarial Distillation of Multi-Scale Facial Region Dictionary)

  • 조병호;박인규;홍성은
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.608-620
    • /
    • 2021
  • 최근 딥러닝 기반의 얼굴 초해상화 연구는 일반적인 영상에 대한 초해상화 연구와 달리 인간의 얼굴이 가지는 구조적 혹은 의미론적인 특성을 반영한 안면 랜드마크 정보, 주요 영역 딕셔너리와 같은 사전 및 참조 정보를 사용하여 우수한 초해상화 결과를 보였다. 그러나 얼굴에 특화된 사전 정보를 사용할 시 추가적인 처리 소요 시간과 메모리를 요구하는 단점이 존재한다. 본 논문은 앞서 언급한 한계점을 극복하고자 지식 증류 기법을 활용한 효율적인 초해상화 모델을 제안한다. 주요 얼굴 영역 기반의 딕셔너리 정보를 사용하는 선생 모델에 지식 증류 기법을 적용하여 추론 시 랜드마크 정보와 부가적인 딕셔너리 사용이 필요 없는 학생 모델을 구축하였다. 제안하는 학생 모델은 특징맵 기반의 적대적 지식 증류를 통해 얼굴 주요 영역 딕셔너리를 가지고 있는 선생 모델로부터 학습을 진행하였다. 본 논문은 제안하는 학생 모델의 실험 결과를 통해 정량 및 정성적으로 우수함을 보이며 선생 모델의 연산량에 비해 90% 이상 절감되는 효율성을 증명한다.

카데바 자료를 이용한 얼굴근육의 해부학적 기능 학습을 위한 삼차원 교육 콘텐츠 제작과 관련된 융합 연구 (Convergence Study on the Three-dimensional Educational Model of the Functional Anatomy of Facial Muscles Based on Cadaveric Data)

  • 이재기
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.57-63
    • /
    • 2021
  • 이 연구는 한국인 성인 시신의 얼굴근육을 해부하고 삼차원 스캔하여, 사실적인 얼굴근육의 형태를 삼차원 오브젝트를 만들고, 이를 통해 표정을 재현하여 카데바 얼굴근육의 복합적인 움직임을 삼차원적으로 관찰 가능한 교육 자료를 제작하는데 목적이 있다. 카데바 해부 사진 자료를 이용하여, 얼굴근육에 대해 삼차원 모델링 하였고, 네 가지 표정(슬픔, 미소, 놀람, 분노)에 따라 얼굴근육이 변화하는 삼차원 영상을 제작하였다. 이를 통해, 삼차원으로 구현한 카데바 얼굴근육의 복합적인 작용과 다양한 표정 변화를 확인할 수 있었다. 이 연구결과는 얼굴근육의 개별적인 기능에 대한 정량적인 자료를 확인할 수는 없지만, 사실적이고 입체적인 카데바의 얼굴근육 형태를 관찰할 수 있고, 복합적인 얼굴근육의 작용으로 인한 표정 변화를 확인할 수 있다. 이러한 자료는 얼굴근육의 해부학적 교육 자료로 활용할 수 있을 것으로 기대한다.

컨볼루션 뉴럴 네트워크를 이용한 군중 행동 감지 (Crowd Behavior Detection using Convolutional Neural Network)

  • 와셈 울라;파트 우 민 울라;백성욱;이미영
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권6호
    • /
    • pp.7-14
    • /
    • 2019
  • 감시 영상에서 군중 행동의 자동 모니터링 및 감지는 보안, 안전 및 자산 보호와 같은 방대한 응용 프로그램으로 인해 컴퓨터 비전 분야에서 중요한 관심을 받고 있다. 또한 연구 커뮤니티에서 군중 분석 분야가 점차 증가하고 있다. 이를 위해서는 군중들의 행동을 감지하고 분석하는 것이 매우 필요하다. 본 논문에서는 스마트 시티에 설치된 감시 카메라의 비정상적인 활동을 감지하는 딥러닝 기반 방법을 제안하였다. 미세 조정된 VGG-16모델은 트레이닝된 공개적으로 사용 가능한 벤치마크 군중 데이터 셋을 실시간 스트리밍으로 테스트한다. CCTV카메라는 비디오 스트림을 캡쳐하는데, 비정상적인 활동이 감지되면 경보가 발생하여 추가 손실 전에 즉각적인 조치가 이루어지도록 가장 가까운 경찰서로 전송된다. 우리는 제안된 방법이 기존의 첨단 기술 보다 성능이 뛰어남을 실험으로 입증하였다.

치과방사선사진과 증강현실을 활용한 방사선촬영법 숙련용 디지털 콘텐츠 개발에 대한 융복합 연구 (Convergence and integration study related to development of digital contents for radiography training using dental radiograph and augmented reality)

  • 구자영;이재기
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.441-447
    • /
    • 2018
  • 이 연구의 목적은 증강현실기술을 활용하여 치과 방사선 촬영술의 반복 연습이 가능한 디지털 콘텐츠를 개발하는데 있다. 성인 모델의 외형을 사진 촬영하고, 실습용 마네킹 팬텀을 컴퓨터 단층 촬영한 후, 이를 중첩하여 삼차원 객체를 제작하였다. 또한, 결과로 출력되는 106장의 방사선사진은 촬영법과 관련된 치아 정보를 활용하여 데이터베이스화하였고, 학습자가 성공적인 촬영을 수행하면 각 촬영조건에 맞는 부위별 영상이 호출되도록 시스템을 구축하였다. 이를 통해 임상 전 단계에서의 연습을 반복적으로 시행할 수 있었다. 이 콘텐츠를 이용하여 치과위생사의 방사선 촬영 임상 실무역량을 향상하는데 기여하고자 한다. 다만, 직접 얼굴인식을 통해 촬영하는 것이 실습효용 가치가 클 것으로 예상하기 때문에 이에 관련한 후속 연구가 필요하다.