• 제목/요약/키워드: 얼굴 탐지

검색결과 81건 처리시간 0.025초

감정 표현이 가능한 실시간 반응형 그림자 아바타 (A Real-time Interactive Shadow Avatar with Facial Emotions)

  • 임양미;이재원;홍의석
    • 한국멀티미디어학회논문지
    • /
    • 제10권4호
    • /
    • pp.506-515
    • /
    • 2007
  • 본 논문에서는 사용자의 동작에 대한 반응으로 표정을 변화하여 감정을 표현할 수 있는 실시간 반응형 그림자 아바타인 RISA(Real-time Interactive Shadow Avatar)를 제안한다. 아바타 형태는 사용자의 실사로부터 실시간으로 추출한 가상의 그림자를 사용하며, 손동작의 유형에 따라 변화하는 표정 애니메이션이 그림자의 얼굴 위치에 겹쳐지도록 하였다. 가상 그림자의 추출을 위해서는 배경 차분화 기법을 사용하며, 머리위치 및 손동작의 추적 및 유형 탐지를-위해-단순화된 영역 단위 추적 기법을 사용하였다. 또한 표정의 자연스러운 변화를 표현하기 위해 표정 애니메이션은 기존의 동적 이모티콘보다 많은 수의 애니메이션 프레임들을 사용하는 변형된 모핑 기법을 적용하였다. RISA는 인터페이스 미디어 아트 분야에 직접 응용될 수 있을 것이며, RISA에 적용된 탐지 기법은 향후 입력 장치의 간결성이 요구되는 DMB나 카메라폰 등을 위한 대체 인터페이스에도 활용될 수 있을 것이다.

  • PDF

Bidirectional Convolutional LSTM을 이용한 Deepfake 탐지 방법 (A Method of Detection of Deepfake Using Bidirectional Convolutional LSTM)

  • 이대현;문종섭
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.1053-1065
    • /
    • 2020
  • 최근 하드웨어의 성능과 인공지능 기술이 발달함에 따라 육안으로 구분하기 어려운 정교한 가짜 동영상들이 증가하고 있다. 인공지능을 이용한 얼굴 합성 기술을 딥페이크라고 하며 약간의 프로그래밍 능력과 딥러닝 지식만 있다면 누구든지 딥페이크를 이용하여 정교한 가짜 동영상을 제작할 수 있다. 이에 무분별한 가짜 동영상이 크게 증가하였으며 이는 개인 정보 침해, 가짜 뉴스, 사기 등에 문제로 이어질 수 있다. 따라서 사람의 눈으로도 진위를 가릴 수 없는 가짜 동영상을 탐지할 수 있는 방안이 필요하다. 이에 본 논문에서는 Bidirectional Convolutional LSTM과 어텐션 모듈(Attention module)을 적용한 딥페이크 탐지 모델을 제안한다. 본 논문에서 제안하는 모델은 어텐션 모듈과 신경곱 합성망 모델을 같이 사용되어 각 프레임의 특징을 추출하고 기존의 제안되어왔던 시간의 순방향만을 고려하는 LSTM과 달리 시간의 역방향도 고려하여 학습한다. 어텐션 모듈은 합성곱 신경망 모델과 같이 사용되어 각 프레임의 특징 추출에 이용한다. 실험을 통해 본 논문에서 제안하는 모델은 93.5%의 정확도를 갖고 기존 연구의 결과보다 AUC가 최대 50% 가량 높음을 보였다.

프라이버시 보존 분류 방법 동향 분석

  • 김평;문수빈;조은지;이윤호
    • 정보보호학회지
    • /
    • 제27권3호
    • /
    • pp.33-41
    • /
    • 2017
  • 기계 학습(machine-learning) 분야의 분류 알고리즘(classification algorithms)은 의료 진단, 유전자 정보 해석, 스팸 탐지, 얼굴 인식 및 신용 평가와 같은 다양한 응용 서비스에서 사용되고 있다. 이와 같은 응용 서비스에서의 분류 알고리즘은 사용자의 민감한 정보를 포함하는 데이터를 이용하여 학습을 수행하는 경우가 많으며, 분류 결과도 사용자의 프라이버시와 연관된 경우가 많다. 따라서 학습에 필요한 데이터의 소유자, 응용 서비스 사용자, 그리고 서비스 제공자가 서로 다른 보안 도메인에 존재할 경우, 프라이버시 보호 문제가 발생할 수 있다. 본 논문에서는 이러한 문제를 해결하면서도 분류 서비스를 제공할 수 있도록 도와주는 프라이버시 보존 분류 프로토콜(privacy-preserving classification protocol: PPCP) 에 대해 소개한다. 구체적으로 PPCP의 프라이버시 보호 요구사항을 분석하고, 기존의 연구들이 프라이버시 보호를 위해 사용하는 암호학적 기본 도구(cryptographic primitive)들에 대해 소개한다. 최종적으로 그러한 암호학적 기본 도구를 사용하여 설계된 프라이버시 보존 분류 프로토콜에 대한 기존 연구들을 소개하고 분석한다.

단계형 구조를 이용한 실시간 얼굴 탐지 시스템 (Rotation Invariant Real-time Face Detection Using Cascade Structure In Color Images)

  • 김승구;김혜수;고성제
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.339-340
    • /
    • 2007
  • Face detection plays an important role in HCI and face recognition. In this paper, we propose a rotation-invariant real-time face detection algorithm for color images in complex background. It consists of four processing step: (1) motion detection, (2) skin color region filler, (3) Eyemap detector for rotated face, and (4) Adaboost face classifier. This system has been tested in in-door environments, such as office and achieves over 95% detection rate.

  • PDF

칼만 필터를 이용한 시청각 음원 정위 및 추적 (Audio-Visual Localization and Tracking of Sound Sources Using Kalman Filter)

  • 송민규;김진영;나승유
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.519-525
    • /
    • 2007
  • 최근 로봇 기술 및 응용에 대한 관심이 고조됨에 따라, 로봇의 청각기술에 대한 연구가 활발하다. 본 기술에서는 로봇 탑재용으로 인간 청각기능중 하나인 음원정위 및 추적기술에 대하여 논한다. 음원 정위 및 추적을 위하여 시청각 정보를 이용하였는데, 시각정보로는 얼굴색 기반 얼굴 탐지 정보를 이용하였으며, 양이(binaural) 기반의 음원 추정 정보가 청각 정보로서 활용되었다. 시각과 청각 정보는 Kalman 필터를 이용하여 통합하였다. 실험결과 시청각 음원 추적 기술은 일부 정보의 유실이 있을 때, 효과적으로 활용될 수 있음을 보였다.

딥 러닝을 통한 얼굴 크기 탐지 (Face Size Detection using Deep Learning)

  • 바트홍고르 체뎅;이해연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.352-353
    • /
    • 2018
  • Many deep learning approaches are studied for face detection in these days. However, there is still a performance problem to run efficiently on devices with limited resources. Our method can enhance the detection speed by decreasing the number of scaling for detection methods that use many different scaling per image to detect the different size of faces. Also, we keep our deep learning model easy to implement and small as possible. Moreover, it can be used for other special object detection problems but not only for face detection.

YOLO 모델 앙상블을 이용한 복잡한 장면에서의 Mask Detection 기법 (Mask detection in complex scenes using an ensemble of YOLO models)

  • 후쉬펑;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.97-98
    • /
    • 2022
  • 코로나바이러스-19 팬데믹 이후 매일 수만 명의 환자가 발생하고 있다. 보건당국은 사람들의 생활 안전을 보호하기 위해 공항, 정류장 등 공공장소에서는 반드시 마스크를 착용하라고 지시하고 있다. 마스크를 착용하는 목적은 감염으로부터 신체를 보호하고 바이러스 전파와 확산을 막기 위한 것이다. 공공장소에서는 많은 인원에 대한 일괄적인 마스크 착용 검사를 하기 어렵고, 육안으로 확인하는 마스크 착용 검사 방법은 인파가 몰리는 장소에서 검사 효율이 떨어지며 누락되는 경우도 많이 발생한다. 본 연구에서는 입력 이미지에 존재하는 얼굴 영역을 YOLOv4와 YOLOv5 모델을 통해 예측하여 마스크의 착용 여부를 판단하되, 앙상블 기법을 적용하여 보다 효과적인 BB(Bounding Box) 추출 및 마스크 착용 탐지 기법을 적용한다. 따라서 공공장소의 마스크 착용실태를 효과적으로 모니터링 할 수 있는 방법을 제안한다.

  • PDF

비강압적 방법에 의한 원거리에서의 홍채 탐지 기법 (Iris Detection at a Distance by Non-volunteer Method)

  • 박권도;김동수;김정민;송영주;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.705-708
    • /
    • 2018
  • 현재 보안을 위해 상용화된 생체 인식 중 홍채 인식 기술은 개인마다 일치할 확률이 매우 적다. 그러나 현재 상용화된 홍채 인식 기술은 인식력은 뛰어나나 인식하기 위해 사용자의 능동적 협조가 필요하다는 단점을 가지고 있다. 이에 따라 최근 추세는 이러한 불편을 해결하기 위해 비강압적인 방식을 통해 사용자들의 홍채를 검출하는 방향으로 흐르고 있으며, 본 과제의 목적은 고성능 적외선 카메라를 사용하여 3m 거리 이내에서 비자발적 방식으로 확보한 영상에서홍채를 통해 사람을 식별하는 모듈을 개발하는 것이다. 고성능 적외선 카메라를 사용해 확보한 영상에서 이미지를 가져오고, 이 이미지를 식별하여 사람의 얼굴 및 눈의 위치를 가져온 뒤, 식별된 사람의 얼굴 및 눈의 위치를 허프 변환을 통해 홍채의 이미지를 잘라내어 데이터베이스에 저장된 홍채 패턴과 대조하여 사람을 식별하고자 한다.

  • PDF

딥러닝의 얼굴 정서 식별 기술 활용-대학생의 심리 건강을 중심으로 (Exploration of deep learning facial motions recognition technology in college students' mental health)

  • 리파;조경덕
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.333-340
    • /
    • 2022
  • 코로나19는 모두로 하여금 초조하고 불안하게 만들고, 사람들간에는 거리두기가 필요하다. 코로나19로 인해 심리적으로 초조하고 불안 해 지고 거리두기가 필요해졌다. 대학교에서는 학기 초에 정신건강에 대한 단체 평가와 검사가 이루어진다. 본 연구에서는 다층감지기 신경망 모델을 채택하고 훈련시켜 딥러닝을 진행했다. 훈련이 끝난 후, 실제 사진과 동영상을 입력하고, 안면탐지를 진행하고, 표본에 있는 사람의 얼굴 위치를 알아낸 후, 그 감정을 다시 분류하고, 그 표본의 예측한 감정 결과를 그림으로 보여주었다. 결과는 다음과 같다. 테스트 시험에서는 93.2%의 정확도를 얻었고, 실제 사용에서는 95.57%의 정확도를 얻었다. 그중 분노의 식별율은 95%, 혐오의 식별율은 97%, 행복의 식별율은 96%, 공포의 식별율은 96%, 슬픔의 식별율은 97%, 놀라움의 식별율은 95%, 중립의 식별율은 93%이었다. 본 연구의 고효율적 정서 식별 기술은 학생들의 부정적 정서를 포착하는 객관적 데이터를 제공 할 수 있다. 딥러닝의 감정식별 시스템은 심리건강을 향상하기 위한 데이터들을 제공할 수 있다.

수동형 멀리미터파 영상과 가시 영상과의 정합 및 융합에 관한 연구 (Image Registration and Fusion between Passive Millimeter Wave Images and Visual Images)

  • 이형;이동수;염석원;손정영;블라드미르 구신;김신환
    • 한국통신학회논문지
    • /
    • 제36권6C호
    • /
    • pp.349-354
    • /
    • 2011
  • 수동형(passive) 밀리미터파(millimeter wave) 영상은 의복 등에 은닉된 물체의 탐지가 가능하며 악천후의 상황에서도 감쇄도(attenuation)가 낮아 식별이 가능한 영상을 획득할 수 있다. 그러나 영상 시스템의 공간 해상도(spatial resolution)가 낮고 수신신호가 미약하여 잡음의 영향이 크고 시스템의 온도 분해능(temperature resolution)에 따라 영상의 질이 달라진다. 본 논문에서는 수동형 밀리미터파 영상과 일반 카메라부터 획득되는 영상의 정합(registration)과 은닉된 물체의 시각화를 위한 영상 융합(fusion)을 연구한다. 영상의 정합은 추출된 몸체 경계 간의 상호상관도를 최대로 하는 어파인 변환(affine transform)으로 수행되며 융합은 영상 분해를 위한 이산 웨이블릿 변환(discrete wavelet transform), 융합 법칙(fusion rule), 영상을 복원하기 위한 역 이산 웨이블릿 변환의 3단계로 구성된다. 실험에서는 수동형 밀리미터파 영상 시스템에 의해 칼, 도끼, 화장품, 그리고 휴대폰과 같은 또는 비금속의 다양한 물체가 탐지됨을 보인다. 또한 정합과 융합된 영상의 결과로부터 가시 영상으로부터 얻은 얼굴과 의복 등의 대상자의 신원정보와 밀리미터파 영상으로부터 획득한 은닉된 물체의 정보를 동시에 시각화할 수 있음을 보인다.