• 제목/요약/키워드: 얼굴 전처리

검색결과 143건 처리시간 0.029초

OpenPose기반 딥러닝을 이용한 운동동작분류 성능 비교 (Performance Comparison for Exercise Motion classification using Deep Learing-based OpenPose)

  • 손남례;정민아
    • 스마트미디어저널
    • /
    • 제12권7호
    • /
    • pp.59-67
    • /
    • 2023
  • 최근 인간의 자세와 행동을 추적하는 행동 분석 연구가 활발해지고 있다. 특히 2017년 CMU에서 개발한 오픈소스인 오픈포즈(OpenPose)는 사람의 외모와 행동을 추정하는 대표적인 방법이다. 오픈포즈는 사람의 키, 얼굴, 손 등의 신체부위를 실시간으로 감지하고 추정할 수 있어 스마트 헬스케어, 운 동 트레이닝, 보안시스템, 의료 등 다양한 분야에 적용될 수 있다. 본 논문에서는 헬스장에서 사용자들이 가장 많이 운동하는 Squat, Walk, Wave, Fall-down 4개 동작을 오픈포즈기반 딥러닝인 DNN과 CNN을 이용하여 운동 동작 분류 방법을 제안한다. 학습데이터는 녹화영상 및 실시간으로 카메라를 통해 사용자의 동작을 캡처해서 데이터 셋을 수집한다. 수집된 데이터 셋은 OpenPose을 이용하여 전처리과정을 진행하고, 전처리과정이 완료된 데이터 셋은 본 논문에서 제안한 DNN 및 CNN 모델 이용하여 운동 동작 분류를 학습한다. 제안한 모델에 대한 성능 오차는 MSE, RMSE, MAE를 사용한다. 성능 평가 결과, 제안한 DNN 모델 성능이 제안한 CNN 모델보다 우수한 것으로 나타났다.

설진 유효 영역 추출의 시스템적 접근 방법 (Systematic Approach to The Extraction of Effective Region for Tongue Diagnosis)

  • 김근호;도준형;유현희;김종열
    • 전자공학회논문지SC
    • /
    • 제45권6호
    • /
    • pp.123-131
    • /
    • 2008
  • 한의학에서 혀의 상태는 인체 내부의 생리적 병리적 변화와 같은 건강 상태를 진단하는 중요한 지표로 활용된다. 혀의 상태를 진단하는 방법(설진)은 편리할 뿐 아니라 비침습적이므로, 한의학에서 널리 활용되고 있다. 하지만, 설진은 광원이나 환자의 자세, 의사의 건강 조건과 같은 검사 환경에 따라 많은 영향을 받는다. 객관적이고 표준화된 진단을 위한 자동 설진 시스템을 개발하기 위하여 촬영된 얼굴 영상으로부터 혀를 영역분할하고 설태를 분류하는 것은 필수적이지만 혀와 입술, 입 근처의 피부색이 서로 유사하므로 쉽지 않은 일이다. 제안된 방법은 전처리 과정과 영역분할, 혀의 구조로부터 발생하는 음영 영역의 지역 최소값 위치 검색, 지역 최소값의 교정, 컬러의 차이를 최대로 하는 위치를 찾는 컬러 경계면 탐색, 척의 기하적인 특성에 일치하는 경계면 선택, 경계면 평활화로 구성되어 있으며, 여기서 전처리 과정은 계산량의 감소를 위한 부 표본화, 히스토그램 평활화, 경계면 강화를 수행한다. 이러한 시스템적인 과정을 거치면, 영역분할된 혀를 획득할 수 있게 된다. 제안된 방법으로 분할된 영역은 초과적으로 혀가 아닌 영역을 제외해 낼 뿐 아니라 정확한 진단을 위해 중요한 정보를 제공함을 한의사의 진단 유효도 평가점수를 통해 확인할 수 있었다. 제안된 방법은 진단의 객관화와 표준화에 기여할 뿐만 아니라 u-Healthcare 시스템에도 활용 가능하다.

졸음 인식과 안전운전 보조시스템 구현 (Implementation of A Safe Driving Assistance System and Doze Detection)

  • 송혁;최진모;이철동;최병호;유지상
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.30-39
    • /
    • 2012
  • 본 논문에서는 검출된 운전자의 얼굴영역에서 눈의 형태를 인식하여 졸음 상태를 감지하는 기법을 개발하고 감지 결과에 따라 위험 상태를 알려주는 경보 시스템을 구현하고자 한다. 먼저 얼굴 검출에는 Haar 변환 기법을 이용하고 실험실환경, 차량환경 및 적외선 영상을 획득하여 다양한 조명 환경에서도 강인하도록 전처리 및 후처리 과정을 적용한다. 눈 검출에는 보통 한국인이라는 가정하에 눈의 위치 및 크기의 비례 구조 특성 등을 이용하여 후보 영역을 제한하고 트리구조에 대한 실험 결과로 고속 알고리즘을 구현하였다. 또한 졸음 상태를 인식하기 위해서는 눈의 개폐 형태를 검출할 수 있는 Hough 변환을 이용한 기법과 눈의 계폐에 따른 눈의 형태 비율을 이용한 기법을 새로이 제안하며, 눈이 감겨있는 시간을 측정하여 졸음 여부를 판단한다. 1단계 졸음 상태로 판단될 경우 통합 모니터링 인터페이스에서 운전자에게 경고음을 울리며 2단계 졸음 상태로 판단될 경우에는 CAN(Controller Area Network)을 통하여 안전벨트를 진동하게 함으로써 운전자에게 경고를 하는 시스템을 구현한다. 본 논문에서 제안하는 기법은 기존의 기법들과 비교하여 실험실 환경에서 평균 83.64% 이상의 검출률을 달성 하였으며, 실제 차량환경에서도 실험 결과를 통하여 평균적으로 우수한 결과를 보였다.

강건한 다인종 얼굴 검출을 위한 통합 3D 피부색 모델 (Integrated 3D Skin Color Model for Robust Skin Color Detection of Various Races)

  • 박경미;김영봉
    • 한국콘텐츠학회논문지
    • /
    • 제9권5호
    • /
    • pp.1-12
    • /
    • 2009
  • 올바른 피부색 검출은 사람의 얼굴 검출 및 동작 분석에서 매우 중요한 전처리과정에 속한다. 피부 검출은 일반적으로 화소의 칼라 공간을 Non-RGB로 변형하고, 피부색의 조명 요소를 제거한 다음 피부색 분포 모델에 의해 Skin과 Non-Skin으로 분류하는 3단계로 진행된다. 이는 피부색 검출이 칼라 공간, 조명 요소의 존재 여부, 피부 모델링 방법에 따라 수행 성능에 많은 영향을 받기 때문이다. 본 연구에서는 조명 조건에 따라 피부색 모델의 범위에 차이가 있다는 사실에 기초하여 다양한 조명 조건과 복잡한 배경을 가진 영상에서 효과적으로 다인종의 피부색을 분류해내 기 위한 3차원 피부색 모델을 제시하고자 한다. 제안된 피부색 모델은 화소의 칼라 공간을 YCbCr공간으로 변형하고, 각 요소(Y, Cb, Cr) 값에 의한 3차원 피부색 모델을 형성한다. 다인종의 피부색을 함께 분할하기 위해 인종(백인, 흑인, 황인)별 피부색 모델을 먼저 생성한 후 각각의 모델에서 피부색 확률에 따라 결합한 다인종을 위한 통합 모델을 생성하였다. 또한 우리는 적은 양의 훈련 데이터로 피부색 영역을 올바르게 검출할 수 있도록 여러 단계의 피부색 영역을 설정하였다.

딥 러닝 기반 얼굴 메쉬 데이터 디노이징 시스템 (A Deep Learning-Based Face Mesh Data Denoising System)

  • 노지현;임현승;김종민
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1250-1256
    • /
    • 2019
  • 3차원 프린터나 깊이 카메라 등을 이용하면 실세계의 3차원 메쉬 데이터를 손쉽게 생성할 수 있지만, 이렇게 생성된 데이터에는 필연적으로 불필요한 노이즈가 포함되어 있다. 따라서, 온전한 3차원 메쉬 데이터를 얻기 위해서는 메쉬 디노이징 작업이 필수적이다. 하지만 기존의 수학적인 디노이징 방법들은 전처리 작업이 필요하며 3차원 메쉬의 일부 중요한 특징들이 사라지는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 딥 러닝 기반의 3차원 메쉬 디노이징 기법을 소개한다. 구체적으로 본 논문에서는 인코더와 디코더로 구성된 컨볼루션 기반 오토인코더 모델을 제안한다. 메쉬 데이터에 적용하는 컨볼루션 연산은 메쉬 데이터를 구성하고 있는 각각의 정점과 그 주변의 정점들 간의 관계를 고려하여 디노이징을 수행하며, 컨볼루션이 완료되면 학습 속도 향상을 위해 샘플링 연산을 수행한다. 실험 결과, 본 논문에서 제안한 오토인코더 모델이 기존 방식보다 더 빠르고 더 높은 품질의 디노이징된 데이터를 생성함을 확인하였다.

비선형 평활화와 다차원의 명암변화에 기반을 둔 영상인식 (Image Recognition Based on Nonlinear Equalization and Multidimensional Intensity Variation)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.504-511
    • /
    • 2014
  • 본 논문에서는 영상의 비선형 평활화와 다차원의 명암변화에 기반을 둔 조합형 인식기법을 제안하였다. 여기서 비선형 평활화는 적응적 변형의 히스토그램 재조정 전처리 기법으로 영상의 밝기를 조정하여 화질을 개선하기 위함이다. 다차원의 명암변화는 인접 픽셀간의 밝기변화를 4단계로 나누어 고려함으로써 영상의 속성을 더욱 더 정확하게 반영하기 위함이고, x축과 y축의 2방향 각각의 명암변화를 고려한 정규상호상관계수는 좀 더 포괄적으로 영상의 유사성을 측정하기 위함이다. 제안된 기법을 50개 40*40 픽셀의 명암도 변화를 가지는 얼굴영상들을 대상으로 실험한 결과, 평활화를 수행하지 않거나 선형 평활화를 수행한 기법에 비해 각각 영상의 속성을 잘 반영한 우수한 인식성능이 있음을 확인하였다.

효율적인 Quadratic Projection 기반 홍채 인식: Dual QML을 적용한 홍채 인식의 성능 개선 방안 (An Efficient Quadratic Projection-Based Iris Recognition: Performance Improvements of Iris Recognition Using Dual QML)

  • 권태연;노건태;정익래
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.85-93
    • /
    • 2018
  • 생체 정보를 이용한 사용자 인증은 차세대 인증 방법으로서 기존의 인증 시스템에서 급진적으로 사용되고 있는 인증 방법이다. 대부분의 생체 인증 시스템은 수집된 생체 정보가 가지는 노이즈로 인한 문제, 데이터의 품질에 대한 문제, 인식률의 한계 등 많은 문제점들을 가지고 있다. 이를 해결하기 위한 방법으로 본 논문에서는 비선형적인 실제 데이터를 정확하게 처리하기 위해 비선형기법인 Dual QML을 사용하고, 또한 정확한 영역을 추출하여 인증의 정확도를 증가시키는 전처리 과정을 추가로 제안하여 정확도 증가뿐만 아니라 성능을 향상시키는 방법을 제안하고자 한다. 앞서 발표된 Dual QML은 생체 정보로 얼굴, 장문, 귀를 사용하였다. 본 논문은 앞선 Dual QML 실험에 사용하지 않은 홍채를 생체 정보로 사용하여 홍채 인식을 위한 방법으로도 Dual QML이 우수하다는 것을 보이고자 한다. 마지막으로 실험을 통해 이에 대한 실증을 보이고자 한다.

규칙기반 뉴스 비디오 앵커 TIT 검출방법: KBS와 MBC 9시 뉴스를 중심으로 (Rule-Based Anchor Shot Detection Method in News Video: KBS and MBC 9 Hour News Cases)

  • 유헌우;이명의
    • 한국산학기술학회논문지
    • /
    • 제8권1호
    • /
    • pp.50-59
    • /
    • 2007
  • 본 논문은 뉴스 비디오를 색인, 검색하기 위한 관리 시스템의 기본 기술인 앵커 샷을 검출하는 방법을 제안한다. 이를 위해 현재 가장 많은 사람이 시청하는 'KBS 9시 뉴스'와 'MBC 9시 뉴스'의 앵커 샷의 특징 요소를 분석하여 4단계의 규칙기반 검출방법을 제안한다. 먼저 전처리로 비디오의 샷 경계를 검출하고 첫 번째 프레임을 키 프레임으로 선택한 후에 다음의 4가지 조건을 모두 만족하면 해당 샷을 앵커 샷으로 판단한다. 1) 키 프레임에 앵커의 얼굴이 존재하는 가의 여부, 2) 에지의 분포가 구조적으로 적합한지의 여부, 3) 배경의 색상 정보를 추출하여 기존의 앵커모델의 색상과 유사한지의 여부, 마지막으로 4) 샷 내의 움직임 비율이 일정 임계치 이하인지의 여부를 판단한다. 제안된 방법의 성능을 보이기 위해, 총 108분 분량의 서로 다른 날에 저장된 KBS와 MBC의 9시 뉴스 비디오에 대해 실험한 결과 평균적으로 0.91의 정확도와 1.0의 회수율, 0.98의 F-값을 얻을 수 있었다.

  • PDF

조호환경 내 사람 이미지 데이터 증강을 위한 Style-Generative Adversarial Networks 기법 (Style-Generative Adversarial Networks for Data Augmentation of Human Images at Homecare Environments)

  • 박창준;김범준;김인기;곽정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.565-567
    • /
    • 2022
  • 질병을 앓고 있는 환자는 상태에 따라 병실, 주거지, 요양원 등 조호환경 내 생활 시 의료 인력의 지속적인 추적 및 관찰을 통해 신체에 이상이 생긴 경우 이를 감지하고, 신속하게 조치할 수 있도록 해야 한다. 의료 인력이 직접 환자를 확인하는 방법은 의료 인력의 반복적인 노동이 요구되며 실시간으로 환자를 확인해야 한다는 특성상 의료 인력이 상주해야 하기에 이는 곧, 의료 인력의 부족과 낭비로 이어진다. 해당 문제 해결을 위해 의료 인력을 대신하여 조호환경 내 환자의 상태를 실시간으로 모니터링할 수 있는 딥러닝 모델들이 연구되고 있다. 딥러닝 모델은 데이터의 수가 많을수록 강인한 모델을 설계할 수 있으며, 데이터셋의 배경, 객체의 특징 분포 등 다양한 조건에 영향을 받기 때문에 학습에 필요한 도메인을 가지는 많은 양의 전처리된 데이터를 수집해야 한다. 따라서, 조호환경 내 환자에 대한 데이터셋이 필요하지만, 공개된 데이터셋의 경우 양이 매우 적으며 이를 반전, 회전기법 등을이용할 경우 데이터의 수를 늘릴 수 있지만, 같은 분포의 특징을 가지는 데이터가 생성되기에 데이터 증강 기법을 단순하게 적용하면 딥러닝 모델의 과적합을 야기한다. 또한, 조호환경 내 이미지 데이터셋은 얼굴 노출과 같은 개인정보가 포함 될 수 있으며 이를 보호하기 위해 정보들을 비식별화 해야 한다는 문제점이 있다. 따라서 본 논문에서는 조호환경에서 수집된 데이터 증강을 위한 Style-Generative Adversarial Networks 기법을 적용하여 조호환경 데이터셋 수집에 효과적인 증강 기법을 제안한다.

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발 (Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region)

  • 김기백;유제웅;조남익
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.519-528
    • /
    • 2012
  • 음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.