• 제목/요약/키워드: 특징변환

검색결과 1,733건 처리시간 0.024초

얼굴교체 시스템을 위한 적응적 블렌딩 방법 (Adaptive Face Blending for Face Replacement System)

  • 장성걸;김창섭;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.133-135
    • /
    • 2018
  • 본 논문에서는 포즈에 적응적인 가중치 맵 (weight map)에 기반한, 얼굴 교체시스템을 위한 블렌딩 기법을 제안한다. 우선 얼굴교체를 진행하기 위해 목표얼굴이 들어있는 영상으로부터 실시간으로 얼굴의 기하학적 특징점 (land mark)을 검출한다. 다음 검출된 특징점의 분포에 따라 얼굴영역에 대해 삼각화 (triangulation)를 진행한다. 참조영상에 대해서도 같은 과정을 적용하고 대응되는 영역끼리 워핑 (warping) 변환을 시키면 목표 얼굴과 같은 포즈의 참조얼굴을 얻을 수 있다. 그 다음 두 영상의 피부색 톤을 일치시켜주고 안면교체를 진행한다. 하지만 교체된 영역과 목표 얼굴 사이에 부자연스러운 경계가 발생하게 되는데 블렌딩 기법을 통해 이런 경계를 제거한다. 본 논문에서는 사전에 표준얼굴형태모델을 이용하여 정면 얼굴의 가중치 맵을 생성하고, 표준얼굴형태모델과 목표 얼굴사이 변환관계를 이용하여 포즈에 대응되는 가중치지도를 생성하였다. 이렇게 얻어진 가중치 맵은 일관되게 정해진 가중치 맵에 비해 포즈변화에 적응적으로 대처할 수 있어 보다 자연스러운 얼굴교체 효과를 얻을 수 있다.

  • PDF

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

  • 권오륜;민경필;전준철
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.19-32
    • /
    • 2007
  • 본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.

  • PDF

천이구간 정보를 이용한 음성의 가변적인 시간축 변환 (Variable Time-Scale Modification of Speech Using Trasient Information)

  • 이성주;김희동;김형순
    • 전자공학회논문지S
    • /
    • 제35S권6호
    • /
    • pp.147-155
    • /
    • 1998
  • 기존의 시간축 변환 방법은 음성 특징에 따른 발음 속도의 영향을 고려하지 않기 때문에 변환비율이 커짐에 따라 합성음의 명료도가 떨어지는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 음성 인지과정에서 천이 구간의 시간축 정보가 중요한 역할을 한다는 사실에 기반을 둔 가변적인 시간축 변환 방법을 제안한다. 이를 위하여 제안된 방법에서는 먼저 음성신호를 천이 구간과 정적인 구간으로 구분하고, 천이 구간의 시간축 정보는 그대로 유지하면서 정적인 구간만을 시간축 변환함으로써 목표하는 변환 비율을 얻는다. 청취자 선호도 시험 결과, 제안된 방법이 기존의 대표적인 시간축 변환 방법인 SOLA 방법에 비해 그 성능이 우수함을 확인하였다.

  • PDF

자동 조기심실수축 탐지를 위한 최소 퍼지소속함수의 추출 (Minimum Fuzzy Membership Function Extraction for Automatic Premature Ventricular Contraction Detection)

  • 임준식
    • 인터넷정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.125-132
    • /
    • 2007
  • 본 논문은 가중 퍼지소속함수 기반 신경망(neural network with weighted fuzzy membership functions, NEWFM)을 이용하여 심전도(ECG) 신호로부터 조기심실수축(premature vedtricular contractions, PVC)을 자동 탐지하는 방안을 제시하고 있다. NEWFM은 MIT-BIH 데이터베이스의 부정맥 심전도를 웨이블릿 변환(wavelet transform, WT)한 계수로부터 학습하여 정상 파형과 PVC 파형을 구분한다. 비중복면적 분산 측정법을 적용하여 중요도가 가장 높은 웨이블릿 변환의 d3과 d4의 8개 계수를 추출하였다. 이들 특징입력을 3개의 실험군에 사용하여 각각 99.80%, 99.21%, 98.78%의 신뢰성 있는 전체분류율을 나타내었고, 이는 각 실험군에 대한 특징입력의 종속성이 적음을 보여준다. 추출된 8개 계수의 ECG 신호 구간과 퍼지소속함수를 제시함으로써 특징입력에 대한 명시적인 해석을 가능하게 하였다.

  • PDF

얼굴의 움직임을 이용한 다중 모드 인터페이스에서의 응시 위치 추출 (Gaze Detection Using Facial Movement in Multimodal Interface)

  • 박강령;남시욱;한승철;김재희
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1997년도 한국감성과학회 연차학술대회논문집
    • /
    • pp.168-173
    • /
    • 1997
  • 시선의 추출을 통해 사용자의 관심 방향을 알고자하는 연구는 여러 분야에 응용될 수 있는데, 대표적인 것이 장애인의 컴퓨터 이용이나, 다중 윈도우에서 마우스의 기능 대용 및, VR에서의 위치 추적 장비의 대용 그리고 원격 회의 시스템에서의 view controlling등이다. 기존의 대부분의 연구들에서는 얼굴의 입력된 동영상으로부터 얼굴의 3차원 움직임량(rotation, translation)을 구하는데 중점을 두고 있으나 [1][2], 모니터, 카메라, 얼굴 좌표계간의 복잡한 변환 과정때문에 이를 바탕으로 사용자의 응시 위치를 파악하고자하는 연구는 거으 이루어지지 않고 있다. 본 논문에서는 일반 사무실 환경에서 입력된 얼굴 동영상으로부터 얼굴 영역 및 얼굴내의 눈, 코, 입 영역 등을 추출함으로써 모니터의 일정 영역을 응시하는 순간 변화된 특징점들의 위치 및 특징점들이 형성하는 기하학적 모양의 변화를 바탕으로 응시 위치를 계산하였다. 이때 앞의 세 좌표계간의 복잡한 변환 관계를 해결하기 위하여, 신경망 구조(다층 퍼셉트론)을 이용하였다. 신경망의 학습 과정을 위해서는 모니터 화면을 15영역(가로 5등분, 세로 3등분)으로 분할하여 각 영역의 중심점을 응시할 때 추출된 특징점들을 사용하였다. 이때 학습된 15개의 응시 위치이외에 또 다른 응시 영역에 대한 출력값을 얻기 위해, 출력 함수로 연속적이고 미분가능한 함수(linear output function)를 사용하였다. 실험 결과 신경망을 이용한 응시위치 파악 결과가 선형 보간법[3]을 사용한 결과보다 정확한 성능을 나타냈다.

  • PDF

MPEG-2/H.264 트랜스코더를 위한 DCT 기반 Intra 예측기법 (DCT-domain Intra Prediction Scheme for MPEG-2/H.264 Transcoder)

  • 이주경;정기동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.231-234
    • /
    • 2006
  • H.264 코딩시 Intra 모드는 다양한 모드 즉, 매크로블록(MB) 당 16개의 $4{\times}4$ 블록 각각에 대한 9가지의 $4{\times}4$ 모드와 4가지의 $16{\times}16$ 모드의 오류 값을 계산하여 최상의 모드를 선택하게 된다. 이와 같은 픽셀 기반의 예측 기법을 DCT 기반의 MPEG-2/H.264 트랜스코더에 적용할 경우 DCT 변환의 특성으로 인하여 모드 예측을 위한 계산량이 높아지는 단점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 MPEG2 DCT를 H.264의 정수형 DCT로 변환한 후, DCT 계수의 특징을 이용하여 Intra 모드를 결정하는 기법을 제안한다. 이때, 계수의 특징이 모호하여 모드를 결정하기 어려운 경우는 몇 가지 모드를 선택하여 오류 값을 계산하여 모드를 결정한다. 현재 정밀한 실험은 진행 중이며, 여러 동영상의 첫 Intra 프레임에 대한 실험을 수행한 결과 MB의 모드 결정의 정확도는 프레임 내 이미지의 특징에 영향을 많이 받았다. 예를 들면 Mobile과 같이 프레임 내의 픽셀 간 에지가 많이 존재하는 프레임은 추가적인 모드 결정을 사용하지 않아도 93%정도의 정확도를 보였으며 Akiyo, Foreman과 같이 이웃한 픽셀간 유사도가 상대적으로 높은 경우는 약 80% 정도의 순수 정확성을 보였다. 그러나 모드 판단이 모호한 경우의 모드도 결정한다면 90%이상의 정확도를 보일 것으로 예상된다. 향후 이미지의 특성에 따라 모드를 결정하는 값을 유동적으로 설정하는 기법을 연구하여 정확도를 높이는 연구를 수행하도록 하겠다.

  • PDF

양방향 반올림 필터를 이용한 객체 영역 기반 고속 영상 검색 (Fast Image Retrieval Based on Object Regions Using Bidirectional Round Filter)

  • 류권열;강경원
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.240-246
    • /
    • 2003
  • 본 논문에서는 웨이브릿 변환 영역에서 양방향 반올림 필터를 이용한 객체 영역 기반 고속 영상 검색 방법을 제안한다. 기존의 방법은 웨이브릿 변환 영역의 부대역 전체에서 특징 벡터를 추출하기 때문에 불필요한 배경 정보가 포함됨으로써 검색 효율이 감소하였다. 제안한 방법은 양방향 반올림 필터를 이용하여 객체 영역에서만 특징 벡터를 추출함으로써 불필요한 배경 정보를 제거하여 검색 효율을 향상시킨다. 그리고, 색상 정보에 관한 특징 벡터 수를 감소하여도 일정한 검색 효율을 유지한다. 결론적으로, 영상의 특성에 따라 다소 차이는 있으나 2.5%∼5.3%의 검색 효율이 향상됨을 알 수 있었다.

  • PDF

웨이브릿 기반의 에피폴라 평면 영상에서의 움직임 분석 (Motion Analysis on the Wavelet-based Epipolar-Plane Images)

  • 장재건;이형석;박지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.374-376
    • /
    • 1999
  • 본 논문은 연속적인 영상에서 움직이는 물체의 광류를 예측하는데 있어서 웨이브릿과 에피폴라 평면(Epipolar-Plane Images, EPI)을 사용하여 물체의 움직임을 분석하는 기법을 제안한다. 하나의 영상에서 물체의 특징을 찾는데 2차 웨이브릿 변환이 사용되고 있으나 연적인 영상에 대한 분석에서 시간에 대한 또 하나의 변환을 해 줌으로서 움직이는 물체의 정보를 얻어낼 수 있다. 3차 웨이브릿 변환에서 유도된 데이터를 가지고 만들어지는 에피폴라 평면은 움직이는 물체의 광류를 예측하는데 있어서 기존의 방법보다 시간적으로 절약을 할 수 있다. 특히 서로 다른 방향에 대한 민감성을 보여 주는 웨이브릿 계수들은 움직이는 물체의 광류 예측에 많은 도움을 주고 있다. EPI 분석에서는 물체가 깊이 방향으로 움직이는 경우에도 물체의 각 에지들(edges)의 기울기를 분석함으로서 깊이 방향의 광류를 측정할 수 있다. 본 논문에서 제시한 3차 웨이브릿 변환과 EPI 기법의 조합으로 분석된 실험 결과와 그 전 연구들과의 비교가 마지막 부분에 서술되었다.

  • PDF

변환영역 기반의 시각특성 파라미터를 이용한 영상 분석 (Image Analysis using Transform domain-based Human Visual Parameter)

  • 김윤호
    • 한국항행학회논문지
    • /
    • 제12권4호
    • /
    • pp.378-383
    • /
    • 2008
  • 본 논문에서는 DCT 변환과 퍼지추론을 이용하여 영상을 분석하는 방법을 제안 한 바, 병해충 과실 등의 특성을 분석 할 수 있는 퍼지추론 알고리즘과 변환계수에 시각특성파라미터를 접목하는 방법에 중점을 두었다. 전처리 과정에서 이산코사인 변환계수로부터 엔트로피와 텍스처 등의 시각특징 파라미터들을 구하였고, 이 변수들을 이용하여 퍼지 추론의 입력 변수를 생성 하였다. 맘다니 연산자와 ${\alpha}$-cut 함수를 적용하여 영상 분석을 실험한 결과, 제안한 방법의 응용가능성을 입증하였다.

  • PDF

비선형 변환에 의한 중간층 뉴런 상관계수 감소 (Decreasing of Correlations Among Hidden Neurons of Multilayer Perceptrons)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제3권3호
    • /
    • pp.98-102
    • /
    • 2003
  • 다층퍼셉트론의 중간층 뉴런이 지닌 역할을 정보처리의 관점에서 밝혀내기 위해서, 이 논문에서는 중간층 뉴런의 가중치 합들 간의 상관계수가 비선형 변환에 의해 감소하게 됨을 증명하였다. 고립단어 인식을 다층퍼셉트론에 학습시킨 경우의 시뮬레이션으로 이러한 증명이 맞음도 보였다. 이 결과로부터 중간층 뉴런이 지닌 비선형 변환은 정보의 중복을 감소시키는 효과가 있음을 알 수 있다.

  • PDF