• Title/Summary/Keyword: 특징 차원 감소

Search Result 164, Processing Time 0.025 seconds

트랜스포머 기반의 다중 시점 3차원 인체자세추정 (Multi-View 3D Human Pose Estimation Based on Transformer)

  • 최승욱;이진영;김계영
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.48-56
    • /
    • 2023
  • 3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.

  • PDF

2-계층 레이아웃을 이용한 2.5차원 대사 경로 드로잉 (2.5D Metabolic Pathway Drawing based on 2-layered Layout)

  • 송은하;함성일;이상호;박현석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.875-890
    • /
    • 2009
  • 대사체학은 대사 경로 네트워크를 통해 생명 활동을 이해하고자 하는 분야로서, 대사 경로 내의 흐름을 한 눈에 알 수 있도록 가시화하여 보여 주는 도구가 반드시 필요하다. 이러한 가시화 도구의 경우 노드수가 증가할수록 에지 교차가 기하급수적으로 증가하는 문제가 있다. 따라서 유전체 수준의 대사경로를 연구하기 위해서는 대사 경로 그래프 레이아웃 상에 나타나는 에지 교차를 줄이는 것이 시각화의 매우 중요한 부분이다. 본 논문에서는 대사 경로의 구조적인 특징에 기반한 3차원 공간 상에 대사 경로 그래프를 레이아웃해 주는 모듈을 설계, 구현하였다. 2-계층 레이아웃을 이용하여 대사 경로 그래프를 계층적으로 레이아웃함으로써 표현영역을, 3차원으로 확장시키고 기존의 2차원 레이아웃 알고리즘 적용시 번번히 나타나는 에지 교차의 수를 감소시키는 결과를 얻었다.

차원별 Eigenvoice와 화자적응 모드 선택에 기반한 고속화자적응 성능 향상 (Performance Improvement of Fast Speaker Adaptation Based on Dimensional Eigenvoice and Adaptation Mode Selection)

  • 송화전;이윤근;김형순
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.48-53
    • /
    • 2003
  • Eigenvoice 방법은 고속화자적응에 적합하다고 알려져 있지만, 이 방법은 발화수가 증가하더라도 추가적인 인식성능향상이 이루어지지 않는 단점이 있다. 본 논문에서는 이 문제를 해결하기 위해 음성 특징벡터의 차원별로 eigenvoice의 가중치를 구하여 적응시키는 방법과 또한 적응 데이터 수에 따라 높은 인식률을 얻는 적응 방식을 선택하는 방식을 제안한다. 화자독립모델 및 eigenvoice들을 구성하기 위해 POW (Phonetically Optimized Words)데이터베이스를 사용하였으며, PBW(Phonetically Balanced Words) 452단어 중50개까지 발화 수를 변화시키면서 교사방식 (Supervised mode)로 적응에 사용하고 나머지 중 400개를 인식실험에 사용하였다. 차원별 eigenvoice 방법이 발화수가 증가함에 따라 기존의 eigenvoice 나 MLLR 방법보다 높은 성능을 보였으며, eigenvoice와 차원별 eigenvoice방법 사이의 적응 모드 선택을 통해 기존의 eigenvoice 방식에 비해 최고 26%의 단어 오인식률 감소를 얻었다.

영상의 특징점과 비용함수를 고려한 스테레오 정합개선 (Improve Stereo Matching by considering the Characteristic Points of the Image and the Cost Function)

  • 백영민;최현준;서영호;김동욱
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1667-1679
    • /
    • 2010
  • 본 논문에서는 최종 변이영상의 정확도를 높이기 위해 영상의 특징점을 이용한 적응적 가변 정합창 방법과 교차 일치성 검사의 신뢰도를 높이는 방법을 제안한다. 제안한 적응적 가변 정합창 방법은 색상정보를 이용하여 영상을 분할하고 분할된 각 영상의 특징점을 찾아 그 특징점들의 유무에 따라 정합창의 크기를 적응적으로 가변시키는 방법이다. 또한 제안한 교차 일치성 검사 방법은 최적의 변이와 차상위 최적의 변이에 대한 비용함수 값들을 비교하여 비용하수 값 자체가 너무 크거나 두 비용함수의 차이가 너무 적은 경우를 찾아내어 처리하는 방법이다. 제안한 두 방법에 대한 Middleburry에서 제공한 네 가지 실험영상을 대상으로 실험한 결과 적응적 가변 정합창 방법은 최대 18.2%의 오차율을 감소시켰다. 또한 제안한 교차 일치성 검사는 최대 7.4%의 신뢰도를 향상시킨 것으로 나타났다.

지역특징분석을 이용한 SVM 커널 디자인 (SVM Kernel Design Using Local Feature Analysis)

  • 이일용;안정호
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.17-24
    • /
    • 2010
  • 얼굴인식과 같은 고차원 영상의 패턴분류 문제에서는 특징추출과정이 필수적이라 할 수 있다. 특징추출방법 중 부분공간기법은 데이터의 표현이 우수할 뿐만 아니라 차원 감소 면에서도 효율적이라 보고되고 있으며, 그 대표적인 방법으로 주성분분석, 선형판별분석 등이 널리 알려져 있다. 하지만, 이들 방법은 전역적 변환 방법으로써 포즈, 조명 등의 변화에 민감하여, 그 변화량이 크면 전역적 변환으로 인한 얼굴정보가 전체적으로 손실될 가능성이 크다. 따라서, 이러한 변화들에 대해 잘 대처하기 위해서는 얼굴영상에서 변화들을 상쇄시키는 정규화 작업을 수행해야만 한다. 정규화를 추구하는 이유는 일반적인 얼굴과 가깝게, 다시말해 평균 얼굴과 가깝게 하기 위함이고, 이러한 정규화를 위해서는 부분적 변환 방법이 이상적이라 할 수 있다. 이 방법은 변환으로 인한 얼굴 정보가 부분적 손실만을 유발하기 때문에 전역적 변환 방법에 비해 적합하다고 할 수 있다. 본 논문에서는 지역적 부분공간기법 중 지역특징분석을 SVM커널에 적용하여, 기존 SVM다항식커널에 지역적 정보를 포함시킴으로써, 보다 강력하고 새로운 SVM커널을 디자인하였다.

초분광 이미지 픽셀 분류를 위한 풀링 연산과 PSNR을 이용한 최적 밴드 선택 기법 (Optimal Band Selection Techniques for Hyperspectral Image Pixel Classification using Pooling Operations & PSNR)

  • 장두혁;정병현;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.141-147
    • /
    • 2021
  • 본 연구를 통해 임베디드 시스템(Embedded System)에서 뉴럴 네트워크(Neural Network) 인풋의 차원 감소 방식으로 복잡한 연산량을 줄여 초분광 대용량 데이터 특징 정보의 활용률을 개선하기 위해, 전체 밴드를 밴드별 최댓값과 최솟값 차이로 부분집합으로 군집화하여, 각 부분집합에서 밴드 선택 알고리즘을 적용한다. 특징 추출과 특징 선택 기법 중에, 특징 선택 기법을 통해, 파장 범위와 관계없이 데이터세트에 맞는 최적의 밴드 수와 기존 알고리즘 적용 소요 시간과 성능을 향상하고자 한다. 이 실험을 통해 기존 밴드 선택 기법보다 1/3~ 1/9배 소요 시간을 단축했음에도 불구하고 K-최근접 이웃 분류기를 통한 성능 면에서는 약 4% 이상 향상된 의미 있는 결과를 도출하였다. 실시간 초분광 데이터 분석 활용에는 어렵지만, 개선된 가능성을 확인했다.

중심이동과 신경망 기반 주요성분분석을 이용한 얼굴인식 (Face Recognitions Using Centroid Shift and Neural Network-based Principal Component Analysis)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.715-720
    • /
    • 2005
  • 본 논문에서는 영상의 1차 모멘트와 단층신경망에 기반을 둔 주요성분분석을 이용한 얼굴인식 기법을 제안하였다. 여기서 1차 모멘트는 입력되는 얼굴영상의 중심이동을 위한 것으로 차원을 감소시켜 얼굴인식에 불필요한 배경을 배제시키기 위함이다. 또한 단층신경망을 이용한 주요성분분석은 수치적 기법의 대안으로 Foldiak 학습알고리즘을 이용하며, 차원을 감소시켜 얼굴영상의 특징추출을 위한 정규직교기저를 얻기 위함이다. 제안된 기법을 64$\ast$64 픽셀의 48개(12명$\ast$4장) 학습자 얼굴영상을 대상으로 city-block, Euclidean, 그리고 negative angle의 각 거리 척도를 분류척도로 이용하여 실험하였다. 실험결과, 제안된 기법은 우수한 인식성능이 있음을 확인하였다. 특히 negative angle를 이용하는 것이 city-block이나 Euclidean을 이용하는 것보다 상대적으로 정확하게 유사성을 측정할 수 있었다.

다면체 인식을 위한 탐색 공간 감소 기법 (A Reduction Method of Search Space for Polyhedral Object Recognition)

  • 이상용
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.381-385
    • /
    • 2003
  • 본 논문에서는 다면체의 인식을 위하여 사용되는 여러-방향-보기 방법 (multiple-view approach)에서, ART-1 신경망을 이용하여 모델베이스의 탐색공간 크기를 줄이기 위한 방법을 제안한다. 이 방법에서 모델베이스는 물체를 둘러싸고 있는 보기 구체의 미리 정해진 시점에서 관측된 2차원 투영체에서 추출된 특징들로 구성된다.

주성분분석법을 이용한 반도체패키지의 위치정렬 영상처리기법 (An Image Processing Method for Aligning the Positions of Semiconductor Package using Principal Component Analysis)

  • 김학만
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.850-853
    • /
    • 2009
  • 반도체 조립공정에서 사용되는 Pick and Placement장비는 반도체패키지를 컴퓨터 비젼을 이용하여 위치 정렬하고 Placement Tray에 적재하는 장비로서 고속,고정밀도가 요구된다. 다변량 통계적 분석방법인 주성분 분석법은 주어진 데이터에서 특징이 되는 일정한 패턴을 찾는 방법으로 영상의 차원감소를 위해 최근 많이 사용되어지고 있다. 본 논문에서는 반도체패키지의 기하학적 형태를 이용하여 위치정렬을 하도록 한 후 성능을 검증하도록 하였다. 패키지 원영상에서 밝기값의 차이에 따른 윤곽선을 인식한 후, 각 위치값들을 주성분 분석법을 이용해 직선을 추출한 방법으로 위치정렬한 결과 신뢰할만한 위치정렬 성능을 보였다.

  • PDF

Registration 오차감소를 위한 3차원 비접촉식 측정용 Fixture 개발 (Development of Fixture for Reducing Errors in Registration of 3D Laser Measuring System)

  • 김연술;진영주;이회관;양균의
    • 한국정밀공학회지
    • /
    • 제22권10호
    • /
    • pp.107-113
    • /
    • 2005
  • This paper presents a method to reduce errors in registration, which is used in transformation coordinate system of the multiple measuring data. In general, the ICP algorithms and feature-based approaches are used for registration. In order to measure wrap-around object, it is necessary to change the scanning direction or set-up of the object. A fixture is made to reduce registration errors caused by inaccurate center point of tooling balls, providing the more accurate registration method. And, the motorized fixture controls rotation and tilting to get precise the measuring data and registration. The proposed motorized fixture and registration method have advantages in accurate registration and precise measurement, compared with the conventional methods.