• 제목/요약/키워드: Feature extraction

검색결과 2,569건 처리시간 0.029초

선형모델을 이용한 방향성 조명하의 얼굴영상 정규화 (Normalization of Face Images Subject to Directional Illumination using Linear Model)

  • 고재필;김은주;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 얼굴인식은 외관기반(appearance-based) 매칭기법으로 풀어야 할 문제 중의 하나이다. 그러나, 얼굴영상의 외관은 조명 변화에 매우 민감하다. 얼굴인식 성능을 향상시키기 위해서는 다양한 조명 아래에서 다양한 학습 데이타를 수집해야 하나, 실제로는 데이타 수집이 용이하지 않다. 따라서, 성능향상을 위해서 다양한 데이타를 학습시키는 것 보다 다양한 조건의 데이타를 정규화 하는 기법에 주목하는 것이 바람직하다. 본 논문에서는 방향성 조명 아래에서 취득한 얼굴영상을 정규화 할 수 있는 간단한 방법을 제안한다. 조명 문제는 얼굴인식 시스템에서 오류를 일으키는 가장 중요한 요인중 하나이다. 제안하는 방법을 ICR(illumination Compensation based on Multiple Linear Regression)이라 명명하였다. 본 방법에서는 다중회귀분석 모델을 사용하여 얼굴영상의 화소 밝기 갈 분포에 가장 잘 맞는 평면을 찾은 후 이 평면을 이용하여 얼굴영상을 정규화 한다. 제안하는 방법의 장점은 간단하고 실용적이며, 얼굴영상의 밝기 값 분포에 대한 평면 근사가 선형모델에 의해 수학적으로 정의된다는 점이다. 얼굴인식에서 제안하는 방법의 성능 향상을 보여주기 위해 공개 및 자체 구축 데이타 베이스에 대한 실험 결과를 제시한다. 실험 결과 두드러진 얼굴인식 성능 향상을 보여주었다.

모멘트 정보와 표면거리 기반 다중 모달리티 의료영상 정합 (Multi-modality MEdical Image Registration based on Moment Information and Surface Distance)

  • 최유주;김민정;박지영;윤현주;정명진;홍승봉;김명희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권3_4호
    • /
    • pp.224-238
    • /
    • 2004
  • 다중 모달리티 영상정합은 서로 다른 성격의 두 영상의 중요정보를 결합하여 복합적 정보를 얻기 위해 널리 사용되는 영상처리 기법이다. 본 연구에서는 정합 대상 객체의 초기위치 및 방향에 종속적이지 않고, 낮은 정합오차 범위 내에서의 안정적인 정합을 지원하기 위하여 기존의 표면기반 정합 기법을 개선한 모멘트 정보 및 표면거리 기반의 정합 기법을 제시한다. 제안방법에서는 우선 정합대상객체의 표면 윤곽 점을 추출하고, 이를 기반으로 대상객체의 모멘트 정보를 추출하여, 표면거리 기반 상세 정합 이전에 모멘트 정보를 일치시키는 변환을 수행함으로써, 정합이전 대상객체의 위치 및 방향이 상이한 경우에 있어서도 정합이 안정적으로 수행되도록 한다. 또한 테스트 영상에 대한 표면 대표점 추출 시, 표면 코너추출법을 적용함으로써, 기존 표면 정보 기반 정합기법에서 일반적으로 사용하고 있는 무작위 샘플링 및 일정간격 샘플링에 의한 취약점을 보완한다. 본 논문에서 제안기법의 검증을 위하여 뇌 부위 자기공명단층영상(MRI)과 양자 방출 단층 촬영 영상(PET)을 적용하고, 정합오류율과 정합결과에 대한 2,3차원 가시화 영상의 육안평가를 통하여 정확성 및 안정성 측면을 검증한다.

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

인공 신경망 기반의 지문 영상 복원 알고리즘 (An Algorithm of Fingerprint Image Restoration Based on an Artificial Neural Network)

  • 장석우;이사무엘;김계영
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.530-536
    • /
    • 2020
  • 일반적인 지문 인식기에서 이용되는 미뉴셔 특징은 표현 공격에는 강건하지만 오 정합률이 상대적으로 높다는 약점이 있다. 따라서 미뉴셔 특징은 스켈리톤 영상과 함께 이용되는 경향이 있다. 보통 지문의 미뉴셔 특징에 대한 보안 취약성 연구는 많이 진행되어 있으나 스켈리톤에 대한 취약성 연구는 미약한 형편이므로 본 연구에서는 스켈리톤에 대한 표현 공격의 취약성을 분석하고자 한다. 이를 위해, 본 연구에서는 지문의 스켈리톤으로부터 학습 알고리즘을 사용해 원래의 지문을 복구하는 방법을 제시한다. 본 논문에서 제시된 방법은 기존의 Pix2Pix 모델에 잠재 벡터를 추가한 새로운 학습 모델인 Pix2Pix을 제안하여, 보다 자연스러운 지문을 생성한다. 본 논문의 실험 결과에서는 제시된 학습 알고리즘을 이용해 원래의 지문을 복원한 다음, 복원된 지문을 지문 인식기에 입력시켜 높은 인식률을 달성하였다. 그러므로 본 연구는 스켈리톤을 함께 이용하는 지문 인식기는 표현 공격에 취약함을 검증하였다. 본 논문에서 제시된 접근방법은 지문 인식 및 복원, 비디오 보안, 생체 인식 등과 연관된 많은 실제적인 응용 분야에서 유용하게 사용될 것으로 기대된다.

교육용 어학 영상의 내용 기반 특징 분석에 의한 샷 구분 및 색인에 대한 연구 (A Study on Shot Segmentation and Indexing of Language Education Videos by Content-based Visual Feature Analysis)

  • 한희준
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.219-239
    • /
    • 2017
  • IT기술이 급속히 발달하고 스마트 기기의 개인보급이 늘어나면서 정보의 전달 매체로 시청각 자료 중에서도 특히 영상 자료가 많이 활용된다. 문헌정보서비스 콘텐츠로서 영상자료는 필수 요소가 되었으며, TV를 통한 단방향 전달, 인터넷을 통한 양방향 서비스, 도서관 시청각 자료 대출 등 다양한 방법으로 활용되고 있다. 특히 인터넷 환경에서 스마트 기기를 통한 영상서비스 관점에서 정보 제공자는 제공 정보에 대한 가공에 적은 노력과 비용을 들이고자 하고, 또한 사용자는 과도한 데이터 사용량에 대한 부담과 시간, 공간적인 제약으로 인해 원하는 부분만을 효율적으로 이용하고자 한다. 따라서 영상에 대한 내용을 유사한 부분끼리 자동으로 구분하고 요약, 색인하여 이용 편의성을 높일 필요가 있다. 본 논문에서는 교육용 어학 영상의 내용과 그 특성을 분석하여 영상을 이루는 샷을 자동으로 구분하고 비주얼 특징을 조합하여 어학 영상의 세분화된 내용 정보를 결정하고 색인하는 방법을 제안한다. 외국어 강의 영상을 이용한 실험에 의해 의미기반의 샷 결정에 높은 정확률을 보였으며, 교육용 어학 영상의 요약 서비스에 효율적으로 적용 가능함을 확인하였다.

얼굴인증 방법들의 조명변화에 대한 견인성 비교 연구 (Study On The Robustness Of Face Authentication Methods Under illumination Changes)

  • 고대영;김진영;나승유
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.9-16
    • /
    • 2005
  • 본 논문은 얼굴인증 시스템 구현과 조명변화에 견인한 얼굴인증 방법들에 관한 연구에 초점을 둔다. 얼굴인증 시스템 구현을 위한 방법으로 PCA(Principal Component Analysis), GMM(Gaussian Mixture Models), 1차원 HMM(1 Dimensional Hidden Markov Models), 준 2차원 HMM(Pseudo 2 Dimensional Hidden Markov Models) 방법을 이용한다. 네 가지 다른 얼굴인증 방법들의 조명변화에 대한 성능비교 실험을 수행한다. 조명변화실험을 위해 얼굴이미지의 왼쪽에서 오른쪽으로 인공적인 조명효과(${\delta}=0,40,60,80$)를 준다. 얼굴특징벡터는 얼굴이미지에서 분할한 각 블록에 대한 2D DCT(2 Dimensional Discrete Cosine Transform) 계수를 이용하고 실험은 ORL(Olivetti Research Laboratory) 얼굴데이터베이스를 사용한다. 실험결과 모든 경우 조명변화 값이 커질수록 성능저하가 발생한다. 또한 조명변화가 없는 경우(${\delta}=0$) 준 2차원 HMM이 $2.54{\%}$, 1차원 HMM이 $3.18{\%}$, PCA가 $11.7{\%}$, GMM이 $13.38{\%}$의 EER(Equal Error Rate) 성능을 나타낸다. 조명변화가 없는 경우(${\delta}=0$) 1차원 HMM 방법이 PCA 방법보다 좋은 성능을 나타내지만 조명변화 ${\delta}{\geq}40$인 때에는 반대로 PCA 방법이 더 좋은 성능을 나타낸다. 마지막으로 준 2차원 HMM의 경우 조명변화에 관계없이 가장 좋은 EER성능을 나타낸다.

증류탑을 위한 머신러닝 기반 플랫폼 개발 (Development of Machine Learning-Based Platform for Distillation Column)

  • 오광철;권혁원;노지원;최영렬;박현도;조형태;김정환
    • Korean Chemical Engineering Research
    • /
    • 제58권4호
    • /
    • pp.565-572
    • /
    • 2020
  • 본 연구는 증류탑 분리공정 시스템 최적화를 위하여 인공지능 머신러닝이 적용된 소프트웨어 플랫폼을 개발하였다. 증류탑 분리공정은 석유화학 산업의 대표적이고 핵심적인 공정이다. 하지만 다양한 운전조건과 연속식공정 특성으로 인하여 안정적인 운전이 어려우며 운전자 숙련도에 의하여 공정효율에 차이가 발생된다. 이를 해결하기 위하여 이론적 시뮬레이션을 활용한 제어방법이 개발되어 사용되고 있지만 특수하거나 복잡한 반응이 포함된 공정에는 적용이 어려우며, 거대한 시스템에 대하여 분석이 이루어질 경우 계산비용 증대로 인하여 실시간 제어와 연동이 어려운 한계점을 지니고 있다. 따라서 본 연구에서는 이러한 문제점을 해결하기 위하여 머신러닝을 기반으로 한 경험적 시뮬레이션 모델을 개발하고 이를 통하여 최적의 공정운영방법을 제시하고자 한다. 경험적 시뮬레이션 개발은 실제 공정에서 수집된 빅 데이터, 데이터마이닝을 통한 특성추출, 공정을 대표하는 데이터 선별, 화학공정 특성에 맞는 모델 선정으로 이루어졌으며, 현장검증 및 테스트를 통하여 증류탑 분리공정 플랫폼이 개발되었다. 최종적으로 개발된 플랫폼을 통하여 운전 조작변수의 예측이 가능하며, 최적화된 운전조건을 제공하여 효율적인 공정운영을 달성할 수 있다. 본 논문은 머신러닝 기법을 화학공정에 적용한 기초연구로서 이후 다양한 공정에 적용하여 4차 산업의 스마트 팩토리의 초석이 되어 널리 활용될 수 있을 것이라 판단된다.

SWAT 모형을 이용한 저해상도 DEM 사용으로 고해상도 DEM 지형 인자 추출 모듈 개발 (Development of High Resolution DEM Topographic Feature Extraction Module from Low Resolution DEM Using SWAT Model)

  • 김종건;박윤식;김남원;장원석;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1077-1081
    • /
    • 2008
  • Soil and Water Assessment Tool(SWAT) 모형은 DEM(Digital Elevation Model)을 사용하여 지형인자를 추출하고 이를 바탕으로 수문 및 수질 모의가 이루어진다. 지형인자의 추출시 DEM 격자크기에 따라 상이한 결과를 초래할 수 있다. 그리하여 정확한 수문 및 수질 모델링에 있어 가능한 고해상도의 DEM을 사용하도록 권장하고 있다. 그러나 넓은 유역에서의 적용시 고해상도 DEM 사용에 따른 컴퓨터 처리 용량과 프로그램 실행 시 소요되는 시간상의 문제는 그 효율성에 있어서 문제시될 수 있다. 그리하여 본 연구에서는 소양강댐, 임하댐 유역을 대상으로 SWAT 모형에서 저해상도 DEM 사용으로 고해상도 DEM의 지형인자를 추출하여 자동 입력될 수 있는 모듈을 개발 적용하였다. 본 연구의 결과 소양강댐 유역을 대상으로 격자크기 20m DEM과 100m DEM을 사용하였을 때 연평균 유사량이 83.8%의 큰 차이가 발생한 반면 격자크기의 20m DEM과 본 모듈을 적용하여 20m DEM의 지형인자로 자동 보정된 100m DEM을 사용하였을 때의 연평균 유사량이 4.4%로 차이가 상당히 줄어든 것을 볼 수 있었다. 임하댐 유역의 경우는 격자크기 10m DEM과 100m DEM을 사용하였을 때 연평균 유사량이 43.4% 큰 차이가 발생하였다. 반면 격자크기 10m DEM과 본 모듈을 적용하여 10m DEM의 지형인자로 자동 보정된 100m DEM을 사용하였을 때의 연평균 유사량이 0.3%로 차이가 크게 줄어든 것을 확인 할 수 있었다. 또한 본 모듈의 검정을 위해 소양강댐 유역의 지형 자료와 유사한 충주댐 유역을 대상으로 본 모듈을 적용하여 검정을 실시하였다. 그 결과 연간 평균 유사량이 격자크기 20m와 100m의 DEM을 이용하였을 때 98.7%의 큰 차이가 발생한 반면 격자크기 20m와 본 모듈을 적용하여 보정된 경사도 값의 100m DEM을 사용하였을 때 20.7%로 차이가 크게 줄어든 것을 볼 수 있었다. 그리하여 본 연구의 결과를 통해 SWAT 모형에서의 개선된 지형인자 추출 방식을 사용하여 저해상도의 DEM 사용으로 고해상도 DEM 사용의 효과를 볼 수 있을 것이고 이로 인해 넓은 유역에서 저해상도 DEM 사용으로 컴퓨터 사용용량과 프로그램 지연 시간을 줄일 수 있을 것으로 판단된다. 향후 여러 유역을 대상으로 보정, 검정하여 보다 정확하고 통합적으로 적용될 수 있는 모듈의 개선이 필요할 것으로 사료된다.

  • PDF

스테레오 영상에서 임베디드 데이터를 이용한 거리에 따른 얼굴인식률 비교 (Face recognition rate comparison with distance change using embedded data in stereo images)

  • 박장한;남궁재찬
    • 전자공학회논문지CI
    • /
    • 제41권6호
    • /
    • pp.81-89
    • /
    • 2004
  • 본 논문에서는 스테레오 영상에서 좌·우측 영상을 입력 받아 거리변화와 임베디드 데이터를 이용해 얼굴인식률을 PCA알고리듬으로 비교한다. 제안된 방법에서는 RGB컬러공간에서 YCbCr컬러공간으로 변환하여 얼굴영역을 검출한다. 또한 거리변화에 따라 추출된 얼굴영상의 확대 및 축소하여 보다 강건한 얼굴영역을 추출한다. 실험을 통하여 제안된 방법은 30cm∼200cm 정도의 거리에서 기준 거리(100cm)를 설정하고, 스케일 변화에 따른 평균적인 인식결과로 99.05%(100cm)의 인식률을 얻을 수 있었다. 정규화된 크기(92×112)에서 특정영역인 슈퍼 상태를 정의하고, 각각 정의된 슈퍼 상태의 내부요소인 임베디드 데이터만을 추출하여 PCA 알고리듬을 통하여 얼굴인식을 수행하였다. 원본영상을 모두 학습하는 것이 아니라 임베디드 데이터만을 학습시키기 때문에 제한된 영상의 크기(92×112)에서 특정 데이터를 받아들일 수 있으며, 평균적으로 92×112크기의 영상에서는 99.05%, 실험1은 99.05%, 실험2는 98.93%, 실험3은 98.54%, 실험4는 97.85%의 얼굴인식률을 보였다. 따라서 실험을 통하여 제안된 방법은 거리변화율을 적용하면 높은 인식률을 얻을 수 있음을 보였으며, 얼굴정보를 축소할 뿐만 아니라 처리속도도 향상되었다.

모바일 증강현실을 이용한 작업자 중심의 폐색된 건축물 시각화 시스템 개발 (Implementation of Constructor-Oriented Visualization System for Occluded Construction via Mobile Augmented-Reality)

  • 김태호;김경호;한윤상;이석한;최종수
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.55-68
    • /
    • 2014
  • 현대의 지하 시설물들은 보행자의 보행에 방해되지 않도록 지하에 매설 되어 있기 때문에 가시적인 확인이 어렵다. 이러한 폐색 시설물들을 다루는 건설현장에서는 시각적으로 위치를 정확히 추정하기 어렵기 때문에 작업자의 경험 또는 종이 도면 등에 의존하다 보니 침수나 붕괴의 위험에 노출되는 등 많은 문제점이 발생한다. 본 논문에서는 일반적인 건설 현장에서 폐색된 지하 시설물을 모바일을 이용한 작업자 중심의 시각화 시스템을 제안한다. 논문의 구성은 크게 3단계로 이루어 진다. 먼저, "맨홀 검출 및 특징점 추출 단계"에서는 폐색된 건축물의 기준점인 폐색되지 않는 맨홀을 검출 및 추출한다. 다음으로, "특징점 추적 단계" 에서는 이전단계에서 추출한 특징점을 추적한다. 마지막으로, "폐색 건축물 시각화 단계" 에서는 맨홀에 따라 서로 다른 지하시설물이 존재함으로 이전 단계에서 검출 및 추적된 맨홀의 위치에 모바일에 내장된 GPS 데이터를 분석하여 현장에 해당하는 폐색된 건축물인 3차원 객체를 정합 한다. 제안된 방법은 실내 환경에서 맨홀 검출과 특징점 추출 및 추적방법들의 비교 분석을 통해 최적의 방법을 적용하였으며, 실제 환경에서의 폐색된 상/하수도 배관 증강을 통해 가능성을 확인하였다. 또한, 폐색된 상하수도 등의 건축물의 증강된 3차원 결과들로부터 작업자 중심의 보다 유용한 건설 환경을 제공할 수 있다.