• Title/Summary/Keyword: Image Normalization

검색결과 246건 처리시간 0.022초

Hausdorff와 LBP 거리의 융합을 이용한 개선된 얼굴검출 (An Improved Face Detection Method Using a Hybrid of Hausdorff and LBP Distance)

  • 박성천;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.67-73
    • /
    • 2010
  • 본 논문에서는 두 점의 집합들 사이의 기하학적 유사도에 근거한 Hausdorff 거리와 국지적 미세 텍스처의 분포에 근거한 Local Binary Pattern 거리가 융합된 새로운 측도를 도입함으로써 얼굴검출의 정확도를 높이는 방법을 제안하고 있다. 트레이닝 데이터를 이용해서 두 가지의 상이한 측도들을 정규화할 수 있는 매개변수와 최적화된 융합 비율을 찾는 방법을 보였다. 흔히 사용되는 얼굴 데이터베이스에 적용함으로써 제시된 방법이 두 가지 방법 각각을 이용한 방법보다 효과적이고 얼굴의 자세, 조명, 배경의 변화에 강인함을 보였다. 실험에서 사용된 데이터베이스의 경우 실제 얼굴의 위치와 검출된 얼굴의 위치 간의 평균거리오차가 LBP 방식의 47.9%, Hausdorff 방식의 22.8% 로 감소됨을 보였다.

Hyperspectral Imaging and Partial Least Square Discriminant Analysis for Geographical Origin Discrimination of White Rice

  • Mo, Changyeun;Lim, Jongguk;Kwon, Sung Won;Lim, Dong Kyu;Kim, Moon S.;Kim, Giyoung;Kang, Jungsook;Kwon, Kyung-Do;Cho, Byoung-Kwan
    • Journal of Biosystems Engineering
    • /
    • 제42권4호
    • /
    • pp.293-300
    • /
    • 2017
  • Purpose: This study aims to propose a method for fast geographical origin discrimination between domestic and imported rice using a visible/near-infrared (VNIR) hyperspectral imaging technique. Methods: Hyperspectral reflectance images of South Korean and Chinese rice samples were obtained in the range of 400 nm to 1000 nm. Partial least square discriminant analysis (PLS-DA) models were developed and applied to the acquired images to determine the geographical origin of the rice samples. Results: The optimal pixel dimensions and spectral pretreatment conditions for the hyperspectral images were identified to improve the discrimination accuracy. The results revealed that the highest accuracy was achieved when the hyperspectral image's pixel dimension was $3.0mm{\times}3.0mm$. Furthermore, the geographical origin discrimination models achieved a discrimination accuracy of over 99.99% upon application of a first-order derivative, second-order derivative, maximum normalization, or baseline pretreatment. Conclusions: The results demonstrated that the VNIR hyperspectral imaging technique can be used to discriminate geographical origins of rice.

얼굴 표정의 자동 인식을 통한 PDA 상에서의 3차원 얼굴 애니메이션 (3-D Facial Animation on the PDA via Automatic Facial Expression Recognition)

  • 이돈수;최수미;김해광;김용국
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.795-802
    • /
    • 2005
  • 본 논문에서는 일곱 가지의 기본적인 감정 정보를 자동으로 파악하고 얼굴을 PDA 상에서 렌더링할 수 있는 얼굴 표정의 인식 및 합성 시스템을 제시한다. 얼굴 표정 인식을 위해서 먼저 카메라로부터 획득한 영상으로부터 얼굴 부분을 검출한다. 그리고 나서 기하학적 또는 조명으로 인한 보정을 위해 정규화 과정을 거친다. 얼굴 표정을 분류하기 위해서는 Gabor wavelets 방법을 enhanced Fisher 모델과 결합하여 사용할 때가 가장 좋은 결과를 보였다. 본 표정 분류에서는 일곱 가지 감정 가중치가 결과로 제시되고, 그러한 가중 정보는 모바일 네트웍을 통하여PDA 상으로 전송되어 얼굴 표정 애니메이션에 이용되어진다. 또한 본 논문에서는 고유한 얼굴 캐릭터를 가진 3차워 아바타를 생성하기 위하여 카툰 쉐이딩 기법을 채택하였다. 실험 결과 감정 곡선을 이용한 얼굴 표정 애니메이션은 선형 보간법 보다 감정 변화의 타이밍을 표현하는데 더 효과적인 것으로 나타났다.

다중 애플리케이션 처리를 위한 경량 인공지능 하드웨어 기반 통합 프레임워크 연구 (A Study of Unified Framework with Light Weight Artificial Intelligence Hardware for Broad range of Applications)

  • 전석훈;이재학;한지수;김병수
    • 한국전자통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.969-976
    • /
    • 2019
  • 경량 인공지능 하드웨어는 다양한 문제의 해결을 위해 멀티모달 센서 데이터를 입력받아 특징 선택, 추출, 차원축소, 정규화 과정을 수행한 후 인공지능 엔진으로 예측 결과를 도출한다. 다양한 애플리케이션에서 높은 성능을 달성하기 위해서는 이러한 경량 인공지능 하드웨어의 초 매개변수와 전체적인 전처리 시스템의 구성을 데이터에 맞춰 최적화할 필요가 있다. 본 논문에서는 경량 인공지능 하드웨어의 효율적인 제어 및 최적화를 위한 통합 프레임워크를 제안한다. 제안된 통합 프레임워크는 데이터 전처리 및 뉴로모픽 기반 경량 인공지능 엔진을 유연하게 재구성할 수 있으며, 최적의 모델을 생성할 수 있다. 기능검증을 위해 손글씨 이미지 데이터 세트와 관성 센서 데이터 기반의 낙상 검출 데이터 세트를 사용하였으며, 실험 결과 제안하는 통합 프레임워크가 각각의 데이터 세트에서 90% 이상의 정확도를 갖는 최적의 모델을 생성함을 확인하였다.

생활패턴 인지가 가능한 스마트 레이더 시스템 (Smart Radar System for Life Pattern Recognition)

  • 정상중
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.91-96
    • /
    • 2022
  • 현재 카메라 기반 기술 수준으로는 센서 기반 기본 생활패턴 인지 기술은 정확한 데이터를 얻기 위해서는 불편함을 감수해야 하고, 상용화 밴드 제품은 정확한 데이터 수집이 어려우며, 행동의 동기와 원인 및 심리적 영향 등을 고려하지 못하는 실정이다. 본 논문에서는 생활패턴 인지를 위한 레이더 기술은 일상생활에서 주변의 사람이나 물체를 탐지하기 위해 고안된 파형을 전송하여 반사되어 오는 수신 신호를 신호 처리함으로써 물체와의 거리, 속도, 각도를 측정하는 기술을 적용하여 기존 영상 기반의 서비스에서의 사생활 보호와 같은 이슈를 보완할 수 있도록 고안하였다. 제안 시스템의 구현을 위해 TIIWR1642 칩을 기반으로 60GHz 대역 밀리미터파 FMCW 송신/수신을 위한 RF 칩셋제어, 거리/속도/각도 검출을 위한 모듈의 개발 및 신호처리 소프트웨어를 포함한 기술을 구현하였다. 생활 정보에 대한 메타 분석으로 생활패턴의 정량적 분석을 통해 개인별 맞춤형 생활패턴 추출을 통해 자기 관리 및 행동 시퀀스를 산출하여 개인별 생활패턴의 분석이 보안 및 안전 응용서비스로 가능할 것으로 기대된다.

A Novel, Deep Learning-Based, Automatic Photometric Analysis Software for Breast Aesthetic Scoring

  • Joseph Kyu-hyung Park;Seungchul Baek;Chan Yeong Heo;Jae Hoon Jeong;Yujin Myung
    • Archives of Plastic Surgery
    • /
    • 제51권1호
    • /
    • pp.30-35
    • /
    • 2024
  • Background Breast aesthetics evaluation often relies on subjective assessments, leading to the need for objective, automated tools. We developed the Seoul Breast Esthetic Scoring Tool (S-BEST), a photometric analysis software that utilizes a DenseNet-264 deep learning model to automatically evaluate breast landmarks and asymmetry indices. Methods S-BEST was trained on a dataset of frontal breast photographs annotated with 30 specific landmarks, divided into an 80-20 training-validation split. The software requires the distances of sternal notch to nipple or nipple-to-nipple as input and performs image preprocessing steps, including ratio correction and 8-bit normalization. Breast asymmetry indices and centimeter-based measurements are provided as the output. The accuracy of S-BEST was validated using a paired t-test and Bland-Altman plots, comparing its measurements to those obtained from physical examinations of 100 females diagnosed with breast cancer. Results S-BEST demonstrated high accuracy in automatic landmark localization, with most distances showing no statistically significant difference compared with physical measurements. However, the nipple to inframammary fold distance showed a significant bias, with a coefficient of determination ranging from 0.3787 to 0.4234 for the left and right sides, respectively. Conclusion S-BEST provides a fast, reliable, and automated approach for breast aesthetic evaluation based on 2D frontal photographs. While limited by its inability to capture volumetric attributes or multiple viewpoints, it serves as an accessible tool for both clinical and research applications.

뇌 PET과 MR 영상의 자동화된 3차원적 합성기법 개발 (Development of an Automatic 3D Coregistration Technique of Brain PET and MR Images)

  • 이재성;곽철은;이동수;정준기;이명철;박광석
    • 대한핵의학회지
    • /
    • 제32권5호
    • /
    • pp.414-424
    • /
    • 1998
  • 목적: PET과 MR 영상을 체계적으로 합성i분석하여 각각의 영상기법이 갖는 단점을 보완하고 기능을 향상시킴으로써 보다 정확하고 유용한 임상정보를 얻을 수 있다. 두 영상을 공간적으로 합성하기 위해서 머리 표피 경계점들 간의 거리를 최소화하는 알고리즘을 이용할 경우 경계점 추출의 정확성 및 견실성과 거리 계산 속도가 합성 알고리즘의 성능을 결정하는 중요한 요소가 된다. 본 연구에서는 PET 영상의 경계 추출과 거리 계산 방법을 개선하고 이를 이용하여 PET과 MR 영상을 3차원적으로 합성하였다. 대상 및 방법: 공간적인 합성을 위한 영상처리기법의 핵심인 경계점 추출을 위해 PET영상에서는 방출스캔 sinogram의 경계를 강조한 후 재구성한 횡단면으로부터 2 mm 간격으로 머리 표피 경계점들을 추출하였으며 MR 영상에서는 각 횡단면마다 약 2도 간격으로 경계점들을 추출하였다. 두 영상의 모든 경계점들 간의 평균 유클리디안 거리를 최소화하는 3차원 가상공간 상에서의 위치 이동과 회전 각도를 최소자승법을 이용하여 구한 후 PET영상을 역 전환하여 위치 정합을 하였다. 평균 거리의 계산 속도를 향상시키기 위하여 고정된 대상의 각 경계점을 중심으로 하여 주변 공간 정들에서의 거리를 순차적으로 계산하고 이들의 최소값을 취하는 방법으로 거리지도를 구성하였으며 최소자승법에서 경계점들 간의 위치가 변할 때마다 매번 평균거리를 다시 계산하지 않고 거리지도를 참조하여 평균 거리를 산출하는 방법을 사용하였다. 위치 정합된 두 영상의 동시 표현을 위하여 PET 영상의 화소값에 $0.4{\sim}0.7$부터 1사이의 범위로 정규화된 MR 영상의 화소 값으로 가중치를 주는 가중정규화 방법을 사용하였다. 결과: 방출스캔의 sinogram을 이용함으로써 PET영상의 경계를 견실하게 추출할 수 있었으며, 거리지도를 이용하여 거리 계산을 한 결과 계산 속도를 향상시킬 수 있었다. 정상인의 뇌영상에 대해 위치 정합을 실시한 결과 평균 거리 오차는 2mm 이하였다. 가중정규화 방법을 사용하였을 때 합성된 영상의 정성적인 식별 명확도가 향상하였다. 결론: 견실한 PET 영상 경계점 추출과 거리지도를 이용한 계산 속도의 향상을 통해 뇌 PET과 MR 영상 합성기법의 성능을 개선할 수 있었으며 이를 이용하며 개발한 영상정합 프로그램은 임상 환경에서 유용하게 사용될 수 있을 것이다.

  • PDF

가사 텍스트의 감성분석에 기반 한 음악 시각화 콘텐츠 개발 (Development of the Artwork using Music Visualization based on Sentiment Analysis of Lyrics)

  • 김혜란
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.89-99
    • /
    • 2020
  • 본 연구에서는 음악 가사의 감성분석을 통한 영상작품의 제작을 시도하였다. 가사 텍스트의 감성분석에는 구글(Google)의 자연어 처리 API를 활용하였고 그 결과를 영상 시각화 규칙과 연결하였다. 기존의 공학적 연구들에서의 텍스트 기반 감성분석은 소셜 미디어에서의 사용자 댓글과 리뷰를 분석해서 사용자들의 감정과 태도를 이해하도록 하는 연구들이 많았다. 본 연구에서는 감성분석 데이터가 예술작품 창작의 재료가 되어 심미적 표현에 활용될 수 있도록 하였다. 기계의 관점에서 볼 때 감정은 숫자로 치환되어 나타나므로 규격화, 표준화 될 수밖에 없다는 한계점이 있다. 이에 가사 데이터의 감성분석 결과를 시각예술에서의 조형요소들의 규칙과 연결하여 이러한 한계를 일부 극복해보자 하였다. 본 연구는 인공지능이 인간의 고도화 된 정신적 산물인 예술작품의 창작까지 시도하는 현 시대를 반영하며 문학, 음악, 회화, 무용 등 기존의 전통적인 예술작품을 기계를 통해 바라본 새로운 형태의 예술작품으로 만들어 보고자 하는 목표를 가지고 있다. 더불어 감정표현에 어려움을 겪는 발달 장애인들의 창작활동과 심리분석 및 의사소통을 용이하게 해주는 예술창작 및 교육 플랫폼으로 확장되기를 기대한다.

딥러닝 모델을 이용한 항공정사영상의 비닐하우스 탐지 (Detection of Plastic Greenhouses by Using Deep Learning Model for Aerial Orthoimages)

  • 윤병현;성선경;최재완
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.183-192
    • /
    • 2023
  • 위성영상 및 항공사진과 같은 원격탐사 자료들은 영상판독과 영상처리 기법을 통하여 영상 내의 객체를 탐지하고 추출하는 데에 사용될 수 있다. 특히, 원격탐사 자료의 해상도가 향상되고, 딥러닝(deep learning) 모델 등과 같은 기술의 발전으로 인하여 관심객체를 자동으로 추출하여 지도갱신 및 지형 모니터링 등에 활용될 수 있는 가능성이 증대되고 있다. 이를 위해, 본 연구에서는 의미론적 분할에 사용되는 대표적인 딥러닝 모델인 fully convolutional densely connected convolutional network (FC-DenseNet)을 기반으로 하여 항공정사영상 내 존재하는 비닐하우스를 추출하고, 이에 대한 결과를 정량적으로 평가하였다. 농림축산식품부의 팜맵(farm map)을 이용하여 담양, 밀양지역의 비닐하우스에 대한 레이블링을 수행하여 훈련자료를 생성하고, 훈련자료를 이용하여 FC-DenseNet의 훈련을 수행하였다. 원격탐사자료에 딥러닝 모델을 효과적으로 이용하기 위하여, 각 밴드별 특성이 유지되도록 instance norm을 이용하여 정규화과정을 수행하였으며, attention module을 추가하여 각 밴드별 가중치를 효과적으로 산정하였다. 실험결과, 딥러닝 모델을 이용하여 영상 내 존재하는 비닐하우스 지역을 효과적으로 추출할 수 있음을 확인하였으며 팜맵, 토지피복지도 등의 갱신에 활용될 수 있을 것으로 판단하였다.

주성분분석을 이용한 C[11]-PIB imaging 영상분석 (Principal component analysis in C[11]-PIB imaging)

  • 김남범;신귀순;안성민
    • 핵의학기술
    • /
    • 제19권1호
    • /
    • pp.12-16
    • /
    • 2015
  • 주성분분석(Principal component analysis, PCA)은 고차원 변수들 사이의 복잡한 상관성 구조를 더 낮은 차원으로 단순화하여 상관성의 구조를 쉽게 설명하기 위한 다변량분석기법으로 뇌영상 분석에서 자주 사용되는 방법이다. 주성분분석의 기본개념은 서로 직교하는 변수들의 선형결합을 통해서 원래의 뇌영상 자료가 가지고 있는 전체정보를 최대한 설명할 수 있는 서로 독립적인 새로운 변수들을 유도하는 것이다. 뇌영상분석에서 주성분분석의 효율성과 유용성을 알아보기 위해서 C[11]-PIB 영상을 이용하여 분석하였다. 대상 및 방법으로는 평균나이가 같은 9명의 정상인, 10명의 알츠하이머/경도인지장애환자들의 C[11]-PIB 영상을 이용하였다. PET-CT 장비로는 Biograph 6 Hi-Rez (Siemens-CTI, Knoxville, TN)를 영상을 획득하였고 9.6 MBq/kg C[11]-PIB를 정맥주사 한 후 40분 후에 20분 동안 3D acquisition mode로 방출영상을 얻었다. Attenuation map은 X-ray CT scan을 이용하여 재구성하였다(130 kVp, 240 mA). PIB template을 만들기 위해서 정상인에서 3T MRI T1-weighted 영상을 동시에 얻었다. 주성분분석을 위한전처리과정으로서 공간정규화 및 공간편평화를 SPM8을 이용하여 실시하였고 주성분분석은 Matlab2012b를 이용하여 분석하다. 결과는 주성분분석을 통해서 서로 독립적인 주성분영상들을 얻을 수 있었다. 주성분분석을 통해서 얻어진주성분영상은 C[11]-PIB brain PET 영상의 패턴을 몇 개의 주성분으로 단순화 할 수 있었으며 주로는 neocortex를 변동 나타내는 영상, white matter의 변동을 나타내는 영상 그리고 pons등 deep brain의 변동을 나타내는 영상 등으로 단순화되었다. 결론으로는 주성분분석은 C[11]-PIB brain 영상을 단순화하여 영상의 패턴을 해석하는데 매우 유용하였다. 이러한 주성분분석은C[11]-PIB영상 분석뿐만 아니라 뇌의 포도당 대사를 측정하는 FDG-PET 또는 뇌기능영상등의 다변량분석 방법으로서 그 적용범위가 클 것으로 기대된다.

  • PDF