• 제목/요약/키워드: mathematical image

검색결과 490건 처리시간 0.025초

색상정보와 AdaBoost 알고리즘을 이용한 얼굴검출 (Face Detection using Color Information and AdaBoost Algorithm)

  • 나종원;강대욱;배종성
    • 한국정보통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.843-848
    • /
    • 2008
  • 얼굴 검출은 대부분 얼굴의 움직임 정보를 이용한다. 기존에 얼굴 검출 방법은 프레임간의 차를 이용하여 움직임을 검출하는 방법이 사용되어 왔으나 대부분이 실시간을 고려하지 않은 수학적 접근법을 사용하거나 알고리즘이 지나치게 복잡하여 실시간 구현에 용이하지 않았다. 본 논문에서는 실시간 얼굴검출을 위하여 감시카메라에서 입력된 RGB 영상을 YCbCr 영상으로 변환한 후 연속된 두 영상의 차를 구하고 Glassfire 라벨링을 실시했다. 라벨링 결과 가장 넓은 구역의 면적과 Area 임계치 값을 비교하여 임계값 이상의 면적이면 동작변환으로 인식하고 영상을 추출하였다. 이렇게 추출된 동작변환 영상을 대상으로 얼굴 검출을 실시하였다. 얼굴 검출에 필요한 특징을 추출하기 위해 AdaBoost 알고리즘을 사용하였다.

소수 데이터의 신경망 학습에 의한 카메라 보정 (Camera Calibration Using Neural Network with a Small Amount of Data)

  • 도용태
    • 센서학회지
    • /
    • 제28권3호
    • /
    • pp.182-186
    • /
    • 2019
  • When a camera is employed for 3D sensing, accurate camera calibration is vital as it is a prerequisite for the subsequent steps of the sensing process. Camera calibration is usually performed by complex mathematical modeling and geometric analysis. On the other contrary, data learning using an artificial neural network can establish a transformation relation between the 3D space and the 2D camera image without explicit camera modeling. However, a neural network requires a large amount of accurate data for its learning. A significantly large amount of time and work using a precise system setup is needed to collect extensive data accurately in practice. In this study, we propose a two-step neural calibration method that is effective when only a small amount of learning data is available. In the first step, the camera projection transformation matrix is determined using the limited available data. In the second step, the transformation matrix is used for generating a large amount of synthetic data, and the neural network is trained using the generated data. Results of simulation study have shown that the proposed method as valid and effective.

Classification of algae in watersheds using elastic shape

  • Tae-Young Heo;Jaehoon Kim;Min Ho Cho
    • Communications for Statistical Applications and Methods
    • /
    • 제31권3호
    • /
    • pp.309-322
    • /
    • 2024
  • Identifying algae in water is important for managing algal blooms which have great impact on drinking water supply systems. There have been various microscopic approaches developed for algae classification. Many of them are based on the morphological features of algae. However, there have seldom been mathematical frameworks for comparing the shape of algae, represented as a planar continuous curve obtained from an image. In this work, we describe a recent framework for computing shape distance between two different algae based on the elastic metric and a novel functional representation called the square root velocity function (SRVF). We further introduce statistical procedures for multiple shapes of algae including computing the sample mean, the sample covariance, and performing the principal component analysis (PCA). Based on the shape distance, we classify six algal species in watersheds experiencing algal blooms, including three cyanobacteria (Microcystis, Oscillatoria, and Anabaena), two diatoms (Fragilaria and Synedra), and one green algae (Pediastrum). We provide and compare the classification performance of various distance-based and model-based methods. We additionally compare elastic shape distance to non-elastic distance using the nearest neighbor classifiers.

회전된 객체 분류를 위한 CNN 기법들의 성능 비교 분석 (Comparative Analysis of CNN Techniques designed for Rotated Object Classifiation)

  • 한희일
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.181-187
    • /
    • 2024
  • 이미지 공간에서 무작위로 회전된 객체에 대한 분류 성능이 우수한 기법으로는 군 등변 CNN과 steerable 필터를 이용한 CNN 등이 있다. 본 논문에서는 이들의 수학적 구조를 설명하고 구현 방법을 소개한다. 기존의 CNN을 포함한 세 개의 모델에 대하여 동일한 필터 수를 갖도록 구현한 다음, 무작위로 회전된 MNIST를 이용하여 실험하고 이들의 성능을 비교분석한다. 실험 결과에 의하면 steerable CNN은 CNN보다 6.5% 이상의 인식률 향상을 보여준다. 특히, steerable CNN은 학습할 파라미터의 수가 상대적으로 적어서 훈련 데이터셋의 크기를 줄여도 성능 열화가 비교적 크지 않음을 실험 결과로 확인한다.

컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구 (Implementation of Intelligent Image Surveillance System based Context)

  • 문성룡;신성
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.11-22
    • /
    • 2010
  • 본 논문은 컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구로써 기존 연구의 시공간적 제약성 및 실시간 처리가 어려운 단점을 보완하여 초당 30 프레임으로 이루어져 있는 저해상도 동영상(320*240)을 대상으로 다양한 환경에서 실시간 처리가 가능한 움직임 검출 및 장면 분석 알고리즘을 제안하고 이를 이용해 동영상 감시 시스템을 구축한다. 먼저 장면 분석을 수행하기 위한 전처리 과정인 움직임 검출 알고리즘에서는 연속된 프레임 중 의미 없는 유사 프레임과 배경을 제거하고 움직임 영역만을 검출하기 위해 웨이브렛 변환과 에지 히스토그램을 이용하여 샷의 경계를 검출한다. 다음으로 키프레임 선정 파라미터에 의해 샷 경계 내 대표 키프레임을 선정하며, 에지 히스토그램 및 수학적 형태론을 이용하여 움직임 영역만을 검출한다. 장면 분석 알고리즘에서는 검출된 객체의 수직 수평 비율과 질량 중심을 통해 재구성된 허프 변환 후의 각도를 이용해 독립 객체 분석을 수행하며, '서다, 걷다, 눕다, 앉다'의 4가지 기본 상황 정보를 정의한다. 또한 각 상황의 연결 상태 추정을 통해 일반 상황 및 위급 상황으로 구성되는 단순 상황 모델을 정의함으로써 장면 분석을 수행하며, 제안된 알고리즘의 실시간 처리 가능성을 확인하기 위해 시스템을 구성한다. 제안된 시스템은 저해상도 영상을 대상으로 인식률 면에서 평균 92.5%의 성능을 보였으며, 처리속도는 프레임 당 평균 0.74초로 실시간 처리가 가능함을 확인하였다.

CT 영상을 이용한 감쇠 보정 시 조영제가 PET 영상에 미치는 영향 (Impact of Contrast Agent for PET Images with CT-based Attenuation Correction)

  • 손혜경;;권윤영;정해조;김희중
    • 한국의학물리학회지:의학물리
    • /
    • 제16권4호
    • /
    • pp.192-201
    • /
    • 2005
  • 본 연구에서는 PET/CT 시스템에서 CT 영상을 이용한 감쇠 보정 시 조영제가 PET 영상에 미치는 영향을 관찰하기 위해 팬텀실험과 모의실험을 수행하였다. 다양한 농도로 희석한 조영제를 채운 플라스틱 병을 스티로폼을 이용하여 전신 팬텀 내에 고정시킨 후 투과 영상을 획득하였다 모의실험을 위해 인체 기관 중간을 가진 수학적 방출 맵과 투과 맵을 각각 생성하였다. 조영제의 비균일 증강, 조영제의 다양한 농도 및 분포 크기, 잡음 정도, 영상의 해상도, 재구성 알고리듬, 조영제의 저-감쇠, 그리고 각각 다른 시간상에 대한 조영제의 분포의 차이와 같은 다양한 인자들에 대하여 평가하였다. 팬텀실험으로부터 CT의 Hounsfield 값이 조영제의 농도 및 전압 값에 의존함을 확인할 수 있었다. 모의실험으로부터 조영제가 감쇠 보정한 PET 영상에서 인공산물을 생성하고 영상의 질을 떨어뜨리는 것을 관찰할 수 있었다. 조영제의 영향은 조영제의 농도 및 분포 크기, 잡음 정도, 영상의 해상도 등에 의해 영향을 받는 것으로 나타났다. 본 연구 결과들은 임상적 PET/CT 영상에서 조영제로 인해 발생할 수 있는 잠재적 문제를 충분히 이해하고 이를 고려해야 함을 보여 주었다.

  • PDF

비공학도를 위한 X-ray 영상촬영 시스템 해상력 평가 방법 (An Evaluation Method of X-ray Imaging System Resolution for Non-Engineers)

  • 우정은;이용금;배석환;김용권
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제35권4호
    • /
    • pp.309-314
    • /
    • 2012
  • Digital Radiography(DR) 시스템은 임상현장에서 아날로그 시스템을 대체하고 널리 이용되고 있다. DR을 이용하여 얻어진 X선 영상의 해상력을 결정짓는 요소에는 이용되는 검출기의 고유 해상력, 피사체의 대조도 및 특성, X선 선질, X선원의 산란, DR 검출기의 성능, X선 변환효율 및 초점의 크기, 피사체의 움직임 등이 있다. DR 검출기를 구성하는 요소에는 X선 포획 요소, 커플링 요소, 정보수집 요소가 있는데 이들은 시스템의 성능에 영향을 미치며, 그 성능은 해상력으로 평가된다. 의료영상 시스템의 해상력은 촬영대상물의 조직 간의 해부학적 영상을 구분하는 능력을 나타낸다. 해상력 평가를 위해 Modulation Transfer Function(MTF)이 보편적으로 이용되고, MTF는 입력 공간주파수 성분에 대한 출력 공간주파수 성분의 비를 나타내는데, 수학적으로 MTF는 Point Spread Function(PSF) 입력에 대한 시스템의 주파수 응답이며 Edge Phantom을 이용한 결과 영상에서 추출된 Line Spread Function(LSF)을 Fourier Transform하면 얻을 수 있다. 일반적으로 임상현장에서 의료영상시스템의 이용 및 관리의 책임은 방사선사가 맡고 있지만, MTF를 측정하기 위해서는 공학적, 수학적 기초 및 C, Fortran, Matlab등의 프로그램 작성 능력이 필요하기 때문에 비 공학도는 정확한 측정이 불가능하다. 의료영상 시스템의 성능 관리 및 최상의 상태를 유지하기 위해 시스템의 성능평가가 이뤄져야 하는데, 이를 위해 본 연구에서는 비공학도가 해상력 성능평가를 할수 있도록 ImageJ 및 Excel을 이용하여 해상력 평가를 할 수 있도록 방법을 제시하고, 제안된 방법을 이용해 계산된 결과와 프로그래밍을 이용해 계산된 결과의 비교를 통해 본 논문에서 제시하는 방법의 유용성을 확인하였다.

수식을 포함한 전자문헌의 구조적 처리를 위한 XML 문서편집시스템 (XML Document Editing System for Structural Processing of the Digital Document to Including Mathematical Formula)

  • 윤화묵;유범종;김창수;정회경
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.96-111
    • /
    • 2002
  • 현재 기관이나 조직 내에 수많은 양의 데이터가 축적되어 존재하고 있으나 대부분의 데이터는 각 기관이나 조직에 따라 정형화된 형태로 남아있는 실정이다. 정형화된 정보는 정보의 교환 및 공유에 어려움이 있다. 이러한 단점을 극복하고자 지식정보자원관리라는 새로운 개념이 도입되었으며, 축적된 데이터들을 공유 및 관리하기 위한 지식정보자원의 디지털화가 실행되고 있다. 특히 과학기술 또는 교육학술 분야에서는 지식정보자원의 교환 및 공유에 필요한 데이터를 구조적으로 처리하고자 XML을 도입하려는 움직임이 일고 있으며, 이들 분야의 전자문서 안에 사용되어지는 수많은 수학식의 표현이 이미지나 텍스트 등의 비구조적인 데이터로 처리됨에 따라 검색과 인덱싱 또는 재사용성 등의 제한사항이 발생하게 된다. 이를 극복하고자 MathML을 이용한 수학식의 처리에 관심이 집중되고, MathML을 구조적인 문서상에 쉽고 효율적으로 처리할 수 있는 솔루션이 요구되고 있는 실정이다. 이에 본 논문에서는 지식정보자원을 목적으로 하는 전자문서의 구조적인 처리를 용이하게 하고, MathML에 대한 전문적인 지식이 없어도 구조적인 문서상에 쉽게 MathML을 생성 및 표현할 수 있는 XML 문서 편집 시스템을 구현하였다.

형태학적 정규화 패턴 스펙트럼을 이용한 질감영상 분류 (Classification of Scaled Textured Images Using Normalized Pattern Spectrum Based on Mathematical Morphology)

  • 송근원;김기석;도경훈;하영호
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.116-127
    • /
    • 1996
  • 본 논문에서는 일반적인 환경인 카메라의 줌 기능(zoom-in, zoom-out)에 의해 임의로 크기 변화된 질감 영상들을, 크기변화에 무관한 형태학적 정규화(normalized) 패턴 스펙트럼에 기반하여 분류하였다. 정규화 패턴 스펙트럼은 질감영상으로부터 형태학적 패턴 스펙트럼을 구하고 이로부터 크기변화 성분을 구한 다음 크기 변화비에 따른 선형보간을 하여 같은 부류의 질감영상내에서 크기변화를 통합함을 뜻한다. 본 논문에서는 패턴 스펙트럼을 구할 때 기존의 방법과 달리 영상의 문턱값을 중심으로 두 부분으로 계산하였다. 즉 문턱값 이상을 가지는 화소들에 대해서는 opening방법으로 패턴 스펙트럼을 구하였고 문턱값 미만을 가지는 화소들에 대해서는 closing방법으로 패턴 스펙트럼을 구하여 효과적인 정보추출을 하였다. 또 본 논문에서는 각각 명암도 방법과 이진 방법에 대한 분류 정확도를 비교 검토하였다. 제안된 방법은 효과적인 정보추출, 높은 분류 정확도, 계산량 감소, 및 병렬처리 구현등의 여러 가지 장점이 있다. 특히 제안된 방법은 질감영상 학습단계에서 최근의 방법들과는 달리 다양하게 크기변환된 질감영상들을 사용하지 않고, 즉 기준크기(1:1) 질감영상만을 사용하였음에도 불구하고 높은 분류 정확도를 얻을 수 있었다.

  • PDF

수학자 테일러의 선 원근법과 화가 커비의 해설서 (Mathematician Taylor's Linear Perspective Theory and Painter Kirby's Handbook)

  • 조은정
    • 미술이론과 현장
    • /
    • 제7호
    • /
    • pp.165-188
    • /
    • 2009
  • In the development of linear perspective, Brook Taylor's theory has achieved a special position. With his method described in Linear Perspective(1715) and New Principles of Linear Perspective(1719), the subject of linear perspective became a generalized and abstract theory rather than a practical method for painters. He is known to be the first who used the term 'vanishing point'. Although a similar concept has been used form the early stage of Renaissance linear perspective, he developed a new method of British perspective technique of measure points based on the concept of 'vanishing points'. In the 15th and 16th century linear perspective, pictorial space is considered as independent space detached from the outer world. Albertian method of linear perspective is to construct a pavement on the picture in accordance with the centric point where the centric ray of the visual pyramid strikes the picture plane. Comparison to this traditional method, Taylor established the concent of a vanishing point (and a vanishing line), namely, the point (and the line) where a line (and a plane) through the eye point parallel to the considered line (and the plane) meets the picture plane. In the traditional situation like in Albertian method, the picture plane was assumed to be vertical and the center of the picture usually corresponded with the vanishing point. On the other hand, Taylor emphasized the role of vanishing points, and as a result, his method entered the domain of projective geometry rather than Euclidean geometry. For Taylor's theory was highly abstract and difficult to apply for the practitioners, there appeared many perspective treatises based on his theory in England since 1740s. Joshua Kirby's Dr. Brook Taylor's Method of Perspective Made Easy, Both in Theory and Practice(1754) was one of the most popular treatises among these posterior writings. As a well-known painter of the 18th century English society and perspective professor of the St. Martin's Lane Academy, Kirby tried to bridge the gap between the practice of the artists and the mathematical theory of Taylor. Trying to ease the common readers into Taylor's method, Kirby somehow abbreviated and even omitted several crucial parts of Taylor's ideas, especially concerning to the inverse problems of perspective projection. Taylor's theory and Kirby's handbook reveal us that the development of linear perspective in European society entered a transitional phase in the 18th century. In the European tradition, linear perspective means a representational system to indicated the three-dimensional nature of space and the image of objects on the two-dimensional surface, using the central projection method. However, Taylor and following scholars converted linear perspective as a complete mathematical and abstract theory. Such a development was also due to concern and interest of contemporary artists toward new visions of infinite space and kaleidoscopic phenomena of visual perception.

  • PDF