• 제목/요약/키워드: 영역 히스토그램

검색결과 586건 처리시간 0.023초

문자 인식 향상을 위한 회전 정렬 알고리즘에 관한 연구 (A Study on Rotational Alignment Algorithm for Improving Character Recognition)

  • 진고환
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.79-84
    • /
    • 2019
  • 영상을 기반으로 하는 기술들의 지속적인 발전으로 다양한 분야에서 활용되고 있고, 카메라를 통하여 획득한 영상의 객체를 분석하고 판별하는 비전 시스템의 기술 수요가 급속하게 증가하고 있다. 비전 시스템의 핵심 기술인 영상처리는 반도체 생산 분야의 불량 검사, 타이어 표면의 숫자 및 심볼과 같은 객체 인식 검사 등에 사용되고 있고, 자동차 번호판 인식 등의 연구가 계속하여 이루어지고 있는 실정으로, 객체를 신속, 정확하게 인식할 필요가 있다. 본 논문에서는 곡면과 같은 곳에 마킹되어 있는 숫자나 심볼과 같이 기울어진 객체를 인식하기 위하여 입력된 영상 이미지의 객체 기울기에 대한 각도 값을 확인하여 객체의 회전 정렬을 통한 인식 모델을 제안한다. 제안 모델은 컨투어 알고리즘을 기반으로 객체 영역을 추출하고, 객체의 각도를 산출한 후, 회전 정렬된 이미지에 대한 객체 인식을 진행할 수 있는 모델이다. 향후 연구에서는 기계학습을 통한 탬플릿 매칭 연구가 필요하다.

GAN을 이용한 흑백영상과 위성 SAR 영상간의 모의 및 컬러화 (Simulation and Colorization between Gray-scale Images and Satellite SAR Images Using GAN)

  • 조수민;허준혁;어양담
    • 대한토목학회논문집
    • /
    • 제44권1호
    • /
    • pp.125-132
    • /
    • 2024
  • 광학 위성영상은 국가 보안 및 정보 획득을 목적으로 사용되며 그 활용성은 증가하고 있다. 그러나, 기상 조건 및 시간의 제약으로 사용자의 요구에 적합하지 않은 저품질의 영상을 획득하게 된다. 본 논문에서는 광학 위성영상의 구름 폐색영역을 모의하기 위하여 고해상도 SAR 영상을 참조한 딥러닝 기반의 영상변환 및 컬러화 모델을 생성하였다. 해당 모델은 적용 알고리즘 및 입력 데이터 형태에 따라 실험하였으며 생성된 모의영상을 비교 분석하였다. 특히 입력하는 흑백영상과 SAR 영상간의 화소값 정보량이 유사하도록 하여 상대적으로 색상정보량 부족에서 오는 문제점을 개선하였다. 실험 결과, Gray-scale 영상과 고해상도 SAR 영상으로 학습한 모의영상의 히스토그램 분포가 비교적 원 영상과 유사하였고, 정량적인 분석을 위하여 산정한 RMSE 값은 약 6.9827, PSNR 값은 약 31.3960으로 나타났다.

국부지역 이진 패턴 분석법에 기초한 단락 및 돌기형 FAB불량 검출기법 (A Method of Detecting Short and Protrusion-type FAB Defects Based on Local Binary Pattern Analysis)

  • 김진수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.1018-1020
    • /
    • 2013
  • PCB 제작 분야에서 TCP와 COF에서는 전기적인 특성검사만으로 자동화를 이루어지고 있으며, 실제 단락 및 돌기(근사단락) 형태의 데이터 불량 등에 대해서는 노동력을 동원해 불량을 검출하고 있는 실정이다. 본 논문에서는 영상처리에 의해 국부지역패턴 분석법에 기초한 검출기법을 제안한다. 제안한 방법은 히스토그램보정, 공간위치보정 및 최대왜곡좌표를 구하는 전처리 과정을 포함하여, 지역기반의 패턴분석법이 적용된다. 모의실험을 통하여 제안한 방식은 기존의 영역기반의 검출기법에 비해 성능이 개방 및 근사개방 결함 검출에서 크게 성능을 개선할 수 있음을 보인다.

  • PDF

입체 화상의 3차원 전산모사기 구현에 관한 연구 (A Study on the 3-Dimensional Implementation of Computer-Aid Management of Stereo Images)

  • 이중;윤도영
    • Korean Chemical Engineering Research
    • /
    • 제47권2호
    • /
    • pp.179-184
    • /
    • 2009
  • 최근 전산기술의 발전으로 난류를 비롯한 3차원의 복잡한 전달현상에 대한 전산유체역학(CFD) 해석의 실효성이 제고되고 있다. 본 연구에서는 초음파나 레이저를 이용한 방법보다 저렴하고, 간편하게 좌, 우 입체 화상으로 추출된 입체화상의 변위히스토그램을 이용하여 3차원 화상을 구현하기 위한 윈도우환경하의 모사기 CAMSI(Computer-Aided Management of Stereo Images)를 개발하였다. 본 프로그램에서는 영역기반 방법이 적용되었으며, 좌우 화상의 정합시 대응점을 결정하기 위하여 제곱차거리합계(SSD), 절대거리차합계(SAD), 평균상관계수(NCC)와 동일점세기(MPC)의 방법들이 각각 적용되었다. 구현된 프로그램은 다양한 윈도우 크기와 한계값에 대하여 우수한 해석능력을 보여주었다. 특히, 화상의 잡영이 적은 곳에서는 작은 윈도우 크기의 SSD가 좀더 정확성이 높은 것으로 나타났으며, 일반적으로는 NCC가, 그리고 잡영이 매우 심한 경우에는 MPC 또는 NCC가 SSD보다는 정확성이 높게 나타났다. 본 연구를 통해 구현된 CAMSI는 복잡한 물체의 구현 또는 그 주변에서 다양한 전달현상의 3차원 CFD 해석에 효과적으로 사용될 수 있을 것이다.

최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 알고리즘 설계 (Design of Optimized pRBFNNs-based Face Recognition Algorithm Using Two-dimensional Image and ASM Algorithm)

  • 오성권;마창민;유성훈
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.749-754
    • /
    • 2011
  • 본 연구에서는 최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 시스템을 설계하고자 한다. 기존의 2차원 영상 기반 얼굴 인식 기법들은 인식하고자 하는 객체의 영상내의 위치, 크기 및 배경의 존재 유무에 따라 인식률이 영향을 받는 단점이 있으며, 본 연구에서는 이를 보완하기 위하여 관심 영역 내에서의 얼굴 영역 추출 및 특징 추출기법을 이용한 얼굴인식 방법을 소개한다. 본 연구에서는 CCD 카메라를 이용하여 영상을 획득하고 히스토그램 평활화를 이용하여 조명으로 왜곡된 영상정보를 개선한다. AdaBoost 알고리즘을 이용하여 얼굴영역을 검출하고 ASM을 통하여 얼굴 윤곽선 및 형상을 추출하여 개인 프로필을 구성한 후 PCA 알고리즘을 사용하여 고차원 얼굴데이터의 차원을 축소한다. 그리고 인식 모듈로서 pRBFNNs 패턴분류기를 제안한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 구성되어 있고 조건부는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉, 학습률, 모멘텀 계수, 퍼지 클러스터링의 퍼지화 계수를 최적화한다. 제안된 다항식 기반 RBFNNs는 얼굴 인식을 위한 패턴분류기로서 직접 CCD 카메라로부터 입력받은 데이터를 영상 보정, 얼굴 검출 및 특징 추출 등과 같은 데이터 전 처리 과정을 포함하여 고차원 데이터로 이루어진 얼굴 영상에 대한 인식 성능을 확인한다.

스마트폰에서 웃음 치료를 위한 표정인식 애플리케이션 개발 (Development of Recognition Application of Facial Expression for Laughter Theraphy on Smartphone)

  • 강선경;이옥걸;송원창;김영운;정성태
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.494-503
    • /
    • 2011
  • 본 논문에서는 스마트폰에서 웃음 치료를 위한 표정인식 애플리케이션을 제안한다. 제안된 방법에서는 스마트폰의 전면 카메라 영상으로부터 AdaBoost 얼굴 검출 알고리즘을 이용하여 얼굴을 검출한다. 얼굴을 검출한 다음에는 얼굴 영상으로부터 입술 영역을 검출한다. 그 다음 프레임부터는 얼굴을 검출하지 않고 이전 프레임에서 검출된 입술영역을 3단계 블록 매칭 기법을 이용하여 추적한다. 카메라와 얼굴 사이의 거리에 따라 입술 영역의 크기가 달라지므로, 입술 영역을 구한 다음에는 고정된 크기로 정규화한다. 그리고 주변 조명 상태에 따라 영상이 달라지므로, 본 논문에서는 히스토그램 매칭과 좌우대칭을 결합하는 조명 정규화 알고리즘을 이용하여 조명 보정 전처리를 함으로써 조명에 의한 영향을 줄일 수 있도록 하였다. 그 다음에는 검출된 입술 영상에 주성분 분석을 적용하여 특징 벡터를 추출하고 다층퍼셉트론 인공신경망을 이용하여 실시간으로 웃음 표정을 인식한다. 스마트폰을 이용하여 실험한 결과, 제안된 방법은 초당 16.7프레임을 처리할 수 있어서 실시간으로 동작 가능하였고 인식률 실험에서도 기존의 조명 정규화 방법보다 개선된 성능을 보였다.

대응점 및 히스토그램을 이용한 영상 간의 컬러 차이 측정 기법 (Method of Measuring Color Difference Between Images using Corresponding Points and Histograms)

  • 황영배;김제우;최병호
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.305-315
    • /
    • 2012
  • 두 카메라 혹은 다수의 카메라에서의 컬러 보정은 이후 알고리즘의 성능 향상 및 양안식 3D 카메라에서 매우 중요한 기술이다. 최근 컬러 보정 방법들이 다수 제안되었지만 이 방법들의 결과에 대한 정확한 측정 방법이 많지 않으며 기존의 측정 방법은 두 영상이 카메라의 위치에 따른 서로 다른 장면을 가지고 있을 경우 적합하지 않을 수 있다. 본 논문에서는 컬러 보정을 위한 컬러 간의 차이 측정 기법을 제안한다. 이 기법은 대상이 되는 두 영상의 장면이 일치하지 않는 경우를 고려하여 대응점 검색을 통해 두 장면간의 같은 컬러를 가져야 하는 대응점을 찾고 이 대응점 주위의 영역으로부터 통계치를 계산하여 컬러의 차이를 계산한다. 이 경우 두 영상의 위치 변화를 하나의 기하학적 변환으로 설명하는 기존 방법에서 생길 수 있는 대응점간의 불일치를 고려할 수 있다. 또한 대응점들이 영상의 모든 영역을 포함하지 않을 수 있기 때문에 전체 영상의 통계치를 계산하여 컬러의 차이를 측정한다. 최종적인 컬러의 차이는 대응점 기반과 전체 영상 기반의 컬러 차이의 가중치의 합으로 결정되며 이 가중치는 대응점 기반의 컬러 비교가 영상 내의 얼마만큼의 영역을 포함하는지에 따라서 결정된다.

PCA와 HMM을 이용한 실시간 립리딩 시스템의 설계 및 구현 (Design and Implementation of a Real-Time Lipreading System Using PCA & HMM)

  • 이지근;이은숙;정성태;이상설
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1597-1609
    • /
    • 2004
  • 립리딩은 잡음 환경에서 저하되는 음성 인식률의 보상과 음성을 청취하기 어려운 상황에서의 음성인식보조 수단으로 많은 연구가 시도되고 있다. 기존 립리딩 시스템은 인위적인 조명 환경이나 얼굴과 입술 추출을 위하여 미리 정해진 제한된 조건에서 실험되어 왔다. 본 논문에서는 화자의 움직임이 허용되고 컬러나 조명과 같은 환경 변화에 제한조건을 완화한 영상을 이용하여 실시간 립리딩 시스템을 구현하였다. 본 논문의 시스템은 범용으로 사용되는 PC 카메라를 통해 입력받은 영상에서 얼굴과 입술 영역을 실시간으로 검출한 후, 립리딩에 필요한 영상정보를 추출하고 이 입술 영상 정보를 이용하여 실시간으로 발성 단어를 인식할 수 있다. 얼굴과 입술 영역 검출을 위하여 조명환경에 독립성을 갖는 색도 히스토그램 모델을 이용하였고 움직이는 화자의 얼굴 추적을 위하여 평균 이동 알고리즘을 이용하였다. 검출된 입술 영역에서 학습과 인식에 필요한 영상 정보를 추출하기 위하여 PCA(Principal Component Analysis)를 사용하였고, 인식 알고리즘으로는 HMM을 이용하였다. 실험 결과 화자종속일 경우 90%의 인식률을 보였으며 잡음이 있는 음성과 합병하여 인식률 실험을 해 본 결과, 음성 잡음비에 따라서 음성 인식률을 약 40~85%까지 향상시킬 수 있었다.

  • PDF

동영상에서 보행자 추적을 위한 변형된 HOG 특징 추출에 관한 연구 (Modified HOG Feature Extraction for Pedestrian Tracking)

  • 김회준;박영수;김기봉;이상훈
    • 한국융합학회논문지
    • /
    • 제10권3호
    • /
    • pp.39-47
    • /
    • 2019
  • 본 논문에서는 실시간으로 보행자를 추적할 때 배경 제거를 이용하여 변형된 HOG(Histogram of Oriented Gradients) 특징 추출을 제안하였다. 기존의 HOG 특징 추출은 연산량이 많아 추적 속도가 느린 문제가 있다. 배경 제거를 통해 연산량 감소와 추적률을 향상시키기 위해 연구하였다. 불필요한 영역에서의 특징 추출을 감소시키기 위해 HSV 색공간에서 S 채널과 V 채널을 이용하여 영역 제거를 진행하였다. 영상의 평균 S 채널과 V 채널로 배경 제거 후 입력 영상이 전체적으로 어두워 객체 추적에 실패하는 경우가 있다. 이러한 경우를 방지하기 위해 히스토그램 평활화를 하였다. 제거된 영역에서 추출되는 HOG 특징이 감소되고, 객체에서는 명확한 HOG 특징이 추출되어 객체 추적 속도와 추적률이 향상되었다. 본 실험에서는 다수의 보행자나 한명의 보행자가 존재하는 영상, 배경이 복잡한 영상, 흔들림이 심한 영상을 가지고 실험하였다. 제안하는 방법은 기존의 HOG-SVM 방법과 비교하여 처리 속도는 약 41.84% 향상되었으며 오 추적률은 약 52.29% 감소되어 개선된 추적률을 보였다.

칼라 지정을 이용한 내용기반 화상검색 시스템 구현 (Implementation of a Content-Based Image Retrieval System with Color Assignments)

  • 김철원;최기호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.933-943
    • /
    • 1997
  • 본 논문에서는 화상의 칼라 지정을 이용한 내용기반 화상검색 시스템 구현에 관하여 연구 하였다. 화상의 칼라는 사람이 느끼는 칼라에 적합하도록 RGB칼라 공간을 HSC(hue, saturation, value) 칼라공간으로 변환시켜 그 특징을 추출하였다. 칼라특징 추출시 화상을 9개의 영역으로 나누어 각 영역의 대표칼라 3개를 칼라 히스토 그램을 사용 하여 선택하였다. 키워드로 화상의 종류를 선택가능하도록 했으며, 검색은 화상 입력 에 의한 검색과,칼라지정을 이용한 키워드에 의한 검색, 칼라지정을 이용한 키워드와 화상 입력을 결합한 화상검색, 화상내의 특징 객체를 선택하여 검색하는 4가지 질의방법을 사용하여 실험하였다. 실험결과, 각각의 방법에서 Pre-cision/Recall이 0.55/0.37, 0.57/0.43, 0.59/0.45, 0.63/0.61의 결과를 얻었으며, 칼라지정을 사용함으로써 우수한 검색효율을 보였다.

  • PDF