• 제목/요약/키워드: edge histogram

검색결과 281건 처리시간 0.028초

문장 사이의 공백 기울기를 이용한 문서 이미지 기울기 보정 (Deskewing Document Image using the Gradient of the Spaces Between Sentences.)

  • 허우형;구은진;김철기;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.379-381
    • /
    • 2013
  • 본 논문에서는 문서 이미지에서 문장 사이에 공백영역의 기울기를 검출하고 보정하는 방법을 제안한다. 제안하는 방법은 문서 이미지에서 에지를 추출한 문장 사이에 가지는 공백들의 기울기 값을 통해 문서 이미지의 기울기를 보정한다. 문서 이미지를 일부의 영역으로 나누어서 처리함으로써 문서 내 외곽의 여백영역, 그림, 다단형식 등에 대해서 강건한 처리 결과를 보여준다. 제안하는 방법은 문자 영역의 픽셀을 이용하는 것이 아닌, 공백영역을 이용함으로써 기존의 방법보다 선명한 화질은 물론 저화질 문서 이미지에서도 효과적으로 보정된다.

  • PDF

HMM을 이용한 알파벳 제스처 인식 (Alphabetical Gesture Recognition using HMM)

  • 윤호섭;소정;민병우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.384-386
    • /
    • 1998
  • The use of hand gesture provides an attractive alternative to cumbersome interface devices for human-computer interaction(HCI). Many methods hand gesture recognition using visual analysis have been proposed such as syntactical analysis, neural network(NN), Hidden Markov Model(HMM) and so on. In our research, a HMMs is proposed for alphabetical hand gesture recognition. In the preprocessing stage, the proposed approach consists of three different procedures for hand localization, hand tracking and gesture spotting. The hand location procedure detects the candidated regions on the basis of skin-color and motion in an image by using a color histogram matching and time-varying edge difference techniques. The hand tracking algorithm finds the centroid of a moving hand region, connect those centroids, and thus, produces a trajectory. The spotting a feature database, the proposed approach use the mesh feature code for codebook of HMM. In our experiments, 1300 alphabetical and 1300 untrained gestures are used for training and testing, respectively. Those experimental results demonstrate that the proposed approach yields a higher and satisfying recognition rate for the images with different sizes, shapes and skew angles.

  • PDF

동영상에서 배경프레임을 이용한 차량 프레임 검출 (Car Frame Extraction using Background Frame in Video)

  • 남석우;오해석
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.705-710
    • /
    • 2003
  • 본 연구는 동영상으로부터 내용기반 검색을 위하여 동영상의 연속된 프레임간의 영상의 내용 변화를 찾아내어 프레임의 시간정보와 번호판 프레임 영상을 통하여 얻어진 정보를 데이터베이스화하여 검색하는 시스템을 제안한다. 얻어진 동영상을 배경프레임과 처리프레임의 비교영역의 영상의 특징정보를 비교하여 원하는 프레임을 찾는다. 차량의 통과 시간과 차량의 번호판 프레임을 자동으로 추출하여 동영상을 내용과 함께 저장하여 원하는 차량의 동영상 부분을 보여주는 웹에서의 검색시스템이다. 이는 교통정보를 구축 동영상이 포함하고 있는 내용 즉 통과 차량의 정보를 제공할 수 있게 된다.

의도적인 공감각 기반 영상-음악 변환 시스템 구현 (Implementation of the System Converting Image into Music Signals based on Intentional Synesthesia)

  • 배명진;김성일
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.254-259
    • /
    • 2020
  • 본 논문은 사전에 학습된 기억으로 공감각 현상을 지각할 수 있는 의도적인 공감각으로 영상에서 음악으로 변환하는 시스템을 구현하였다. 영상에서 변환정보로 색상(Color), 질감(Texture), 모양(Shape)을 사용하여 음악의 멜로디(Melody), 하모니(Harmony), 리듬(Rhythm) 정보로 변환하였다. 정적인 영상에서 단조로운 음이 반복되는 것을 최소화하고 영상에 있는 정보를 표현하기 위해 색상의 분포도에 따라 확률적으로 멜로디를 선택하여 출력함으로써 자연스럽게 음을 구성할 수 있도록 하였고, 영상에서 질감은 통계적 질감 특징 추출방식인 GLCM(Gray-Level Co-occurrence Matrix)의 7가지 특징으로 하모니의 장조와 단조를 표현하였다. 마지막으로 모양은 영상의 외곽선을 추출한 후 주파수 성분 분석인 허프 변환(Hough Transform)을 이용해 선 성분을 검출하여 각도의 분포에 따라 리듬을 선택하는 방식으로 음악을 생성하였다.

비전 검사기를 활용한 T형 용접너트 자동 선별시스템 개발 (Development of Auto Sorting System for T Type Welding nut using A Vision Inspector)

  • 송한림;허태원
    • 전자공학회논문지 IE
    • /
    • 제48권1호
    • /
    • pp.16-24
    • /
    • 2011
  • 본 논문에서는 트림 T형 용접너트 생산 시스템 중 불량품을 자동으로 선별할 수 있는 자동 선별기를 비전 검사기를 사용하여 개발하였다. 카메라로부터 입력되는 영상 신호에 대해 히스토그램을 활용한 경계 판별 및 나사산 검출, 이진 모폴로지 연산(Binary morphology operation)을 활용한 얼룩 검출 등의 기법을 활용하였다. 기존의 검사기나 육안 검사에서 불가능하였던 수치 검사를 0.1mm의 정밀도로 검사할 수 있도록 하였으며, 이를 통해 제조단가를 25% 절감하고 생산성을 330% 이상 향상시킬 수 있었다.

비파괴 검사를 이용한 세라믹 재료의 결함 검출 (Detection of Flaws in Ceramic Materials Using Non-Destructive Testing)

  • 김광백;우영운
    • 한국전자통신학회논문지
    • /
    • 제5권3호
    • /
    • pp.321-326
    • /
    • 2010
  • 본 논문에서는 세라믹을 비파괴 검사를 통하여 얻어진 영상에서, 조직의 이상이나 결함의 정도를 자동으로 확인하는 방법을 제안한다. 비파괴 검사를 통하여 얻어진 영상에서 소벨 마스크를 적용하여 윤곽선을 추출하고, 추출된 윤곽선의 방향 정보를 $9{\times}9$ 마스크에 적용하여 영역을 분류한다. 그리고 분류된 각 영역을 히스토그램 스트레칭을 적용하여 영상을 보정하고, 4-방향 윤곽선 알고리즘을 적용하여 객체를 추출한다. 그리고 추출된 객체의 영역에 대해 형태학적 정보를 이용하여 잡음을 제거한 후, 손상된 영역을 추출한다. 본 논문에서 제안한 방법을 비파괴검사를 통하여 얻어진 영상을 대상으로 실험한 결과, 손상된 영역이 정확히 검출되는 것을 확인하였다.

베이지안 네트워크를 이용한 동영상 기반 라이프 로그의 분석 및 의미정보 추출 (Context Extraction and Analysis of Video Life Log Using Bayesian Network)

  • 정태민;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.414-418
    • /
    • 2010
  • 최근 라이프 로그의 수집과 관리에 관련된 연구가 많이 진행 중에 있다. 또 핸드폰 카메라, 디지털 카메라, 캠코더 등의 발전으로 자신의 일상생활을 비디오로 저장하고, 인터넷을 통해 공유하는 사람도 증가하고 있다. 비디오 데이터는 많은 정보를 포함하고 있는 라이프 로그의 한 예로. 동영상의 촬영 및 수집이 활발해짐에 따라 동영상의 메타정보를 생성하고, 이를 이용해 동영상 검색과 관리에 이용하려는 연구들이 진행 중이다. 본 논문에서는 라이프 로그를 수집하고 수집된 동영상과 라이프 로그를 이용하여 의미정보를 추출하는 시스템을 제안한다. 의미정보란 사용자의 행동을 나타내는 정보로써 컴퓨터 사용, 식사, 집안일, 이동, 외출, 독서, 휴식, 일, 기타로 9가지의 의미정보를 추출한다. 제안하는 방법은 사용자로부터 GPS, 가속도센서, 캠코더를 이용해 실제 데이터를 수집하고, 전처리 과정을 통하여 특징을 추출한다. 이때 추출될 특징은 위치정보와 사용자의 상태정보 그리고 영상처리릍 통한 RGB와 HSL 색공간의 요소와 MPEG-7의 EHD(Edge Histogram Descriptor). CLD(Color Layout Descriptor)이다. 추출된 특징으로부터 사람 행동과 같은 불안정한 상황에서 강점을 보이는 확률모델 네트워크인 베이지안 네트워크를 이용하여 의미정보를 추출한다. 제안하는 방법의 유용성을 보이기 위해 실제 데이터를 수집하고 추론하고 10-Fold Cross-validation을 이용하여 데이터를 검증한다.

  • PDF

소형 모바일 디스플레이의 Local Dimming 백라이트를 위한 영상 컨트라스트 향상 기법 (Image Contrast Enhancement Technique for Local Dimming Backlight of Small-sized Mobile Display)

  • 정진영;윤기방;김기두
    • 전자공학회논문지 IE
    • /
    • 제46권4호
    • /
    • pp.57-65
    • /
    • 2009
  • 본 논문에서는 대형 TFT-LCD 장치에서 소모전력 개선방안의 하나로 사용되는 Local Dimming 백라이트 제어방식을 휴대 단말기와 같은 소형 디스플레이에 적용하고자 이에 적합한 영상 컨트라스트 향상기법을 제안한다. 대형 디스플레이뿐만 아니라 소형 디스플레이 장치로 널리 각광받는 TFT-LCD의 광원인 백라이트 LED의 배치는 기존에 측면조사 구조로써 Global Dimming 방법이 사용되어졌으나 근래 진보된 기술을 통해 액정 후면에 배치, Local Dimming 방법이 제안되면서 입력영상을 블록단위로 분할 처리해야할 필요성이 대두되고 있다. 즉, 분할된 블록의 영상이 어두울 경우 해당 백라이트 LED의 공급전류를 감소시켜 명암대비를 극대화시킴과 동시에 소모전력량을 감소시키는 방법이다. 본 논문에서는 입력영상을 같은 크기의 블록단위로 분할한후 각 블록 내 화소정보를 분석하여 밝기성분(Y)에 대한 히스토그램과 평균, 표준편차 등의 정보를 획득하여 블록단위로 독립적인 컨트라스트 향상과정을 수행함으로써 영상정보를 통한 1차 컨트라스트 향상을 실현하고 동시에 블록단위 결과 정보를 Local Dimming을 조절하는 백라이트 제어부로 전달하여 광원제어를 통한 2차 컨트라스트 향상과 동시에 전류소모 감소 목표를 실현하고자 한다.

대화형 유전자 알고리즘을 이용한 감성기반 비디오 장면 검색 (Emotion-based Video Scene Retrieval using Interactive Genetic Algorithm)

  • 유헌우;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권6호
    • /
    • pp.514-528
    • /
    • 2004
  • 본 논문에서는 감성에 기반한 장면단위 비디오 검색방법을 제안한다 먼저 특정 줄거리를 담은 장면 비디오 클립에서 급진적/점진적 샷 경계 검출 후. "평균 색상 히스토그램", "평균 자기", "평균 에지 히스토그램", "평균 샷 시간", "점진적 샷 변화율"의 5가지 특징을 추출하고, 이 특징과 사람이 막연하게 가지고 있는 감성공간과의 매핑을 대화형 유전자 알고리즘(IGA, Interactive Genetic Algorithm)을 통하여 실현한다. 제안된 검색 알고리즘은 초기 모집단 비디오들에 대해 찾고자 하는 감성을 내포하고 있는 비디오를 선택하면 선택된 비디오들에서 추출된 특징 벡터를 염색체로 간주하고 이에 대해 교차연산(crossover)을 적용한다. 다음에 새롭게 생성된 염색체들과 특징벡터로 색인된 데이타베이스 비디오들간에 유사도 함수에 의해 가장 유사한 비디오들을 검색하여 다음 세대의 집단으로 제시한다. 이와 같은 과정을 여러 세대에 걸쳐서 실행하여 사용자가 가지고 있는 감성을 내포하는 비디오 집단들을 얻게 된다 제안된 방법의 효과성을 보이기 위해, 300개의 광고 비디오 클립들에 대해 "action", "excitement", "suspense", "quietness", "relaxation", "happiness" 의 감성을 가진 비디오를 검색한 결과 평균 70%의 만족도를 얻을 수 있었다.

스포츠 영상 내 자동적인 광고 삽입을 위한 저정보영역 추출 (Less Informative Region Extraction for Automatically Advertisement Insertion in Sports Image)

  • 정재영;김영갑
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.615-622
    • /
    • 2015
  • 최근 가상광고는 비용의 절감 및 적용의 편의성으로 인하여 TV시장에서 중요한 관심 영역으로 자리 잡고 있다. 방송에 가상광고를 삽입하는 방법으로는 촬영현장에 장비와 기술진을 파견해 방송사의 제작 장비와 연동하여 이미지를 삽입하는 업링크(Uplink)기법과 영상처리 기법을 활용하여 중계 영상에 자동적으로 가상이미지를 삽입하는 다운스트리밍(Down streaming)기법이 있다. 최근에는 자동적인 가상광고 삽입을 위한 영상 처리 기술이 가상광고 영역에서 중요한 연구 분야로 자리 잡고 있다. 따라서 본 논문에서는 스포츠 영상 내에서 자동적으로 가상광고를 삽입하기 위해 영상처리 기법을 활용하여 저정보영역을 추출하는 방법을 제안한다. 제안 방법은 허프(Hough)변환을 이용한 사각형 검출과 검출된 사각형영역에 대한 색 히스토그램 분포의 분석을 통해 저정보영역을 추출한다.