• 제목/요약/키워드: video indexing/retrieval

검색결과 103건 처리시간 0.019초

모바일 이미지 기반의 문자인식 시스템 (The Character Recognition System of Mobile Camera Based Image)

  • 박영현;이형진;백중환
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1677-1684
    • /
    • 2010
  • 최근 모마일 폰의 발달과 스마트 폰의 보급으로 인해서 많은 콘텐츠들이 개발되어지고 있다. 특히, 모바일 휴대장치에 소형 카메라가 탑재되면서부터 카메라로부터 입력되어지는 영상 기반 콘텐츠 개발은 사람들의 흥미뿐만 아니라 활용 면에서도 중요한 부분을 차지하고 있다. 그중 문자인식 시스템은 시각 장애인 보행 보조 시스템, 로봇 자동 주행 시스템, 비디오 자동 검색 및 색인 시스템, 텍스트 자동 번역 시스템 등과 같은 활용영역에서 매우 광범위하게 쓰일 수 있다. 따라서 본 논문에서는 스마트 폰 카메라로 입력되는 자연 영상에 포함되어 있는 텍스트를 추출 및 인식하고 음성으로 출력해주는 시스템을 제안하였다. 텍스트 영역을 추출하기 위해 Adaboost 알고리즘을 이용하고 추출된 개별 텍스트 후보영역의 문자 인식에는 오류 역전파 신경망을 이용하였다.

동영상 데이터에서 조명 보정을 사용한 관심 영역의 획득 (Acquisition of Region of Interest through Illumination Correction in Dynamic Image Data)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.439-445
    • /
    • 2021
  • 영상 센서 및 소형 디스플레이의 발달로 가능해진 저가의 고속 카메라는 영상처리 및 패턴인식 분야에서 유용하게 활용될 수 있다. 본 논문에서는 약간의 시차를 두고 연속적으로 입력되는 고속의 영상으로부터 불규칙적인 조명을 보정한 다음, 조명이 보정된 영상으로부터 사람의 관심 영역인 노출된 피부 색상 영역을 획득하는 알고리즘을 소개한다. 본 연구에서는 먼저 받아들인 고속의 영상으로부터 비 균일하게 발생된 조명적인 효과를 프레임 블렌딩 기법을 사용하여 보정한다. 그런 다음, 사전에 반복적인 학습으로 생성된 타원형의 피부 색상 분포 모델을 적용하여 입력된 고속의 컬러 영상으로부터 관심 영역을 강인하게 획득한다. 실험 결과에서는 본 논문에서 제시된 접근 방법이 입력되는 컬러 영상으로부터 조명을 보정한 다음 관심 영역을 정확하게 획득한다는 것을 보여준다. 본 연구에서 제안된 알고리즘은 얼굴 인식 및 추적, 조명 보정 및 제거, 동영상 색인 및 검색 등과 같은 영상 인식과 연관된 다양한 종류의 실제적인 응용 프로그램에서 매우 유용하게 이용될 것으로 추측된다.

필터링에 기반한 고차원 색인구조의 동시성 제어기법의 설계 및 구현 (Design and Implementation of High-dimensional Index Structure for the support of Concurrency Control)

  • 이용주;장재우;김학영;김명준
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 최근 이미지, 비디오와 같은 멀티미디어 데이터에 대한 효율적인 검색을 위해 많은 다차원 및 고차원 색인 구조들에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 색인 구조의 연구 방향은 검색의 효율을 극대화 하는데 초점을 맞추어 왔으며 최근의 멀티미디어 데이터베이스나 데이터 마이닝 분야와 같은 다수 사용자 환경을 요구하는 환경에서는 부적합한 실정이다. 이에 본 논문에서는 기존의 제시된 차원이 증가하면서 급속하게 성능이 저하되는 문제를 특징 벡터의 시그니쳐를 구성하여 완화시킨 필터링에 기반한 고차원 색인 구조에 동시성 제어기법을 설계 및 구현하여 위스콘신 대학에서 개발한 지속성 객체 저장 시스템인 SHORE 하부저장 시스템과 밀결합 방식으로 통합하였다. 확장된 SHORE 하부저장 시스템은 고차원 데이터에 대한 효율적인 검색 뿐만 아니라 레코드 레벨의 색인 데이터에 대한 동시성 제어를 지원하며 시그니쳐 파일을 모두 메모리에 로딩하는 구조를 개선하여 페이지 레벨의 관리가 가능하다. 아울러 본 논문에서 제시한 확장된 SHOE 하부저장 시스템을 실제 응용 시스템에 적용하기 위해 플랫폼 독립적인 환경을 지원하는 자바 언어를 사용하여 미들웨어 구축 방안을 제시한다. 또한 구축된 미들웨어를 통해 쓰레드 별로 대표적인 내용기반 질의 형태인 포인트질의, 범위질의, k-최근접 질의에 대한 다수 사용자 환경에서의 성능 평가를 수행하였다.