• 제목/요약/키워드: 문자영역복원

검색결과 29건 처리시간 0.019초

확장적 블록 정합 방법과 영역 보상법을 이용한 비디오 문자 영역 복원 방법 (A Method for Recovering Text Regions in Video using Extended Block Matching and Region Compensation)

  • 전병태;배영래
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.767-774
    • /
    • 2002
  • 기존의 원영상 복원 기술은 주로 신호 처리 분야에서 영상의 형성(formation), 저장 및 통신상에서 발생되는 왜곡 현상을 복원하는 연구가 많이 이루어 졌다. 원 영상 복원과 관련된 기존의 연구는 블록 정합(block matching algorithm)을 이용한 원영상 복원 방법이 있다. 이 방법은 오 정합(incorrect matching)이 발생하기 쉽고, 오 정합 시 에러가 전파되는 문제점이 있다. 그리고 장면 전환이 2회 이상 발생될 경우 장면 전환 지점과 지점 사이의 복원이 불가능하다는 문제점이 있다. 본 논문에서는 기존의 문제점들을 해결하기 위하여 확장적 블록 정합 방법(EBMA: Extended Block Matching Algorithm)과 영역 보상법(Region compensation method)을 이용한 원영상 복원 방법을 제안하고자 한다. 원영상 복원에 사용하기 위하여 비디오 사전 정보(장면 전환 정보, 카메라 모션 정보, 캡션 영역 정보)를 추출한다. 추출된 캡션 영역 정보를 이용하여 캡션 문자의 구성 요소 정보를 추출한다. 추출된 비디오 사전 정보를 이용하여 복원의 방향성을 결정하고, 복원의 방향성에 따라 문자의 구성 요소 단위로 확장적 블록 정합 방법과 영역 보상법을 이용하여 원영상 복원을 수행한다. 실험결과 확장적 블록 정합 방법은 빠른 물체의 움직임이나 복잡한 배경에 영향을 받지 않고 복원이 잘 되는 것을 알 수 있었다. 참조할 원영상이 없이 원영상 복원을 수행하는 영역 보상법의 복원 결과 또한 좋음을 볼 수 있었다.

비디오 자막 문자의 효과적인 교환 방법 (An Effective Method for Replacing Caption in Video Images)

  • 전병태;김숙연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.97-104
    • /
    • 2005
  • 자막 문자는 시청자의 이해를 돕기 위하여 제작된 비디오 영상에 종종 삽입한다. 영화의 경우 영상과 자막과 영상의 트랙이 달라 자막 교환이 영상에 손실을 주지 않고 이루어 질 수 있다. 자막이 삽입된 비디오 영상의 경우, 기존의 자막 교환 방법은 자막이 존재하는 부분 박스 형태로 일정 영역을 색칠한 후 그위에 새로운 자막을 삽입한다. 이러한 자막 교환 방법은 문자 영역을 포함한 주변 영역의 원영상의 손실을 초래함으로써 시청자에 시청의 불편을 초래하는 문제가 있다. 본 논문에서는 기존 방법의 문제점을 해결하기 위한 효과적인 자막 교환 방법을 제안하고자 한다 효과적인 교환 방법은 자막 영역을 원영상으로 복원한 복원된 문자 영역에 교환될 문자를 삽입하는 방법이다. 실험결과 대부분 자막이 복원이 잘 되어 효과적인 자막 교환이 이루어짐을 볼 수 있었다. 일부 복잡한 영상의 경우 복원 결과 약간의 왜곡 현상은 보여주나 왜곡된 위치에 새로운 자막을 삽입은 복원의 오류를 보완하는 역할을 함으로써 자연스런 자막 교환이 이루어짐을 볼 수 있었다.

  • PDF

개선된 퍼지 신경망을 이용한 여권 인식 시스템 (Recognition System of Passports by Using Enhanced Fuzzy Neural Networks)

  • 류재욱;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.155-161
    • /
    • 2003
  • 출입국 관리 절차를 간소화하는 방안의 하나로 퍼지 신경망을 이용한 여권 인식 시스템을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다 여권의 문자열 영역은 OCR 문자 서체로 구성되어 있고, 명도 차이가 다양하게 나타난다. 따라서 추출된 문자열 영역을 블록 이진화와 평균 이진화를 각각 수행하고 그 결과들을 AND 비트 연산을 취하여 적응적으로 이진화한다. 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM(Conditional Dilation Morphology) 마스크를 적용한 후, 역 CDM마스크와 HEM(Hit Erosion Morphology)마스크를 적용하여 잡음을 제거한다 잡음이 제거된 문자열 영역에 대해 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 추출된 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크와 개선된 퍼지 ART 알고리즘과 지도 학습을 결합한 퍼지 자가 생성 지도 학습 알고리 즘을 각각 제안하여 여권의 개별 코드 인식에 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권 영상을 대상으로 실험한 결과, 제안된 추출 및 인식 방법이 여권 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

비디오 영상에서 시공간적 문자영역 제거방법 (Spatiotemporal Removal of Text in Image Sequences)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.113-130
    • /
    • 2004
  • 많은 시각적 정보를 포함한 비디오 데이터들의 자동화된 처리 기술 중, 비디오 데이터들의 시청자적인 정보를 보강시키고, 부가적인 정보를 첨가하기 위한 일환으로 자막을 삽입하는 경우가 많다. 이러한 자막은 때로 영상자료의 재사용성(reusability)을 저해하고, 원 영상을 훼손하는 경우가 발생한다. 본 논문에서는 영상의 재사용성을 높이고 원 영상 복원을 위해 Support Vector Machines(SVM)과 시공간적 영상복원 방법(spatiotemporal restoration)을 이용한 비디오 영상에서의 자동 문자 검출과 제거 방법을 제안한다. 연속적인 두 프레임 이상의 영상을 입력받아, 현재 프레임 영상에서 SVM을 이용하여 문자 영역을 검출한 다음, 검출된 문자 영역을 제거하고, 문자 영역에 의해 가려졌던 원 영상을 복원하기 위한 두 단계- 시간적 복원(temporal restoration)과 공간적 복원(spatial restoration)접근방법을 제안한다. 제안된 복원 방법은 글자 모션(text motion) 정보와 두 영상의 배경 차이(background difference)를 이용하여 영상을 그 특징에 따라 분류하고, 각 영상의 특징에 맞는 복원 방법을 적용한다. 제안된 방법은 다양한 종류의 영상에서 문자뿐만 아니라 관심의 대상이 되는 객체의 자동 검출 및 복원 등 다양한 응용분야를 포함한다.

개선된 퍼지 RBF 네트워크를 이용한 여권 인식 (Recognition of the Passport by Using Enhanced Fuzzy RBF Networks)

  • 류재욱;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.147-152
    • /
    • 2003
  • 출입국 관리 시스템은 위조 여권 소지자, 수배자, 출입국 금지자 또는 불법 체류자 등의 출입국 부적격자를 검색하여 출입국자를 관리하고 있다. 이러한 출입국 관리 시스템은 위조 여권 판별이 중요하므로 위조 여권을 판별하는 전 단계로 퍼지 RBF 네트워크 제안하여 여권을 인식하는 방법을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다. 추출된 문자열 영역을 사다리꼴 타입의 소속 함수를 이용한 퍼지 이진화 방법을 제안하여 이진화하고 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM 마스크를 적용한 후에 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크를 제안하여 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권영상을 대상으로 실험한 결과, 제안된 방법이 여권 인식에 우수한 성능이 있음을 확인하였다.

  • PDF

블록 정합을 이용한 비디오 자막 영역의 원 영상 복원 방법 (A Method for Reconstructing Original Images for Captions Areas in Videos Using Block Matching Algorithm)

  • 전병태;이재연;배영래
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.113-122
    • /
    • 2000
  • 이미 방송된 비디오 영상으로부터 자막 영역을 제거하고 원 영상으로 복원할 필요가 종종 발생한다. 복원될 영상의 량이 적을 경우 수 작업에 의한 복원이 가능하나, 비디오 영상과 같이 복원할 영상이 많아질 경우에는 수 작업에 복원은 어렵다고 볼 수 있다. 따라서 자동으로 자막 영역을 원 영상으로 복원할 수 있는 방법이 필요하게 된다. 기존의 영상 복원에 관한 연구는 주로 블러링(blurring)된 영상을 주파수 필터를 사용하여 선명하게 복원하거나, 영상 통신을 위한 비디오 코딩 방법에 대한 연구가 많이 이루어졌다. 본 논문에서는 블록 정합 알고리즘(Block Matching Algorithm)을 이용하여 자막 영역을 복원하는 방법을 제안하고자한다. 자막 복원을 위한 사전 정보로 자막 영역 정보와 장면 전환 정보를 추출한다. 추출된 자막 정보로부터 자막의 시작 프레임, 끝 프레임, 자막 문자의 구성 요소 정보를 얻을 수 있다. 자막 정보(자막의 시작 프레임, 끝 프레임)와 장면 전환 정보를 이용하여 복원의 방향성 및 복원의 종점을 결정한다. 복원의 방향성에 따라 각 프레임마다 문자의 구성 요소에 대한 블록 정합을 수행하여 원 영상을 복원한다. 실험결과 비교적 움직임이 적은 영상에서는 복원이 잘 됨을 볼 수 있었으며, 복잡한 배경을 갖고 있는 영상의 경우도 복원됨을 볼 수 있었다.

  • PDF

영상신호처리에 의한 금석문 음각문자 판독 - 샘플시료를 이용한 실험을 통하여 (Image Processing in Deciphering the Letter Written in Rocks by Experiment of Sample Texts)

  • 황재호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.765-768
    • /
    • 2003
  • 금속이나 암석에 음각(陰角)으로 각인된 문자나 그림들은 날씨나 주변 빛 환경에 따라 시각으로 입력되는 정보에 큰 차이를 보인다. 이를 이미지검출장치를 통해 읽어드려 디지털 이미지 신호로 만들고자 할 때는 더욱 그 정도가 심하여 대상체가 위치하는 빛 환경이나 검출기 특성에 각별한 신경을 써야한다. 자연광이나 전구 그리고 기후나 날씨에 의해 조성되는 빛 환경은 조도(照度), 조사각도(照射角度), 그림자 및 대상체 표면 상태 등이 중요한 결정 인자들이다. 빛 환경이 디지털 이미지 질(質)에 끼치는 영향을 최소화하기 위한 실험실 차원의 빛환경조정실을 구축하였다. 외부 유입 광선을 모두 차단하고 지향성이 있는 조명에 의해서만 대상체에 빛이 조사되도록 하고 디지털 카메라로 대상체의 이미지를 담았다. 음각 문자를 새긴 샘플석문(石文)을 제작하고 실험실 안의 정량화된 빛환경 하에서 석문의 이미지를 취득하였다. 전처리 과정을 통해 노이즈를 제거하고 이미지의 질을 향상시켰다. 처리된 이미지를 분석하여 문자영역과 바탕영역의 신호패턴을 추출한 다음 룩업 테이블, 조도 레벨 슬라이징, 중첩의 원리 및 Morphology 등의 기법을 알고리즘화하여 2진 형태의 음각문자를 판독 및 복원하는데 성공하였다.

  • PDF

개선된 신경망과 사진 인증을 이용한 여권 인식 (Recognition of Passports using Enhanced Neural Networks and Photo Authentication)

  • 김광백;박현정
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.983-989
    • /
    • 2006
  • 현재의 출입국 관리는 여권을 제시하면 여권을 육안으로 검색하고 수작업으로 정보를 입력하여 여권 데이터베이스와 대비하는 것이다. 본 논문에서는 여권의 정보를 인식 할 수 있는 방법을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다. 추출된 문자열 영역을 이진화하고 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM 마스크를 적용한 후에 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 개별 코드의 인식은 ART2 알고리즘을 RBF 네트워크의 중간층으로 적용하고 중간층과 출력층의 학습에는 일반화된 델타 학습 방법으로 동작하는 RBF 네트워크를 적용한다. 사진 영역은 코드의 문자열 영역을 추출한 후에 코드의 문자열 영역이 시작되는 좌표를 중심으로 사진 영역을 추출한 후, Luminance, Edge, Hue 정보를 이용하여 사진 부분을 검증한다. 검증된 사진 부분 영상은 ART2 알고리즘을 적용하여 사진의 특징들을 분류하고, 이를 이용하여 사진 인증을 하게 된다. 제안된 방법의 성능을 확인하기 위해서 실제 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권 인식에 우수한 성능이 있음을 확인하였다.

개선된 퍼지 ART 기반 RBF 네트워크와 PCA 알고리즘을 이용한 여권 인식 및 얼굴 인증

  • 장도원;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.547-556
    • /
    • 2005
  • 본 논문에서는 출입국자 관리의 효율성과 제계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 여권 이미지가 기울어진 상태로 스캔되어 획득되어질 경우 개별 코드 인식과 얼굴 인증에 많은 영향을 미칠 수도 있으므로 기울기 보정은 문자 분할 및 인식, 얼굴 인증에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 모드 추출은 소벨 연산자와 수평 스미어링, 8 방향 윤곽선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이지화 방법을 적용하여 코드의 문자열 영역을 이진화한다. 이진화된 문자열 영역에 대해 CDM 마스크를 적용하여 문자열의 코드들을 복원하고 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드 인식은 개선된 RBF 네트워크를 제안하여 적용한다. 제안된 RBF 네트워크는 퍼지 논리 접속 연산자를 이용하여 경계변수를 통적으로 조정하는 개선된 퍼지 ART 알고리즘을 제안하여 RBF 네트워크의 중간층으로 적용한다. 얼굴 인증을 위해서는 얼굴 인증에 가장 보편적으로 사용되는 PCA 알고리즘을 적용한다. PCA 알고리즘은 고차원의 벡터를 저 차원의 벡터로 감량하여 전체 입력 영상들의 직교적인 공분산행렬을 계산한 후 그것의 고유 값에 따라 각 영상의 고유벡터를 구하므로 PCA 알고리즘을 적용하여 얼굴의 고유 벡터를 구한 후 특징 벡터를 추출한다. 따라서 여권 영상에서 획득되어진 얼굴 영상의 특징벡터와 데이터베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능을 평가를 위하여 원본 여권에서 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.