• 제목/요약/키워드: 문자영상

검색결과 795건 처리시간 0.031초

유사 문자쌍 구분을 위한 지역적 공헌도 기반 비선형 정규화 (Non-linear Normalization for Pair-wise Discrimination Based On Local Contribution Measure)

  • 류상진;김인중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.393-396
    • /
    • 2010
  • 지금까지 필기 변이를 완화하기 위한 다양한 비선형 정규화 방법들이 제안되었으며 실제 인식 시스템에서 상당한 인식률 개선 효과를 나타내었다. 그러나, 필기 한글 인식에 있어서는 필기 변이 외에도 문자간의 높은 유사도로 인해 높은 인식률을 얻는데 어려움을 겪고 있다. 한글과 같이 문자간 유사도가 높은 언어를 효과적으로 인식하기 위해서는 필기 변이를 흡수하는 것뿐 아니라, 유사 문자간의 차이를 정확히 찾아내어 그 차이점을 부각시키는 것이 요구된다. 본 논문에서는 유사 문자간의 차이점을 부각시킬 수 있는 비선형 정규화 방법을 제안한다. 기존의 비선형 정규화 방법들이 영상의 지역적 복잡도를 균일화 함으로써 정규화를 수행했던 것에 반해, 제안하는 방법에서는 유사 문자쌍의 구분에 있어 지역적 공헌도에 기반하여 영상을 정규화한다. 즉, 유사 문자쌍 구분에 공헌도가 높은 지역은 확대하고 그렇지 않은 지역은 축소한다. 그 결과, 문자간에 서로 상이한 지역을 강조 함으로써 유사 문자쌍에 대한 구분력을 높인다. 실험 결과, 제안하는 방법으로 정규화된 영상에서는 유사 문자쌍의 차이점이 확대되었으며, 문자쌍의 구분 성능 또한 향상되었다.

문서 영상의 그림 영역에서 통계적 분석을 이용한 단어 영상 추출 (Word Image Decomposition from Image Regions in Document Images using Statistical Analyses)

  • 정창부;김수형
    • 정보처리학회논문지B
    • /
    • 제13B권6호
    • /
    • pp.591-600
    • /
    • 2006
  • 본 논문에서는 문서 영상의 그림 영역에서 통계적 분석을 통한 단어 영상을 추출하는 방법을 제안한다. 제안 방법은 그림 영역의 구성 요소를 문자 성분과 그래픽 성분으로 분류하기 위하여 연결요소에 대한여 통계적 분석 방법인 상자그림 분석을 적용하고, 분류된 문자 성분들에 대하여 지역적 밀집도를 분석하여 문자 영역을 추출한다. 추출된 문자 영역에서 투영 히스토그램 분석을 통하여 문자열을 추출하고, 문자열을 단어단위 영상으로 분리하기 위하여 투영 히스토그램 분석과 갭 군집화, 특수 기호 검출 등을 수행한다. 제안 방법은 임계값의 사용 대신에 그림 영역의 구성 요소들에 대하여 통계적 분석을 수행하기 때문에 그림의 형태 변화에 민감하지 않으며, 지역적 밀집도 분석으로 보다 정확한 문자 영역을 추출하였다. 또한 제안 방법의 응용 분야인 주제어 검색을 위한 오프라인의 전처리에 해당하는 문서 영상의 단어단위 영상 추출에 적용하여 제안 방법에 대한 연구의 필요성을 제시하였다.

형태학적 연산을 이용한 운송 컨테이너 영상의 문자 분할 (Character Segmentation from Shipping Container Image using Morphological Operation)

  • 김낙빈
    • 한국멀티미디어학회논문지
    • /
    • 제2권4호
    • /
    • pp.390-399
    • /
    • 1999
  • 운송 컨테이너 영상에서 문자 영역 분할 오류는 컨테이너 자동화 처리를 위한 운송 컨테이너 식별자 인식시스템의 성능에 심각한 영향을 주는 요소 중의 하나이므로, 운송 컨테이너 식별자 인식 시스템의 성능을 향상시키기 위해서는 보다 정확한 문자 영역의 분할이 요구된다. 그러므로 본 연구에서는 문자 영역으로 오인할 수 있는 운송 컨테이너 영상에 포함된 여러 가지 불필요한 영상들을 형태학적 연산에 의하여 제거하고 식별자 영역 즉, 문자열 영역만을 분리한다. 이렇게 분리된 문자열 영역의 임계값을 구하여 이진화 한 후에 개별 문자로 분할하는 방법을 제안한다. 또한, 제안한 방법으로 실험한 결과는 컨테이너 식별자의 각 문자들이 정확하게 분할되었음을 보여준다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

변형된 Run Length Coding 기법을 이용한 이치화된 자동차 번호판 영상에서의 문자 분리 (Character Segmentation of Binary Vehicle Plate using Modified Run Length Coding)

  • 이도엽;김형재;배익성;이철희;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.138-142
    • /
    • 1998
  • 자동차 번호판 인식시스템은 영상획득, 번호판 추출, 전처리(이치화), 문자영역분할, 문자인식 등의 5가지 핵심부분으로 구성되어 있다. 따라서 자동차 번호판 인식시스템의 최종 인식률은 각 단계의 성능에 따라 직접적인 영향을 받는다. 본 논문은 컴퓨터 비젼의 한 분야인 영상처리 기법을 이용한 이치화된 자동차 번호판의 문자영역 추출에 관한 연구로서 문자 인식단계에서 높은 인식률을 확보하기 위해서 가장 중요한 입력 데이터의 상태를 보다 깨끗하게 정확하게 분리하는데 변형된 Run Length Coding 기법을 이용하여 효과적이고 빠른 문자 영역 분리 방법을 제안함으로서 처리속도의 향상은 물론 잡영에도 강한 문자 영역 분리 시스템을 구현하였다.

  • PDF

윤곽선 추적 알고리즘을 이용한 명함 영상에서의 문자 추출에 관한 연구 (A Study on the Extraction of Character from a Calling Card by using Contour Tracking Algorithm)

  • 박소연;윤수정;이정호;김명재;임은경;김광백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.723-726
    • /
    • 2001
  • 본 논문은 흑백 영문 명함 영상에서 개별 문자 추출에 관한 연구이다. 20개의 원본 명함 영상을 3배로 축소하고, 가로 세로 스미어링 기법을 이용하여 문자간의 여백을 제거하여, 문자 영역의 추출을 용이하게 하였다. 그리고, 윤곽선 추적 기법을 이용하여 문자열과 개별 문자를 추출하였다. 실험결과에서는 윤곽선 추적 알고리즘을 이용한 명함의 개별 문자 추출이 효과적인 것을 보인다.

  • PDF

디지털영상신호처리에 의한 금석문 음각문자 신호 패턴 분석 (Digital Image Processing in Analyzing the Signal Pattern of Rock-Inscribed Letter)

  • 황재호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.758-761
    • /
    • 2003
  • 금석문의 영상데이터를 디지털 형태로 검출하고, 영상신호처리 알고리즘을 사용하여 신호의 특성을 분석하고 그 결과를 제시하였다. 대상체는 비석에 음각된 문자로 하였다. 대전 주변의 백제권에서 몇몇 유형의 음각 문자를 형태별로 분류하여 디지털 이미지화한 다음, 문자가 각인된 정보영역과 바탕영역의 신호패턴을 추출하였다. 먼저 칼라 이미지를 grey tone으로 변환한 후, 전처리 과정을 거쳐 이미지의 노이즈나 불명확성을 제거하고 히스토그램 전 영역에 걸쳐 스케일 확장시켰다. 문자가 각인된 정보영역과 바탕영역을 구분하여 무작위로 소이미지 샘플을 취득하고 각 소이미지의 신호패턴을 분석하였다. 그 결과를 중첩의 원리를 이용하여 합성한 후 영역별 신호분석 패턴을 정형화하였다. 유형별로 다소 차이를 보이나 두 영역의 이미지 분석 결과는 차별성을 보였다. 문자 영역은 grey level 범위가 좁고 한정되며 일관성을 보이는데 비해, 바탕영역은 범위가 넓고 광범위하였다. 두 영역의 교차 레벨 범위는 극히 제한적이었으며 패턴 분리에 큰 영향을 끼치지 못하였음이 밝혀졌다. 이 일련의 과정은 알고리즘화되어, 1-2분 정도의 사전 작업만 하면 프로그램에 의해 문자를 추출할 수 있다. 이러한 사실들은 종래 무리한 탁본 작업에만 전적으로 의존하던 금석학 분야의 디지털화를 가능케 할 수 있다.

  • PDF

다양한 조명 환경에 강인한 seven-segment OCR 방법 (Robust seven-segment OCR method for various illumination environments)

  • 김진성;노가은;남현길;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.235-238
    • /
    • 2022
  • 본 논문은 인식이 어려운 조명 환경에도 강인한 seven-segment 문자 인식을 위해서, 영상 내에 다양한 조명 연출이 가능하도록 합성 데이터 셋을 생성하고 학습할 수 있는 OCR 방법을 제안한다. 기존 연구에서는 deblurring 과 같이 영상 이미지의 해상도를 높여 문자 인식의 정확도를 향상시키는 것에 초점을 두었으나, 여러 조명 환경에 대비할 수 있는 OCR 관련 연구들은 부족하다. 이를 해결하기 위해 본 논문에서는 문자가 포함된 자연스러운 배경 영상에, seven-segment 문자를 합성시킨 후 relighting 을 적용함으로써 실제 환경과 유사한 장면을 연출해 새로운 합성 데이터 셋을 생성한다. 그리고 생성된 데이터 셋을 딥러닝 기반 학습시켜 다양한 조명에도 강인한 문자 인식기를 만들고자 한다. 합성 데이터 셋의 사용여부와 일반적인 데이터 augmentation 기법의 사용 여부를 비교하여, 본 논문에서 제안한 방법의 효과를 확인할 수 있었다. 이를 통해서 seven-segment 문자 인식 뿐만 아니라, 다양한 문자에 대해서도 적용될 수 있는 초석이 될 것으로 기대된다.

  • PDF

카메라를 이용한 flowchart-C변환 시스템 (Flowchart-C Conversion System using Camera)

  • 이창우;주윤희;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.165-168
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 프로그래머의 알고리즘이 표현된 flowchart의 영상을 입력받아 C언어 코드로 변환하는 시스템을 구현하였다. 입력된 영상을 이진화 처리한 영상으로부터 flowchart 기호들을 인식하기 위하여 chain code 방법을 이용하였고, flowchart 기호에 기술된 영문자 및 특수문자의 인식을 위하여 가로 및 세로 히스토그램을 이용하여 한 문자색 분할한 후 각 문자들을 구성하는 흑화소 pixel의 합과 chain code 방법을 사용하였다. 가로 및 세로 투영을 이용하여 흐름선을 인식함으로써 flowchart의 논리흐름을 파악할 수 있었다. 이 시스템을 수치연산에 적용하여, 프로그래머의 알고리즘에 부합하는 프로그램이 작성되어짐을 확인할 수 있었다.

  • PDF

차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System)

  • 한수환;우영운;박성대
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.346-351
    • /
    • 2002
  • 본 연구에서는 차량 번호판에서 추출된 문자영역의 DCT(Digital Cosine Transform) 계수와 LVQ (Learning Vector Quantization) 신경회로망을 이용하여 차량 번호판 인식 시스템을 구성하였다. 입력된 차량영상의 RGB 칼라정보를 이용하여 번호판 영역을 추출하고 추출된 번호판의 히스토그램과 문자의 상대적 위치정보를 병합하여 문자영역을 추출하였다. 이렇게 추출된 문자영역의 명암도 영상에 DCT를 적용하여 얻은 특징 벡터는 LVQ 신경회로망의 입력으로 사용되어 인식 과정을 수행한다. 제안된 시스템의 검증을 위하여 다양한 환경에서 촬영된 109대의 자가용 차량영상에 대하여 실험하여 상대적으로 높은 번호판 영역 추출율과 인식률을 보였다.

  • PDF