• 제목/요약/키워드: 문자 추출

검색결과 670건 처리시간 0.025초

문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑 (Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document)

  • 옥세영;박환철;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF

질감과 깊이 특징 기반의 문자영역 추출 (Character Region Extraction Based on Texture and Depth Features)

  • 장석우;박영재;허문행
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.885-892
    • /
    • 2013
  • 본 논문에서는 3차원의 입체영상으로부터 질감과 깊이 특징을 활용하여 영상 내에 존재하는 문자를 효과적으로 분할하는 방법을 제안한다. 제안된 문자 분할 방법은 크게 후보 문자영역 추출 단계, 문자영역 지역화 단계, 문자와 배경영역 분리 단계, 그리고 후보 문자영역 검증 단계의 네 가지 단계로 구성된다. 후보 문자영역 추출 단계에서는 입력된 영상에서 질감 특징을 이용해 문자영역이 존재하는 후보 영역을 분할하고, 문자영역 지역화 단계에서는 후보 문자영역 중에서 문자열만을 형성하는 영역을 추출한다. 그리고 문자와 배경 분리 단계에서는 지역화된 문자영역을 문자와 배경으로 분리하며, 후보 문자영역 검증 단계에서는 거리 특징을 활용하여 추출된 문자영역이 비 문자영역을 포함하지 않고 문자영역만을 포함하고 있는지를 최종적으로 검증한다. 실험에서는 제안된 방법을 여러 가지 영상에 적용하여 테스트 해 보았으며, 제안된 방법이 기존의 방법에 비해 보다 정확하게 문자영역을 추출함을 확인하였다.

거리 정보를 활용한 문자 분할 (Character Segmentation Using Depth Information)

  • 장석우;박영재;김계영;최현준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.229-230
    • /
    • 2013
  • 본 논문에서는 입체영상을 분석하여 3차원의 영상 내에 나타나는 문자 영역을 효과적으로 분리하는 알고리즘을 제안한다. 제안된 알고리즘은 먼저 입력된 영상에서 질감 특징을 이용해 문자영역이 존재하는 후보 영역을 분할하고, 후보 문자영역 중에서 문자열만을 형성하는 영역을 추출한다. 그런 다음, 지역화된 문자영역을 문자와 배경으로 분리하며, 거리 특징을 활용하여 추출된 문자영역이 비 문자영역을 포함하지 않고 문자영역만을 포함하고 있는지를 최종적으로 검증한다. 실험에서는 제안된 방법을 여러 가지 영상에 적용하여 테스트 해 보았으며, 제안된 방법이 기존의 방법에 비해 보다 정확하게 문자영역을 추출함을 확인하였다.

  • PDF

차량 번호판의 영역 추출 및 문자 분할에 관한 연구 (The Extraction of Car License Plates and the Separation of Characters)

  • 권숙연;이화진;전병환
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.457-462
    • /
    • 2000
  • 교통 법규 위반 단속이나 주차 관리를 위한 차량 번호판 인식 시스템을 구현하기 위해서는 크게 차량 번호판 추출, 문자 분할, 문자 인식의 세부분으로 이루어진다. 본 논문에서는 차량 번호판 인식 시스템의 구현을 위해 번호판 영역의 색상정보를 이용하여 차량 번호판을 추출하는 방법을 제안하고, 번호판 영역 문자들의 사전 정보와 색상성분을 사용하여 정확하게 번호판 문자 분할을 하는 방법을 제안한다. 자가용과 영업용 차량 영상을 주간/dirks 및 정면/후면으로 나누어 다양하게 취득하여 실험한 결과, 94.6%의 번호판 추출률과 86.8%의 문자분할률을 얻었다.

  • PDF

Client/Server 구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Localization System Using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2004
  • PDA에서 사용하는 대부분의 CPU는 실수 연산 구성요소(float computation component)가 없는 정수(integer) CPU를 사용한다. 인공 신경망(neural network)과 같은 실수 연산이 많은 알고리즘은 PDA에서 많은 수행시간을 가진다. 본 논문에서는 이런 단점을 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/Server(PC) 구조를 이용한 효과적인 문자 추출 시스템을 제안한다. Client(PDA)는 대략적인 문자 추출 결과를 JPEG으로 압축하여 전송속도를 최소화한다. Server(PC)는 Client(PDA)의 결과를 바탕으로 정밀한 문자 영역 추출을 위해, 텍스춰 분류 방법과 연결 성분 분석 방법을 이용한다. 실험에서 제안한 방법은 속도뿐만 아니라 문자 추출에서도 효과적이었다.

  • PDF

일반화된 문자 및 비디오 자막 영역 추출 방법 (A Generalized Method for Extracting Characters and Video Captions)

  • 전병태;배영래;김태윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.632-641
    • /
    • 2000
  • 기존의 문자 영역 추출 방법은 전체 영상에 대하여 컬러 축소(color reduction), 영역 분할 및 합병(region split and merge), 질감 분석(texture analysis)등과 같은 방법을 이용하여 문자 영역을 추출했다. 이 방법들은 많은 휴우리스틱(heuristic) 변수와 추출하고자 하는 문자의 사전 지식에 의해 임계치 값을 설정함으로서 알고리즘을 일반화하기 어렵다는 문제점이 있다. 본 논문에서는 문자의 지형학적 특징점 추출 방법과 점-선-면 확장법을 이용하여 문자 영역을 추출함으로서 기존 문자 영역 추출의 문제점인 휴우리스틱 변수의 사용을 최소화하고 임계치 값을 일반화함으로 서 일반화된 문자 영역 추출 방법을 제안 하고자 한다. 실험결과 일반화된 변수와 임계값을 사용함으로서 문자의 사전 지식 없이도 문자 영역을 추출함을 볼 수 있었다. 비디오 영상의 경우 후보 영역 추출율 100%, 검증을 통한 자막 영역 추출율은 98% 이상임을 볼 수 있었다.

  • PDF

개선된 퍼지 신경망을 이용한 여권 인식 시스템 (Recognition System of Passports by Using Enhanced Fuzzy Neural Networks)

  • 류재욱;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.155-161
    • /
    • 2003
  • 출입국 관리 절차를 간소화하는 방안의 하나로 퍼지 신경망을 이용한 여권 인식 시스템을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다 여권의 문자열 영역은 OCR 문자 서체로 구성되어 있고, 명도 차이가 다양하게 나타난다. 따라서 추출된 문자열 영역을 블록 이진화와 평균 이진화를 각각 수행하고 그 결과들을 AND 비트 연산을 취하여 적응적으로 이진화한다. 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM(Conditional Dilation Morphology) 마스크를 적용한 후, 역 CDM마스크와 HEM(Hit Erosion Morphology)마스크를 적용하여 잡음을 제거한다 잡음이 제거된 문자열 영역에 대해 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 추출된 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크와 개선된 퍼지 ART 알고리즘과 지도 학습을 결합한 퍼지 자가 생성 지도 학습 알고리 즘을 각각 제안하여 여권의 개별 코드 인식에 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권 영상을 대상으로 실험한 결과, 제안된 추출 및 인식 방법이 여권 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

한글의 미적 평가를 위한 특징 추출 및 유사도 함수 정의 (Feature Extraction and Similarity Measure Function Define For Beauty Evaluation of Korean Character)

  • 한군희;오명관;이형우;전병민
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.59-67
    • /
    • 2002
  • 본 논문에서는 입력의 자동화 및 교육을 위한 문자 익히기 시스템을 위하여 자소의 특징 추출과 유사도 함수를 정의하여 한글에 대한 미적평가를 수행하였다. 이를 위해 한글 문자의 자소에 대한 특징 추출 및 유사도 함수를 정의 한 후 표준 문자와 입력 문자가 얼마나 유사한지를 평가하는 방법을 제안하였다. 표준 문자와 입력 문자의 획에 대한 특징 추출 및 유사도 함수를 정의하였으며, 다양한 입력 문자 패턴에 대해 표준 문자 패턴과 얼마나 유사한지를 실험한 결과 예상한 값과 유사하게 일치하는 실험 결과를 얻을 수 있었다. 또한 일반 사람들의 미적 평가 결과와 제안한 방법의 실험 결과가 유사하게 일치한다는 결과도 얻을 수 있었다.

  • PDF

칼라 문서에서 문자 영역 추출믹 문자분리 (The Character Area Extraction and the Character Segmentation on the Color Document)

  • 김의정
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.444-450
    • /
    • 1999
  • 본 논문에서는 칼라로 입력된 문서 영상에서 문자 영역추출을 위하여 k-means을 이용한 클러스트링 알고리즘을 제안하였다. 칼라 영상의 클러스트링을 위해서 HIS 좌표계에 적합한 거리함수를 제안하였다. 이를 인식하기 위한 전처리 단계인 문자분리(segmentation)방법은 연결 화소를 이용한 개별문자 추출 알고리즘을 제안하였다. 본 알고리즘 에서는 문자분리방벙에서 접촉문자 (touching character)또는 겹친 문자(overlapped character)등과 같이 분리가 곤란한 문자를 개별문자로 분리하는 방법이다. 기존의 문자 분리방법에서는 투영(projection)dop 의한 방법과 외곽선(edge)추적에 의한 방법등을 사용하여 왔으나 제안된 방법은 문자열 추출후 한번의 투영으로 연결화소를 이용하여 개별문자를 추출한다. 문자 영역과 비 문자 영역을 구분하여 개발문자 추출을 한 결과 단순한 이진 영상이 아닌 칼라 영상에서의 문서 처리가 큰 의의가 있고 기존의 문서 처리기 보다 향상된 알고리즘인 것을 확인하였다.

  • PDF

지역적 연결요소 및 에지 구조 성분 특징을 이용한 자연이미지로부터 문자영역 검출 (Text Region Detection Using Regional Connected Component and Edge Structure Component Feature From Natural Scene Images)

  • 박종천;황동국;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.40-43
    • /
    • 2009
  • 최근 모바일 영상기반 응용 분야에 관한 연구가 활발히 진행되고 있으며 모바일기기로 촬영된 영상에서 문자정보를 추출하고자 하는 많은 연구도 진행되고 있다. 자연이미지로부터 문자정보를 추출을 위한 전단계로 문자영역 검출이 필수적이다. 본 연구는 문자영역의 지역적 에지 및 연결요소 특징을 고려하여 조명 및 복잡한 배경에서도 문자영역을 검출하는 방법을 제안한다. 에지 검출은 캐니-에지 검출기로 추출하고, RGB 컬러분포 패턴을 분석하여 컬러 양자화를 함으로서 연결성분을 추출한다. 각각 추출된 에지 및 연결성분으로부터 문자후보 영역을 검출하고, 각각의 결과를 결합하여 최종적인 문자 후보 영역을 검출하고, 문자 후보 영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 환경에서 얻어진 자연이미지를 대상으로 실험한 결과, 에지 및 연결성분의 두 가지 특징을 결합함으로서 자연이미지에 존재하는 다양한 형태의 문자영역을 효과적으로 검출하였다.

  • PDF