• 제목/요약/키워드: 문자영역추출

검색결과 288건 처리시간 0.02초

탁본영상의 영역분석 (Region Analysis of Takbon Images)

  • 황재호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.141-143
    • /
    • 2006
  • 한국을 비롯한 동양 금석학 정보 인식의 중요한 매체인 탁본을 디지털 영상데이터로 변환하여 영상 특성을 분석하고 수학적 모델을 구현한다. 이를 위해 역사적으로 유명한 대표적 탁본을 포함한 50여개의 탁본영상 샘플을 작위로 선택하였고, 샘플영상 속에 내재되어 있는 영역특성을 중심으로 통계분석을 시도하였다. 탁본 원영상은 흑백의 두 영역으로 분할되는 완벽한 이진영상인데 반하여, 관측영상은 탁본뜨기 수작업과정을 거치면서 영역간 색도의 혼재와 얼룩무늬와 문양이 전체 영상에 분포한다. 본래의 두 영역은 정보영역과 바탕영역으로 구분되나 이들 얼룩무늬들은 또 다른 영역들로 치부되어 주로 바탕영역에 산발적으로 분포되어 영상인식을 저해하는 요인으로 작용한다. 관측영상 속에 내재되어 있는 영역 본래의 특성과 본뜨기 수작업 과정에서 새로 생성되는 영역들 사이의 기하학적 차이를 통계적으로 분류 처리함으로 관측 탁본영상의 영역 특성의 추이를 추론할 수 있다. 분석 결과, 탁본영상은 영역간 극단적인 확률적 차이를 보였으며, 이 양극성은 곧 탁본 원영상의 속성이 수작업과 관측이라는 훼손 과정을 거치면서도 보존됨을 의미한다. 이를 근거로 영역 특성과 훼손 과정을 수학적으로 모델링하였고 정보영역 추출의 일차적 개연성을 제시하였다.

  • PDF

타이어 분류 코드의 효율적 인식을 위한 MCBP망 (MCBP Neural Netwoek for Effcient Recognition of Tire Claddification Code)

  • 구건서;오해석
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.465-482
    • /
    • 1997
  • 본 논문은 타이어에 각인된 타이어 분류 코드인(DOT(Department of Transportation) 코드 인식 처리를 위해 타이어 문자를 영상 처리한 후 신명망을 이용하여 인식 시스템을 구축한 것이다. 타이어에 각인된 문자부분을 영상 처리시, 타이어 표면에 각인된 문자가 조명에 민감한 반응을 보일 뿐아니라 난반사로 인한 문자 경계선이 왜곡되는 현상과 인접한 두 개의 문자가 한 레이블을 갖는 현상이 발생된다. 따라서 본 논문에서는 이러한 특성을 고려한 타이어 영상 처리 알고리즘을 제안하여 실헝을 통해 유효성을 증명하였다. 또한 타이어분류 코드인DOT 코드를 효율적으로 인식하기 위해 인식기를 다중 연결한 MCBP(Multi-Chained BackPropogation)망을 제안하였다. MCBP망에서는 타이어 개별 문자영역에 대한 X, Y축 투영 값을 추출하여 문자 영역 분류를 위한 특징 값과 가로, 세로 7$\times$8 정규화를 이용한 개별 문자의 특징을 추출하여 인식 처리한다. 본 논문에서는 MCBP망에 의해 인식된 결과와 DOT 코드 데이터 베이스를 비교 처리하는 후처리를 통해서 오인식율을 3% 줄였다. 학습 및 인식 결과는 단일 역전파망에 비해 학습시간에서는 60%의 개선과 효과를 얻었으며, 인식율은 90%에서 95%로 향상었다. 또한 후처리까지 포함하면 전체 인식율을 98%까지 증가되는 높은 인식율을 얻을 수 있었다.

  • PDF

하이브리드 통계적 특징 모델과 신경망을 이용한 자동차 번호판 인식 (Recognition of License Plates Using a Hybrid Statistical Feature Model and Neural Networks)

  • 유신;정병준;강현철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1016-1023
    • /
    • 2009
  • 자동차 번호판 인식 시스템은 문자 추출, 특징 추출 등의 영상처리와 추출된 문자를 인식하는 인식기로 구성된다. 특징 추출은 문자 영역의 데이터 감소뿐만 아니라 인식 성능을 결정한다. 따라서 본 논문에서는 번호판 인식의 결과에 영향이 큰 숫자 인식, 특히 숫자의 특징 추출에 초점을 두었으며, 데이터의 군집성을 재배치하여 데이터 간의 최적의 산란도를 확보할 수 있는 통계적 특징의 혼합 모델을 제안하고, 이를 다층 퍼셉트론과 LVQ 신경망을 이용하여 유효성을 검증하였다. 제안된 통계적 특징 추출 방법은 번호판 영상이 갖는 정보를 가장 잘 유지하고, 잡음과 외부 환경에 강건하며 효과적인 방법임을 보여준다.

신경망과 그래픽 기법을 이용한 심전도 결과지 이미징 시스템 (An ECG Document Imaging System based on Neural Network and Graphic Techniques)

  • 김진상;최상열;배인호;김윤년
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.269-272
    • /
    • 2006
  • 병원의 각종 측정 장비에서 출력되는 결과지나 의사들이 작성한 기록지를 스캔하여 이미지형태로 저장하는 이미징 시스템 개발이 크게 요구되고 있다. 본 논문에서는 신경망과 그래픽 기법을 사용하여 대학병원 심전도실에서 사용되는 여섯 종류의 심전도 출력지를 이미지 형태로 저장하고 검색하는 이미징 시스템의 설계와 구현에 대해 논하였다. 구현된 시스템은 여섯 종류의 심전도 출력지를 분류하고, 분류된 각 출력지에 인쇄된 중요한 측정 데이터를 인식하여 데이터베이스에 저장한다. 심전도 출력지의 분류는 각 샘플 서식들의 평균 히스토그램을 구한 다음 새로운 출력지가 들어올 때 평균 히스토그램과의 거리가 가장 가까운 출력지로 분류하는 nearest-neighbor 방법을 사용하였다. 출력지에 인쇄된 데이터의 인식을 위해 먼저 XML로 작성한 출력지별 추출 정보를 기반으로 스캔한 이미지의 영역 분할 작업을 수행한다. 분할된 영역들은 신경망을 이용해 문자 인식을 하고, 인식된 문자들이 데이터베이스의 해당 속성값으로 저장된다. 스캔한 출력지는 의사들이 주석을 붙이거나 조건 검색을 위해 이미지 형태로 저장된다.

  • PDF

색상레이어를 이용한 스팸메일 영상에서의 텍스트 영역 추출 (Extraction of Text Regions from Spam-Mail Images Using Color Layers)

  • 김지수;김수형;한승완;남택용;손화정;오성열
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.409-416
    • /
    • 2006
  • 본 논문에서는 스팸메일 영상에서 텍스트 영역의 추출을 위한 색상 레이어기반의 알고리즘을 제안한다. CLTE(color layer-based text extraction)는 색상 레이어를 사용하여 영상을 8개로 나눈다. 8개 각각의 영상에서 연결요소를 추출한 후, 연결요소의 크기에 의해서 텍스트 영역과 비텍스트 영역을 분류하고 텍스트 영역을 추출한다. 또한, 추출된 텍스트 영역으로부터 회손된 획 정보를 복구하는 알고리즘을 제안한다. 이진영상내의 한글 문자에는 두 가지 형태의 손상된 획이 존재한다. 첫째 중성 획에 해당하는 'ㅣ' 나 'ㅡ' 등의 획들이 지워지는 경우와, 둘째 초 종성 획에 해당하는 'ㅁ' 이나 'ㅇ'이 흑화소로 채워지는 경우가 있다. 제안한 알고리즘은 이러한 두 가지 손상된 획들을 복구해준다. 200개의 스팸메일 영상을 사용한 실험 결과 제안한 알고리즘이 기존의 텍스트 추출 알고리즘보다 10% 이상 우수함을 관측하였다.

불변 모멘트를 이용한 휴대용 차량 번호판 인식 시스템의 설계 및 구현 (Design and Realization of Portable Vehicle License Plate Recognition System Using Invariant Moment)

  • 이진혁;최창규;김승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.232-234
    • /
    • 2003
  • 차량 번호판 인식 시스템은 차량 보급의 대중화와 그에 따라 발생되는 여러문제의 해결차원에서 활발하게 연구 개발되고 있는 분야이다. 본 논문에서는 휴대용 입력 장치로부터 획득한 차량 번호판 영상에서 차량 번호판이 가지는 특성을 이용하여 번호판을 추출한 후, 차량 번호판의 특성을 이용하여 개별 문자 영역들의 MBR(Minimum Boundary Rectangle)을 추출한다. 그리고. 불변 모멘트의 특징을 이용하여 기존의 템플릿 매칭 방식 보다 연산시간이 매우 빠르고 입력 영상내의 번호판 크기에 제약이 적온 장점을 가진 보다 향상된 차량 번호판 인식 시스템을 제안한다.

  • PDF

클러스터 신경망을 이용한 우편번호 인식 시스템의 설계 (Design of Zip Code Recognition System Using Cluster Neural Network)

  • 김종석;홍연찬
    • 한국지능시스템학회논문지
    • /
    • 제11권2호
    • /
    • pp.132-140
    • /
    • 2001
  • 최근에는 대부분의 우편물 봉투가 창이나 색깔을 포함하고 있다. 본 논문에서는 창이 있는 봉투와 색깔이 있는 우편 봉투 영상에서 구조적 방법을 분석하여 수취인 주소 영역을 자동적으로 추출하는 시스템을 제안하였다. 제안된 방법은 이치화전 에지 검출을 이용하여 문자열 추출 후 검출된 블록에 대해 적응 이치화를 적용함으로써 이치화 후 우편 번호를 검출할 때보다 우편 봉투의 숫자 패턴이 밝기 및 주변 환경에 의한 영향을 적게 받는다는 점에서 더 효율적이다.

  • PDF

단락 자동 구분을 통한 중요 문자 추출 (Setences Extraction System using Automatic Division of Paragraph)

  • 김계성;이현주;정영규;서연경;손기준;이상조
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.233-237
    • /
    • 2000
  • 본 논문은 단락의 자동 구분을 통한 중요 문장 추출 시스템을 제안한다. 먼저 어휘의 재출현 여부와 어휘의 일치도, 어휘의 역할 변화를 파악하여 재출현 어휘에 대한 양상을 분석하고 이를 통하여 문장 간의 긴밀도를 정량적으로 계산한다. 다음으로 측정된 문장 간 긴밀도를 이용하여 사용자의 추출 범위에 따라 단락을 구분하고, 각 단락의 대표 문장을 선정하여 최종 요약문을 생성한다. 제안한 방법은 문서 제목, 문장의 위치, 수사 구조 등의 정보를 이용하지 않으며, 단순히 어휘의 출현 빈도만을 이용하던 기존의 통계적인 방법보다 질높은 요약문을 생성할 수 있다. 또한 제안한 방법론은 본 논문이 대상으로 삼고 있는 신문기사의 영역뿐만 아니라 다른 영역으로의 적용이 가능하다.

  • PDF

대용량 소포영상에서 관심영역 고속추출 방법에 관한 연구 (The High-Speed Extraction of Interest Region in the Parcel Image of Large Size)

  • 박문성;박상은;김인수;김혜규;정회경
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.691-702
    • /
    • 2004
  • 본 문은 고속으로 이송되는 컨베이어 벨트 환경에서 획득된 대용량 소포 영상에서 다양한 관심영역(ROI:Region of Interest)을 고속 추출할 수 있는 방법을 제안한다. 제안된 방법의 친 번째 단계에서는 영상을 32${\times}$32 픽셀 크기의 마스크로 나누고 그 중 내부 픽셀의 최대값과 최소값의 차이값이 최저 동적 입계값보다 큰 경우에 1차 후보로 검출한다. 두 번째 단계에서는 1차 후보 마스크를 다시 8${\times}$8크기의 서브마스크로 나누고 적셀 값의 편차(deviation)을 기준으로 최저 임계값보다 큰 마스크만 남김으로서 불필요한 영역을 제거한다. 이러한 전처리 과정을 거쳐 1차원 바코드, 2차원 바코드, 소포의 외형 경계, 레이블 및 문자와 같은 소포의 정보가 기록되어 있는 영역(ROI)을 제외한 나머지 영역을 제거한다. 후처리 과정에서는 위의 ROI 중 2차원 바코드 영역만을 추출하기 위해서 각각의 ROI에 대하여 기준축을 생성한 결과를 이용하여 각각의 영역을 검증하였다. 이와 같은 방법으로 실험한 결과 대용량 소포영상에서 약 200msec 이내에 다양한 ROI를 추출하였으며 100%의 정확도로 2차원 바코드 영역을 지정할 수 있음을 확인하였다.

차량 규격과 특징 패턴을 이용한 자동차 번호판 추출 (Extracting Of Car License Plate Using Motor Vehicle Regulation And Character Pattern Recognition)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.339-345
    • /
    • 2002
  • 자동차의 번호판을 인식하는 것은 차량을 식별하는데 있어서 매우 중요하다. 어두운 조명에서나 날씨가 나쁠 경우 차량의 형상이 왜곡 될 수 있고, 번호판을 식별하는데 어려움이 있다. 본 논문은 차량의 규격을 이용하여 효율적으로 번호판을 추출하는 방법을 제안한다. 이 방법에서 색상이나 형태처럼 차량의 규격을 따르는 자동차 번호판의 특징들은 번호판의 후보영역으로 결정되고, 신경망에 의해 숫자나 문자의 패턴 갖는 영역이 번호판 영역으로 인식된다. 또한 특징패턴인식의 결과로서 번호판을 확정하였다. 70개 차량영상을 실험해 본 결과 번호판 추출률에서는 84.29 %, 인식률에서는 80.81 %의 결과를 나타내었다.