문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.
현재, 컨베이어 벨트시스템에 소포를 직재하고, 우편번호를 운영자가 입력하여 구분한다. 구분된 소포 중에서 기록관리 대상의 경우에는 바코드를 판독하여 처리하고 있다. 이에 따라, 본 논문에서는 2m/sec 이내로 이송되는 소포를 라인 CCD(Charged Coupled Device) 카메라에 의해 이미지 획득한 후, 바코드 ROI 추출 방법을 위해 $32{\times}32$ 미세블룩 검사 방법을 적용하였다. ROI 추출 절차는 최대-최소 차이값과 동적 인계값 기준으로 바탕면 제거, 문자열과 바코드 영역을 판단하기 위한 대각선(diagonal) 검사방법 적용, 바코드 영역인지 검증하기 위해 수평으로 5 라인을 검사하고 에지의 수와 폭의 변화량 비교 등의 과정으로 수행하였다. 그리고 바코드 ROI 추출은 레이블링 과정에 의해 바코드 영역의 보정과 그룹크기 비교에 의한 ROI 영역의 구체화와 정보 해석을 위하여 ROI 외곽좌표 8개중에서 가장 간 중심축 라인으로 생성하는 방법 등을 적용하였다. ROI 추출과 중심축 시험결과에 의하면 $50{\sim}180msec$이내에 가능하게 되었다. 그리고, ROI 추출의 정확도는 99.994% 이상을 만족한다.
오프라인 필기체 문자 인식은 동적인 정보를 가지고 있지 않고, 다양한 필기와 자음과 모음의 겹침이 심하며, 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움이 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 전처리 즉 이진화 및 세선화에 대한 연구가 필요하다. 본 논문에서는 오프라인 필기체 한글 문자 인식의 전처리로서 워터쉐드 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 그레이 레벨 문자 영상에서의 문자 영역과 배경 영역의 분할을 위한 효과적인 워터쉐드 알고리즘의 적용 방법과 추출된 워터쉐드 영상을 이진화하는 분할 함수를 제안한다. 또한 수행 시간과 골격선의 품질을 고려한 조건 검사 마스크를 통해서 효과적으로 골격선을 추출하는 세선화 방법을 제안하고 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 성능을 평가한다. 실험 결과 기존의 방법은 평균 2.16초, 본 논문 방법은 평균 1.72초의 수행 시간이 걸렸다. 또한 결과 영상의 품질은 본 논문 방법이 문자 획 사이의 잡영을 효과적으로 처리함을 알 수 있었다.
본 논문에서는 글꼴의 변화와 잡영을 흡수할 수 있도록 자소의 탐색 영역을 정의 하였으며 이 영역에 나타나는 횡모음과 종모음의 주획을 추출하는 방법을 기술하였다. 종모음 영역에서 추출한 수직획들과 횡모음 영역에서 추출한 수평획들을 각각 종모음과 횡모음의 주획이 될 수 있는 후보들로써 이들로 부터 종모음과 횡모음의 존재를 파악하는 것이 한글 유형 분류의 주된 내용이다. 그러나 다양한 글꼴에 나타나는 수평획들로부터 곧바로 횡모음의 존재를 파악하는 것은 쉬운 문제가 아니다 본 논문에서는 기존의 트리 분류기를 확장하여 복잡하고 다양한 특징을 단계별로 단순화시키고 트리 분류기의 상위 노드에서 결정된 정보와 제약 조건을 이용하여 유형을 분류하는 방법을 제안하였다. 제안된 방법은 한글 상위 빈도 1405자, 3가지 글꼴에 대하여 99.8 %의 유형 분류율을 보이고 있다.
일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.
본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.
카메라 영상에 의한 자동차 번호판 인식시스템은 영상 획득, 번호판 추출, 전처리, 문자 분리, 문자 인식 등 크게 5자기의 핵심 부분으로 구성된다. 따라서 자동차 번호판 인식시스템의 성능을 향상시키기 위해서는 이들 부분들 각각의 성능의 최적화가 필요하다. 본 연구는 자동차 번호판 인식시스템의 여러 단계 중 전처리에 해당하는 번호판 영역의 이진화에 관한 연구로서, 기존의 단일 임계치 방법과 다중 임계치 방법이 해결하지 못했던 부분을 보완하는 새로운 다중 임계치 방법을 제안한다. 본 논문에서 제안하는 다중 임계치 알고리즘(Adaptive Multi-threshold Algorithm)을 사용함으로써 gray-level 번호판 영상에 대해서 보다 깨끗한 이진 영상을 얻을 수 있었으며, 또한 이 알고리즘은 번호판 영역의 밝기값이 고르지 않은 영상에 대해서도 효율적인 알고리즘 임을 알 수 있었다.
본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화 한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다. 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간안에 처리 함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자인식에 실패한 영상은 0.4%의 결과를 나타내었다.
본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간 처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간 안에 처리함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자 인식에 실패한 영상은 0.4%의 결과를 나타내었다
MRF (Markov random fields)로 전후 관계가 모델링된 변형된 형태의 ICM 방식을 소개한다. 특징 추출을 위해 부합블록인접의 새로운 MRF 모델을 제시한다. 이 모델은 현재 고려중인 화소를 기점으로 지엽구조인 복수방향의 기하학적 인접화소군들을 발생시켜 집합을 형성한다. 전처리 작업을 통해 산출한 특정 영역 색도분포의 확률적 데이터를 근거로 매 인접화소군 화소들 사이의 색도분포와 인접화소군들 사이의 관련성 여부를 단계별로 확률적으로 비교 판별함으로 해당화소의 영역귀속을 결정한다. 귀속 영역이 판별된 화소에는 특정 색도를 부여하고 타영역의 원소와 차별한다. 이러한 과정을 전 화소들에 확대 적용하면서 관측영상은 영역별로 순차적으로 분류되며 정보가 추출된다. 대상 영상은 탁본영상으로서 바탕영역과 정보영역을 차별적으로 분류, 색도부여를 통해 문자만의 특징을 선별한다. 이 방식은 종래의 ICM 방식의 단점이었던 과/부족 평활 현상을 최소화하는 동시에, 벡터적 판별력 부가에 의한 특정영역 잡음 제거와 얼룩현상 극소화에 효과가 있음이 실험을 통해 확인할 수 있었다. 또한 MICM 방식을 탁본영상의 문자인식에 적용하면 우수한 효과가 있으리라 기대한다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.