• 제목/요약/키워드: 문자표

검색결과 57건 처리시간 0.028초

표의 테두리 유사 라벨을 활용한 문자 영역 검출 방법 (Text Region Detection Method Using Table Border Pseudo Label)

  • 한정훈;박세진;문영식
    • 한국정보통신학회논문지
    • /
    • 제24권10호
    • /
    • pp.1271-1279
    • /
    • 2020
  • 문자 영역 검출이란 수기 혹은 인쇄된 문서에서 문자의 영역을 검출하는 기술이다. 검출된 문자 영역들은 인식 단계를 거쳐 디지털화되며 이는 활용 목적에 따라 다양한 곳에서 활용된다. 하지만 문자 단위의 검출 결과는 대용량 문서를 인식해야 하는 산업 현장의 문자 인식 단계에는 적합하지 않다. 또한, 문서 내 존재하는 표는 문자 영역 검출 단계에서 오검출을 야기하며 이는 문자 인식 단계에서 악영향을 끼친다. 이를 해결하기 위해 본 논문에서는 표의 테두리 정보를 활용한 문자 영역 검출 방법을 제안한다. 표의 테두리 정보를 활용하기 위하여 제안하는 방법은 2개 디코더를 추가하고 간접적인 학습을 유도하기 위하여 각 디코드의 흐름을 조절하였다. 실험을 통해 표의 테두리 유사 라벨을 이용한 약지도 학습 방법이 성능 향상에 도움이 됨을 보였다.

문자의 이진체계 교육 콘텐츠 개발에 관한 연구 (The Study on the Development of the Binary System Teaching Contents for the Characters)

  • 고형철;김종우
    • 정보교육학회논문지
    • /
    • 제20권1호
    • /
    • pp.39-46
    • /
    • 2016
  • 컴퓨터과학의 원리를 교육하기 위한 도구로서 언플러그드 교육은 널리 사용되고 있다. 본 연구에서는 초등학교에서 자연수를 이진체계로 표현하는 사전 학습이 이루어진 학생들을 대상으로 문자를 이진체계로 표현하는 교육자료 개발에 대해 제시하였다. 학습방법은 활동중심학습으로 구성하였으며, 학습내용은 생활 속의 문자를 이진체계로 표현하는 원리를 학습하기 위하여 문자를 수와 대응시킨 문자표를 사용하여 이진체계로 표현하기이다. 개발된 자료의 적합성 평가를 위하여 교육자료를 현장에 적용하였으며, 그 결과는 문자의 이진체계 표현에 대한 지식과 적용 및 확장은 효과적인 것으로 평가되었다.

OCR 기반 화장품 성분표 분석 시스템 (OCR-based Cosmetics Ingredients Labeling Analysis System )

  • 강범진;육찬기;이진영;오혜빈;이의진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.167-170
    • /
    • 2022
  • 본 논문에서는 화장품의 효율적 구매를 위한 화장품 성분표를 분석하고 정보를 전달하는 기능의 시스템을 제안한다. 이 시스템에서는 화장품 성분표에 최적화시킨 OCR (Optical Character Recognition) 모델을 사용해 화장품 성분표를 촬영한 영상에서 인식한 문자 데이터를 추출한다. 이 문자 데이터를 통해 얻은 화장품 성분이 사용자 피부 유형에 적합한지 구축된 데이터베이스와의 비교를 통해 소비자에게 최종 전달된다. 200개의 화장품 성분표 영상을 사용해 제안하는 화장품 성분표 분석 모델의 성능을 평가한 결과 80.348%의 정확도를 보였다.

  • PDF

히스토그램을 이용한 문자 영역 추출 (character segmentation using histogram)

  • 김지은;정우영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

문서영상에서 표 구성 직선과 데이터 추출 (The Extraction of Table Lines and Data in Document Image)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.556-563
    • /
    • 2006
  • 문서 영상에서 표 영역을 분류하고 구조를 파악하려면 표를 구성하는 직선과 데이터를 추출할 수 있어야 한다. 그러나 영상 입력 장치의 오차나 영상축소로 인해 표를 구성하는 직선이 끊어지거나 길이가 변하며 직선에 노이즈나 문자가 붙어 표로부터 직선과 데이터의 정확한 추출이 어렵다. 본 논문에서 는 1차원 메디안 필터를 이용하여 표를 구성하는 수평선과 수직선을 추출한다. 1차원 메디안 필터는 필터링 방향의 직선을 추출하는 과정에서 노이즈와 필터링 방향에 수직한 직선을 제거할 뿐 아니라 직선의 끊어진 부분이 필터 탭 길이보다 짧은 경우 끊어진 부분을 연결한다. 또한 수직선을 추출하는 과정에서 직선에 붙어 있던 문자들을 분리함으로써 상용제품을 포함한 기존의 방법에 비해 표 영역 분류 및 구조 분석을 위한 직선과 데이터 추출이 우수한 방법을 제안한다.

한국어 음성 합성을 위한'이음표'의 문자 전사 (Transcribing Some Text Symbols for Improving Korean TTS System)

  • 정영임;정휘웅;윤애선;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.558-560
    • /
    • 2003
  • 최근 신문기사의 음성 서비스 등 음성합성 연구가 실용단계로 접어들고 있으나, 텍스트의 비-문자 처리에는 오류율이 높다. 본 연구는 신문 텍스트에 나타나는 비-문자 중 중의성이 높은 이음표의 문자화 유형을 6가지로 제시하고, 이음표를 포함한 어절의 패턴화된 구조 및 좌우 문맥 정보를 이용하여 이음표의 문자화 규칙을 알아본다. 제시된 이응표의 문자화 규칙과 이음표가 좌우 문맥 숫자의 문자화에 미치는 영향에 따른 숫자 읽기 방식을 포함하여 이음표 포함된 텍스트의 문자화 전사 시스템을 구현하였고, 2런치 J신문 텍스트를 코퍼스로 하여 이음표 문자화 시스템의 정확도를 측정하였다. 아울러 실험 결과에서 오류로 나타난 유형을 분석하여 정확도를 향상시킬 수 있는 방안을 제시하였다.

  • PDF

1차원 메디안 필터 기반 문서영상 영역해석 (The Region Analysis of Document Images Based on One Dimensional Median Filter)

  • 박승호;장대근;황찬식
    • 대한전자공학회논문지SP
    • /
    • 제40권3호
    • /
    • pp.194-202
    • /
    • 2003
  • 인쇄문서를 전자문서로 자동변환하기 위해서는 문서영상 영역해석과 문자인식 기술이 필요하다. 이들 중 영역해석은 문서영상을 세부 영역으로 분할하고, 분할한 영역을 문자, 그림, 표 등의 형태로 분류한파. 그러나 문자와 그림의 일부는 크기, 밀도, 화소분포의 복잡도가 비슷하여 정확한 분류가 어렵다. 따라서 영역해석에서의 오 분류는 자동변환을 어렵게 만드는 주된 원인이 된다. 본 논문에서는 분서영상을 문자와 그림영역으로 분할하는 영역해석 방법을 제안한다. 문자와 그림의 분류는 1차원 메디안 필터링을 기반으로 한 방법을 이용하여 언급한 문제점을 해결한다. 또한 메디안 필터링에 의해 발생하는 볼드체 문자와 그래프나 표와 같은 그림영역의 오 분류 문제를 표피 제거 필터와 문자의 최대크기를 이용하여 해결한다. 따라서 상용제품을 포함한 기존의 영역해석 방법보다 그 성능이 우수하다.

재난문자에서의 외국어 제공 현황 (Status of Providing Foreign Languages in Disaster Warning Text Message)

  • 이현지;변윤관;장석진;최성종;표경수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.140-142
    • /
    • 2019
  • 이 연구에서는 재난문자에서의 외국어 제공 현황에 대해 알아보았다. 우선, 뉴스를 분석한 결과, 외국인들은 국내 재난문자의 문제점으로 한국어라는 언어 제공 한정을 꼽았다. 다음으로, 미국은 WEA 규정에 따라 영어 외에 스페인어로 된 경고 메시지를 지원해야 하는 것으로 나타났다. WEA에서의 다국어 제공을 위한 다양한 노력도 하고 있었다. 마지막으로, 일본은 이동통신사 차원에서 다국어 재난문자를 지원하고 있는 것으로 나타났다. NTT DOCOMO는 외국인을 위해 일본어 재난문자를 영어, 중국어, 한국어로 번역해 주는 기능을 제공하고 있었다. KDDI도 NTT DOCOMO가 제공하는 언어 외에 포르투칼어, 스페인어도 제공하고 있었다.

  • PDF

사전 정보를 이용한 자동차 번호판의 문자 위치 추출과 세그멘테이션에 관한 연구 (A Study of plate Number Extraction and Segmentation using domain Knowledge)

  • 김병훈;고미애;김영모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2003
  • 차량 번호판 인식 시스템의 번호판 인식과정은 영상획득 및 번호판 영역 추출, 개별문자 추출, 문자 인식의 3가지 핵심부분으로 구성된다. 이 중에서도 번호판 추출의 정확성은 시스템 전체의 결과에 영향을 줄 수 있는 부분이며 다양한 주변 환경에도 정확한 추출과 빠른 수행 시간을 요구한다. 본 논문에서는 검출 시간의 단축을 위하여 명암값의 차이와 사전정보를 이용하여 먼저 인식대상의 주목표인 등록번호의 위치를 추출 및 검증하고 등록번호에 대한 지역명의 상대적인 위치 정보를 이용하여 문자의 대략적인 위치를 선정, 각 요소들의 외곽 근접 선들의 투영(protection)과 이동을 통하여 번호판의 모든 문자 요소의 위치를 추출한다.

  • PDF

지역 맞춤 기반의 긴급 재난문자 서비스를 위한 다대일 통신 (Many-to-One Communications for Cell Broadcast Service Based on Geo-Targeting)

  • 변윤관;이현지;장석진;최성종;표경수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.5-7
    • /
    • 2020
  • 재난문자 전송은 기지국에서 다수의 단말기로 재난문자를 전달하는 단방향 프로토콜인 CBS 긴급 재난문자 서비스를 이용한다. 이 CBS 전송 기법은 일대다(One-to-Many) 방식을 이용한다. 현 CBS 프로토콜은 일종의 방송 방식으로 기지국은 긴급재난문자를 수신한 단말기로부터 어떠한 확인 메시지도 전달받지 못한다. 그러나 재난관리기관은 효율적인 재난 대응을 위하여 재난지역의 재난문자 수신자로부터 유용한 정보를 전달받을 필요가 있다. 즉 CBS 재난문자를 수신한 단말기들로부터 재난관리기관 서버로 CBS 메시지에 대한 응답 메시지를 전달받는 방식으로 유용한 정보를 취합할 수 있다. 이러한 전달방식을 위해 다대일(many-to-one) 통신 기법이 고려된다.

  • PDF