• Title/Summary/Keyword: 광학적 문자인식

Search Result 42, Processing Time 0.032 seconds

영상처리를 활용한 현장 안전관리 개선방안 (Improvements of Field Safety Management Using Image Processing)

  • 장민우;이민용;구도진;신동호;강우철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.710-712
    • /
    • 2019
  • 오늘 날 산업현장에서는 현장에서의 생산성 향상과 안전을 강화하기 위한 방법으로 IT기술을 접목한 현장 안전관리 분야가 비약적으로 성장하고 있다. 특히 제조업, 건설업 분야의 산업현장에서 발생하는 안전사고에 대응하기 위해 현장 관리자를 보조하는 IT 기술은 지속적인 분석과 개선이 요구된다. 본 논문에서는 산업현장에 투입되는 근로자의 안전을 위하여 인물 Tracking과 광학문자인식 기법을 활용하여 스마트 현장 안전관리 시스템의 구조와 개선방안을 제시한다.

딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구 (A Study on Improvement of Korean OCR Accuracy Using Deep Learning)

  • 강가현;고지현;권용준;권나영;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.693-695
    • /
    • 2018
  • 다음은 본 논문에서는 딥러닝을 통한 한글 OCR 정확도 향상을 제안한다. OCR은 인쇄되거나 손으로 쓴 문자를 광학적 방법으로 감지 인식하여 디지털로 인코딩하는 프로그램이다. 현재 가장 많이 쓰이는 tesseract OCR의 경우, 영문 인식의 정확도가 높다. 하지만 한글은 복잡한 구조에 비해 학습 데이터가 적어 정확도가 떨어진다. 따라서 이 연구에서는 이미지 프로세싱을 통해 원하는 이미지에서 글자 영역을 추출하고, 이를 학습 데이터로 활용한 딥러닝으로 한글 OCR의 정확도를 향상시키는 방법을 제안한다. 기존 영문과 숫자 및 몇 가지 언어에만 국한되어 발전해왔던 OCR을 다양한 언어에도 응용할 수 있을 것으로 기대된다.

  • PDF

맞춤형 여행 콘텐츠 개발을 위한 OCR 기법을 활용한 영화 속 촬영지 정보 추출 방안 제시 (Study on Extracting Filming Location Information in Movies Using OCR for Developing Customized Travel Content)

  • 박은비;신유빈;강주영
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.29-39
    • /
    • 2020
  • 목적 사회 전반적으로 퍼진 개인의 취향에 대해 존중하는 분위기는 소비 트렌드를 바꾸었다. 그에 따라 여행 산업에서도 소비자 개인의 취향을 반영하는 맞춤형 여행이 새로운 트렌드로 주목받고 있다. 특히 여행 산업 분야 중 하나인 '영화 관광'에 대한 관심이 커지고 있음에 주목하였다. 영화를 시청하며 발생하는 개인의 여행 동기를 맞춤형 여행 제안으로 충족시키고자 하며, 이는 '영화 관광 산업'의 지속적 발전의 촉진제가 될 것으로 기대한다. 설계/방법론/접근 본 연구에서는 시청자가 실제로 방문하고 싶은 영화 속 촬영지 정보를 'OCR'을 통해 추출, 제안하는 방법론을 구현하였다. 먼저, 실시간 이미지 프로세싱 라이브러리인 'OpenCV'를 활용하여 사용자가 선택한 영화 속 장면을 추출 받는다. 또한, 딥러닝 기반의 텍스트 영역 탐지모델인 'EAST 모델'을 활용하여 해당 장면 이미지에서 문자가 위치한 곳을 탐지하여 검출한다. 검출한 이미지는 'OpenCV 내장 함수'를 사용해 전처리하여 인식의 정확도를 높인다. 마지막으로 광학 문자 인식 엔진인 'Tesseract'를 사용하여 이미지 속 문자를 인식 가능한 텍스트로 변환한 후, 'Google Map API'를 통해 실제 위치 정보를 반환한다. 의의 본 연구는 기존의 영화 관광에서 나아가, 4차 산업 기술을 활용한 개인 맞춤 관광 콘텐츠를 제공해준다는 점에서 큰 의의가 있다. 이는 앞으로 여행사와 함께 영화 관광 패키지 상품 개발에 활용될 수 있다. 또한 국내에서 해외로의 유입뿐만 아니라, 해외에서 국내로의 유입에 활용될 가능성 역시 내포하고 있다.

기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항 (Considerations for Applying Korean Natural Language Processing Technology in Records Management)

  • 김학래
    • 한국기록관리학회지
    • /
    • 제22권4호
    • /
    • pp.129-149
    • /
    • 2022
  • 기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.

시각장애인을 위한 보행 안내 스마트 안경 플랫폼 설계 (Design of Smart Glasses Platform walking guide for the visually impaired)

  • 이재범;장종욱;장성진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.320-322
    • /
    • 2021
  • 세계적으로 고령 인구가 증가함에 따라 시각장애인의 비율 역시 증가하고 있으며, 여전히 안전상에 문제, 안내정보 부족 등 시각장애인이 외부 활동을 하는 데에 있어서 많은 제약이 존재한다. 이를 해결하기 위해 광학 문자 인식(OCR) 기능이 탑재된 스마트 안경 등 스마트 기기에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 전방에 장애물을 인식해 음성으로 정보를 알려주고, 목적지까지 길을 안내해주는 시스템을 제안한다. 딥러닝 객체 인식 모델인 Yolo를 이용하여 계단, 라바 콘과 같은 위험요소를 장애물로 인식하고 음성으로 정보를 전달해주며, 길 찾기 API와 음성인식, TTS 라이브러리를 사용하여 입력한 목적지까지 음성으로 길 안내를 해줌으로써 시각장애인의 외부 활동 범위가 확대되는 효과를 기대할 수 있다.

  • PDF

노년층을 위한 의약품 식별 애플리케이션 (Drug identification application for aged group)

  • 조현준;서혜민;정환훈;임혁;주종화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.673-675
    • /
    • 2022
  • 우리 사회에서 개인이 복용하고 있는 약물의 종류와 수가 점점 늘어나고 있다. 약물의 사용이 증가하면서 때로는 치명적일 수 있는 약물 오남용 또한 빈번히 발생하고 있으며 특히 노년층과 같이 약품을 정확하게 구별할 수 없는 사람들은 더욱더 그 위험에 노출되어있다. 본 논문에서는 사용자가 간단한 사진을 찍는 행위를 거치면 약물의 정보를 제공하고, 복용법을 알 수 있는 모바일 애플리케이션에 관하여 기술한다. 이를 구현하기 위하여 세밀한 시각적 분류 (Fine-Grained Visual Categorization, FGVC) 기법과 광학 문자 인식 (Optical Character Recognition, OCR) 기법을 결합한 인공지능 모델을 사용하였으며, React Native 를 사용하여 운영체제에 종속되지 않도록 애플리케이션을 제안한다. 이 애플리케이션은 노년층에 친화된 UI/UX 로 디자인되었으며, 약물의 정보 제공 이외에도 개인 약물 관리, 주변 약국 길 찾기 등의 편의 기능을 통해 노년층에 삶의 질 향상을 기대할 수 있을 것이다.

광학 문자 인식(OCR)을 활용한 저시력자 및 시각장애인 등 사회적 약자를 위한 비건 판독 시스템 개발 (Development of a Vegan Decipher System for the Social Vulnerable, such as the Low Vision Person and the Visually Impaired Person Using Optical Character Recognition (OCR))

  • 오혜림;공예나;김정민;최재준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.990-991
    • /
    • 2023
  • 커져만 가는 비건 시장에 비해서 비건 제품의 가격은 높고, 한정되어 있다. 성분표만을 보고 비건 여부를 파악하기에는 어렵고, 저시력자 및 시각장애인에게는 더욱 어려운 일이다. 치주 질환이나 당뇨를 포함한 크고 작은 다양한 질병으로 인해 육식 섭취 대신 불가피하게 채식을 실천해야 하는 경우 또는 가격 부담이 크고 찾기 어렵다. 그래서 비건 인증을 받은 제품 대신 일반 제품들 사이에서 비건에 적합한 제품을 찾는 데 도움이 되는 시스템을 개발하고자 한다. 본 논문에서는 저시력자 및 시각장애인을 위한 큰 글씨 화면, 음성 입출력 시스템 제공과 성분표 촬영을 통해 비건 적합 여부 및 알레르기 정보 제공, 사용자 특성 분석을 통한 UI 구성의 서비스를 제공한다. 성분표 촬영에 어려움을 겪는 저시력자 및 시각장애인에게 편리를 제공하기 위해 소프트웨어 뿐만 아니라 하드웨어를 구성한다.

문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발 (Development of Intelligent OCR Technology to Utilize Document Image Data)

  • 김상준;유동희;황소영;김민호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.212-215
    • /
    • 2022
  • 오늘날 소위 디지털 전환시대를 맞아, 많은 부분에서 빅데이터의 구축과 활용에 대한 필요성이 높아졌다. 오늘날에 많은 데이터가 디지털기기, 미디어 친화적으로 생산 및 보관되는 것과 달리, 과거 오랜 기간 데이터의 생산 및 보관은 활자 인쇄도서가 주를 이루었다. 따라서 오랜 기간 축적되어온 방대한 활자 인쇄도서를 빅데이터로써 활용하기 위한 광학 문자 판독(OCR: Optical Character Recognition) 기술의 필요성 역시 빅데이터의 필요성에 맞추어 함께 요구되었다. 본 연구에서는 도서 스캔 이미지의 정보를 각 문서 객체별로 세분화하여 그 구조와 내용을 디지털화하는 시스템을 제안한다. 제안 시스템은 크게 1) 문서객체(표, 수식, 그림, 본문)의 영역정보를 인식. 2)인식된 객체의 영역정보를 각각 표 처리, 수식 처리, 텍스트 처리 모듈로 OCR. 3) OCR로 처리된 문서 정보를 JSON형식으로 종합하여 반환하는 세 단계로 구성된다. 본 연구에서 제안하는 모델은 이러한 단계를 수행함에 있어 오픈소스로 공개된 프로젝트를 활용하되, 본 시스템의 목표에 맞추어 추가적인 학습과 개량을 거쳤다. 본 연구에서 제안한 지능형 OCR 시스템은 문서 이미지 내 4종(표, 수식, 이미지, 텍스트)의 객체인식과 처리에 있어 상용 소프트웨어 수준의 성능을 확인할 수 있었다.

  • PDF

인슈어테크(InsurTech)산업에서의 인공지능(AI)을 활용한 보험서비스 마케팅사례 연구 (Case Studies for Insurance Service Marketing Using Artificial Intelligence(AI) in the InsurTech Industry.)

  • 조재욱
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.175-180
    • /
    • 2020
  • 최근 활성화 되고 있는 인슈어테크(InsurTech) 산업에서의 인공지능(AI)을 활용한 보험서비스 마케팅 사례연구를 통해, 보험산업 생태계에서 혁신적인 기술(예: 인공지능, 기계학습 등)이 어떻게 활용되고 있는지 살펴보았다. 특히, 국내·외 서비스 사례연구를 통해 인공지능기술을 활용하여 파괴적 혁신을 가져온 미국의 레모네이드(Lemonade)사의 챗봇을 이용한 신속하고, 간편한 보험가입 및 보험금 지급 서비스, 국내 AI컴퍼니의 광학 문자 인식(OCR)기반의 진단서 입력을 통해 예상 보험금이 산출되는 보험금 산정서비스를 고찰해 보았다. 사례분석 결과 인공지능 기반의 수많은 고객데이터를 활용한 기계학습을 통해 보험 가입 및 지급 절차에 있어 리드타임을 획기적으로 단축하였고, 고객과 보험사간의 분쟁이 많은 보험금 산정에 있어서도 정확하고 합리적인 보험금을 산출함으로써, 고객만족과 고객가치를 높일 수 있었다.

기계학습 알고리즘 기반 하자 정보 관리 시스템 개발 - 공동주택 전용부분을 중심으로 - (A Developing a Machine Leaning-Based Defect Data Management System For Multi-Family Housing Unit)

  • 박다슬;차희성
    • 한국건설관리학회논문집
    • /
    • 제24권5호
    • /
    • pp.35-43
    • /
    • 2023
  • 공동주택 하자 분쟁의 증가와 함께, 하자관리의 중요성 또한 커지고 있다. 그러나 기존의 연구는 '공용 부분'에 초점을 맞추어 진행되었다. 또한 하자관리의 주체인 '관리사무소'를 위한 시스템 연구도 부족한 실정이다. 이는 관리사무소의 하자관리 능력의 부족과 관리 품질의 저하를 초래한다. 따라서, 본 논문에서는 관리사무소를 위한 기계학습 기반의 하자 정보 관리 시스템을 제안한다. OCR과 NLP 모듈을 사용하여 관리상의 불편한 점을 해소하는 것을 목표로 한다. OCR을 통해 수기로 작성된 하자 정보를 디지털 문서로 변환한다. 이후 언어모델을 이용하여 사용자가 지정한 양식과 함께 하자 정보를 재생성한다. 최종적으로 생성된 텍스트를 데이터베이스에 저장하고 이를 기반으로 통계적 분석을 실행한다. 이러한 일련의 과정을 통해, 관리사무소의 하자관리 역량을 향상할 수 있도록 돕고, 의사결정을 지원할 수 있을 것으로 기대한다.