• 제목/요약/키워드: 문자기능

검색결과 374건 처리시간 0.028초

재난 문자 크롤링 및 시각화 애플리케이션 설계 및 구현 (A Design and Implementation of Disaster Text Crawling and Visualization Application)

  • 이원주;박봉균;박문규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.89-90
    • /
    • 2021
  • 본 논문에서는 Python과 Selenium 라이브러리 기반의 재난 문자 크롤링 및 데이터 시각화 애플리케이션을 설계하고 구현한다. 이 애플리케이션의 특징은 웹상에서 재난 문자 데이터를 크롤링(Crawling)하여 그 빈도수에 따라 시각화하는 것이다. 이 애플리케이션을 활용하여 국민재난안전포털에 접속하여 재난 문자 데이터를 크롤링하고, 그 데이터를 Word Cloud를 활용하여 지역별 재난 문자 빈도수를 시각화한다. 지역별 재난 문자 빈도수를 한눈에 보기 쉽게 시각화함으로써 재난문자를 잘 확인하지 않는 사람들에게 해당 지역의 재난 정보를 쉽게 전달하는 기능을 제공한다.

  • PDF

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발 (Text/Voice Recognition & Translation Application Development Using Open-Source)

  • 윤태진;서효종;김도헌
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.425-426
    • /
    • 2017
  • 본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

  • PDF

이미지파일에 포함된 개인정보추출에 관한 연구 (A Study on Detecting Personal Information from Image Files)

  • 이민석;김숙현;윤지애;원유재
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.209-212
    • /
    • 2017
  • 최근 정보통신기술의 비약적 발전에 따라 문서 제작 과정 또한 디지털 방식의 형태가 주를 이루게 되었다. 하지만 이와 더불어 문서를 통한 개인 정보 유출의 문제 또한 대두되게 되었다. 본 논문에서는 이미지 형식의 문서의 유출 방지를 위해 광학문자인식(OCR)을 활용한 문자인식 기능과 개인정보 검출 기능을 통합적으로 수행 한하여 기존 OCR엔진과의 차별점을 두었다. 또한 원하는 경로의 파일 탐색을 가능하도록 하고, 선택한 경로에 저장되어 있는 이미지파일 내의 검출 문자들을 정규표현식을 사용해 특정한 개인정보 패턴과 매칭하여 문서 내 포함된 개인정보를 반환하여 출력한다. 이러한 개인정보 검출 결과 중요 개인정보가 포함된 파일을 사용자에게 별도로 통보하도록 한다. 따라서 본 논문에서는 기존의 개인정보 검출 과정의 번거로움을 극복하여 사용자의 편의 향상과 더불어 문서를 통한 개인정보의 유출을 사전에 방지 할 수 있도록 하였다.

  • PDF

인공 문법을 사용한 암묵 학습: EPAM IV를 사용한 모사 (Implicit Learning with Artificial Grammar : Simulations using EPAM IV)

  • 정혜선
    • 인지과학
    • /
    • 제14권1호
    • /
    • pp.1-9
    • /
    • 2003
  • 본 연구에서는 EPAM(Elementary Perceiver and Memorizer) Ⅳ를 사용하여 인공 문법이 사용된 암묵적 학습에서의 인간 수행을 모사하였다. 암묵 학습(implicit learning) 과제에서 참가자들은 인공 문법(rtificial grammar)을 사용해 만들어진 '문법적' 문자열과 무선적으로 만들어진 '비문법적' 문자열을 학습하였는데, 이 때 비문법적 문자열보다 문법적 문자열의 학습이 더 우수하였다. 또한 참가자들은 이전에 본 적이 없었던 새로운 문자열에 대해서도 그 문법성을 판단할 수 있었다. 단순 기억 시스템인 EPAM Ⅳ에 항목 내 군집화(within-item chunking) 기능을 추가하여 암묵 학습 과제에서의 인간수행을 모사한 결과, EPAM Ⅳ 또한 무선적인 문자열보다 문법적인 문자열을 보다 잘 학습하였고, 비문법적 문자열과 문법적 문자열을 구별할 수 있었다. 이러한 결과는 인공 문법을 사용한 암묵 학습 과제에서의 수행이 규칙 추상화보다는 군집화(chunking)에 근거한 재인 기억을 바탕으로 이루어짐을 시사한다.

  • PDF

EAST 모델과 OCR을 이용한 실시간 문자 탐지 시스템 (Real-time Character Detection System Using EAST Model and OCR)

  • 최예준;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.683-684
    • /
    • 2023
  • 웹페이지나 디지털 문서에는 특정 단어나 특정 문구를 검색하는 기능이 있다. 인쇄된 도서나 참고서 등과 같은 인쇄물에는 실시간으로 특정 단어나 특정 문구를 찾는 기능이 없어 어려움을 겪는 경우가 많다. 본 논문에서는 텍스트를 감지(Detection)하는 EAST 모델과 텍스트를 인식(Recognition)하는 EasyOCR을 활용한 실시간 문자 탐지 시스템의 개발내용에 대해 기술한다. 이 시스템을 통해 사용자는 인쇄물에서 실시간으로 원하는 단어나 문구를 찾아 필요한 정보를 빠르게 읽는 것에 효과적일 것을 기대한다.

  • PDF

맥 포렌식을 통한 아이폰 아티팩트 분석 기법

  • 이경식
    • 정보보호학회지
    • /
    • 제26권5호
    • /
    • pp.17-21
    • /
    • 2016
  • 아이폰은 애플컴퓨터에서 개발한 스마트폰으로 애플의 데스크톱 운영체제인 OS X를 스마트폰에 맞게 변형한 iOS 운영체제를 사용한다. iOS는 폐쇠성과 높은 보안성 기능을 내장함으로 사용자에게는 개인 정보를 안전하게 보호할 수 있는 장점을 제공하지만, 디지털 포렌식 분석가에게는 분석 시 많은 어려움을 주고 있다. 애플은 2013년 OS X 매버릭스(10.9)를 시작으로 iOS와 OS X간의 기밀 정보 동기화 및 통화/문자 메시지를 연동할 수 있는 기능을 제공하기 시작하였으며, 2016년에 공개된 시에라(10.12)에서도 클립보드 기능 공유 등의 다양한 연동 기능을 제공하고 있다. 이러한 편의 기능은 분석가에게 아이폰 분석이 어려운 상황에서 아이폰 소유주의 OS X 시스템을 분석하여 아이폰의 아티팩트를 확보할 수 있는 한가지 방법이 될 수 있다. 본 논문에서는 아이폰에서만 획득 가능했던 아티팩트인 통화 및 문자 메시지 내역, 패스워드 정보 등이 OS X와 어떻게 연동되는지 알아보고 OS X 분석 만으로 이러한 증거를 확보할 수 있는 기법을 알아보도록 한다.

정규표현식 프로세서에서의 효율적 문자 클래스 매칭을 위한 구조 (Architecture for Efficient Character Class Matching in Regular Expression Processor)

  • 윤상균
    • 전기전자학회논문지
    • /
    • 제22권1호
    • /
    • pp.87-92
    • /
    • 2018
  • 보통의 CPU 처럼 명령어 기반으로 정규표현식 패턴 매칭을 수행하는 정규표현식 프로세서가 최근에 연구되었다. 이들 중 REMPc만이 문자 클래스 처리를 위한 기능을 제공한다. 본 논문에서는 정규표현식에서 사용 빈도가 높은 문자 클래스들에 대해서 명령어의 오퍼랜드 필드에 비트맵 방식으로 나타내고, 하드 배선 방식으로 이 문자 클래스에 대한 매칭을 수행하여 효율적인 문자클래스 매칭을 수행하는 구조를 제안한다. 제안한 방법을 사용하면 Snort 규칙의 문자 클래스에 대해서 대부분의 문자 클래스를 명령어의 한 오퍼런드 또는 한 명령어로 나타낼 수 있다. 이처럼 REMPc에 비해서 적은 수의 명령어를 사용하므로 효율적인 문자 클래스 매칭을 할 수 있다.

항만 영상정보시스템 구축을 위한 컨테이너 식별자 인식 (A Recognition Method of Container ISO-code for Vision & Information System in Harbors)

  • 구경모;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.721-723
    • /
    • 2007
  • 현재 항만의 컨테이너 양하 및 적하 과정에서 획득되는 컨테이너 영상은 크기 및 위치가 정형화되어 있지 않고, Yard Tractor의 정차 차선과 컨테이너의 크기 등의 외부 환경 변화로 인해 인식에 적합한 영상을 획득하기 어렵다. 본 논문에서는 Top-Hat Transform을 이용하여 실시간 영상으로부터 문자의 영역을 추정하고, 카메라의 PAN/TILT/ZOOM 기능을 이용한 시선이동을 통해 문자인식에 적합한 영상을 획득한다. 획득된 컨테이너 영상으로부터 Top-Hat Transform 및 Histogram Projection을 이용하여 식별자 영역을 추출하고 이진화한 뒤, Labeling 된 결과를 토대로 배경과 문자영역을 구분하고 개별 문자들을 추출한다. 이후 오류역전파 알고리즘을 이용하여 추출된 개별 문자들을 인식한다. 실제 부두에 설치하여 제안된 컨테이너 식별자 영상 획득 및 인식 방법이 우수함을 확인하였다.

  • PDF

중간점 알고리즘을 이용한 신경회로망 필기체 패턴인식 (Neural Network Handwriting Recognition Using Middle Point Algorithm)

  • 소아람;신병석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.394-397
    • /
    • 2007
  • 본 논문에서는 문자 인식의 특징 선별 방법으로 중간점 알고리즘을 이용하는 방법을 제안한다. 영상자료의 특징들로부터 중간점을 선별하고 심볼패턴을 이용하여 필기체 문자를 인식한다. 이 방법은 사전에 많은 심볼 패턴을 학습해야 하지만 한글과 영어의 높은 인식률을 보이고 있으며, 특히 복잡한 문자들의 경우 좋은 결과를 낸다. 여기서는 중간점 알고리즘으로 입력된 데이터를 심볼 패턴과 비교하고, 심볼 영역에 의해 최적 판별 기저를 탐색한 후, 그것을 특징으로 선택한다. 또한 사전 기능과 투명도 기능을 구현하여 필기체 인식을 이용한 여러 활용 방안을 제시한다.

  • PDF

OSD 메뉴 자동검증을 위한 작업스케줄링 및 패턴 인식 기법 (Job Scheduling and Pattern Recognition for Auto OSD Verification System)

  • 이진석;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.379-381
    • /
    • 2006
  • 본 연구는 디스플레이 제품의 OSD(On Screen Display) 메뉴의 문자 오류 검사 과정을 자동화하는 방법과 FMM 신경망을 이용한 실시간 문자인식 방법을 제안한다. 이는 일반적인 문자인식 문제와는 달리 시스템 환경에 대한 몇 가지 가정과 제약조건을 고려해야 한다. 예컨대 문제의 특성상 카메라 및 TV제어 기기부의 동작과 연동하는 작업 스케줄링 기능과 실시간 분석기능 등의 요건은 시스템개발을 복잡하게 하는 반면, 주어진 OSD 메뉴 데이터로부터 검증과정은 미지 패턴에 대한 인식과정을 단순화하여 일종의 판정(decision) 문제로 고려될 수 있게 한다. 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시켜서 검증과정을 자동화하는 작업스케줄링 방법을 제안하고 인식의 방법론으로서 수정된 구조의 FMM신경망을 적용한다. 또한 실제 데이터를 사용한 실험결과를 통해 시스템의 유용성을 고찰한다.

  • PDF