• 제목/요약/키워드: 문자인식

검색결과 1,167건 처리시간 0.023초

주차 시설 현황 조사를 통한 주차 회전율 파악에 관한 연구 (A Study on Understanding Parking Turnover through Parking Survey)

  • 이현창;신성윤;신광성
    • 한국정보통신학회논문지
    • /
    • 제18권11호
    • /
    • pp.2645-2650
    • /
    • 2014
  • 본 논문에서는 효율적으로 주차 공간을 확보하고 주차장의 성능을 향상시키기 위한 방법 중 하나인 차량 번호판 조사를 이용하여 평균 주차 시간과 주차 회전율을 구하였다. 특이할 만한 사항은 일반적인 차량 번호판 조사는 사람이 직접 수행하게 되어있는데 본 조사에서는 사람이 직접 조사하지 않고 CCTV를 통하여 조사를 수행하였다. 따라서 적당한 조사 시간 간격(인터벌)을 두고 평균 주차 지속 시간과 주차 회전율을 구한 것이다. 이것으로 인하여 효율적으로 주차장을 사용하는지 여부와 차량의 주차 소통 여부를 쉽게 알 수 있다. 단지 실험에서 문자 인식 부분은 4-방향 프로젝션을 이용하여 추출하는데 이번 연구에선 제외하였다.

밝기 정보를 이용한 영상 이진화에 관한 연구 (A Study on Image Binarization using Intensity Information)

  • 김광백
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.721-726
    • /
    • 2004
  • 영상의 이진화는 문자 인식, 영상 분석 등 다양한 영상 처리 분야의 전처리 과정으로 자주 적용되고 있다. 영상 이진화는 임계치의 설정에 따라 처리 성능이 좌우되며, 대부분의 기존 이진화 방법은 밝기 값의 히스토그램을 사용하여 평균 밝기 값이나 히스토그램의 골짜기를 임계치로 설정한다. 이와 같은 방법은 양봉의 특징을 보이지 않거나 특정 영상을 추출하려는 경우에는 적절한 임계치를 얻기 어렵다. 따라서 본 논문에서는 그레이 스케일 영상에서 밝기 값을 여러 구간으로 분할하여 각 구간의 밝기 평균값을 구하고, 두 개의 구간에 대해 평균값 사이의 거리를 각 구간에서 평균값과 양극과의 거리 비율로 나누어서 계산된 값을 두 개의 구간을 합친 새로운 구간의 임계치로 설정한다. 최종적으로 하나의 구간이 생성될 때까지 구간 통합과 임계값 계산을 반복함으로써 이진화 임계값을 산출한다. 제안된 이진화 방법의 성능을 평가하기 위하여 다양한 종류의 영상에 적용한 결과, 기존의 이진화 방법들보다 효율적인 것을 확인하였다.

지능 에이전트 구현의 인지적 접근 (Cognitive Approach for Building Intelligent Agent)

  • 태강수
    • 인터넷정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.97-105
    • /
    • 2004
  • 에이전트가 지각이나 행위의 표상을 이해할 수 없는 이유는 의미론적 자질을 문자열로 변환하는 구문론적 표상방식에 의해서 일어난다. 자율적으로 학습하는 인지 에이전트를 구현하기위해 코헨은 에이전트가 sensor와 effector를 사용하여 주위환경과 물리적으로 직접적인 상호작용을 통하여 물리적 스키마의 의미 표상을 학습하는 의미론적 방법을 제안하였다. 본 논문에서는 부정(negation)은 그러한 물리적 스키마를 인식하게 하는 메타 스키마임을 제안한다. 최근에 Graphplan은 계획 시스템의 성능을 향상하기 위하여 inconsistency를 이용하는 제어규칙을 사용하지만, 구문론적으로 접근하여서 부정의 의미 개념을 이해하지 못하고 중복표현의 문제를 야기한다. IPP는 부정 함수인 not을 도입하여 중복문제를 해결하지만 여전히 구문론적으로 접근하며 또한 시간과 공간에서 비효율적이다. 본 논문에서는 의미론적인 접근법을 도입하여 부정을 위해서 반대 개념이라는 긍정 아톰(atom)을 사용하는 것이 지능 에이전트를 구현의 효율적 기법이라고 제안하고, 이 가설을 지지하는 실험적 결과를 제시한다.

  • PDF

이미지 변환 엔진을 탑재한 모바일용 전자우편 추출 엔진의 설계 및 구현 (Design and implementation of e-mail extraction engine for mobile with image conversion facilities.)

  • 윤호범;김명삼
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.628-634
    • /
    • 2003
  • 인터넷상에서 서비스되고 있는 E-Mail 서비스는 POP3 또는 IMAP4 통신 규약을 기반으로 하고 있으며, 최근에는 이미지와 Hypertext를 포함한 메일 내용을 전송하고, 수신하는 기능이 보편화되고 있다. 무선 인터넷을 이용한 모바일 전자우편 서비스를 위해서는, POP3의 경우 전용 모바일 E-Mail 서버를 이용하거나 E-Mail 내용을 모바일에 적합하도록 변환하여야만 하고, Web-Mail로 이용되는 IMAP4 E-Mail의 경우에는 원격 파일 서버와 같이 서버 측에 E-Mail이 보관되므로 IMAP4 규약이 없는 모바일 클라이언트로는 모바일 E-Mail 서비스의 이용이 곤란하다 특히, 이미지나 Hypertext를 포함하는 경우 이들이 문자형태로 전송되므로 모바일에서 정보로 인식하기 매우 곤란하다는 문제점이 있다. 본 논문에서는 최근 보편화되고 있는 IMAP4 기반의 Web-Mail을 모바일에서 이용할 수 있도록 하는 모바일용 E-Mail 추출 엔진을 구현함으로써, POP3 E-Mail 서비스뿐만 아니라 IMAP4를 기반으로 하는 Web-Mail을 모바일 환경에서 이용할 수 있도록 하였으며, 이미지 변환 기능을 설계하여 기존 E-Mail 서비스에서 제공하지 않았던 E-Mail에 포함된 이미지 정보를 사용자에게 제공하도록 하였다. 이와 같이 E-Mail 추출엔진과 이미지 변환 엔진을 설계 및 구현함으로써 모바일 환경에서 최적의 E-Mail 서비스를 받을 수 있도록 하였다.

  • PDF

External knowledge를 사용한 LFMMI 기반 음향 모델링 (LFMMI-based acoustic modeling by using external knowledge)

  • 박호성;강요셉;임민규;이동현;오준석;김지환
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.607-613
    • /
    • 2019
  • 본 논문은 external knowledge를 사용한 lattice 없는 상호 정보 최대화(Lattice Free Maximum Mutual Information, LF-MMI) 기반 음향 모델링 방법을 제안한다. External knowledge란 음향 모델에서 사용하는 학습 데이터 이외의 문자열 데이터를 말한다. LF-MMI란 심층 신경망(Deep Neural Network, DNN) 학습의 최적화를 위한 목적 함수의 일종으로, 구별 학습에서 높은 성능을 보인다. LF-MMI에는 DNN의 사후 확률을 계산하기 위해 음소의 열을 사전 확률로 갖는다. 본 논문에서는 LF-MMI의 목적식의 사전 확률을 담당하는 음소 모델링에 external knowlege를 사용함으로써 과적합의 가능성을 낮추고, 음향 모델의 성능을 높이는 방법을 제안한다. External memory를 사용하여 사전 확률을 생성한 LF-MMI 모델을 사용했을 때 기존 LF-MMI와 비교하여 14 %의 상대적 성능 개선을 보였다.

IPM 기반 정밀도로지도 매칭을 통한 지도 신속 갱신 방법 (Quickly Map Renewal through IPM-based Image Matching with High-Definition Map)

  • 김덕중;이원종;김기창;최윤수
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1163-1175
    • /
    • 2021
  • 자율 주행에서 도로 표시는 객체 추적, 경로 계획을 위한 필수 요소이며 측위를 위한 중요한 정보를 제공할 수 있다. 이 논문은 역 관점 매핑 이미지와 정밀도로지도 투영 이미지를 매칭하여 비교함으로써 도로 노면 표지의 갱신 및 위치 측위를 하는 접근 방식을 제시한다. 역 관점 매핑(IPM; Inverse Perspective Mapping) 기법을 사용하여 차량의 전방을 촬영한 카메라 이미지에서 원근 효과를 제거하고 2D 도메인으로 버드뷰 이미지를 생성한다. 그 다음에 GNSS/INS를 참조하여 촬영된 이미지와 동일한 정밀도로지도 영역을 이미지로 생성하여 두 이미지의 노면표지가 최대한 일치하도록 피팅 한다. 또한 정지선, 횡단 보도, 점선 및 직선 등 문자와 화살표를 인식하여 정밀도로지도의 객체와 비교 함으로써 갱신 여부를 판단 한다. 그리고 새로 설치된 객체의 측위는 주변의 객체의 위치 좌표값을 정밀도로지도에서 참조하여 얻을 수 있다. 우리는 매우 낮은 계산 비용과 저가의 카메라 및 GNSS/INS 센서 만으로도 빠르게 갱신된 정밀도로지도를 얻을 수 있다.

디스플레이용 유리의 눈부심 현상 억제를 위한 표면 에칭 및 돌기 형성에 관한 연구 (Study on surface etching and projection formation to control the glare of display glass)

  • 우희수;강승구
    • 한국결정성장학회지
    • /
    • 제30권6호
    • /
    • pp.251-257
    • /
    • 2020
  • 디스플레이용 유리를 통해 문자나 이미지를 뚜렷하고 빠르게 인식하기 위해서는 유리의 눈부심 현상(glare)을 억제해야 한다. 본 연구 연구에서는 에칭공정을 통해 유리 표면 형상 및 광학 특성 변화를 분석하여 눈부심 현상을 낮추고자 하였다. 에칭 공정은 에칭 용액인 BOE 및 HF의 농도를 변수로 수행하였다. 에칭과정에서 유리 표면에 F 이온이 포함된 화합물이 생성되어 돌기(projection) 형태로 불규칙한 패턴을 형성되었고, 이로 인해 유리의 광학적 특성이 변화되었다; 반사율은 2.5~4.6 %, 탁도는 4.5~6.6 %, 투과율은 77~9 2 %, 그리고 광택도는 82~107 GU 범위. 그 결과 유리의 눈부심 현상을 억제하면서도 다른 광학적 특성의 손실을 최소화하는 에칭 조건을 확보하였다.

디지털 포렌식을 위한 증거 분석 도구의 신뢰성 검증 (Reliability Verification of Evidence Analysis Tools for Digital Forensics)

  • 이태림;신상욱
    • 정보보호학회논문지
    • /
    • 제21권3호
    • /
    • pp.165-176
    • /
    • 2011
  • 본 논문에서는 TTAK.KO-12.0112 문서에 따른 컴퓨터 포렌식을 위한 디지털 증거 분석도구의 일반적인 검증 절차를 살펴보고, 제시된 검증 항목들을 이용하여 실제 증거분석 도구를 대상으로 기능 요구사항들을 테스트한다. 또한 테스트 내용을 바탕으로 대상 도구들에 대한 성능 평가를 수행하며 각 도구들의 증거 분석 기능에 대하여 향후 성능 개선 방향을 제시한다. 이는 테스트 대상 도구가 수행 가능한 기능들을 파악하고, 요구사항 문서에서 제안된 검증 절차들을 활용하여 각 기능 별로 구체적인 모의 테스트를 설계한 후, 검증 항목의 내용을 포함시킨 가상의 증거 이미지 파일들을 생성하여 도구가 분석한 결과를 검증하고 해석한다. 이 과정을 통해 대부분의 도구들에서 단편화된 삭제 파일에 대한 복구, 국내에서 널리 사용되고 있는 파일 포맷 인식, 한글 문자열 처리 기능 등에 취약점이 존재함을 확인할 수 있다.

딥러닝을 활용한 전략물자 판정 지원도구 개발에 대한 연구 (A Study on the Development of a Tool to Support Classification of Strategic Items Using Deep Learning)

  • 조재영;윤지원
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.967-973
    • /
    • 2020
  • 전략물자관리 제도의 이행 확산에 따라 전략물자 판정의 중요성이 높아지고 있으나 전략물자 제도를 처음 접하는 수출기업은 전략물자의 개념을 이해하기 쉽지 않고, 전략물자를 통제하는 기준이 다양하여 전략물자 판정에 어려움이 따른다. 본 논문에서는 전략물자 제도를 처음 접하는 기업이나 전략물자 판정시스템 이용자에게 진입장벽을 낮추어 판정이라는 과정을 쉽게 접근할 수 있는 방법을 제안한다. 이용자가 전략물자 판정이라는 절차를 매뉴얼이나 카탈로그의 제공만으로 판정결과를 확인할 수 있게 된다면, 전략물자 판정 방법과 절차에 보다 편리하고 쉽게 다가설 수 있을 것이다. 본 연구 목적을 달성하기 위해 이미지 인식 및 분류에서 연구되고 있는 딥러닝과 OCR(광학문자판독) 기술을 활용하고, 전략물자 판정 지원도구에 대한 개발과 연구를 통하여 우리 기업의 전략물자 판정에 도움이 되는 정보를 제공한다.

UAV 기반 외래거북 탐지를 위한 광학문자 인식(OCR)의 가능성 평가 (Feasibility of Optical Character Recognition (OCR) for Non-native Turtle Detection)

  • 임태양;김지윤;김휘문;강완모;송원경
    • 한국환경복원기술학회지
    • /
    • 제25권5호
    • /
    • pp.29-41
    • /
    • 2022
  • Alien species cause problems in various ecosystems, reduce biodiversity, and destroy ecosystems. Due to these problems, the problem of a management plan is increasing, and it is difficult to accurately identify each individual and calculate the number of individuals, especially when researching alien turtle species such as GPS and PIT based on capture. this study intends to conduct an individual recognition study using a UAV. Recently, UAVs can take various sensor-based photos and easily obtain high-definition image data at low altitudes. Therefore, based on previous studies, this study investigated five variables to be considered in UAV flights and produced a test paper using them. OCR was used to monitor the displayed turtles using the manufactured test paper, and this confirmed the recognition rate. As a result, the use of yellow numbers showed the highest recognition rate. In addition, the minimum threat distance was confirmed to be 3 to 6m, and turtles with a shell size of 6 to 8cm were also identified during the flight. Therefore, we tried to propose an object recognition methodology for turtle display text using OCR, and it is expected to be used as a new turtle monitoring technique.