• 제목/요약/키워드: Text Localization

검색결과 71건 처리시간 0.025초

딥러닝 기반의 회전에 강인한 텍스트 검출 기법 (Rotation-robust text localization technique using deep learning)

  • 최인규;김제우;송혁;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.80-81
    • /
    • 2019
  • 본 논문에서는 자연스러운 장면 영상에서 임의의 방향성을 가진 텍스트를 검출하기 위한 기법을 제안한다. 텍스트 검출을 위한 기본적인 프레임 워크는 Faster R-CNN[1]을 기반으로 한다. 먼저 RPN(Region Proposal Network)을 통해 다른 방향성을 가진 텍스트를 포함하는 bounding box를 생성한다. 이어서 RPN에서 생성한 각각의 bounding box에 대해 세 가지의 서로 다른 크기로 pooling된 특징지도를 추출하고 병합한다. 병합한 특징지도에서 텍스트와 텍스트가 아닌 대상에 대한 score, 정렬된 bounding box 좌표, 기울어진 bounding box 좌표를 모두 예측한다. 마지막으로 NMS(Non-Maximum Suppression)을 이용하여 검출 결과를 획득한다. COCO Text 2017 dataset[2]을 이용하여 학습 및 테스트를 진행하였으며 주관적으로 평가한 결과 기울어진 텍스트에 적합하게 회전된 영역을 얻을 수 있음을 확인하였다.

  • PDF

Client/Server 구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Localization System Using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2004
  • PDA에서 사용하는 대부분의 CPU는 실수 연산 구성요소(float computation component)가 없는 정수(integer) CPU를 사용한다. 인공 신경망(neural network)과 같은 실수 연산이 많은 알고리즘은 PDA에서 많은 수행시간을 가진다. 본 논문에서는 이런 단점을 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/Server(PC) 구조를 이용한 효과적인 문자 추출 시스템을 제안한다. Client(PDA)는 대략적인 문자 추출 결과를 JPEG으로 압축하여 전송속도를 최소화한다. Server(PC)는 Client(PDA)의 결과를 바탕으로 정밀한 문자 영역 추출을 위해, 텍스춰 분류 방법과 연결 성분 분석 방법을 이용한다. 실험에서 제안한 방법은 속도뿐만 아니라 문자 추출에서도 효과적이었다.

  • PDF

이미지로부터 계층적 문자열 추출에 관한 연구 (Hierarchical Text Extraction and Localization on Images)

  • 전병민;전우경
    • 한국산학기술학회논문지
    • /
    • 제19권1호
    • /
    • pp.609-614
    • /
    • 2018
  • 인터넷 기술의 급격한 성장으로 우리들은 언제 어디에서나 다양한 장치를 이용하여 온라인에 접속할 수 있으며, 실시간, 대용량의 영상 및 사진들이 인터넷상에 올려지고 있다. 이러한 영상들의 대부분은 영상에 관련된, 영상을 인식할 수 있는 간단한 주석을 갖는다. 그럼에도 아직도 주석이 없는 단일 영상이나 잘못된 주석이나 태그 정보 때문에 우리가 원하는 영상을 찾는데 문제점이 있어 이러한 문제해결을 위해서는 영상의 올바른 정보를 태깅하는 것이 필수적이다. 대부분의 태그는 문서나 주석의 형태를 가지므로 주석이나 문서의 정보가 올바르지 않으면 원하는 영상을 찾는데 많은 어려움이 따른다. 그리하여 더 나은 영상 탐색 결과와 올바른 영상 주석을 위해서 작가에 의한 주석뿐만 아니라 올바른 영상분석 또한 아주 중요하다. 영상 특징을 추출하는 것은 신뢰성 있는 영상 주석을 위해 필수 불가결한 요소이다. 따라서 본 논문에서는 다양한 불특정 영상으로 부터 계층적 텍스트 추출 방법을 사용하여 신뢰성 있는 영상 주석을 얻는다. 다양한 영상으로 부터 영상이나 사진 속에 포함된 텍스트 정보를 추출하는 방법을 제안하였으며, 실험결과 제안한 텍스트 추출기법이 대부분의 영상으로부터 정확하게 텍스트 특징을 추출하는 결과를 보여주었고, 성능 평가 결과 최소 0.04부터 최대 0.52의 높은 평가결과를 보여주었다. 또한 정확도 측면에서도 다른 기법들 보다 최소 18.1%부터 최대 37.9%의 높은 정확도를 보여주었다.

Text Mining과 네트워크 분석을 활용한 교육훈련용 모의사격 시뮬레이션 경험지식 분석 (Analysis of Experience Knowledge of Shooting Simulation for Training Using the Text Mining and Network Analysis)

  • 김성규;손창호;김종만;정세교;박재현;전정환
    • 한국군사과학기술학회지
    • /
    • 제20권5호
    • /
    • pp.700-707
    • /
    • 2017
  • Recently, the military need more various education and training because of the increasing necessity of various operation. But the education and training of the military has the various difficulties such as the limitations of time, space and finance etc. In order to overcome the difficulties, the military use Defense Modeling and Simulation(DM&S). Although the participants in training has the empirical knowledge from education and training based on the simulation, the empirical knowledge is not shared because of particular characteristics of military such as security and the change of official. This situation obstructs the improving effectiveness of education and training. The purpose of this research is the systematizing and analysing the empirical knowledge using text mining and network analysis to assist the sharing of empirical knowledge. For analysing texts or documents as the empirical knowledge, we select the text mining and network analysis. We expect our research will improve the effectiveness of education and training based on simulation of DM&S.

《목양애화(牧羊哀話)》의 시대별 한국어 번역 전략 연구 (A Study on the Korean Translation Strategy of 《Mu Yang Ai Hua, 牧羊哀話》 by Period)

  • 문대일
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.377-382
    • /
    • 2021
  • 《牧羊哀話, 목양애화》는 중국현대문학사상 최초의 한인제재 소설로 알려져 있으며, 저자가 직접 한국을 방문하고 영감을 얻어 창작한 소설로 유명하다. 《목양애화(牧羊哀話)》의 번역본은 꾸준히 재번역(4종)되고 있다. 이러한 번역본은 시기별 특성도 반영하고 있으며, 활용한 번역 전략도 각기의 특징을 가지고 있다. 본 연구를 통해 4종의 번역본을 비교 분석한 결과는 다음과 같다. A역은 일제시기 출판된 작품으로 검열을 피하기 위해서 역자의 의도에 따라 일정부분이 축소, 생략되었으며 이국화 번역 전략을 사용하였다. B역, C역, D역은 많은 부분 자국화 번역 전략을 활용하여 내용적 등가를 구현해 내었으며, 독자의 이해를 돕기 위해서 부분적으로 보충설명을 덧붙여 놓았다. 번역은 의사소통의 과정이므로 단순히 원천 텍스트를 목표 텍스트로의 전환하는 것이 아니라, 작품에 대한 목표어 독자들의 반응이 출발어 독자들의 반응과 같아야만 한다. 때문에 번역은 시대 환경과 독자층을 감안해야만하며, 가능한 모든 방법을 동원하여 독자로 하여금 원문을 읽은 것과 같은 감동과 공감을 이끌어내야 한다. 그러므로 번역자는 목표어와 도착어 국가의 정치, 경제, 역사, 문화 등에 대한 이해를 바탕으로 자(이)국화 전략은 동시에 적절히 활용할 필요가 있다.

모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출 (Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images)

  • 박종천;오명관;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 2부
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF