• Title/Summary/Keyword: text region classification.

검색결과 18건 처리시간 0.022초

문서 영상의 영역 분류와 회전각 검출 (A Block Classification and Rotation Angle Extraction for Document Image)

  • 모문정;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.509-516
    • /
    • 2002
  • 본 논문에서는 그림, 글자, 표, 직선 등과 같은 다양한 정보를 포함하는 문서 영상 인식에 대한 효율적인 알고리즘을 제안한다. 이 시스템은 문서영상의 기울짐을 보정하기 위한 회전각검출 단계, 불필요한 배경영역을 제거하는 단계, 문서영상에 내재된 각 구성요소를 검출하는 분류 단계로 구성된다. 알고리즘은 문서의 기울어짐에 의해서 발생되는 오류를 최소화하기 위한 회전각 검출과정과 검출된 회전각을 기반으로 문서를 보정하는 전처리단계를 수행한다. 입력된 문서영상의 수평성분과 수직성분만을 이용하여 회전각을 검출하고, 문서의 구성요소 검출과정에서 불필요한 배경영역을 제거함으로써 계산시간을 최소화하였다. 그리고 영상에 내재된 그림영역, 글자영역, 표영역, 직선영역 둥의 다양한 구성요소를 분류한다. 제안한 문서 인식 시스템의 성능 평가를 위해서 다양한 문서영상에 제안한 방법을 적용하고 성공적인 결과를 보인다.

지역적 엔트로피와 텍스처의 주성분 분석을 이용한 문서영상의 분할 및 구성요소 분류 (Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm)

  • 김보람;오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.377-384
    • /
    • 2009
  • 본 논문은 지역적 엔트로피 기반의 히스토그램을 이용한 문서영상의 분할과 텍스처 기반의 주성분 분석을 이용한 구성요소인 글자, 그림, 그래프 등의 구성요소 분류방안을 제안한다. 지역적 엔트로피와 히스토그램을 이용함으로써 문서영상의 다양한 변형이나 잡음에 강건하며 빠르고 손쉬운 이진화가 가능하다. 그리고 문서영상 내 존재하는 구성요소들이 각기 다른 텍스처 정보를 가지고 있다는 것에 착안하여 각 분할 영역의 텍스처 정보를 기반으로 주성분분석을 수행하였으며 이를 통해 사전에 구성요소들에 대한 구조정보를 설정할 필요가 없다는 장점을 가진다. 실험결과에서 다양한 문서영상의 분할 및 분류결과를 보였으며, 기존 방법보다 우수한 성능을 가져 그 유효함을 보였다.

능동 시각을 이용한 이미지-텍스트 다중 모달 체계 학습 (Active Vision from Image-Text Multimodal System Learning)

  • 김진화;장병탁
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.795-800
    • /
    • 2016
  • 이미지 분류 문제는 인간 수준의 성능을 보이지만 일반적인 인식 문제는 어려운 점들이 남아있다. 실내 환경은 다양한 정보를 담고 있어 정보 처리의 양을 효율적으로 줄일 필요성이 있다. 정보의 양을 효율적으로 줄일 수 있도록 대상 객체의 위치 측정을 위한 변분 추론, 변분 베이지안 등의 방법이 소개되었지만, 모든 경우에 대한 주변(marginal) 확률 분포를 구하기 어렵기 때문에 현실적으로 계산하기 어렵다. 본 연구에서는 공간 변형 네트워크(Spatial Transformer Networks)을 응용하여 능동 시각을 이용한 이미지-텍스트 통합 인지 체계를 제안한다. 이 체계는 주어진 텍스트 정보를 바탕으로 이미지의 일부를 효율적으로 샘플링 하도록 학습한다. 이를 통해 전통적인 방법으로 해결하기 어려운 문제를 상당한 격차로 성능을 향상 시킬 수 있다는 것을 보인다. 제안하는 모델을 통해 샘플링 된 이미지를 정성적으로 분석하여 이 모델이 가지는 특성도 함께 살펴본다.

문서의 영역분리와 레이아웃 정보의 추출 (The Block Segmentation and Extraction of Layout Information In Document)

  • 조용주;남궁재찬
    • 한국통신학회논문지
    • /
    • 제17권10호
    • /
    • pp.1131-1146
    • /
    • 1992
  • 본 논문은 이미 출판된 문서를 대상으로 문서의 영역을 분리하고, 문서의 구성요소와 레이아웃 정보를 추출하는데 새로운 알고리즘을 제안한다. 먼저 300 dpi로 입력된 문서에서 문서를 이루는 각 요소를 영역화 하기 위하여 레이 블링과 블럭화 작업을 행한다. 둘째로 블럭화된 문서의 각 요소를 대상으로 부분영역으로 분리를 수행한다. 셋째로 추출된 부분영역에서 그림영역을 추출하고 문자영역에 대해서는 문자열 추출 및 개변 문자 추출을 한다. 마지막으로 이렇게 추출된 정보로 문서의 레이아웃 인식을 위한 정보를 추출하였다. 실험은 어느정도의 형식을 가진 학회 논문지를 대상으로 하였으며, 문자와 그림 영역의 분류 및 문자열 추출에 대해서 98.5%의 성공율을 얻고, 레이아웃 인식을 위한 정보의 추출에서도 98%의 성과를 보였다.

  • PDF

AdaBoost를 이용한 윈도우 영상의 하위 영상 검출 (Subimage Detection of Window Image Using AdaBoost)

  • 길종인;김만배
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.578-589
    • /
    • 2014
  • 윈도우 영상은 흔히 컴퓨터에서 응용프로그램을 실행하였을 때, 모니터를 통해 출력되는 화면을 의미하여, 웹페이지, 동영상 플레이어 및 여러 가지 응용프로그램을 모두 포함한다. 웹페이지는 다른 어플리케이션에 비해 다양한 종류의 정보를 다양한 형태로 전달한다. 이러한 웹페이지와 같은 윈도우 영상은 카메라로부터 획득할 수 있는 자연영상과 달리 텍스트, 로고, 아이콘 및 하위 영상과 같은 여러 가지 요소들을 포함하고 있고, 각 요소들은 서로 다른 형식의 정보를 사용자에게 전달한다. 그러나 텍스트와 영상은 정보가 다른 형태로 제공되기 때문에, 엄연히 다른 특성을 가지고 있는 요소들을 지역적으로 분리할 필요성이 있다. 본 논문에서는 윈도우 영상을 지역적인 특성에 따라 다수의 블록으로 분할한 후, 분할된 각 영역을 배경, 텍스트, 하위영상으로 분류하였다. 이러한 분류기법을 통해 분류된 하위 영상은 3D입체영상 변환, 영상 검색, 영상 브라우징등과 같은 응용을 가질 수 있다. 영상을 분류하는 방법에는 여러 가지가 존재할 수 있으나, 본 논문에서는 기계학습 기반의 알고리즘이 하위 영상 검출에도 좋은 접근법이 될 수 있음을 증명하기 위해 AdaBoost를 이용하였고, 실험결과로부터 93.4%의 검출률, 13%의 거짓 긍정률을 보임으로서, 이를 입증하였다.

한반도 맥문동속 집단의 자생지 생육환경과 군락구조 (Community Structure and Habitat Environment of Genus Liriope Group in Korea)

  • 송홍선;이정훈;김성민;신동일;김창호;구한모;박충범;박용진
    • 한국약용작물학회지
    • /
    • 제19권1호
    • /
    • pp.24-30
    • /
    • 2011
  • This text was analyzed and investigated the vegetation and floristic composition by cluster analysis and classification of phytosociological method, to evaluate the species composition, habitat environment and community structure of Liriope platyphylla and Liriope spicata group in Korea. The southeast slope gradient of the habitat of L. platyphylla and L. spicata was 6.7 to 8.4%, and the habitat altitude of L. platyphylla (41.0 m), L. spicata (114.9 m) was different. Habitat distribution of L. spicata was broader than L. platyphylla. Appearing plants of L. platyphylla and L. spicata group was 58 taxa, 99 taxa, respectively, and Coverage of tree layer was 87.5%, 92.5% respectively. In genus Liriope group, the highest appearing frequency of plant grow in the moist valley as Quercus serrata. Thus, plants of genus Liriope growth was better in moist shade. The vegetation of L. platyphylla group was classified into Quercus serrata community, Castanopsis sieboldii community, Pinus densiflora community and Pinus thunbergii community, and the Liriope spicata group was classified into Quercus serrata community, Quercus alien community, Quercus acutissima community, Prunus verecunda community, Robinia pseudoacacia community, Pinus densiflora community and Pinus thunbergii community. In genus Liriope group, Quercus serrata and Pinus densiflora communities was the closest the similarities.

텍스트 마이닝을 활용한 지역 특성 기반 도시재생 유형 추천 시스템 제안 (Suggestion of Urban Regeneration Type Recommendation System Based on Local Characteristics Using Text Mining)

  • 김익준;이준호;김효민;강주영
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.149-169
    • /
    • 2020
  • 현 정부의 주요 국책사업 중 하나인 도시재생 뉴딜사업은 매년 100 곳씩, 5년간 500곳을대상으로 50조를 투자하여 낙후된 지역을 개발하는 것으로 언론과 지자체의 높은 이목이 집중되고 있다. 그러나, 현재 이 사업모델은 면적 규모에 따라 "우리동네 살리기, 주거정비지원형, 일반근린형, 중심시가지형, 경제기반형" 등 다섯 가지로 나뉘어 추진되어 그 지역 본래의 특성을 반영하지 못하고 있다. 국내 도시재생 성공 키워드는 "주민 참여", "지역특화" "부처협업", "민관협력"이다. 성공 키워드에 따르면 지자체에서 정부에게 도시재생 사업을 제안할 때 지역주민, 민간기업의 도움과 함께 도시의 특성을 정확히 이해하고 도시의 특성에 어울리는 방향으로 사업을 추진하는 것이 가장 중요하다는 것을 알 수 있다. 또한 도시재생 사업 후 발생하는 부작용 중 하나인 젠트리피케이션 문제를 고려하면 그 지역 특성에 맞는 도시재생 유형을 선정하여 추진하는 것이 중요하다. 이에 본 연구는 '도시재생 뉴딜 사업' 방법론의 한계점을 보완하기 위해, 기존 서울시가 지역 특성에 기반하여 추진하고 있는 "2025 서울시 도시재생 전략계획"의 도시재생 유형을 참고하여 도시재생 사업지에 맞는 도시재생 유형을 추천하는 시스템을 머신러닝 알고리즘을 활용하여 제안하고자 한다. 서울시 도시재생 유형은 "저이용저개발, 쇠퇴낙후, 노후주거, 역사문화자원 특화" 네 가지로 분류된다 (Shon and Park, 2017). 지역 특성을 파악하기 위해 총 4가지 도시재생 유형에 대해 사업이 진행된 22개의 지역에 대한 뉴스 미디어 10만여건의 텍스트 데이터를 수집하였다. 수집된 텍스트를 이용하여 도시재생 유형에 따른 지역별 주요 키워드를 도출하고 토픽모델링을 수행하여 유형별 차이가 있는 지 탐색해 보았다. 다음 단계로 주어진 텍스트를 기반으로 도시재생 유형을 추천하는 추천시스템 구축을 위해 텍스트 데이터를 벡터로 변환하여 머신러닝 분류모델을 개발하였고, 이를 검증한 결과 97% 정확도를 보였다. 따라서 본 연구에서 제안하는 추천 시스템은 도시재생 사업을 진행하는 과정에서 신규 사업지의 지역 특성에 기반한 도시재생 유형을 추천할 수 있을 것으로 기대된다.

국내 로봇치료 연구 현황에 대한 체계적 고찰 (A Systematic Review on the Present Condition of the Internal Robot Therapy)

  • 오민경;송지현;심은지;염지윤;이후신;유두한
    • 대한지역사회작업치료학회지
    • /
    • 제6권1호
    • /
    • pp.49-60
    • /
    • 2016
  • 목적 : 본 연구는 국내에서 로봇치료가 중재도구로 사용된 연구 사례들을 PICO (Patient, Intervention, Comparison, Outcome) 형식에 따라 체계적으로 정리하여 국내 로봇치료의 연구 현황을 알아보고자 하였다. 연구방법 : 한국학술연구정보서비스(RISS)와 국가전자정보도서관(NDSL) 데이터베이스에서 최근 9년간의 연구를 주요 검색용어 '로봇치료'로 하여 국내 학술지와 학위논문 총 710개의 연구를 검색하였다. 로봇을 치료적 중재도구로 사용한 국내연구 중 원문을 구할 수 있는 연구를 기준으로 최종 15개를 선정하였다. 선정된 연구는 PICO 형식을 통해 체계적으로 정리하여 제시하였다. 결과 : 연구도구의 질적 수준은 근거기반 연구수준 5단계 분류 방법을 사용하였다. 그 중 질적 수준이 3단계 이상인 연구는 13개(86.6%)였다. 로봇치료를 사용한 연구를 중재 분야별로 나눈 결과 언어, 보행, 인지, 발달 그리고 상지의 다섯 가지 영역에 대한 연구가 진행되었음을 알 수 있었다. 결론 : 국내에서 로봇치료는 상지와 하지의 중재를 포함한 언어, 인지, 발달 등의 다양한 영역의 재활을 위해 사용되고 있었다. 본 연구가 국내 로봇치료와 관련된 다양한 영역의 적용에 필요한 기초자료로 활용되기를 바란다.