• 제목/요약/키워드: 텍스트 구성

검색결과 865건 처리시간 0.027초

Text line extraction based on filtering and peak detection (필터링 및 피크검출을 이용한 텍스트 추출)

  • Jin, Bora;Cho, Nam-Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.41-42
    • /
    • 2013
  • 본 논문에서는 문서 영상 처리의 중요한 전처리 과정인 텍스트 라인 추출을 위하여 가우시안 필터링 및 피크 검출을 이용하는 방법을 제안한다. 이는 문서 영상 내의 글자 영역의 픽셀 강도와 텍스트 라인 사이의 간격에 해당하는 강도의 차이로 인해 문서 영상의 각 열마다 높은 피크와 낮은 피크가 번갈아 가며 나타나는 것에 기반으로, 제안하는 알고리즘은 필터 스케일 추정, 필터량 및 피크 검출, 라인 성분 그룹화의 세 단계로 구성된다. 필터 스케일 추정 단계에서는 여러 초기 값으로 필터링하여 피크 차이 간의 히스토그램을 만듦으로써 글자 크기를 대략적으로 예축하며, 필터링 및 피크 검출 단계에서 앞서 예측된 스케일의 가우시안 필터를 이용하여 필터링 한 후, 각각의 열마다 피크를 검출한다. 마지막으로 라인 성분 그룹화를 통하여 검출된 피크를 서로 연결하여 하나의 텍스트 라인을 구성하는 성분들로 그룹화시켜 텍스트 라인을 추출한다. 실험 결과를 통하여, 제안하는 알고리즘은 이진화 과정을 거치지 않음으로써 균일하지 못한 조명환경 등으로 이진화 성능이 좋지 못할 경우에도 텍스트 라인을 추출할 수 있으며, 텍스트 라인 간격이 인정하지 않고 휘어진 라인을 포함하는 경우에도 적용할 수 있음을 확인 할 수 있다.

  • PDF

Warum werden die Passivkonstruktionen in den wissenschaftlichen Fachsprachen besonders bevorzugt? (왜 수동구문이 학술적 전문어에서 특히 선호되고 있는가?)

  • Gang Gook-Jin
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • 제1집
    • /
    • pp.119-139
    • /
    • 1999
  • 일상어는 한 사회의 모든 구성원이 쉽게 이해할 수 있고 사회생활에서 아무런 어려움이 없이 상호간에 의사소통을 할 수 있는 언어의 표현 수단이다. 이에 반하여 학술어는 각각의 전문분야에서 사용되고 있는 언어의 한 형태이다. 학술적 텍스트에서 나타나는 일반적인 특징은 글이 객관적이면서도 명확하게 기술된다는 점이다. 일반독자는 자주 사용되는 전문어휘를 통하여 학술적 텍스트를 가장 쉽게 인식할 수 있으며, 또한 텍스트의 구성에 있어서도 학술적 텍스트가 일반 텍스트와 다르다는 사실을 알 수 있다. 이 외에도 독일어에서는 일정한 문법적 현상들이 학술적 전문어의 요소로서 사용되고 있다. 예를 들면 삼인칭 단수, 부사구, 명사화 경향, 기능동사구의 선호, 수동구문 등등이 있다. 일반적으로 학술적 전문어에 자주 사용되고 있는 문법적 요소 중의 하나가 수동구문이다. 학술어의 요소로서 수동구문이 갖는 언어적 기능은 다음과 같다: 1. 수동구문에서는 일반적으로 행위자가 언급되지 않음으로써 사실이 객관적으로 표현되며, 동시에 행위자의 억제는 언어의 경제성에 기여한다. 2. 경우에 따라서 행위자가 표현될 때, 직접적인 행위의 주체를 나타내는 von-전치사구 혹은 매개체나 원인을 표현하는 durch-전치사구를 통하여 사건을 정확하게 기술할 수 있다. 3. 테마-레마 구조와 관련하여 살펴보면 문장구성 혹은 문장연결을 위한 표현수단으로도 수동구문은 활용된다. 4. 수동구문을 사용함으로써 문체상의 단조롭고 획일적인 점을 회피할 수도 있다. 본 논문은 이와 같이 수동구문이 지니고 있는 언어적 기능을 살펴봄으로써 학술적 전문어의 특징과 전문어를 이해하는데 기여한다.

  • PDF

A Comparison of Retrieval Effectiveness between Image File and Text File (이미지 화일과 텍스트 화일의 검색효율성 비교)

  • 임영선;이두영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 1996
  • 본 논문은 본문 전체가 기계가독형 화일로 구성된 텍스트 전문데이터베이스와 이미지화일로 구성된 이미지 전문데이터베이스와의 검색효율성을 비교함으로써 도서관과 최종이용자의 입장에서 바람직한 전문데이터베이스가 어떤 것인지를 제안하고자 한다.

  • PDF

Extracting curved text lines using the chain composition and the expanded grouping method (체인 정합과 확장된 그룹핑 방법을 사용한 곡선형 텍스트 라인 추출)

  • Bai, Nguyen Noi;Yoon, Jin-Seon;Song, Young-Jun;Kim, Nam;Kim, Yong-Gi
    • The KIPS Transactions:PartB
    • /
    • 제14B권6호
    • /
    • pp.453-460
    • /
    • 2007
  • In this paper, we present a method to extract the text lines in poorly structured documents. The text lines may have different orientations, considerably curved shapes, and there are possibly a few wide inter-word gaps in a text line. Those text lines can be found in posters, blocks of addresses, artistic documents. Our method based on the traditional perceptual grouping but we develop novel solutions to overcome the problems of insufficient seed points and vaned orientations un a single line. In this paper, we assume that text lines contained tone connected components, in which each connected components is a set of black pixels within a letter, or some touched letters. In our scheme, the connected components closer than an iteratively incremented threshold will make together a chain. Elongate chains are identified as the seed chains of lines. Then the seed chains are extended to the left and the right regarding the local orientations. The local orientations will be reevaluated at each side of the chains when it is extended. By this process, all text lines are finally constructed. The proposed method is good for extraction of the considerably curved text lines from logos and slogans in our experiment; 98% and 94% for the straight-line extraction and the curved-line extraction, respectively.

A Study on Feasibility of Full-text Search Using Super-structure of Text (텍스트의 상부구조를 이용한 전문탐색 기법의 타당성 고찰)

  • 이병기
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.19-22
    • /
    • 1996
  • 본 연구는 전문 D/B의 본문 필드를 텍스트 언어학적 상부구조로 분할하고 태그를 부여함으로써 이용자의 목적이나 상황에 따라서 필요한 부분만을 검색할 수 있는 전문탐색기법의 타당성을 고찰하였다. 한 문헌은 다수의 텍스트 단위로 구성되며, 이 텍스트는 의사소통이나 인지과정의 기본 단위로써 문헌 전체를 통괄하는 상부구조에 의해 연결된다. 상부구조는 텍스트의 생성과 이해에 중요한 매개체 역할을 하며, 정보요구의 상황이나 목적과 밀접하게 관련되어 있음을 밝히고 정보검색시스템의 주요 대상인 학술문헌의 상부구조를 고찰하였다.

  • PDF

Multi-modal approach for FASCODE-EVAL (FASCODE-EVAL을 위한 복합모달 접근방법)

  • Chung, Euisok;Kim, Hyun Woo;Park, Minho;Song, Hwa Jeon
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.514-517
    • /
    • 2021
  • FASCODE-EVAL1은 고객과 시스템간의 의상 추천 대화 문맥과 해당 문맥의 요구사항을 고려한 의상셋 추천 목록으로 구성된다. 의상셋 추천 목록은 3개의 의상셋 후보로 구성되고, 문맥과 관련성이 높은 순서로 정렬된다. 해당 정렬을 찾는 방식으로 의상 추천 시스템 평가를 진행한다. 대화 문맥는 텍스트로 되어 있고, 의상 아이템은 텍스트로 구성된 자질 정보와 의상 이미지 정보로 구성된다. 본 논문은 FASCODE-EVAL 문제를 해결하기 위하여 트랜스포머 기반의 사전학습 언어모델을 이용하고, 텍스트 정보와 이미지 정보를 해당 언어모델에 통합하는 방법을 보여준다. FASCODE-EVAL 실험결과는 기존 공개된 결과들보다 우수한 성능을 보여준다.

  • PDF

Study on Impact of GUI Design Elements of Mobile Phone on Brand Preference With focus on senior citizens (모바일 폰의 GUI 디자인의 구성요소가 브랜드 선호도에 미치는 영향 실버세대를 중심으로)

  • Kim, Young Seok
    • Science of Emotion and Sensibility
    • /
    • 제16권4호
    • /
    • pp.545-556
    • /
    • 2013
  • This study has established the GUI design elements of mobile phones as color, text, layout, graphic icon, and video, under the purpose of exploring the relevance between such elements and brand preference among senior citizens. To accomplish the objective, a model and hypotheses were established, which were tested through a multiple regression analysis. The findings are as follows. First, when the statistical significance was examined by GUI design element of mobile phones, the following results were obtained: Color, text, layout, graphic icon, and video were statistically significant at the significance level given, indicating that such elements all affect brand preference. Second, the relative influence of GUI design elements of mobile phones on brand preference was revealed in the following order: text, color, video, graphic icon, layout. It indicates that boosting the brand preference of senior citizens for mobile phones requires considering 'text' and 'color' first before any other element. In addition, as the influence of 'text' and 'color' becomes greater, the brand preference also becomes higher.

A Study on the Game Criticism: Meta-analytical Approach to Game Critiques (게임비평에 대한 연구 : 게임비평 텍스트의 메타분석적 접근)

  • Jeon, Gyongran
    • Journal of Korea Game Society
    • /
    • 제13권3호
    • /
    • pp.19-30
    • /
    • 2013
  • Digital games have become a major part of the modern popular culture, but little attention has been paid to understanding the textuality of games and what the game texts have the cultural meanings. As the games develop, however, the academic and journalistic game critiques and reviews that try to understand and to deconstruct the game texts are on the rise. This study explores how the game criticism characterizes the game texts, creates and shapes the understanding of games. The finding shows that game criticism is rich and varied in terms of themes and approaches covered, more generally, games criticism can also help preserve game history by focusing on the distinctive game textuality, forms and meanings, and by contextualizing the links and cultural meanings that exist between games and between games and the cultural context.

Development of a Script-Based Multimedia Simulator for Representing Spatio-Temporal Situation (스크립트에 기반한 시공간 상황들을 표현하기 위한 멀티미디어 시뮬레이터의 개발)

  • 백경훈;박종희;김남철
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 1996년도 학술대회
    • /
    • pp.119-124
    • /
    • 1996
  • 본 논문에서는 복잡하고 다양한 시공간적 장면들을 하이퍼텍스트적 구조[1]를 이용하여 서로 연결하고 스크립트 및 프레임이라는 구조를 통해서 장면을 구성함으로써 객체의 재활용도 및 네트워킹을 높이는 객체지향적 멀티미디어 시스템을 설계하고 개발한다. 장면을 구성하는 사물을 객체로 정의하며, 이러한 객체는 2D 그래픽, 텍스트, 사운드와 같은 멀티미디어 정보와 장면에 적용되었을 때 필요한 정보로 구성되어져 있다. 이와 함께 장면과 객체 사이를 연결하는 스크립트와 프래임구조를 통해서 장면 속에서의 객체의 역할을 정의한다.

  • PDF

A Role-Based Access Control Security Model for a Distributed Hypertext System (역할기반접근제어를 기반으로 한 분산 하이퍼텍스트 시스템 보안모델)

  • Jeong, Cheol-Yun;Lee, Hyeong-Hyo;No, Bong-Nam
    • The Transactions of the Korea Information Processing Society
    • /
    • 제5권3호
    • /
    • pp.720-731
    • /
    • 1998
  • 멀티미디어, 인터넷 환경에서 하이퍼텍스트 시스템의 활용이 일반화됨에 따라 하이퍼텍스트 시스템에 저장된 정보에 대한 보호를 위해 권한부여나 접근제어와 같은 상위수준의 보안 메카니즘의 필요성이 요구되었다. 또한 분산환경에서는 하이퍼텍스트 시스템내에 저장된 정보들의 정형화된 스키마의 부재, 비체계성 등으로 인하여 보다 복잡한 체계의 보안이 필요하다. 본 논문에서는 분산 하이퍼텍스트 시스템 보안모델을 설계하기 위해 하이퍼텍스트 시스템의 특성 및 현재까지 제안된 보안 메카니즘을 살펴보고, 하이퍼텍스트 시스템상에 다양한 접근제어 정책들을 적용하였을 때의 문제점들을 제시한다. 또한 본 논문에서 제안하는 분산 하이퍼텍스트 시스템 보안모델의 기본개념인 연산도메인의 구성요소 및 관련 성질에 대해 기술하고, 현재 상용시스템에서 보안 메카니즘으로 널리 활용중인 역할기반 접근제어 정책과 연산도메인이 결합된 새로운 보안모델에 대해 기술한다. 마지막으로 본 모델의 장 단점 및 추후 연구과제를 제시한다.

  • PDF