• Title/Summary/Keyword: 텍스트 구성

Search Result 865, Processing Time 0.026 seconds

A Comparative Study on Modelling Readability Formulas: Focus on Primary and Secondary Textbooks (텍스트의 언어적 난이도 측정 공식 비교 연구 - 초중고 교과서를 중심으로 -)

  • Choe, In-Sook
    • Journal of the Korean Society for information Management
    • /
    • v.22 no.4 s.58
    • /
    • pp.173-195
    • /
    • 2005
  • The purpose of this study is to clarify whether readability formulas based on linguistic factors are suitable for secondary and older primary age texts. A comparison among fomulas for primary age texts, some for both primary and secondary age, and some for secondary age revealed that exclusive ones for narrow age range were more effective. A model estimating readability scores from the average number of sentences in paragraphs or a model with two factors, the average number of sentences and paragraphs in texts was found to be good one for secondary age. While a model based on total number of unique syllables or a model from total number of unique syllables and new syllable occurrence ratio was good for primary age.

Empirical Analysis on the Effect of Design Pattern of Web Page, Perceived Risk and Media Richness to Customer Satisfaction (콘텐츠 제작방식, 지각된 위험, 미디어 풍부성이 고객만족에 미치는 영향 분석)

  • Park, Bong-Won;Lee, Jung-Mann;Lee, Jong-Won
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.6
    • /
    • pp.385-396
    • /
    • 2011
  • Internet web pages can be classified by three major types such as texts only, images with texts and videos with texts. The purpose of this paper is to analyze how customers recognize and respond perspective of perceived risk and media richness with regard to design patterns of internet web pages. Additionally, we will examine the extent to which aforementioned factors affect customer satisfaction. Analyses with perceived risks revealed that customers feel less personal risks including performance, psychology and time/convenience when used web pages of text-images and text-videos, compared to text only based web pages. However, customers feel that web pages consisting of image-text or video-text have higher points in terms of symbolism and social presence in media richness, compared to text only based web pages. Finally, we showed that personal risk and text-based Web page negatively affect but symbolism and social presence positively impact on customer satisfaction. Therefore, this study suggests a clue that why video-based Web content did not grow different from many people's expectation.

기획 - Text Mining을 이용한 영문 특허텍스트 DB의 텍스트 경제성 및 피검색성을 평가하는 기법에 관한 연구

  • Kim, Hyeon-Tae
    • Patent21
    • /
    • s.89
    • /
    • pp.2-15
    • /
    • 2010
  • 본 연구보고서는 Text Mining 가법을 기반으로 영문 특허텍스트 DB를 구성하는 텍스트 (Text) 부분의 경제성 및 피검색성을 정량적으로 평가하는 모델을 제시하고, 이를 바탕으로 2차 가공된 영문 특허텍스트 DB의 성능을 일정범위 내에서 관리하는 품질관리모델의 개발 가능성을 탐색하는데 그 목적이 있다.

  • PDF

Components for Picturebook Peritext Analysis (그림책 페리텍스트 분석을 위한 구성 요소)

  • A Reum Nam;Sang Lim Kim
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.2
    • /
    • pp.181-188
    • /
    • 2023
  • Academic interest in the educational value of picturebooks for children and the narrative importance of peritexts have been increased. This study was conducted with the purpose of presenting the components for analyzing the picturebook peritext. To this end, the components of the peritext used in 11 previous studies that analyzed the peritext of picturebooks were comprehensively reviewed. Looking at the results of the study, the components used in previous studies were largely categorized into four categories, and according to the characteristics of the components within each category, they were classified into 'basic information', 'physical elements', 'positional elements', and 'content elements.' The first category, 'basic information,' includes the title, authors' name, publication information, award information, and dedication/acknowledgment, laudatory comment. The second category, 'physical elements,' includes the format, book binding, and quality of material. The third category, 'positional elements,' includes cover(front cover, back cover, spine), endpaper, title page, copyright page, dust jacket and belly band. The fourth category, 'content elements,' includes text, illustration, typography, layout and page shape. Through the results of this study, it is expected that research on the analysis and utilization of various picturebooks will be activated.

An Automatic Classification of Discourse Relations in the Arguing Structure of Korean Texts (한국어 텍스트의 논증 구조 내 담화 관계의 자동 분류 연구)

  • Lee, Sana;Shin, Hyopil
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.59-64
    • /
    • 2015
  • 최근 온라인 텍스트 자료를 이용하여 대중의 의견을 분석하는 작업이 활발히 이루어지고 있다. 이러한 작업에는 주관적 방향성을 갖는 텍스트의 논증 구조와 중요 내용을 파악하는 과정이 필요하며, 자료의 양과 다양성이 급격히 증가하면서 그 과정의 자동화가 불가피해지고 있다. 본 연구에서는 정책에 대한 찬반 의견으로 구성된 한국어 텍스트 자료를 직접 구축하고, 글을 구성하는 기본 단위들 사이의 담화 관계를 정의하였다. 각 단위들 사이의 관계는 기계학습과 규칙 기반 방식을 이용하여 예측되고, 그 결과는 합성되어 하나의 글에 대응되는 트리 구조를 이룬다. 또한 텍스트의 구조상에서 주제문을 직접적으로 뒷받침하는 문장 혹은 절을 추출하여 글의 중요 내용을 얻고자 하였다.

  • PDF

A Still Image Compression System with a High Quality Text Compression Capability (고 품질 텍스트 압축 기능을 지원하는 정지영상 압축 시스템)

  • Lee, Je-Myung;Lee, Ho-Suk
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.3
    • /
    • pp.275-302
    • /
    • 2007
  • We propose a novel still image compression system which supports a high quality text compression function. The system segments the text from the image and compresses the text with a high quality. The system shows 48:1 high compression ratio using context-based adaptive binary arithmetic coding. The arithmetic coding performs the high compression by the codeblocks in the bitplane. The input of the system consists of a segmentation mode and a ROI(Region Of Interest) mode. In segmentation mode, the input image is segmented into a foreground consisting of text and a background consisting of the remaining region. In ROI mode, the input image is represented by the region of interest window. The high quality text compression function with a high compression ratio shows that the proposed system can be comparable with the JPEG2000 products. This system also uses gray coding to improve the compression ratio.

A Study on Modelling Readability Formulas for Reading Instruction System (독서교육시스템을 위한 텍스트수준 측정 공식 구성에 관한 연구)

  • Choe, In-Sook
    • Journal of the Korean Society for information Management
    • /
    • v.22 no.3 s.57
    • /
    • pp.213-232
    • /
    • 2005
  • The purpose of this study is to determine factors affecting text difficulty and to model objective formulas which measure readability scores. Some readability-related factors such as total number of letters, total number of syllables, total number of unique syllables, total number of sentences and total number of paragraphs were found through correlation analysis. Some regression equations with these factors as their variables were produced through regression analysis. A model estimating readability score from total number of unique syllables was a good formula, while a model with two factors, total number of unique syllables and new syllable occurrence ratio, was a better enhanced one. The readability score represents detailed level so we can recommend students read texts corresponding to their reading levels.

Text Extraction using Character-Edge Map Feature From Scene Images (장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Kwon, Kyo-Hyun;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.139-142
    • /
    • 2006
  • 본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

  • PDF

An Overview of Hypertext and Its Applications (하이퍼텍스트의 개념과 응용에 관한 고찰)

  • 정영미
    • Journal of the Korean Society for information Management
    • /
    • v.6 no.2
    • /
    • pp.3-20
    • /
    • 1989
  • Hypertext system is a new type of electronic information system which offers users great freedom in writing and reading electronic documents. Hypertext means non-linear or non-sequential text, which consists of a collection of nodes connected by links. Nodes may contain segments of text, video images, and sound. In this paper, the concept and characteristics of hypertext are reviewed, components of hypertext are explored in detail, and Guide is illustrated with application examples.

  • PDF

Text Region Detection using Feature of Adaptive Character-Edge Map in Natural Images (자연영상에서 적응적 문자-에지 맵 특징을 이용한 텍스트 영역 검출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2007.05a
    • /
    • pp.181-184
    • /
    • 2007
  • 자연영상에 포함된 텍스트는 많은 중요한 정보를 포함하고 있으므로 자연영상에서 텍스트 정보를 검출하는 연구가 활발히 진행되고 있다. 본 논문에서는 문자 영역의 구조적인 특정을 배열문법으로 정의한 적응적 문자-에지 맵을 제안하여 텍스트 영역을 검출한다. 캐니-에지 검출기로 에지를 추출하고, 생성된 에지 이미지를 레이블링하고 그 영역의 문자구조 특징을 분석하기 위해서 적응적 문자-에지 맵을 분석한다. 적응적 문자-에지 랩의 분포 상태를 분석함으로서 텍스트 후보 영역을 검출하고, 텍스트 영역의 에지 히스토그램 프로파일을 분석함으로서 텍스트 후보 영역에 대한 검증을 수행하여 최종적인 텍스트 영역을 검출한다. 제안한 방법은 다양한 종류의 자연영상을 대상으로 실험하였고, 기울어진 텍스트와 다양한 크기의 텍스트 구성된 자연영상에서 텍스트 영역을 효과적으로 검출하였다.

  • PDF