• Title/Summary/Keyword: 텍스트분석

Search Result 2,604, Processing Time 0.032 seconds

Empirical Analysis on the Holy Bible Texts' Cliche for English-Korean Interpretation and Translation (영·한 통번역을 위한 성경 텍스트 클리셰(cliche)의 실증적 분석)

  • You, Seon-Young
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.10
    • /
    • pp.54-64
    • /
    • 2017
  • The purpose of this study was to analyze the cliche for English-Korean interpretation and translation with special reference to the cliche based on the Holy Bible texts. Cliches are figurative or literal expressions and are overused expressions in various different cultures. In addition, cliches are languages, a tool of communication in an appealing way. Therefore, cliches are must be clearly distinguished from the term of idioms that are figurative phrases with an implied meaning; the phrase is not to be taken literally. Also, cliches are the single most important factor that characterizes socioculturally. Through this empirical analysis on cliches we see that this study has conceptualized the meaning of cliche. Based on this result, I expect that anyone who researches English-Korean interpretation and translation field should be concerned about cliches. I hope this study will be a guide to the right uses of cliches in English language fields.

Current Research Trends and Present Conditions on Visual Transformation of Digital Text (디지털텍스트의 시각적 변형에 관한 연구 동향 및 실태 분석)

  • Jin, Sung-Hee
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.1
    • /
    • pp.486-497
    • /
    • 2010
  • The purpose of this study is to investigate the research trends and the present conditions of real digital texts on "Visual Transformation." For the purpose of this study adopted two different methods: meta analysis and case study. The research trends on visual transformation of digital text were investigated through analyzing the total of 167 literature by means of synthetic meta analysis. Relevant literature was categorized into three types of research: functional, dynamic, and interactional transformation. The type of literature and research methods in each literature were analyzed. The present conditions of real digital texts on visual transformation were investigated by means of case study. The well designed 12 e-learning contents selected and analyzed in terms of the analysis framework which was drawn by the research trends. The results suggested problems as follows in designing e-learning contents. Firstly, there were some cases that did not follow the basic design principles related to typography. Secondly, the content was just provided in each learning steps without consideration of design to enhance text comprehension in many cases. Thirdly, web technology adequately was not applied to design e-learning contents.

Text Undestanding System for Summarization (텍스트 이해 모델에 기반한 정보 검색 시스템)

  • Song, In-Seok;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

A Development of the Evaluation Metrics of the Object-Oriented Text/Visual Programming Education (객체 지향 텍스트/시각 프로그래밍 교육의 평가 지표 개발)

  • Jung, Deok-Gil;Jung, Min-Po;Cho, Hyuk-Gyu;Lho, Young-Uhg
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.10a
    • /
    • pp.331-333
    • /
    • 2012
  • 객체지향 텍스트 프로그래밍 및 시각 프로그래밍 교육에 대한 연구는 학생들이 프로그램 개발을 진행하는 과정 혹은 프로그래밍을 교수하는 방법론과 프로그램 개발을 위한 적합한 분석 및 설계 방법론을 찾는 것이다. 이 논문에서는 컴퓨터 프로그래밍 교육에서 객체지향 텍스트/시각 프로그래밍 교육을 적용하고 평가하기 위한 평가 지표를 개발한다. 이 지표는 시각적 혹은 텍스트 기반 프로그래밍 언어/도구를 사용할 때 학생들의 프로그래밍 교육에 대한 적합성을 측정하고 분석하여 학생들의 이해력, 추상화 능력, 프로그램 구현 능력과 학생들의 수준별 적합성을 측정하고 분석하며, 또한, 측정/분석 방법론을 개발하고 적용하는데 활용할 수 있다.

  • PDF

A Study on Preprocessing Image Text Using Yolov4 in OCR System (OCR 시스템에서 YOLOv4를 활용한 텍스트 이미지 전처리 연구)

  • Kim, Ha-Yoon;Yu, Sang-Yin;Ju, Hye-gyeong;Choi, Yeo-jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.964-966
    • /
    • 2022
  • 본 연구는 유료 OCR 서비스를 이용하여 야외 촬영 이미지의 텍스트를 검출하는 프로젝트에서 야외 촬영 텍스트를 학습시킨 Yolov4 모델을 통한 전처리 작업을 제안한다. 텍스트 감지를 통한 이미지 텍스트 전처리 진행은 불필요한 OCR 실행을 줄여 리소스를 절약하고 유료 서비스의 경우 비용 절감 효과까지 도모할 수 있다는 장점이 있다.

Corpus-Based Literary Analysis (코퍼스에 기반한 문학텍스트 분석)

  • Ha, Myung-Jeong
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.9
    • /
    • pp.440-447
    • /
    • 2013
  • Recently corpus linguistic analyses enable researchers to examine meanings and structural features of data, that is not detected intuitively. While the potential of corpus linguistic techniques has been established and demonstrated for non-literary data, corpus stylistic analyses have been rarely performed in terms of the analysis of literature. Specifically this paper explores keywords and their role in text analysis, which is primary part of corpus linguistic analyses. This paper focuses on the application of techniques from corpus linguistics and the interpretation of results. This paper addresses the question of what is to be gained from keyword analysis by scrutinizing keywords in Shakespeare's Romeo and Juliet.

Comparison of Term-Weighting Schemes for Environmental Big Data Analysis (환경 빅데이터 이슈 분석을 위한 용어 가중치 기법 비교)

  • Kim, JungJin;Jeong, Hanseok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.236-236
    • /
    • 2021
  • 최근 텍스트와 같은 비정형 데이터의 생성 속도가 급격하게 증가함에 따라, 이를 분석하기 위한 기술들의 필요성이 커지고 있다. 텍스트 마이닝은 자연어 처리기술을 사용하여 비정형 텍스트를 정형화하고, 문서에서 가치있는 정보를 획득할 수 있는 기법 중 하나이다. 텍스트 마이닝 기법은 일반적으로 각각의 분서별로 특정 용어의 사용 빈도를 나타내는 문서-용어 빈도행렬을 사용하여 용어의 중요도를 나타내고, 다양한 연구 분야에서 이를 활용하고 있다. 하지만, 문서-용어 빈도 행렬에서 나타내는 용어들의 빈도들은 문서들의 차별성과 그에 따른 용어들의 중요도를 나타내기 어렵기때문에, 용어 가중치를 적용하여 문서가 가지고 있는 특징을 분류하는 방법이 필수적이다. 다양한 용어 가중치를 적용하는 방법들이 개발되어 적용되고 있지만, 환경 분야에서는 용어 가중치 기법 적용에 따른 효율성 평가 연구가 미비한 상황이다. 또한, 환경 이슈 분석의 경우 단순히 문서들에 특징을 파악하고 주어진 문서들을 분류하기보다, 시간적 분포도에 따른 각 문서의 특징을 반영하는 것도 상대적으로 중요하다. 따라서, 본 연구에서는 텍스트 마이닝을 이용하여 2015-2020년의 서울지역 환경뉴스 데이터를 사용하여 환경 이슈 분석에 적합한 용어 가중치 기법들을 비교분석하였다. 용어 가중치 기법으로는 TF-IDF (Term frequency-inverse document frquency), BM25, TF-IGM (TF-inverse gravity moment), TF-IDF-ICSDF (TF-IDF-inverse classs space density frequency)를 적용하였다. 본 연구를 통해 환경문서 및 개체 분류에 대한 최적화된 용어 가중치 기법을 제시하고, 서울지역의 환경 이슈와 관련된 핵심어 추출정보를 제공하고자 한다.

  • PDF

Hangul Text Detection using Text Corner Edge Feature Analysis in Natural Scene Images (자연영상에서 코너 에지 특징 분석방법을 이용한 한글 텍스트 검출기법에 관한 연구)

  • Park Jong-Cheon;Kwon Kyo-Hyun;Jun Byung-Min
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2005.11a
    • /
    • pp.379-383
    • /
    • 2005
  • 본 연구에서는 자연 이미지에서 한글 텍스트가 갖고 있는 에지 코너 특징을 이용한 한글 텍스트 검출방법을 제안한다. 자연영상으로부터 에지를 검출하고, 검출된 에지를 20종류의 에지 구조 성분을 갖는 에지 맵을 생성한다. 생성된 에지 맵에서 한글 텍스트 특징 갖는 특징들을 조합하여 모두 8가지의 텍스트 영역 후보 특징을 추출한다. 추출된 텍스트 영역의 특징을 수평 및 수직방향으로 검사하여 텍스트의 시작 라인과 끝라인을 검출하여 텍스트 영역의 수평좌표를 구한다. 추출된 텍스트 후보 영역에서 최종적으로 텍스트 영역을 결정한다. 제안한 방법은 다양한 종류의 자연 이미지에서 텍스트 영역을 검출에서 좋은 성능을 나타냈다.

  • PDF

Components for Picturebook Peritext Analysis (그림책 페리텍스트 분석을 위한 구성 요소)

  • A Reum Nam;Sang Lim Kim
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.2
    • /
    • pp.181-188
    • /
    • 2023
  • Academic interest in the educational value of picturebooks for children and the narrative importance of peritexts have been increased. This study was conducted with the purpose of presenting the components for analyzing the picturebook peritext. To this end, the components of the peritext used in 11 previous studies that analyzed the peritext of picturebooks were comprehensively reviewed. Looking at the results of the study, the components used in previous studies were largely categorized into four categories, and according to the characteristics of the components within each category, they were classified into 'basic information', 'physical elements', 'positional elements', and 'content elements.' The first category, 'basic information,' includes the title, authors' name, publication information, award information, and dedication/acknowledgment, laudatory comment. The second category, 'physical elements,' includes the format, book binding, and quality of material. The third category, 'positional elements,' includes cover(front cover, back cover, spine), endpaper, title page, copyright page, dust jacket and belly band. The fourth category, 'content elements,' includes text, illustration, typography, layout and page shape. Through the results of this study, it is expected that research on the analysis and utilization of various picturebooks will be activated.

SNS Analysis Related to Presidential Election Using Text Mining (텍스트 마이닝을 활용한 대선 관련 SNS 분석)

  • Kwon, Young-Woo;Jung, Deok-Gil
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.361-363
    • /
    • 2017
  • 최근 소셜 미디어의 이용률이 폭발적으로 증가함에 따라, 방대한 데이터가 네트워크로 쏟아져 나오고 있다. 이들 데이터는 기존의 정형 데이터뿐만 아니라 이미지, 동영상 등의 비정형 데이터가 있으며, 이들을 포괄하여 빅데이터라고 불린다. 이러한 빅데이터는 오피니언 마이닝, 테스트 마이닝 등의 기술적인 분석 기법과 빅데이터 요약 및 효과적인 표현방법에 대한 시각화 기법에 대하여 활발한 연구가 이루어지고 있다. 이 논문은 인기 있는 사회연결망 서비스인 Twitter의 트윗을 수집하고, 빅데이터 분석 기법인 텍스트 마이닝을 활용하여 2017년 대선에 대하여 분석하였다. 또한 분석된 자료의 효과적인 전달을 위해 워드 클라우드 진행하였다. 이 논문을 위하여 인기 있는 SNS인 Twitter의 최근 7일간 트윗(tweet)을 수집하고 분석하였다.

  • PDF