• 제목/요약/키워드: Text theory

검색결과 392건 처리시간 0.026초

압축된 써픽스 배열 구축의 실제적인 성능 비교 (Comparisons of Practical Performance for Constructing Compressed Suffix Arrays)

  • 박치성;김민환;이석환;권기룡;김동규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.169-175
    • /
    • 2007
  • 써픽스 배열은 기본적인 전체 텍스트 인덱스 자료구조로서, 반복되는 패턴 질의 수행 시 효율적으로 사용될 수 있다. 유용한 전체 텍스트 인덱스 자료구조들이 많이 제안되어왔음에도 불구하고, O(nlogn)-비트 공간을 필요로 하는 공통적인 문제점으로 인하여 보다 효율적으로 공간을 사용할 수 있는 방법에 대한 필요성이 요구되었다. 하지만 기 개발된 압축된 써픽스 배열이나 FM-인덱스와 같은 것들 또한 이미 존재하는 써픽스 배열에서부터 구축되어야 하기 때문에 실제적인 사용 공간을 줄일 수는 없었다. 최근, 써픽스 배열을 구축할 필요 없이 텍스트로부터 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘들이 제안되었다. 본 논문에서는 실험을 통해 자료구조 구축 시간과 구축 시 필요로 하는 최대 사용 공간, 구축이 끝난 후 최종 자료구조의 크기 등을 측정함으로써 이 두 가지 압축된 써픽스 배열 구축 알고리즘과 기존의 써픽스 배열들과의 실제적인 성능을 비교한다.

과학기술분야 학위논문 내용목차에 따른 주제어 출현빈도에 관한 연구 (A Study on Frequency of Subject on Content of Thesis in Field of Science and Technology)

  • 이혜영;곽승진
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.191-210
    • /
    • 2008
  • 일반적으로 문헌을 검색하고 접근하기 위하여 주제색인과 같은 주제어를 활용하곤 한다. 그렇다면 문헌의 내용과 문헌의 주제어는 분명히 어떤 밀접한 상관관계가 있을 것으로 예측해볼 수 있다. 본 연구는 이러한 의문점에서 출발하여, 디지털콘텐트의 본문내용이 비교적 짜임새 있게 정형화되어 있는 석사 학위논문을 연구문헌으로 한정하여 학위논문 전문에서 나타나는 학위논문의 주제어 분포도를 연구하였다. 학위논문의 주제어는 논문 저자가 부여한 주제어를 사용하되, 학위논문 전문은 '목차', '서론', '이론배경', '본론', '결론', '참고문헌'의 내용위치로 분할하여 내용위치에 따른 주제어의 출현율을 확인하였다. 연구대상 학위논문 전문은 1226.3개의 용어, 5152.3번의 용어 출현을 보였다. 학위논문 저자가 부여한 주제어는 $12{\sim}13$개 용어로 구성되어 있었다. 연구결과, 전문 내용위치에 따른 주제어의 출현율은 '목차' 11.4%와 '서론' 11.2%에서 가장 높았으며(11%), 다음 순위는 내용위치 '결론' 9.8%이었다.

텍스트는 원형인가? - 개념 정립을 위한 원형 이론적 토대를 찾아서 - (Ist Text ein Prototyp? - Versuch einer Begriffsbestimmung aus prototypentheoretischer Sicht -)

  • 이성만
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.289-310
    • /
    • 2002
  • Die Arbeit versucht, den Textbegriff aus prototypentheoretischer Sicht neu zu orientieren. Damit wird unter Text immer eine monologisch geschriebene sprachliche $\"{A}u{\ss}erung$ aus mehreren $S\"{a}tzen$ verstanden. Die in de Beaugrande/Dressler(l98l) als wichtig bezeichnete Textmerkmale wird dann in Bezug auf Vater(1992), $L\"{o}tscher(1987)$ und Klein/von Stutterheim (1991) kritisch $gekl\"{a}rt$. Daraus ergibt sich eine merkmalsorientierte Textbestimmung: Ein Text ist eine abgeschlossene themenorientierte kommunikative Einheit in einem konkreten Kontext; er hat eine bestimmte kommunikative Funktion und $erf\"{u}llt\;koh\"{a}rente$ Bedingungen. Meine These ist: Typische Texte sind auf Mustern, $n\"{a}mlich$ auf Prototypen bezogen. Textmuster sind als Prototypen bezeichnet, die in unterschiedlichem $Ma\ss\;Spielraum\;f\"{u}r\;Variationen\;und\;Kreativit\"{a}t$ lassen. Textmuster sind zu beschreiben $\"{u}ber$ das Zusammenspiel von nichtsprachlichem Handlungstyp und sprachlicher Textsorte. Dieses Zusammenspiel yon Handlungsaspekten wird in prototypischer Weise mit bestimmten Textmerkmalen verbalisiert. Mit Textmusterbeschreibungen werden jeweils prototypische Exemplare beschrieben: die beste Exemplare, die klar als solehe erkennbar sind. Die Formulierung 'Es war einmal....'. ist $f\"{u}r\M\"{a}rchen$ zwar prototypische Anfangsform, aber sie wird nur in etwa einem drittel der $F\"{a}lle$ verwendet. Prototypische Textmustermerkmale sind also nicht obligatorisch. Das $hei{\ss}t$, dass die Realiseirungen je nach individueller bzw. kultureller Situation und damit verfolgtem Zweck variabel sind Damit habe ich mich am Beispiel der Textsorte $besch\"{a}ftigt$.

  • PDF

중등학교 가정과교사 임용시험의 핵심 키워드 탐색: 내용 분석과 텍스트 네트워크 분석을 중심으로 (Exploring the Core Keywords of the Secondary School Home Economics Teacher Selection Test: A Mixed Method of Content and Text Network Analyses)

  • 박미정;한주
    • Human Ecology Research
    • /
    • 제60권4호
    • /
    • pp.625-643
    • /
    • 2022
  • The purpose of this study was to explore the trends and core keywords of the secondary school home economics teacher selection test using content analysis and text network analysis. The sample comprised texts of the secondary school home economics teacher 1st selection test for the 2017-2022 school years. Determination of frequency of occurrence, generation of word clouds, centrality analysis, and topic modeling were performed using NetMiner 4.4. The key results were as follows. First, content analysis revealed that the number of questions and scores for each subject (field) has remained constant since 2020, unlike before 2020. In terms of subjects, most questions focused on 'theory of home economics education', and among the evaluation content elements, the highest percentage of questions asked was for 'home economics teaching·learning methods and practice'. Second, the network of the secondary school home economics teacher selection test covering the 2017-2022 school years has an extremely weak density. For the 2017-2019 school years, 'learning', 'evaluation', 'instruction', and 'method' appeared as important keywords, and 7 topics were extracted. For the 2020-2022 school years, 'evaluation', 'class', 'learning', 'cycle', and 'model' were influential keywords, and five topics were extracted. This study is meaningful in that it attempted a new research method combining content analysis and text network analysis and prepared basic data for the revision of the evaluation area and evaluation content elements of the secondary school home economics teacher selection test.

Cinema of Interval: Sergei Eisenstein′s Theory and Practice of Montage

  • Choe, Young-Jeen
    • 인문언어
    • /
    • 제2권1호
    • /
    • pp.259-284
    • /
    • 2002
  • In the history of cinema, Sergei Eisenstein is always considered as a pioneer to conceive of cinema primarily as a form of expressing thought rather than as a representation of reality. For him, montage is the indispensable method to construct an open totality of thought and image in movement. It functions as a basic thread running through two poles of filmic composition, that is, the organic and the pathetic. The organic is concerned with the composition of the film structure as a whole, while the pathetic is involved in an ongoing process of registering a leaping point in various filmic sequences. The ultimate goal of montage for Eisenstein is to create the cinema of ideas which can synthesize both emotional and intellectual elements in the filmic composition. In his system of intellectual cinema, the identity of image and thought externalizes the sensory-motor unity of nature and man along the ascending spiral of centrifugal force of the film. Indeed, in both theory and practice, Eisenstein firmly argues that nature not only provides basic laws for the organic composition of the film, but also expresses itself in the form of the whole which brings out the experience of totality in the film text, the audience, and surely Eisenstein himself.

  • PDF

아동문학과 영어교육-텍스트 활용 방안에 대한 연구 (Children's Literature in Teaching English As a Foreign Language: A Study of Literary Text Application)

  • 김혜리;권수옥
    • 영어영문학
    • /
    • 제54권2호
    • /
    • pp.189-215
    • /
    • 2008
  • This study proposes using children's literature as a means of teaching and learning English as a foreign language and suggests practical strategies on the basis of transactional theory of reading suggested by Rosenblatt (1994, 1995). This study suggests three novels written for children or young adults: On My Honor (1986) by Marion Dane Bauer, The Giver (1993) by Lois Lowry and Hatchet (1987) by Gary Paulsen. These texts were selected because of their diverse topics, easy and comprehensible language, engaging stories, and authentic and rich expressions, making them effective materials for foreign language learners. This paper is organized as follows: First, it reviews research on teaching literature in English education and response-oriented language teaching to provide theoretical background of literature-based language teaching and learning. Second, it provides the background of the texts selected for the study. Third, it develops diverse, practical strategies for instructors who intend to use children's literature in EFL teaching. We expect to guide EFL instructors in adopting children's literature in their English class by connecting theory and practice and by providing diverse methods and strategies, and sample responses by EFL university students.

스마트 패드 기반 학습 프로그램에서 멀티미디어 학습에 관한 인지이론적 원리의 적용가능성 탐색: 멀티미디어 원리와 개인차 원리를 중심으로 (Exploring the Applicability of the Cognitive Theory of Multimedia Learning for Smart Pad Based Learning with a Focus on Principles of Multimedia and Individual Differences)

  • 김보은;이예경
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.986-997
    • /
    • 2011
  • 본 연구는 학습을 위한 멀티미디어 활용에 대한 설계 원리 중 멀티미디어 원리와 개인차 원리가 스마트패드 기반 콘텐츠에서도 적용되는지 살펴보았다. 이를 위해 텍스트 기반 콘텐츠와 멀티미디어 원리(텍스트+이미지)를 적용한 콘텐츠를 각각 개발하고, 학습자들을 사전지식이 높은 집단과 낮은 집단으로 분류한 다음, 각 집단을 양분하여 두 종류의 스마트 패드용 콘텐츠를 학습하게 하였다. 각 집단의 인지부하 정도와 학업성취도를 측정한 결과, 멀티미디어 원리와 개인차 원리는 인지부하에 유의한 효과를 가져오지 못하였으나, 학업성취도 차원에서는 모두 유의한 효과를 가져왔다. 이러한 연구결과는 PC 모니터보다 제한된 스마트 패드의 화면 크기, 이미지의 성격, 그리고 학습목표의 성격 등에 기인한 것으로 보여지며, 향후 스마트 패드용 콘텐츠 개발에 있어 시사점을 제공할 수 있다.

데이터 활용률 제고를 위한 기술 용어의 상호 네트워크 생성과 통제 (Generating and Controlling an Interlinking Network of Technical Terms to Enhance Data Utilization)

  • 정도헌
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.157-182
    • /
    • 2018
  • 빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

Developing and Pre-Processing a Dataset using a Rhetorical Relation to Build a Question-Answering System based on an Unsupervised Learning Approach

  • Dutta, Ashit Kumar;Wahab sait, Abdul Rahaman;Keshta, Ismail Mohamed;Elhalles, Abheer
    • International Journal of Computer Science & Network Security
    • /
    • 제21권11호
    • /
    • pp.199-206
    • /
    • 2021
  • Rhetorical relations between two text fragments are essential information and support natural language processing applications such as Question - Answering (QA) system and automatic text summarization to produce an effective outcome. Question - Answering (QA) system facilitates users to retrieve a meaningful response. There is a demand for rhetorical relation based datasets to develop such a system to interpret and respond to user requests. There are a limited number of datasets for developing an Arabic QA system. Thus, there is a lack of an effective QA system in the Arabic language. Recent research works reveal that unsupervised learning can support the QA system to reply to users queries. In this study, researchers intend to develop a rhetorical relation based dataset for implementing unsupervised learning applications. A web crawler is developed to crawl Arabic content from the web. A discourse-annotated corpus is generated using the rhetorical structural theory. A Naïve Bayes based QA system is developed to evaluate the performance of datasets. The outcome shows that the performance of the QA system is improved with proposed dataset and able to answer user queries with an appropriate response. In addition, the results on fine-grained and coarse-grained relations reveal that the dataset is highly reliable.

블로그 텍스트 분석을 통해 살펴본 도시공원의 경험적 공간 소비 양상 - 뚝섬한강공원을 중심으로 - (A Study on Experiential Space Consumption Patterns in Urban Parks through Blog Text Analysis - Focusing on Ttukseom Hangang Park -)

  • 김신성
    • 한국조경학회지
    • /
    • 제51권2호
    • /
    • pp.68-80
    • /
    • 2023
  • 최근 사회의 변화와 새로운 기술 등의 도입으로 공원 이용행태가 다양해지면서 공원 관리의 복잡성이 증가하고 있으며, 이에 따른 유연하고 다양한 공원관리가 요구되고 있다. 그러나 이러한 새로운 요구에 대한 현황이 어떠한지, 도시공원 운영관리 정책이 이러한 수요에 대응가능한지에 대한 논의는 미흡한 실정으로, 공원 이용행태가 어떻게 다변화되고 있는지 실증적인 연구가 필요한 시점이다. 이에 본 연구는 다양한 사람들이 개인의 경험을 작성한 블로그 데이터를 활용하여 의미네트워크 분석과 토픽분석을 통해 공간 소비 양상을 고찰하고, 이러한 공간 소비 양상이 체험경제이론에 따른 경험적 소비 특성을 보이는지 살펴보았다. 연구 결과 피크닉 세트 대여, 식음료 배달 등 소비행위가 두드러지며, 감성적 경험을 추구하는 것으로 나타났다. 또한 이는 체험경제이론에 따른 경험적 소비 특성과도 부합하였다. 이는 다변화되고 있는 공원이용 수요에 맞춰 계획 및 유지관리 방법이 보다 더 유연해지고 다양해질 필요가 있다는 것을 시사한다.