• Title/Summary/Keyword: 공간 텍스트

Search Result 418, Processing Time 0.038 seconds

A Semantic Text Model with Wikipedia-based Concept Space (위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델)

  • Kim, Han-Joon;Chang, Jae-Young
    • The Journal of Society for e-Business Studies
    • /
    • v.19 no.3
    • /
    • pp.107-123
    • /
    • 2014
  • Current text mining techniques suffer from the problem that the conventional text representation models cannot express the semantic or conceptual information for the textual documents written with natural languages. The conventional text models represent the textual documents as bag of words, which include vector space model, Boolean model, statistical model, and tensor space model. These models express documents only with the term literals for indexing and the frequency-based weights for their corresponding terms; that is, they ignore semantical information, sequential order information, and structural information of terms. Most of the text mining techniques have been developed assuming that the given documents are represented as 'bag-of-words' based text models. However, currently, confronting the big data era, a new paradigm of text representation model is required which can analyse huge amounts of textual documents more precisely. Our text model regards the 'concept' as an independent space equated with the 'term' and 'document' spaces used in the vector space model, and it expresses the relatedness among the three spaces. To develop the concept space, we use Wikipedia data, each of which defines a single concept. Consequently, a document collection is represented as a 3-order tensor with semantic information, and then the proposed model is called text cuboid model in our paper. Through experiments using the popular 20NewsGroup document corpus, we prove the superiority of the proposed text model in terms of document clustering and concept clustering.

Techniques for Location Mapping and Querying of Geo-Texts in Web Documents (웹 문서상의 공간 텍스트 위치 맵핑과 질의 기법)

  • Ha, Tae Seok;Nam, Kwang Woo
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.27 no.3
    • /
    • pp.1-10
    • /
    • 2022
  • With the development of web technology, large amounts of web documents are being produced. This web document contains various spatial texts, and by converting these texts into spatial information, it is the basis for searching for text documents with spatial query. These spatial texts consist of a wide range of areas, including postal codes and local phone numbers, as well as administrative place names and POI names. This paper presents algorithms that can map locations based on spatial text information existing within web documents. Through these algorithms, web documents can be searched for documents describing the region on a map rather than a general web search. In this paper, we demonstrated the presented algorithms are useful by implementing a web geo-text query system.

The Structure of Text and Spatial Image - Focused on the Signification and Dramatic Space of ${\ulcorner}$the Sea-gull${\lrcorner}$ - (텍스트와 공간이미지의 구조 - "갈매기" 의 극공간 구조와 의미작용을 중심으로 -)

  • 오경환
    • Archives of design research
    • /
    • v.14 no.4
    • /
    • pp.199-207
    • /
    • 2001
  • The public performance of drama has essence to convert text to visual images as stage and to represent, inform such visual images. Visual image is formed through a space as stage. Stage is a dish to fill the texts and is the mother's womb of visual image. Namely, visual image of drama equals space image. The purpose of this study is a trial to grasp the structure and system represented through interpreting. Especially, the concerns of this study are not semiology of letter imported in image but spacial image text importing just contents of text and the process and contents grasping the structure and meaning of dramatic space. Finally, this study proposed 'the system of space embodiment'from the semiotic point of view as interpretation methodology of actual memorial, symbolic space.

  • PDF

Location Mapping Techniques of Textual Spatial Information for Spatial Semantic Web (공간 시멘틱 웹을 위한 텍스트 공간정보의 위치 맵핑 기법)

  • Ha, Tae-Seok;Ha, Su-Wook;Nam, Kwang-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.06a
    • /
    • pp.71-73
    • /
    • 2010
  • 웹에서 다양한 웹 지리 지역 정보를 검색할 수 있는 시스템에 대한 요구가 증가하고 있다. 그러나 현재의 웹 검색 시스템은 사용자가 키워드로 지역 웹 문서를 검색하고 해당 웹 문서를 지도와 비교하여 공간정보를 취득하며, 다른 관련 정보를 얻기 위해서는 검색과 비교를 반복해야 하는 어려움이 있다. 따라서 본 논문에서는 비구조화 된 텍스트 웹 자원으로부터 지리정보 온툴로지(geo-ontology)를 확장할 수 있는 통합된 검색시스템을 제안한다. 이를 위해 문서의 정보에서 위치 정보를 추출하고 공간정보 위치 맵핑 기법을 적용하여 텍스트의 공간정보를 추출한다.

  • PDF

Performance Analysis of Construction Algorithms for Compressed Suffix Arrays (압축된 써픽스 배열 구축 알고리즘의 성능 분석)

  • Park Chi-Seong;Jo Jun-Ha;Sim Jeong-Seop;Kim Dong-Kyue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.409-411
    • /
    • 2006
  • 써픽스 배열은 사전적 순서로 정렬된 써픽스들의 인덱스를 저장한 인덱스 자료구조로서, 긴 텍스트에서 반복되는 패턴 검색 시 효율적으로 사용 될 수 있다. 하지만 O($n\;log{\Sigma}$) 비트의 텍스트보다 큰 O(n log n) 비트 공간을 차지하기 때문에 대용량의 텍스트에 대해서는 큰 공간을 필요로 하는 문제점이 있다. 이를 해결하기 위해 압축된 써픽스 배열이 제안되었지만, 구축 시 이미 만들어진 써픽스 배열을 이용하기 때문에 실제 사용 공간을 줄이지는 못했다. 최근 써픽스 배열 없이 텍스트에서 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘이 개발되었다. 본 논문에서는 이 두 가지 알고리즘을 구현한 후, 구축 시간과 사용 공간 등의 실험을 통해 기존의 써픽스 배열들과의 성능을 비교하고 분석한다.

  • PDF

Research Trends of Graph-Based Text Mining (그래프 기반 텍스트 마이닝의 연구 동향)

  • Chang, Jae-Young;Han, Jong Bin;Jwa, Tae Bin
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1074-1077
    • /
    • 2013
  • 텍스트 마이닝은 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 주제별로 제시한다.

Analyzing and classifying emotional flow of story in emotion dimension space (정서 차원 공간에서 소설의 지배 정서 분석 및 분류)

  • Rhee, Shin-Young;Ham, Jun-Seok;Ko, Il-Ju
    • Korean Journal of Cognitive Science
    • /
    • v.22 no.3
    • /
    • pp.299-326
    • /
    • 2011
  • The text such as stories, blogs, chat, message and reviews have the overall emotional flow. It can be classified to the text having similar emotional flow if we compare the similarity between texts, and it can be used such as recommendations and opinion collection. In this paper, we extract emotion terms from the text sequentially and analysis emotion terms in the pleasantness-unpleasantness and activation dimension in order to identify the emotional flow of the text. To analyze the 'dominant emotion' which is the overall emotional flow in the text, we add the time dimension as sequential flow of the text, and analyze the emotional flow in three dimensional space: pleasantness-unpleasantness, activation and time. Also, we suggested that a classification method to compute similarity of the emotional flow in the text using the Euclidean distance in three dimensional space. With the proposed method, we analyze the dominant emotion in korean modern short stories and classify them to similar dominant emotion.

  • PDF

A Study on the Postmodern Identity in Madonna Costume -Focusing on the intertextuality- (마돈나 의상에 나타난 포스트모던 정체성없음)

  • 김주영;양숙희
    • Journal of the Korean Society of Costume
    • /
    • v.51 no.8
    • /
    • pp.123-139
    • /
    • 2001
  • 본고는 공간, 시간, 계급, 종교 등 하위문화 텍스트의 병행인용 즉 상호텍스트성(intertextuality)을 통해, 20세기 대중 문화의 상징 마돈나 뮤직 비디오와 공연 등의 인체, 의상, 이미지 등에 나타난 포스트모던 정체성을 연구함으로써, 현대 미디어 문화를 관통하는 주체적 여성 정체성과 미적 주관성을 이해하고자한다. 첫째, 상호공간텍스트성 복식은 스패니쉬룩. 태국룩. 게이샤룩, 테크노펑크룩, 테크노 카우걸룩 등의 동서양의 지리적 소외감을 통해 비권위적 다양한 시선을 제시함으로써, 다국적 자본주의와 함께 확장된 미적 체험을 하게 한다.; 둘째, 상호시간텍스트성 복식은 중세 엠파이어 드레스, 18세기 로코코시대의 robe'a la francaise, 미래적 제 3의 종 룩 등 동시적 몽환적 이미지를 통해 유희적 유토피아를 지향하였다.; 셋째, 상호계급텍스트성 복식은 그라피티룩, 펑크룩, 키치룩, 먼로 룩, 보깅(voguing), 에비타 룩 등 상하류층, 하위문화, 빈부, 권력의 유무를 병행인용하여, 좋은/나쁜 취향, 창녀/성녀 이분법을 해체하고 반부르조아적 저항과 물질주의를 찬양하는 탈계급적, 양면적 정체성을 구축하였다. ; 넷째, 상호종교텍스트성 복식은 상징적 가부장인 카톨릭교 텍스트를 인용하여 펑키크리스찬 룩, 에로틱 크리스찬 룩 등의 선/악, 신성성/관능성, 미추, 정숙성/비정숙성의 이분법, 비장미를 해체함으로써 예술의 자율성, 무의식이 강조된 쾌락주의적, 반권위주의적 정체성을 주장한다. 섹슈얼리티에 있어, 시선, 권력, 쾌락의 주체가 됨으로써, 미적 범주에 있어 선악, 미추, 정숙성과 비정숙성의 이분법을 해체함으로써, 유동적 자아를 구성한 마돈나 의상의 포스트모던 정체성은 여성에게 확대된 가능성을 제공하며 내부로부터 해체된 열린 복식을 지향한다.

  • PDF

Text Detection and Binarization using Color Variance and an Improved K-means Color Clustering in Camera-captured Images (카메라 획득 영상에서의 색 분산 및 개선된 K-means 색 병합을 이용한 텍스트 영역 추출 및 이진화)

  • Song Young-Ja;Choi Yeong-Woo
    • The KIPS Transactions:PartB
    • /
    • v.13B no.3 s.106
    • /
    • pp.205-214
    • /
    • 2006
  • Texts in images have significant and detailed information about the scenes, and if we can automatically detect and recognize those texts in real-time, it can be used in various applications. In this paper, we propose a new text detection method that can find texts from the various camera-captured images and propose a text segmentation method from the detected text regions. The detection method proposes color variance as a detection feature in RGB color space, and the segmentation method suggests an improved K-means color clustering in RGB color space. We have tested the proposed methods using various kinds of document style and natural scene images captured by digital cameras and mobile-phone camera, and we also tested the method with a portion of ICDAR[1] contest images.

Study on the management of text clutter on ENC portrayal (전자해도의 텍스트 중첩 해결 방안 연구)

  • Kang, Dongwoo;Oh, Sewoong;Shim, Wooseong
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2013.10a
    • /
    • pp.176-177
    • /
    • 2013
  • 전자해도 표현 측면에서 구분한 종류는 공간적 위상관계를 표현하는 정보, 사물을 표현하는 오브젝트, 그리고 오브젝트의 속성정보를 표현하는 텍스트가 있다. 텍스트가 필요 유무의 구분 없이 동시에 화면에 표출될 때, 각각의 텍스트가 서로 중첩되면서 의미 파악이 힘들뿐만 아니라 화면 가독성에 많은 영향을 미친다. S-52 표준에서는 텍스트의 화면 표출 여부를 선택할 수 있도록 기능을 제공하고 있으나, 이는 모든 텍스트를 동시에 표출하는 것과 하지 않는 것일 뿐 텍스트 중첩 문제는 해결되지 않는다. 이를 해결하기 위하여 본 연구에서는 텍스트 중첩 유무 및 각 오브젝트의 정보를 바탕으로 텍스트의 표출 여부를 판단하는 방안을 제안하였고 이를 통해 전자해도의 가독성을 높이고 텍스트의 의미전달이 용이하도록 하였다.

  • PDF