• 제목/요약/키워드: 텍스트 시각화

검색결과 233건 처리시간 0.03초

텍스트 데이터의 특성에 따른 성경 시각화 사례 분석 -텍스트의 내용적, 구조적 특성 및 인용 정보를 중심으로- (Case Analysis of Bible Visualization based on Text Data Traits -Focused on Content, Structure, Quotation of Text-)

  • 김효영;박진완
    • 한국콘텐츠학회논문지
    • /
    • 제13권8호
    • /
    • pp.83-92
    • /
    • 2013
  • 텍스트 시각화는 시각적 표현의 재료가 되는 텍스트 자체에 대한 이해에서 시작한다. 임의의 텍스트 데이터를 시각화하기 위해서는 해당 텍스트의 특성에 대한 충분한 이해가 선행되어야하며, 이렇게 도출된 텍스트가 갖는 고유한 특성에 따라 시각화의 목적과 표현적 접근 방법이 결정될 수 있다. 본 연구에서는 동일한 텍스트가 갖는 다양한 특성에 따라 도출된 대표적인 시각화 사례를 분석함으로써 텍스트 시각화에 대한 접근 방식에 대한 이론적 토대를 구축하고자 하였다. 이를 위해 동일 시각화의 대상 텍스트로서 전 세계적으로 가장 널리 알려져 있고, 그 디지털 데이터를 획득하기 용이하며 따라서 텍스트 시각화 사례가 다양하게 존재하는 '성경' 텍스트를 선정하여 사례 분석을 진행하였다. 사례 분석을 위한 기준으로서 텍스트가 갖는 고유한 특성-내용적, 구조적 특성 및 인용정보-를 도출하고, 각 기준에 부합하는 텍스트 시각화 사례들을 2-3가지 이상 선정하여 분석에 대한 타당성을 높였다. 분석결과 성경 텍스트가 갖는 독특한 특성에 따라 시각화의 목표와 표현적 접근법이 결정됨을 파악할 수 있었다. 본 연구를 토대로 향후 더욱 다양한 관점의 사례 분석을 통하여 텍스트 시각화를 위한 재료 선택 및 접근 방법에 대한 이론적 방법론 구축이 가능할 것으로 기대한다.

텍스트 데이터 시각화의 표현 재료와 접근 방식에 관한 고찰 (A Review on Expressive Materials and Approaches to Text Visualization)

  • 김효영;박진완
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.64-72
    • /
    • 2013
  • 본 연구에서는 데이터 시각화 연구의 한 분야인 텍스트 시각화에 대하여 그 시각적 표현의 재료가 되는 텍스트 데이터의 종류 및 본질, 특성에 대하여 고찰하고, 다양한 텍스트 시각화의 사례 연구를 통해 텍스트 데이터의 시각화를 위한 표현적 접근 방식에 대하여 다각적으로 분석하였다. 텍스트 시각화 연구는 컴퓨터의 발달과 방대한 데이터의 공개, 그리고 시각화 툴의 범용화 등의 기류를 타고 급속도로 확산되고 있으며, 이에 따라 공학, 예술, 인문, 사회 등 학제 간 융합 연구를 통해 다양한 작품 또는 연구 성과물로서 창작되고 있다. 그럼에도 불구하고 텍스트 데이터를 비롯한 데이터 시각화에 관한 이론적 고찰과 접근 방식에 대한 체계적 분석은 거의 이루어지지 않고 있는 실정이다. 데이터는 이해와 해석의 대상이며, 가공 및 접근에 따라 무한한 정보와 가능성을 갖는다. 데이터의 중요성이 점차 증가하고 있는 현 시점에서 데이터의 이해와 해석에서 출발하는 텍스트 시각화라는 융합 학문적 연구 분야는 미래 인간 사회에서 데이터가 차지할 위상을 고려할 때, 보다 체계적인 연구와 이론적 축적을 필요로 한다.

생물 의료 정보의 효과적인 텍스트 시각화 (Effective text visualization for biomedical information)

  • 김탁은;박종철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.399-405
    • /
    • 2007
  • 생물 의료 분야에서 정보의 양이 아주 빠르게 증가하고 있다. 이러한 방대한 양의 정보에서 유용한 정보를 추출하기 위해 텍스트 마이닝 기법을 이용한 연구들이 많이 진행되어 왔다. 그렇지만 이렇게 뽑아진 정보조차 그 양이 방대하고, 또한 텍스트로 되어 있기 때문에 직관적으로 이해하기가 어렵다. 따라서 이러한 정보들을 좀 더 직관적으로 이해하기 위해서는 정보 시각화 시스템이 필수적이다. 최근 들어 이러한 정보 시각화에 대한 연구가 많이 진행되었으나 이러한 시각화 정보조차 너무나 방대하기 때문에 사용자가 필요로 하는 정보를 여과해 주는 방법이 필요하다. 그리고 시각화 시스템에서의 지식 발견을 위한 방법을 제공하여야 한다. 본 논문에서는 생물 의료 정보의 텍스트 시각화에 초점을 맞추어 생물 의료 정보의 효과적인 표현 방법과 지식 발견을 위한 직관적인 인터페이스를 제안하고자 한다.

  • PDF

디지털 텍스트의 음절을 이용한 운율 정보 시각화에 관한 연구 (A Study on Rhythm Information Visualization Using Syllable of Digital Text)

  • 박선희;이재중;박진완
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.120-126
    • /
    • 2009
  • 정보화 시대가 빠르게 성장하면서 디지털 텍스트의 양도 증가하고 있다. 이에 따라 수많은 디지털 텍스트를 파악하기 위한 시각화 사례가 증가하고 있다. 기존의 디지털 텍스트 시각화 디자인은 스태밍 알고리즘(stemming algorithm)의 도입과 단어 빈도수를 추출하여 주제어를 형상화하여 텍스트의 의미를 부각시키고 문장과 문장을 연결해주는 것에 치중하고 있다. 이에 디지털 텍스트의 정서적인 느낌을 시각화할 수 있는 운율을 표현하는 것에 있어서 미흡했던 부분이 사실이다. 운율을 보다 효과적으로 표현할 수 있는 음운단위로는 음절을 들 수 있다. 문장에서 음절은 단어나 구, 문장의 발음에 가장 기본적인 발음 단위가 된다. 이를 기본으로 강세, 성조, 운율 요소들의 길이 등이 음절에 기반을 두고 있다. 음절을 정의하는 것과 가장 밀접한 연관이 있는 공명도(sonority)는 발화할 때 폐의 공기 흐름과 운동 에너지(Kinetic energy)를 공명도로 명시되는 음향에너지(acoustic energy)로 표현한 것이다. 본 연구는 이러한 관점에서 디지털 텍스트의 속성인 음절을 기반으로 음운론적 정의와 특성을 살펴보고 운율을 다이어그램을 통해 시각화하기 위한 방법을 연구한다. 실험을 통해 디지털 텍스트를 발음기호로 변환한 후, 모든 언어속의 리듬에서 출발된 음절의 공명도를 사용하고 디지털 텍스트를 음절화하여 운율 정보를 이미지로 시각화한다. 운율 정보를 시각화함으로써 디지털 텍스트의 음절 정보를 알 수 있고, 디지털 텍스트의 정서를 다이어그램을 통해 체계적인 공식에 의하여 사용자의 이해를 돕도록 표현한다. 이에 해당 텍스트의 운율을 보다 쉽게 파악하도록 설계하여 디지털 정보 시각화를 구현하는데 그 목적을 두고 있다.

  • PDF

구텐베르그 프로젝트 텍스트 데이터를 활용한 시각화 및 용례 검색 (Text Visualization and Concordance Search Using Gutenberg Project Text Data)

  • 김동성;신연수;이지안;유지민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-178
    • /
    • 2017
  • 본 연구는 거시적 빅데이터 인문학과 미시적 언어 텍스트 검색 시스템을 구축하고, 이를 통해서 언어를 통한 문화의 역동적 변화를 시간적 순서에 따라 살펴보고자 한다. 연구의 최종적인 목표는 문화도 생물체처럼 변화하는 존재라 여기고 그 구성요소들을 연구한다는 뜻인 '문화체학(文化體學; Culturomics)'과 같은 '인문학 + 정보과학 + 사회과학' 등등의 다학문간의 융합적 연구에 있다. 이 시스템을 통해서 인류 역사의 기록인 텍스트 빅데이터를 통한 인문학적 성찰을 시각화하고 있다. 이러한 구글의 업적은 인문학과 정보기술의 융합을 통해서 인문학 자체의 지평을 넓히고, 사회과학을 변형시키고, 산업과 상아탑 사이의 관계를 재조정하는데 있다.

  • PDF

구텐베르그 프로젝트 텍스트 데이터를 활용한 시각화 및 용례 검색 (Text Visualization and Concordance Search Using Gutenberg Project Text Data)

  • 김동성;신연수;이지안;유지민
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.175-178
    • /
    • 2017
  • 본 연구는 거시적 빅데이터 인문학과 미시적 언어 텍스트 검색 시스템을 구축하고, 이를 통해서 언어를 통한 문화의 역동적 변화를 시간적 순서에 따라 살펴보고자 한다. 연구의 최종적인 목표는 문화도 생물체처럼 변화하는 존재라 여기고 그 구성요소들을 연구한다는 뜻인 '문화체학(文化體學; Culturomics)'과 같은 '인문학 + 정보과학 + 사회과학' 등등의 다학문간의 융합적 연구에 있다. 이 시스템을 통해서 인류 역사의 기록인 텍스트 빅데이터를 통한 인문학적 성찰을 시각화하고 있다. 이러한 구글의 업적은 인문학과 정보기술의 융합을 통해서 인문학 자체의 지평을 넓히고, 사회과학을 변형시키고, 산업과 상아탑 사이의 관계를 재조정하는데 있다[1].

  • PDF

장르 판별 알고리즘을 이용한 책 장르 시각화 (Book Genre Visualization based on Genre Identification Algorithm)

  • 김효영;박진완
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.52-61
    • /
    • 2012
  • 텍스트 시각화는 데이터 시각화의 한 분야로, 방대한 텍스트 데이터에 대한 다양한 분석 기법을 바탕으로 텍스트의 내용적 측면은 물론 구조적, 형식적 측면을 시각적으로 재현(represent)해내는 방법에 관한 연구이다. 본 연구에서는 이러한 텍스트 시각화 연구의 일환으로, 서적이 갖는 장르적 특성을 서적 본문에 직접 사용된 단어들을 바탕으로 파악해낼 수 있는 방법에 대해 고찰하고, 실험을 통한 검증을 바탕으로 서적 장르 시각화의 요소를 도출한 후, 이를 직관적이고 효율적으로 시각화하는 방법에 대해 서술하였다. 본 연구에서 제안하는 시각화는 첫째, 책에 직접 사용된 단어를 토대로 책의 실질적 장르를 파악할 수 있으며, 둘째, 시각화 결과 이미지를 통해 해당 서적이 어떤 장르와 가장 가까운지 한 눈에 파악할 수 있을 뿐 아니라, 한 책이 갖는 복합 장르적 특성을 알 수 있도록 해주고, 이미지 내의 점(dot)의 개수와 곡선의 곡률, 밝기 등을 통해 대표 장르로 파악된 장르의 근접도(유사도)를 짐작할 수 있다는 점에서 그 의의를 갖는다. 나아가 개별 소비자 자신이 선호하는 서적들에 대한 적용을 통해 개인별 선호 서적(또는 장르) 이미지를 제공하는 등 서적 추천 시스템과 같은 북 커스터마이징(book customizing)과 같은 분야에도 다양하게 활용될 수 있다.

텍스트 데이터 시각화를 위한 MVC 프레임워크 (A MVC Framework for Visualizing Text Data)

  • 최광선;정교성;김수동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.39-58
    • /
    • 2014
  • 빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.

인간의 감정을 인지하는 안드로이드 기반 컨텍스트폰 (An Android based Contextphone to aware Human Emotion)

  • 류윤지;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.558-561
    • /
    • 2010
  • 컨텍스트폰은 사용자의 주변 상황을 실시간으로 수집하고 시각화하는 휴대전화이며 인간의 여섯 번째 감각 도구로써 신체의 일부가 되고 있다. 이에 따라 사용자에 특화된 상황 인지 기능을 지원하는 모바일 플랫폼 기술이 많이 연구되고 있다. 하지만 모바일 기기간의 상호작용이 아니라 사용자간의 소셜 인터랙션을 지원하는 모바일 플랫폼 연구는 미비하며 감정 등의 고수준 정보는 지원하지 않는다. 따라서 본 논문에서는 감정을 포함한 다양한 정보들을 지원하는 컨텍스트폰 플랫폼을 이용하여 사용자간의 감정을 공유 할 수 있는 컨텍스트폰에 대해 기술한다. 또한 사용자의 감정을 인식하기 위해 컨텍스트폰 플랫폼은 휴대전화 카메라를 이용하여 사용자의 얼굴이미지를 수집하고 감정인식기로 전달한다. 감정인식기는 사용자의 얼굴을 특징추출하여 패턴인식에 적용되는 분류분석 알고리즘을 통해 사용자의 감정을 알아내고 컨텍스트 서버를 매개체로 사용자간 감정을 전달하며 모바일 화면에 시각화한다.

단어 구름과 동적 그래픽스 기법을 이용한 영어성경 텍스트 시각화 (English Bible Text Visualization Using Word Clouds and Dynamic Graphics Technology)

  • 장대흥
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.373-386
    • /
    • 2014
  • 단어 구름은 문자 텍스트 상의 복수개의 단어들을 대상으로 그 단어들의 출현 빈도에 비례하는 글자의 크기나 글자의 색깔로 중요도를 나타내는 텍스트 시각화 방법이다. 이 그림은 텍스트 상의 핵심단어를 재빨리 인지하고 단어들의 상대적 출현빈도수에 맞추어 배열하는 데 유용하다. 동적 그래픽스를 이용하여 텍스트 장들의 변화에 따른 핵심단어와 단어출현빈도의 패턴의 변하는 모습을 살필 수 있다. 행들이 텍스트 상의 장들이고 열들이 텍스트에 출현하는 단어들의 출현빈도수 순위들인 단어출현빈도행렬을 정의할 수 있고 이 행렬을 이용하여 단어출현빈도행렬그림을 그릴 수 있다. 동적 그래픽스를 이용하여 출현빈도수 순위의 변화에 따른 단어출현빈도행렬의 패턴의 변하는 모습을 살필 수 있다. 우리는 단어 구름과 동적 그래픽스 기법을 사용하여 영어성경 텍스트 시각화를 수행할 수 있다.