• Title/Summary/Keyword: 텍스트화

Search Result 989, Processing Time 0.023 seconds

A Study on the Use of Stopword Corpus for Cleansing Unstructured Text Data (비정형 텍스트 데이터 정제를 위한 불용어 코퍼스의 활용에 관한 연구)

  • Lee, Won-Jo
    • The Journal of the Convergence on Culture Technology
    • /
    • v.8 no.6
    • /
    • pp.891-897
    • /
    • 2022
  • In big data analysis, raw text data mostly exists in various unstructured data forms, so it becomes a structured data form that can be analyzed only after undergoing heuristic pre-processing and computer post-processing cleansing. Therefore, in this study, unnecessary elements are purified through pre-processing of the collected raw data in order to apply the wordcloud of R program, which is one of the text data analysis techniques, and stopwords are removed in the post-processing process. Then, a case study of wordcloud analysis was conducted, which calculates the frequency of occurrence of words and expresses words with high frequency as key issues. In this study, to improve the problems of the "nested stopword source code" method, which is the existing stopword processing method, using the word cloud technique of R, we propose the use of "general stopword corpus" and "user-defined stopword corpus" and conduct case analysis. The advantages and disadvantages of the proposed "unstructured data cleansing process model" are comparatively verified and presented, and the practical application of word cloud visualization analysis using the "proposed external corpus cleansing technique" is presented.

A Visual Specification Language for Process Algebra (프로세스 대수를 위한 시각화 명세 언어)

  • On, Jin-Ho;Woo, Su-Heong;Lee, Moon-Kun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.193-196
    • /
    • 2011
  • 공간적으로 다양하게 재구성되며 이동하는 분산/이동/실시간 시스템을 명세 및 분석하기 위한 기존의 프로세스 대수들은 명세/분석 과정에서 텍스트 기반의 명세 언어를 사용한다. 이로 인하여 프로세스 사이의 이동성과 프로세스들의 공간적 분포를 대한 명세 및 분석 방법은 매우 큰 복잡도가 존재한다. 이를 극복하기 위하여 일반 프로세스 대수를 시각적인 형태로 표현하는 다양한 기법들이 제안되었다. 이러한 시각화 언어들은 시스템의 특정 상태를 명세하거나, 시스템의 속성을 공간적 분포와 링크정보로 분리하는 방법들이 사용되었지만, 명세하고자 하는 시스템의 전체 행위에 대한 효율적인 명세 방법이 존재하지 않고, 시각화 언어임에도 불구하고 텍스트기반의 프로세스 대수와 병행되어 사용되어야만 하는 제약들이 존재한다. 이러한 제약들을 극복하기 위한 하나의 방법으로 본 논문에서는 프로세스 대수를 위한 새로운 시각화 언어인 Onion Visual Language를 제안한다. Onion Visual Language는 프로세스 사이에서 발생하는 이동과 상호작용 등의 전체 행위를 원형의 양파껍질과 같은 형태로 표현하며, 각 프로세스들 사이에서 발생하는 행위들의 관계를 액션으로 표현한다. 또한, 계층화된 프로세스 구조, 프로세스의 상태정보, 프로세스의 미래 행위 정보, 비결정적 행위정보를 포함하여 매우 복잡한 시스템의 특징을 효율적으로 명세/분석 가능하도록 하였다.

A Study on Game Localization with the Game 'Lobotomy Corporation': Based on Translation Considering Characteristics (게임 '로보토미 코퍼레이션'을 통한 게임 현지화 연구: 캐릭터성을 고려한 번역을 대상으로)

  • Won, Ho-Hyeuk;Gu, Bon-Hyeok;Kim, Hyoung-Youb
    • Journal of Korea Game Society
    • /
    • v.18 no.3
    • /
    • pp.87-102
    • /
    • 2018
  • In this study of effective game localization, we attempt to gauge the influence of characteristics on the translation of the texts in games. In general, the characters in the games that feature interactive story-telling structure have a huge impact on events that occur in the games. Additionally, in case the origin of the characters are closely connected with either cultural factors or symbolisms, the relation between characters and stories tends to be stronger. In this research, the characteristics of the characters in the game 'Lobotomy Corporation' - featuring characteristics based on 'The Tree of Sepiroth' of Kabbalah - will be analyzed in depth; then, the result will lead us to suggest the method of proper translation in order to show how to localize the games effectively in future.

A Study on Trend in Reinterpretation of Architectonic Programming as a Schematic Factor in Contemporary Architecture (현대건축디자인에서 개념요소로서 프로그래밍의 재해석 경향에 관한 연구)

  • 김능현
    • Korean Institute of Interior Design Journal
    • /
    • no.25
    • /
    • pp.272-279
    • /
    • 2000
  • It can be characterized that contemporary architects intend to establish architectonics which can make it possible to reinterpret the attribute of movement in space and its programming differed from the traditional perception in moving in and out any space through disjoining and reorganizing human behavior and event. This intends reflect new paradigm for subjugating the compelled fuctioning of modern Architecture. This Study review those intends focused on programming as a pre-disign schema. In those intends, it connotes the effort of establishing more systemic and logical approach through deconstruction and disprogramming the existing from, space, elements and human on the basis of his own schematic conception as substitution of function in modern architecture.

  • PDF

Korea Electronic Technology Institute (멀티미디어 컨텐츠의 지능형 선택/검색 시스템 구현)

  • 이종설;이윤주;박우출;정하중;조위덕
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.61-63
    • /
    • 2002
  • 멀티미디어 컨텐츠의 지능형 선택/검색 시스템(MISS: Multimedia Content Intelligent Selection/search) 는 콘텐츠를 공급하는 서버에 다량의 멀티미디어 컨텐츠들이 존재하며, 이 컨텐츠 중에서 원하는 것을 검색, 선택하는 시스템이다. 지능적 검색, 선택기능을 갖는 MISS 시스템은 인터넷 및 네트워크상에 연결된 시스템들간의 맞춤형 서비스 구현에 필요한 핵심이며, 모든 종류의 멀티미디어 콘텐츠에 적용 가능하다. 현재 WWW 서비스경우는 정보를 찾기 위하여 웹상에서 문서를 찾아주는 텍스트 기반 정보검색기술이 사용되고 있는데, 점점 우리가 접하는 정보의 형태는 텍스트와 함께 화상, 음성, 동영상 등의 멀티미디어화 및 디지털화하고 있다. 사용자들에게는 멀티미디어 데이터를 효과적으로 찾아야 하는 필요성이 증가하고 이에 따라 방대한 양의 분산된 멀티미디어 데이터를 처리할 수 있는 색인 및 검색 도구의 요구가 커지게 되었다. MISS 시스템은 WWW 서비스의 요구에도 적용될 수 있다. MISS 시스템은 다량의 동영상 콘텐츠 중에서 특정 배우, 감독등의 여러 가지 검색 조건으로 콘텐츠를 검색/선택할 수 있고, 하나의 동영상 콘텐츠 내에서 특정Video Segment를 검색할 수 있다. 본 MISS 시스템은 동영상에 대한 Search/Query를 위한DS 구조로써 MPEG-7의 User preference metadata를 이용하였다.

  • PDF

Intelligent Classification and Context Analysis System of Voice Data (음성 데이터의 지능적 분류 및 컨텍스트 분석 시스템 구현)

  • Choi, HyeonSeok;Joo, SungHwan;Kim, DaeCheon;Park, YeChan;Yeom, Sanggil;Choo, HyeonSeung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.162-163
    • /
    • 2016
  • 사람은 의사소통을 위해 음성, 글자, 몸짓 등 다양한 매개체를 활용한다. 오늘날 스마트폰의 발달로 문자의 비중이 높아지고 있지만 음성 대화는 여전히 사람들 사이에서 가장 많이 사용되어지는 의사소통 수단이다. 음성 대화는 녹음해서 음성 데이터로 남길 수 있다. 음성을 녹음하는 과정은 간편하지만 녹음파일에서 원하는 데이터를 찾는 것은 많은 시간이 소모된다. 본 논문에서는 음성 데이터를 인식하여 텍스트화 시키고 문자화 된 데이터를 분석하여 사용자에게 효율적으로 분류하는 시스템을 제안한다. 이 시스템으로 사용자는 음성 데이터의 내용을 들어보지 않고 파악할 수 있으며 원하는 내용을 찾을 수도 있다.

Supporting the Korean Lip Synchronization and Facial Expression (한글 입술 움직임과 얼굴 표정이 동기화된 3차원 개인 아바타 대화방 시스템)

  • Lee, Jung;Oh, Beom-Soo;Jeong, Won-Ki;Kim, Chang-Hun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.640-642
    • /
    • 2000
  • 대화방 시스템은 텍스트화 화상을 이용한 대화방 또는 메시지 전달시스템이 널리 사용되고 있다. 본 논문은 3차원 아바타가 등장하는 대화방 시스템을 생성 및 관리하는 기술을 제안한다. 본 아바타 대화방의 특징은 사진을 가지고 간단히 3차원 개인 아바타로 변환 생성하는 기술, 3차원 개인 아바타의 한글 발음에 적합한 입술 움직임, 메시지에 따른 적절한 표정변화 등이다. 특히, 3차원 개인 아바타는 사진만으로 생성이 가능하며, 텍스쳐 매핑된 3차원 아바타는 실시간으로 사실감있는 대화방 서비스가 가능하도록 제어된다.

  • PDF

A new segmentation method for non-manhattan layout document images using connected component (연결요소 특징을 이용한 복잡한 문서영상의 구조 분석)

  • 이상협;이경무
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1997.11a
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

Usage of voice mail according to different types of projects (프로젝트 성격에 따른 보이스메일의 사용성)

  • Kim, Min-Kyung;Kim, Hee-Choul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.529-531
    • /
    • 2005
  • IT 기술의 발전과 네트워크 보급은 일상생활만 변화시킨 것이 아니라, 인간의 의사소통 방법에도 영향을 미치고 있다. 대면(Face to Face) 커뮤니케이션은 지금까지 가장 효과적인 방법이라 일컬어 졌지만, 이제는 통신 기술의 발달과 더불어 여러 형태의 유용한 의사소통 방법들이 보급되어 생활화되어가고 있다. 특히 PC의 대중화와 초고속 통신망의 보급, 그리고 휴대전화의 보편화는 의사소통 방법의 다양화에 큰 영향을 주었다 보이스 메일은 텍스트 기반 소통과는 다른 음성으로 의사 전달을 하는 소통 방식이면서도, 대표적 텍스트 기반의 시스템인 이메일처럼 비동기적인 통신 수단이기도 하다. 본 논문은 프로젝트 수행이라는 특수한 경우 보이스 메일을 사용한 구성원들의 의사소통 케이스를 관찰, 분석하고, 이것을 기반으로 프로젝트 수행 시 보이스 메일의 사용성의 특성에 대해 살펴보고자 한다.

  • PDF

Usage of Voice Mails in Team Projects Work (프로젝트 수행그룹 내에서의 보이스 메일 사용)

  • 김민경;김희철;김태윤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.542-545
    • /
    • 2004
  • IT 기술의 발전과 네트워크 보급에 힘입어 인간의 의사소통 방법도 나날이 발전되어가고 있다. 대면(Face to Face) 커뮤니케이션은 지금까지 가장 효과적인 방법이 되어왔지만, 이제는 통신 기술의 발달과 더불어 여러 형태의 유용한 소통방법들이 보급되었고, 생활화되기 시작했다 특히 PC의 대중화와 초고속 통신망의 보급, 그리고 휴대전화의 보편화는 의사소통 방법의 다양화에 큰 영향을 주었다. 보이스 메일은 텍스트 기반 소통과는 다른 음성으로 의사 전달을 하는 소통 방식이면서도, 대표적 텍스트 기반의 시스템인 이메일처럼 비동기적인 통신 수단이기도 하다. 본 논문은 기존 커뮤니케이션 미디어는 물론 보이스 메일을 사용하여 실제 프로젝트를 수행한 케이스를 관찰, 분석하고, 이것을 기반으로 프로젝트 수행 시 다양한 의사소통 방법에 대한 이해 및 보이스 메일의 사용상의 특성에 대해 살펴보고자 한다.

  • PDF