• 제목/요약/키워드: text format

검색결과 257건 처리시간 0.019초

공통기술표현포맷에 기반한 다매체자료의 검색효율 향상에 관한 연구 (A Study on the Improvement of Retrieval Efficiency Based on the CRFMD)

  • 박일종;정기태
    • 정보관리학회지
    • /
    • 제23권3호
    • /
    • pp.5-21
    • /
    • 2006
  • 최근 수년 동안 영상자료와 음성자료 분석에 대한 이론들이 텍스트자료 검색 시스템과 함께 사용되기 위해서 제안되어 왔으며 데이터 처리 속도의 급격한 향상과 함께 발전되어 왔다. 일반적 검색 방법들은 단지 텍스트만을 사용하지만 텍스트와 그림을 동시에 사용하는 검색 방법 또한 최근에 제안되어 왔다. 본 연구는 다매체자료의 공통기술표현포맷(CRFMD)이라는 이름으로 화상자료와 텍스트자료를 하나의 자료 구조로 통합하는 방법을 제안하고 있으며, 주어진 테스트자료에 대한 화상자료의 유사성 분석에서 텍스트와 그림의 형태소를 함께 사용하였을 때 현격히 개선되어 짐을 보여주고 있다. CRFMD는 의료문서 검색, WWW 검색, 박물관 소장품 검색과 같은 다양한 분야의 다매체자료 검색 및 처리에 응용될 수가 있을 것이다.

Text-To-Vision Player - Converting Text to Vision Based on TVML Technology -

  • Hayashi, Masaki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.799-802
    • /
    • 2009
  • We have been studying the next generation of video creation solution based on TVML (TV program Making Language) technology. TVML is a well-known scripting language for computer animation and a TVML Player interprets the script to create video content using real-time 3DCG and synthesized voices. TVML has a long history proposed back in 1996 by NHK, however, the only available Player has been the one made by NHK for years. We have developed a new TVML Player from scratch and named it T2V (Text-To-Vision) Player. Due to the development from scratch, the code is compact, light and fast, and extendable and portable. Moreover, the new T2V Player performs not only a playback of TVML script but also a Text-To-Vision conversion from input written in XML format or just a mere plane text to videos by using 'Text-filter' that can be added as a plug-in of the Player. We plan to make it public as freeware from early 2009 in order to stimulate User-Generated-Content and a various kinds of services running on the Internet and media industry. We think that our T2V Player would be a key technology for upcoming new movement.

  • PDF

바이오센싱 융합 빅데이터 컴퓨팅 아키텍처 (Bio-Sensing Convergence Big Data Computing Architecture)

  • 고명숙;이태규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.43-50
    • /
    • 2018
  • 생체정보 컴퓨팅은 생체신호 센서와 컴퓨터 정보처리를 융합한 정보시스템에 기초하여 컴퓨팅시스템 뿐만 아니라 빅데이터 시스템에 크게 영향을 미치고 있다. 이러한 생체정보는 지금까지의 텍스트, 이미지, 동영상 등의 전통적인 데이터 형식과는 달리 생체신호의 의미를 부여하는 값은 텍스트 기반으로 표현되고, 중요한 이벤트 순간은 이미지 형식으로 저장하며, 시계열 분석을 통한 데이터 변화 예측 및 분석을 위해서는 동영상 형식 등 비정형데이터를 포함하는 복합적인 데이터 형식을 구성한다. 이러한 복합적인 데이터 구성은 개별 생체정보 응용서비스에서 요구하는 데이터의 특징에 따라 텍스트, 이미지, 영상 형식 등으로 각각 분리되어 요청되거나, 상황에 따라 복잡 데이터 형식을 동시에 요구할 수 있다. 기존 생체정보 컴퓨팅 시스템들은 전통적인 컴퓨팅 구성요소, 컴퓨팅 구조, 데이터 처리 방법 등에 의존하므로 데이터 처리성능, 전송능력, 저장효율성, 시스템안전성 등의 측면에서 많은 비효율성을 내포하고 있다. 본 연구에서는 생체정보 처리 컴퓨팅을 효과적으로 지원하는 생체정보 빅데이터 플랫폼을 구축하기 위해 개선된 바이오센싱 융합 빅데이터 컴퓨팅 아키텍처를 제안한다. 제안 아키텍처는 생체신호관련 데이터의 저장 및 전송 효율성, 컴퓨팅 성능, 시스템 안정성 등을 효과적으로 지원하며, 향후 생체정보 컴퓨팅에 최적화된 시스템 구현 및 생체정보 서비스 구축을 위한 기반을 제공할 수 있다.

음악 감정 분석을 통한 키네틱 타이포그래피 자막 자동 생성 서비스 (Automatic Generation Subtitle Service with Kinetic Typography according to Music Sentimental Analysis)

  • 지영서;이하람;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제24권8호
    • /
    • pp.1184-1191
    • /
    • 2021
  • In a pop song, the creator's intention is communicated to the user through music and lyrics. Lyric meaning is as important as music, but in most cases lyrics are delivered to users in a static form without non-verbal cues. Providing lyrics in a static text format is inefficient in conveying the emotions of a music. Recently, lyrics video with kinetic typography are increasingly provided, but producing them requires expertise and a lot of time. Therefore, in this system, the emotions of the lyrics are found through the analysis of the text of the lyrics, and the deep learning model is trained with the data obtained by converting the melody into a Mel-spectrogram format to find the appropriate emotions for the music. It sets properties such as motion, font, and color using the emotions found in the music, and automatically creates a kinetic typography video. In this study, we tried to enhance the effect of conveying the meaning of music through this system.

아래아 한글 파일의 텍 파일로의 변환 소프트웨어 구현 (Implementation of Hangul to $T_EX$ conversion software)

  • 김성원;이한나;박상훈;오창혁
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.99-107
    • /
    • 2010
  • 본 연구에서는 아래아 한글 형식으로 작성된 논문 파일을 $T_EX$ 형식의 파일로 변환하는 소프트웨어를 구현하였다. 아래아 한글은 문서작성 또는 출판의 도구로써 사용되는 국내에서 많은 사용자를 가진 워드프로세서이며, 이를 이용한 수식이 포함된 논문 원고의 편집은 상대적으로 수월한 것으로 알려져 있다. $T_EX$은 일반 텍스트 편집기로 작성된 문서를 컴파일하여 고품질의 문서를 얻는 수식 전문조판 프로그래밍 언어이다. 구현된 소프트웨어는 정해진 작성 형식에 따라 아래아 한글로 작성된 논문 원고의 본문, 표, 문단 형식, 수식, 특수문자 등을 지정된 스타일 파일에 맞춘 $T_EX$ 형식으로 변환 한다. 구현의 예제로써 한국데이터정보과학회지 (JKDISS)의 아래아 한글 논문 형식과 $T_EX$ 스타일 파일을 사용하였다.

디지털 객체 보존을 위한 디지털 포맷 레지스트리에 관한 연구 (A study on the Digital Format Registry for digital objects preservation in Korea)

  • 손원성;임순범;남동선;김은미
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1397-1406
    • /
    • 2009
  • 본 논문에서는 국내 환경에서 디지털 객체 보존에 관한 문제를 해결하기 위한 기술정보은행-디지털 포맷 레지스트리(Digital format Registry)를 제안한다. 포맷 레지스트리란 일반적으로, 특정 디지털 정보 파일의 포맷 구문정보와 의미정보를 저장하는 일종의 데이터베이스이며, 특정 어플리케이션이나 기술적인 환경변화가 일어나도 디지털 정보를 장기간 보존 할 수 있게 하는데 목적이 있다. 본 연구를 통해 개발된 "기술정보은행" 시스템은 국내 환경에서 생성되는 다양한 전자기록의 장기보존과 장기 접근성 유시에 근간이 되는 기술정보요소(Technical Information)를 지속적으로 수집 관리하여 마이그레이션이나 에뮬레이션과 같은 보존 전략을 효율적으로 진행 될 수 있도록 한다. 또한 제안 시스템은 소비자에게 필요한 정보를 쉽고 편리하게 검색할 수 있는 Key를 디지털 객체로부터 추출할 수 있도록 하는 기능 등을 제공하여 보다 효율적인 기록관리가 가능하도록 하였다.

  • PDF

바이너리 심전도 파일 포맷의 효율적인 디스크립션을 위한 시각적 도구 설계 (Design of Visual Tool for Efficient Descripting of Binary ECG File Formats)

  • 구흥서
    • 한국지능시스템학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-31
    • /
    • 2007
  • 본 연구에서는 BED(Binary ECG Description)기반의 바이너리 심전도(ECG) 변환시스템은 ECG 데이터의 상호연동성을 지원하기 위해 바이너리 ECG 파일을 XML기반의 HL7 aECG로 변환하는 시스템이다. 그러나, BED 시스템을 처음 사용하는 초보자는 XML을 사용하여 BED 문서를 작성하기 어렵다. 본 논문에서는 초보자들이 BED 문서를 쉽게 작성할 수 있도록 지원하는 시각적 도구인 BED 스튜디오를 구현한다. 이 시스템은 세부분, 즉 비주얼 편집기, XML트리 편집기, 그리고 포맷검증 뷰어로 구성된다. 포맷검증뷰어는 사용자가 비주얼 인터페이스를 사용하여 작성한 BED 문서를 바이너리 ECG 파일과의 포맷 매칭을 시각적으로 검사할 수 있도록 지원하여 BED 문서 작성시 발생할 수 있는 오류 가능성을 감소시켰다.

Extending TextAE for annotation of non-contiguous entities

  • Lever, Jake;Altman, Russ;Kim, Jin-Dong
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.15.1-15.6
    • /
    • 2020
  • Named entity recognition tools are used to identify mentions of biomedical entities in free text and are essential components of high-quality information retrieval and extraction systems. Without good entity recognition, methods will mislabel searched text and will miss important information or identify spurious text that will frustrate users. Most tools do not capture non-contiguous entities which are separate spans of text that together refer to an entity, e.g., the entity "type 1 diabetes" in the phrase "type 1 and type 2 diabetes." This type is commonly found in biomedical texts, especially in lists, where multiple biomedical entities are named in shortened form to avoid repeating words. Most text annotation systems, that enable users to view and edit entity annotations, do not support non-contiguous entities. Therefore, experts cannot even visualize non-contiguous entities, let alone annotate them to build valuable datasets for machine learning methods. To combat this problem and as part of the BLAH6 hackathon, we extended the TextAE platform to allow visualization and annotation of non-contiguous entities. This enables users to add new subspans to existing entities by selecting additional text. We integrate this new functionality with TextAE's existing editing functionality to allow easy changes to entity annotation and editing of relation annotations involving non-contiguous entities, with importing and exporting to the PubAnnotation format. Finally, we roughly quantify the problem across the entire accessible biomedical literature to highlight that there are a substantial number of non-contiguous entities that appear in lists that would be missed by most text mining systems.

인터넷상에서 텍스트와 TIFF 이미지 자료 디스플레이를 위한 뷰어 구현 및 평가 (Implementation and Evaluation of Integrated Viewier for Displanning Text and TIFF Image Materials on the Internet Environments)

  • 최흥식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.67-87
    • /
    • 2000
  • The purpose of the study is to develop an integrated viewer which can display both text and image files on the Internet environment. Up to now, most viewers for full-text databases can be displayed documents only by image or graphic viewers. The newly developed system can compress document files in commercial word processors (e.g, 한글TM, WordTM, ExceITM, PowerpointTM, HunminJungumTM, ArirangTM, CADTM), as well as conventional TIFF image file in smaller size, which were converted into DVI(DeVice Independent) file format, and display them on computer screen. IDoc Viewer was evaluated to test its performance by user group, consisting of 5 system developers, 5 librarians, and 10 end-users. IDoc Viewer has been proved to be good or excellent at 20 out of 26 check lists.

  • PDF

한글 한자 자동변환이 가능한 WC

  • 이기식;서용무
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1983년도 춘계학술발표회논문집
    • /
    • pp.18-28
    • /
    • 1983
  • This paper describes the result of a series of fundamental researches on a word processing system, named WORD80. Given the text consisting of Ilanguel characters, Chinese characters, English alphabets and other special characters, it can provide-ㄴo-see printout, after having processed according to the commands used to control the output format of the text. Since each Hanguel character in input text is made up of and is represented as some compoents, it uses the deterministic finite automata for the formation of Hanguel from its components. When developed at first, the WORD80 can perform Hanguel to Chinese transition character by character by character. But it was thought to be more practical to do this word by word.

  • PDF