원문정보공개서비스를 위한 전자기록구성요소에 관한 연구 (A Study on the Electronic Records Element for Full Text Opening Information Service)

  • 허준석;홍덕용
    • 기록학연구
    • 제50호
    • pp.351-388
    • 2016
  • 정부 3.0의 원문정보공개서비스의 대상인 전자기록물이 기록학적인 관점에서 체계적이고 효율적으로 활용되고 있는지를 파악하고자 공공기관의 정보공개담당자들을 대상으로 관련 설문을 조사 분석하였다. 이를 위해 InterPARES의 전자기록물 구성요소에 대하여 기록물의 4대 원칙인 진본성, 신뢰성, 무결성, 이용가능성을 지표로 하는 전자기록물의 구성요소를 분석하였다. 이러한 분석을 통하여 원문정보공개서비스에서 전자기록구성요소에 따라 관리하며 향상시킬 수 있는 요인을 찾아 개선해야 할 점을 밝혔다. 그 결과를 바탕으로 원문정보공개서비스 시 전자기록물의 요소들의 개선과 기능보완, 특성에 맞는 서비스 등을 제시하였다.

패션디자인 DB 개발

  • 김정회
    • 한국데이타베이스학회:학술대회논문집
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • pp.358-375
    • 1997
  • 가. 패션 디자인 기초 정보 수집/분석 - 국내외에 산재하는 패션디자인 정보의 기초자료를 입수 - 디자이너별/ 컬렉션별/주제별로 분류 - 가공 나- 패션디자인정보의 멀티미디어 DATA BASE개발 - 화상(IMAGE)/해설(TEXT)/ SOUND의 복합 DATA BASE SYSTEM - PC통신망 서비스를 위한 DATA개발 다. 패션디자인 관련자료의 DB화 - 패션디자인 이론서 - 패션디자인 컨테스트 / 이벤트 정보 - 패션디자인 교육기관 정보 - 패션브랜드 정보 (내셔널 / 디자이너 / 수입) 라. DATA BASE 공급 서비스 - PC통신망을 통한 서비스(DOWN LOAD 가능) - 디자인작품 IMAGE 및 CONCEPT/ DETAILS/ CAPTION - PC통신을 이용 디자인 인력 구인/구직정보 활용 - 패션디자인 해외유학 정보 마. Inter-NET 서비스 - Inter-NET을 이용 국내디자이너작품 해외 소개(중략)

문헌간 유사도를 이용한 SVM 분류기의 문헌분류성능 향상에 관한 연구 (Improving the Performance of SVM Text Categorization with Inter-document Similarities)

  • 이재윤
    • 정보관리학회지
    • 제22권3호
    • pp.261-287
    • 2005
  • 이 논문의 목적은 SVM(지지벡터기계) 분류기의 성능을 문헌간 유사도를 이용해서 향상시키는 것이다. SVM은 효과적인 기계학습 시스템으로서 최고 수준의 문헌자동분류 기술로 인정받고 있다. 이 연구에서는 문헌 벡터 자질 표현에 기반한 SVM 문헌자동분류를 제안하였다. 제안한 방식은 분류 자질로 색인어 대신 문헌 벡터를, 자질 값으로 가중치 대신 벡터유사도를 사용한다. 제안한 방식에 대한 실험 결과, SVM 분류기의 성능을 향상시킬 수 있었다. 실행 효율 향상을 위해서 문헌 벡터 자질 선정 방안과 범주 센트로이드 벡터를 사용하는 방안을 제안하였다. 실험 결과 소규모의 벡터 자질 집합만으로도 색인어 자질을 사용하는 기존 방식보다 나은 성능을 얻을 수 있었다.

헤세의 다매체적 특징과 상호매체 넘나들기 (Hesse's Multimedia Features and Inter-Media Crossing)

  • 조희주;채연숙
    • 예술인문사회 융합 멀티미디어 논문지
    • 제7권2호
    • pp.515-523
    • 2017
  • 문학을 활용하는 실습현장에서는 문학의 전문이 아니라 일부분을 발췌해서 사용한다. 따라서 어느 부분을 기억힌트로 활용할 것인지, 어떻게 제시하는 것이 효과적인지에 관한 실증적인 지침이 필요하다. 본 연구를 위해서 헤세의 삶 전반과 그의 인물들을 문학치료적인 관점으로 들여다보았다. 첫째, 헤세의 작품 속 인물을 분석하는 과정에서 자가치유적인 삶을 살아가고 있는 헤세의 모습을 만날 수 있었다. 또한 그는 쓰기, 그리기, 연주하기, 감상하기, 명상하기, 걷기 등과 함께하는 다매체적인 삶을 살았다. 둘째, 연구자는 헤세와 그의 작품을 활용한 문학치료 콘텐츠를 조현병 환자들에게 적용해 보았다. 임상에서 활용한 매체는 헤세의 작품 속에서 추출한 것이었다. 참여자들은 헤세의 작품에 대해 정서적 공감을 할 수 있었으며 나아가 참여자들간의 상호공감나누기도 가능하였다. 헤세가 보여주는 다매체적인 특성과 활용방법은 현대인의 정신건강을 증진하고 병리적인 문제를 치유하기 위해서 중요한 인문학적 자원이 될 것이다.

Three Dimensional Networked Virtual Reailty Architecture Enabling Flexible Configuration Based on Function Distribution

  • Yasuyuki-KIYOSUE;Shohei-SUGAWARA;Shigeki-MASAKI;Susumu-ICHINOSE
    • 한국방송∙미디어공학회:학술대회논문집
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • pp.23.1-28
    • 1999
  • InterSpaceTM is an advanced networked virtual reality system that presents shared three-dimensional computer graphics (CG) worlds via the Internet where multiple users can enjoy synchronous communications with voice, video and text. Users can control their avatars as a surrogate interface. In InterSpace users can walk around and interact with other people and interact with contents. In this paper, we describe the function-distributed architecture used in InterSpace. The architecture enables flexible configuration of server functions and load distribution. It also allows users to select media and client PCs to switch servers dynamically.

Sentence design for speech recognition database

  • Zu Yiqing
    • 대한음성학회:학술대회논문집
    • 대한음성학회 1996년도 10월 학술대회지
    • pp.472-472
    • 1996
  • The material of database for speech recognition should include phonetic phenomena as much as possible. At the same time, such material should be phonetically compact with low redundancy[1, 2]. The phonetic phenomena in continuous speech is the key problem in speech recognition. This paper describes the processing of a set of sentences collected from the database of 1993 and 1994 "People's Daily"(Chinese newspaper) which consist of news, politics, economics, arts, sports etc.. In those sentences, both phonetic phenometla and sentence patterns are included. In continuous speech, phonemes always appear in the form of allophones which result in the co-articulary effects. The task of designing a speech database should be concerned with both intra-syllabic and inter-syllabic allophone structures. In our experiments, there are 404 syllables, 415 inter-syllabic diphones, 3050 merged inter-syllabic triphones and 2161 merged final-initial structures in read speech. Statistics on the database from "People's Daily" gives and evaluation to all of the possible phonetic structures. In this sentence set, we first consider the phonetic balances among syllables, inter-syllabic diphones, inter-syllabic triphones and semi-syllables with their junctures. The syllabic balances ensure the intra-syllabic phenomena such as phonemes, initial/final and consonant/vowel. the rest describes the inter-syllabic jucture. The 1560 sentences consist of 96% syllables without tones(the absent syllables are only used in spoken language), 100% inter-syllabic diphones, 67% inter-syllabic triphones(87% of which appears in Peoples' Daily). There are rougWy 17 kinds of sentence patterns which appear in our sentence set. By taking the transitions between syllables into account, the Chinese speech recognition systems have gotten significantly high recognition rates[3, 4]. The following figure shows the process of collecting sentences. [people's Daily Database] -> [segmentation of sentences] -> [segmentation of word group] -> [translate the text in to Pin Yin] -> [statistic phonetic phenomena & select useful paragraph] -> [modify the selected sentences by hand] -> [phonetic compact sentence set]

R&D Perspective Social Issue Packaging using Text Analysis

  • Wong, William Xiu Shun;Kim, Namgyu
    • 한국IT서비스학회지
    • /
    • /
    • /
    • 2016
  • In recent years, text mining has been used to extract meaningful insights from the large volume of unstructured text data sets of various domains. As one of the most representative text mining applications, topic modeling has been widely used to extract main topics in the form of a set of keywords extracted from a large collection of documents. In general, topic modeling is performed according to the weighted frequency of words in a document corpus. However, general topic modeling cannot discover the relation between documents if the documents share only a few terms, although the documents are in fact strongly related from a particular perspective. For instance, a document about "sexual offense" and another document about "silver industry for aged persons" might not be classified into the same topic because they may not share many key terms. However, these two documents can be strongly related from the R&D perspective because some technologies, such as "RF Tag," "CCTV," and "Heart Rate Sensor," are core components of both "sexual offense" and "silver industry." Thus, in this study, we attempted to discover the differences between the results of general topic modeling and R&D perspective topic modeling. Furthermore, we package social issues from the R&D perspective and present a prototype system, which provides a package of news articles for each R&D issue. Finally, we analyze the quality of R&D perspective topic modeling and provide the results of inter- and intra-topic analysis.

Effectiveness of Fuzzy Graph Based Document Model

  • Aswathy M R;P.C. Reghu Raj;Ajeesh Ramanujan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • /
    • /
    • 2024
  • Graph-based document models have good capabilities to reveal inter-dependencies among unstructured text data. Natural language processing (NLP) systems that use such models as an intermediate representation have shown good performance. This paper proposes a novel fuzzy graph-based document model and to demonstrate its effectiveness by applying fuzzy logic tools for text summarization. The proposed system accepts a text document as input and identifies some of its sentence level features, namely sentence position, sentence length, numerical data, thematic word, proper noun, title feature, upper case feature, and sentence similarity. The fuzzy membership value of each feature is computed from the sentences. We also propose a novel algorithm to construct the fuzzy graph as an intermediate representation of the input document. The Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metric is used to evaluate the model. The evaluation based on different quality metrics was also performed to verify the effectiveness of the model. The ANOVA test confirms the hypothesis that the proposed model improves the summarizer performance by 10% when compared with the state-of-the-art summarizers employing alternate intermediate representations for the input text.