• 제목/요약/키워드: text information

검색결과 4,359건 처리시간 0.029초

문서범주화 효율성 제고를 위한 정보원 평가에 관한 연구 (A Study on Information Resource Evaluation for Text Categorization)

  • 정은경
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.305-321
    • /
    • 2007
  • 이 연구는 색인가가 주제 색인하는 과정에서 참조하는 여러 문서구성요소를 문서 범주화의 정보원으로 인식하여 이들이 문서 범주화 성능에 미치는 영향을 살펴보는데 그 목적이 있다. 이는 기존의 문서 범주화 연구가 전문(full text)에 치중하는 것과는 달리 문서구성요소로서 정보원의 영향을 평가하여 문서 범주화에 효율적으로 사용될 수 있는지를 파악하고자 한다. 전형적인 과학기술분야의 저널 및 회의록 논문을 데이터 집합으로 하였을때 정보원은 본문정보 중심과 문서구성요소중심으로 나뉘어 질 수 있다. 본문정보중심은 본론자체와 서론과 결론으로 구성되며, 문서구성요소중심은 제목, 인용, 출처, 초록, 키워드로 파악된다. 실험결과를 살펴보면, 인용, 출처, 제목정보원은 본문정보원과 비교하여 유의한 차이를 보이지 않으며, 키워드정보원은 본문 정보원과 비교하여 유의한 차이를 보인다. 이러한 결과는 색인가가 참고하는 문서구성요소로서의 정보원이 문서 범주화에 본문을 대신하여 효율적으로 활용될 수 있음을 보여주고 있다.

전문 처리를 위한 웹 기반 정보시스템 구현 (Implementation of Web-based Information System for Full-text Processing)

  • 김상도;문병주;류근호
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1481-1492
    • /
    • 1999
  • 1990년대 웹 개념의 등장으로 인터넷을 개방형 네트?, 사용자 친근성 및 편의성이라는 특성을 바탕으로 급속히 일반화되면서 각종 정보를 제공하는 정보 시스템에서도 커다란 변화를 가져왔다. 웹은 텍스트 정보뿐만 아니라 이미지, 오디오, 비디오 등 멀티미디어 정보를 쉽게 제공함으로써 기존 정보 시스템의 웹 기반으로의 전환을 가속화시키게 되었다. 물론 정보 내용도 텍스트 위주의 단순 초록 정보에서 전문(Full-Text) 정보로 급속히 이전되기 시작하였으며, 전문 정보를 처리하는 다양한 문서 포맷들로 등장하기 시작하였다. 하지만, 전문 정보는 본질적으로 대용량의 시스템 메모리, 막대한 처리시간, 보다 많은 전송용량 등을 요구하게 되므로 웹 기반 전문 시스템의 구축시 이러한 요인들을 세밀하게 비교 평가하여야 한다. 따라서 본 연구는 웹 기반 정보 시스템에서 어떻게 전문을 처리할 것인가에 초점을 맞추어 문서의 통합 정보 기능을 제공하는 정보시스템을 설계 구현한다. 먼저 인터넷상에서 표준 문서형식으로 사용중이거나 개발중인 문서 포맷들의 특징을 검토하고, 정보 시스템의 관점에서 전문정보를 어떤 문서 포맷으로 처리하는 것이 적합한가를 실험하고 평가한다. 그리고 이를 기반으로 본 연구의 목적인 전문 정보를 PDF 문서로 제공하는 웹 기반 정보 시스템을 설계 구현한다.

  • PDF

원문정보 공개제도에 대한 공무원들의 인식조사 연구 (A Study on the Government Full-text Information Disclosure System through the Survey on the Government Officials' Perceptions)

  • 장보성
    • 한국도서관정보학회지
    • /
    • 제47권1호
    • /
    • pp.339-360
    • /
    • 2016
  • 본 연구의 목적은 원문정보 공개제도의 운영 실태를 분석하고, 원문정보의 생산자이며 의사결정자인 공무원을 대상으로 원문정보 공개제도에 대한 이해도, 제도의 순기능 및 역기능, 제도의 발전을 저해하는 요인 및 활성화를 위한 요인에 대하여 조사하였다. 분석결과, 공무원들의 원문정보 공개제도 이해는 제도의 법적 근거, 공개절차 부분에서 상대적 낮은 결과가 나타났다. 원문정보 공개제도의 순기능과 역기능은 행정의 투명성 확보, 국정운영 참여 활성화, 국민의 삶의 질 향상 측면에서 순기능적 기대치가 높았으며, 행정적인 업무 부담 증가, 공무원의 사기저하, 국민사이의 정보격차 발생을 역기능으로 우려하였다. 원문정보 공개제도의 발전을 저해하는 요인은 민원인에 의한 원문정보 오남용, 제도 확대에 따른 업무량 과다, 원문정보 공개에 따른 심리적 부담감, 기관마다 상이한 원문정보 기준 순으로 나타났다. 원문정보 공개제도 활성화 요인으로 원문정보 오남용 방지 대책 마련, 원문정보 공개 절차 및 원칙에 대한 사전 교육, 비공개 원문정보 공개 대상에 대한 구체적인 기준 제시, 공무원 대상 교육 및 부정적인 인식 개선 등이 제시되었다.

수어 동작 키포인트 중심의 시공간적 정보를 강화한 Sign2Gloss2Text 기반의 수어 번역 (Sign2Gloss2Text-based Sign Language Translation with Enhanced Spatial-temporal Information Centered on Sign Language Movement Keypoints)

  • 김민채;김정은;김하영
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1535-1545
    • /
    • 2022
  • Sign language has completely different meaning depending on the direction of the hand or the change of facial expression even with the same gesture. In this respect, it is crucial to capture the spatial-temporal structure information of each movement. However, sign language translation studies based on Sign2Gloss2Text only convey comprehensive spatial-temporal information about the entire sign language movement. Consequently, detailed information (facial expression, gestures, and etc.) of each movement that is important for sign language translation is not emphasized. Accordingly, in this paper, we propose Spatial-temporal Keypoints Centered Sign2Gloss2Text Translation, named STKC-Sign2 Gloss2Text, to supplement the sequential and semantic information of keypoints which are the core of recognizing and translating sign language. STKC-Sign2Gloss2Text consists of two steps, Spatial Keypoints Embedding, which extracts 121 major keypoints from each image, and Temporal Keypoints Embedding, which emphasizes sequential information using Bi-GRU for extracted keypoints of sign language. The proposed model outperformed all Bilingual Evaluation Understudy(BLEU) scores in Development(DEV) and Testing(TEST) than Sign2Gloss2Text as the baseline, and in particular, it proved the effectiveness of the proposed methodology by achieving 23.19, an improvement of 1.87 based on TEST BLEU-4.

텍스트매체 사용에 있어서 매체 경험이 매체 인지와 의사소통과정에 미치는 영향 (Effects of Medium Experience on Medium Perception and Communication Process)

  • 양재호;이현규;서길수
    • Asia pacific journal of information systems
    • /
    • 제9권3호
    • /
    • pp.1-23
    • /
    • 1999
  • The objective of this study is to examine the media richness theory and the social information processing model by analyzing the effect of media experience on media perception and communication process. To accomplish this objective, a laboratory experiment was conducted. The independent variable was text medium experience and a face-to-face medium was added as a control group. The dependent variables were medium perception and communication process. Medium perception includes perceived richness, medium feeling, task satisfaction, and communication satisfaction. Communication processes were also analyzed to compare each treatment group. The results can be summarized into two facts. First, face-to-face group showed higher perceived richness than text medium group. And experienced text medium group perceived their text medium richer than inexperienced text medium group. Second, experienced text medium groups showed more interactions between subjects than inexperienced text medium group. Experienced text medium group also showed more agreements and meta-communication which could be found in face-to-face group. The result of this study supported media richness theory by finding that face-to-face medium was perceived richer than text medium, And the results also proved social information processing model by comparing experienced text medium group and inexperienced text medium group. The text medium, although thought to be the leanest one, could be perceived richer if users had lots of experience on it.

  • PDF

Study of Analyzing Outcome of Building and Introducing System for Preserving Full-Text of e-Journal

  • Kim, Kwang-Young;Kim, Soon-Young;Kim, Hwan-Min
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제2권2호
    • /
    • pp.5-16
    • /
    • 2012
  • Today, most researchers conduct their studies through the full-text of e-journals. Therefore, an important base for domestic development of science and technology is to obtain the full-text of quality e-journals by overseas researchers and to provide it to Korea's researchers. This study aims to build a system based on the National Archiving Center for the full-text of e-journals and to make a service system for providing them to the public by acquiring the full-text of quality overseas e-journals. To do this, an analysis was made of the outcome of introducing such a system for full-text of e-journals in comparison with the investment. As a result, 112 more institutions, that is, from 47 institutions to 159 institutions, have introduced the system as of 2012, and the number of downloaded full-texts increased at least 2.17 times.

법률정보시스템의 색인에 관한 연구 -특히 2차 법률정보를 중심으로- (A Study on the Index Model for Secondary Legal Information Databases)

  • 노정란
    • 한국비블리아학회지
    • /
    • 제8권1호
    • /
    • pp.117-134
    • /
    • 1997
  • This study proves that the quoted legal text functions as the index which represents the contents of the text because of the characteristics of legal information, the automatic indexing in the secondary legal full-text databases can be possible without the assitance of the experts. In case of the establishment, amendment or repealing of law, change of words of index can be possible through revising the legal text quoted in the secondary legal full-text databases. Even when we dont input the full-text about retrospective documents, automatic indexing is also possible, and the establihment and the practice of expert knowledge and integrated databases are possible in case of the retrospective documents. This study indicates that it is necessary to have characteristic information the information experts recognize - that is to say, experimental and inherent knowledge only human being can have - built-in into the system rather than to approach the information system by the linguistic, statistic or structuralistic way, and it can be more essential and intelligent information system.

  • PDF

Text Categorization for Authorship based on the Features of Lingual Conceptual Expression

  • Zhang, Quan;Zhang, Yun-liang;Yuan, Yi
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.515-521
    • /
    • 2007
  • The text categorization is an important field for the automatic text information processing. Moreover, the authorship identification of a text can be treated as a special text categorization. This paper adopts the conceptual primitives' expression based on the Hierarchical Network of Concepts (HNC) theory, which can describe the words meaning in hierarchical symbols, in order to avoid the sparse data shortcoming that is aroused by the natural language surface features in text categorization. The KNN algorithm is used as computing classification element. Then, the experiment has been done on the Chinese text authorship identification. The experiment result gives out that the processing mode that is put forward in this paper achieves high correct rate, so it is feasible for the text authorship identification.

  • PDF

A Method for Text Information Separation from Floorplan Using SIFT Descriptor

  • Shin, Yong-Hee;Kim, Jung Ok;Yu, Kiyun
    • 대한원격탐사학회지
    • /
    • 제34권4호
    • /
    • pp.693-702
    • /
    • 2018
  • With the development of data analysis methods and data processing capabilities, semantic analysis of floorplans has been actively studied. Therefore, studies for extracting text information from drawings have been conducted for semantic analysis. However, existing research that separates rasterized text from floorplan has the problem of loss of text information, because when graphic and text components overlap, text information cannot be extracted. To solve this problem, this study defines the morphological characteristics of the text in the floorplan, and classifies the class of the corresponding region by applying the class of the SIFT key points through the SVM models. The algorithm developed in this study separated text components with a recall of 94.3% in five sample drawings.

Using Collective Citing Sentences to Recognize Cited Text in Computational Linguistics Articles

  • Kang, In-Su
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권11호
    • /
    • pp.85-91
    • /
    • 2016
  • This paper proposes a collective approach to cited text recognition by exploiting a set of citing text from different articles citing the same article. First, the proposed method gathers highly-ranked cited sentences from the cited article using a group of citing text to create a collective information of probable cited sentences. Then, such collective information is used to determine final cited sentences among highly-ranked sentences from similarity-based cited text recognition. Experiments have been conducted on the data set which consists of research articles from a computational linguistics domain. Evaluation results showed that the proposed method could improve the performance of similarity-based baseline approaches.