• Title/Summary/Keyword: Full-text information

Search Result 276, Processing Time 0.026 seconds

Automatic Clustering of Same-Name Authors Using Full-text of Articles (논문 원문을 이용한 동명 저자 자동 군집화)

  • Kang, In-Su;Jung, Han-Min;Lee, Seung-Woo;Kim, Pyung;Goo, Hee-Kwan;Lee, Mi-Kyung;Goo, Nam-Ang;Sung, Won-Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.652-656
    • /
    • 2006
  • Bibliographic information retrieval systems require bibliographic data such as authors, organizations, source of publication to be uniquely identified using keys. In particular, when authors are represented simply as their names, users bear the burden of manually discriminating different users of the same name. Previous approaches to resolving the problem of same-name authors rely on bibliographic data such as co-author information, titles of articles, etc. However, these methods cannot handle the case of single author articles, or the case when articles do not have common terms in their titles. To complement the previous methods, this study introduces a classification-based approach using similarity between full-text of articles. Experiments using recent domestic proceedings showed that the proposed method has the potential to supplement the previous meta-data based approaches.

  • PDF

Dynamic Management of Equi-Join Results for Multi-Keyword Searches (다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법)

  • Lim, Sung-Chae
    • The KIPS Transactions:PartA
    • /
    • v.17A no.5
    • /
    • pp.229-236
    • /
    • 2010
  • With an increasing number of documents in the Internet or enterprises, it becomes crucial to efficiently support users' queries on those documents. In that situation, the full-text search technique is accepted in general, because it can answer uncontrolled ad-hoc queries by automatically indexing all the keywords found in the documents. The size of index files made for full-text searches grows with the increasing number of indexed documents, and thus the disk cost may be too large to process multi-keyword queries against those enlarged index files. To solve the problem, we propose both of the index file structure and its management scheme suitable to the processing of multi-keyword queries against a large volume of index files. For this, we adopt the structure of inverted-files, which are widely used in the multi-keyword searches, as a basic index structure and modify it to a hierarchical structure for join operations and ranking operations performed during the query processing. In order to save disk costs based on that index structure, we dynamically store in the main memory the results of join operations between two keywords, if they are highly expected to be entered in users' queries. We also do performance comparisons using a cost model of the disk to show the performance advantage of the proposed scheme.

Mass Media and Social Media Agenda Analysis Using Text Mining : focused on '5-day Rotation Mask Distribution System' (텍스트 마이닝을 활용한 매스 미디어와 소셜 미디어 의제 분석 : '마스크 5부제'를 중심으로)

  • Lee, Sae-Mi;Ryu, Seung-Eui;Ahn, Soonjae
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.6
    • /
    • pp.460-469
    • /
    • 2020
  • This study analyzes online news articles and cafe articles on the '5-day Rotation Mask Distribution System', which is emerging as a recent issue due to the COVID-19 incident, to identify the mass media and social media agendas containing media and public reactions. This study figured out the difference between mass media and social media. For analysis, we collected 2,096 full text articles from Naver and 1,840 posts from Naver Cafe, and conducted word frequency analysis, word cloud, and LDA topic modeling analysis through data preprocessing and refinement. As a result of analysis, social media showed real-life topics such as 'family members' purchase', 'the postponement of school opening', ' mask usage', and 'mask purchase', reflecting the characteristics of personal media. Social media was found to play a role of exchanging personal opinions, emotions, and information rather than delivering information. With the application of the research method applied to this study, social issues can be publicized through various media analysis and used as a reference in the process of establishing a policy agenda that evolves into a government agenda.

A Study on the Design of a Full-Text Indexing System for Thesis (학위논문의 전문색인시스템 설계)

  • 추윤미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1996.08a
    • /
    • pp.57-60
    • /
    • 1996
  • 전문데이터베이스는 원문의 접근가능성과 전문탐색의 장점으로 인해 최근 급속하게 발전하고 있다. 그러나 이제까지 대부분의 전문데이터베이스는 문헌의 구조를 고려하지 않고 본문의 문자열에서 자동추출한 색인어를 대상으로 비통제탐색방법을 사용하여 왔으므로 효율적이고 다양한 검색방법을 적용하기 어려웠다. 본 연구에서는 SGML을 이용하여 문헌을 구조화하고 이를 이용한 색인시스템을 설계함으로써, 문헌구조를 이용한 다양한 검색이 가능하도록 하였다. 이를 위해 논문을 대상으로 하여 문헌의 구조를 분석하고, 주요 문헌요소인 초록, 목차, 본문, 참고문헌의 특성을 색인에 반영하였다. 색인시스템은 문헌요소를 태그와 텍스트데이터로 분석하여 색인하는 일차색인과, 일차색인에 의해 만들어진 문헌요소테이블과 내용데이터파일을 이용하여 주요 문헌요소를 색인한 이차색인으로 구성된다.

  • PDF

An Improved Conversational Help Agent Using Approximate Pattern Matching (근사 패턴매칭을 이용한 개선된 대화형 도우미 에이전트)

  • 김수영;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.415-417
    • /
    • 2001
  • 인터넷의 성장에 따라, 많은 웹사이트가 생기고, 더 많은 정보들이 웹사이트에 등록되었다. 웹사이트에서 등록되는 정보가 많을수록, 사용자가 원하는 정보를 얻기가 쉽지 않다. 따라서, 사용자가 찾는 정보를 쉽게 찾을 수 있도록, 웹사이트 내에 전문(full-text) 검색엔진을 도입하기도 한다. 본 논문에서는 사용자가 자연어를 이용한 대화를 통해 웹사이트 내의 정보를 습득할 수 있도록 하는 대화형 도우미 에이전트를 위하여 한글 전처리 방법과 근사패턴매칭기법을 제안한다. 사용자가 문장을 입력하면, 동의어처리와 형태소 분석을 통해 사용자의 문장을 분석하고, 이미 작성되어 있는 지식과의 매칭을 통해 사용자에게 알맞은 대답을 제시한다. 지식은 XML 형식으로 저장되며, 사용자가 입력한 문장과 아주 똑같지 않더라도, 어느 정도의 유사도를 가지고 대답을 이끌어 낼수 있다.

  • PDF

A Study on Automatic Indexing System for Newspaper Articles (신문기사(新聞記事) 자동색인(自動索引)에 관한 고찰(考察))

  • Cho, Sun-Hee
    • Journal of Information Management
    • /
    • v.23 no.3
    • /
    • pp.19-44
    • /
    • 1992
  • As most of the domestic newspaper companies are adopting CTS system, the need for automatic indexing system, which can transfer the full-text into a computer, is sharply expanding. In this research, I tried to analyse problems and prospects of the automatic indexing system through various examples and studies conducted by other analysts previously.

  • PDF

오픈 사이언스를 위한 국내 학술논문 Fulltext XML 구축 및 비텍스트 DOI 등록 관리

  • Kim, Byeong-Gyu
    • Korea Information Processing Society Review
    • /
    • v.23 no.5
    • /
    • pp.44-52
    • /
    • 2016
  • 최근 학술정보서비스는 논문의 메타정보 중심에서 논문 원문의 전문정보(Full-text)로 구축 및 서비스 범위가 확장되고 있다. 학술지 논문의 전문정보를 기술하기 위해 해외출판사들을 중심으로 다양한 XML 양식이 개발되었으나, 2012년에 국제표준으로 제정된 JATS(Journal article tag suite)가 국내에서 폭넓게 사용되고 있다. 국내 과학기술분야 정보서비스의 대표기관인 KISTI는 2014년부터 JATS 기반으로 학술논문 XML을 구축하여 서비스하고 있다. 아울러 KISTI는 2007년부터 국내 학술논문의 국제적 유통 활성화를 위하여 논문에 DOI를 부여하고 CrossRef에 기탁해오고 있다. 향후, KISTI가 주관하는 Korea DOI Center를 통해 논문 DOI 뿐만 아니라 논문의 비텍스트(표, 그림)정보까지 모두 DOI를 부여하고 서비스에 반영할 계획이다. 이를 위해, 현재까지 구축된 JATS XML에 대한 구성요소를 분석하고 비텍스트정보의 DOI 등록방법 및 활용방안에 대해 살펴본다.

Conversational Help Agent Using Sequential Pattern Matching Technique (순차적 패턴 매칭 기법을 이용한 대화형 도우미 에이전트)

  • 김수영;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.24-26
    • /
    • 2000
  • 인터넷이 급속도로 성장함에 따라 웹사이트의 숫자도 늘어나고, 많은 정보들이 등록되었다. 웹사이트들은 사용자의 정보획득을 위해 다양한 하이퍼링크를 제공하고, 전문(full-text) 검색엔진을 도입하기도 하나, 웹사이트에 등록되는 정보의 양이 많아지면서 전문검색엔진의 유용성이 점점 줄어들고 있다. 따라서 본 논문에서는 사용자가 좀 더 친근하고 빠른 방법으로 웹사이트에 있는 정보를 습득할 수 있도록 하는 대화형 도우미에이전트를 제안한다. 즉, 사용자가 일상적으로 사용하는 자연어로 된 문장을 웹사이트 내의 도우미 에이전트와 주고받음으로써, 사용자가 원하는 정보를 얻을 수 있도록 한다. 도우미에이전트의 지식을 패턴-답변형태로 저장하고, 순차적 패턴매칭 기법을 이용하여 사용자가 원하는 대화를 이끌어낸다.

  • PDF

Trends in Clinical Research of Catgut Embedding for Obesity Treatment (비만 치료에 매선을 이용한 임상 연구 동향 분석)

  • Jung-Sik Park
    • Journal of Korean Medicine Rehabilitation
    • /
    • v.33 no.3
    • /
    • pp.129-134
    • /
    • 2023
  • Objectives The purpose of this study was to review the studies of catgut embedding related to obesity treatment. Methods We searched the papers with key words of obesity and catgut embedding via searching Research Information Sharing Service, DBpia, Koreanstudies Information Service System, Oriental Medicine Advanced Searching Integrated System, Scopus, PubMed. Additional data including study design, study topics, characteristics of participants and treatment, outcomes was extracted from full text of each study. Results There were nine studies about the catgut embedding related to obesity treatment. Five articles were conducted in China, two articles were conducted in Mexico, and two articles was published in Korea. Analysis of seven experimental studies and two observational studies were conducted to describe each research subject, method, and research results. Conclusions More interest and further research will be needed on catgut embedding related to obesity treatment in the Korean medicine to achieve clinical application and to develop treatment protocols for the obesity disease.

Analysis and Service Quality Evaluation on NDSL Website (NDSL 웹사이트 분석 및 서비스 품질평가)

  • Lee, Ju-Hyun;Lee, Eung-Bong;Kim, Hwan-Min
    • Journal of Information Management
    • /
    • v.37 no.4
    • /
    • pp.69-91
    • /
    • 2006
  • The purpose of this study is to improve the effectiveness and quality of web service by analyzing the web service problems and suggesting the solutions through the expert service quality evaluation from the point of view of users and website quality evaluation by measurement tools for a whole NDSL website. In case of website analysis, this study analyzed the website completeness of NDSL site and looked into the problem that users can judge by intuition during their use of the site, and evaluated the searchability and usability for web-based service quality evaluation by centering on the service quality of database quality items. After the results of this analysis, it appeared that there was not a big problem on the use. But after searching, several problems were found on loading rates, website completeness, user sensitiveness, the protection of private information, metadata completeness, website accessability, etc. And as a result of the evaluation of website service quality, it does not show the all satisfactory results in the function of search methods and search result printing, mark list and the items related to full-text in the part of searchability and usability. However, comparing with the results of other information organizations, it shows the similar level of quality.