• Title/Summary/Keyword: 본문 검색

Search Result 73, Processing Time 0.037 seconds

Crepe Search System Design using Web Crawling (웹 크롤링 이용한 크레페 검색 시스템 설계)

  • Kim, Hyo-Jong;Han, Kun-Hee;Shin, Seung-Soo
    • Journal of Digital Convergence
    • /
    • v.15 no.11
    • /
    • pp.261-269
    • /
    • 2017
  • The purpose of this paper is to provide a search system using a method of accessing the web in real time without using a database server in order to guarantee the up-to-date information in a single network, rather than using a plurality of bots connected by a wide area network Design. The method of the research is to design and analyze the system which can search the person and keyword quickly and accurately in crepe system. In the crepe server, when the user registers information, the body tag matching conversion process stores all the information as it is, since various styles are applied to each user, such as a font, a font size, and a color. The crepe server does not cause a problem of body tag matching. However, when executing the crepe retrieval system, the style and characteristics of users can not be formalized. This problem can be solved by using the html_img_parser function and the Go language html parser package. By applying queues and multiple threads to a general-purpose web crawler, rather than a web crawler design that targets a specific site, it is possible to utilize a multiplier that quickly and efficiently searches and collects various web sites in various applications.

A Study of Retrieval Model Providing Relevant Sentences in Storytelling on Semantic Web (시맨틱 웹 환경에서 적합한 문장을 제공하는 이야기 쓰기 도우미에 관한 연구)

  • Lee, Tae-Young
    • Journal of the Korean Society for information Management
    • /
    • v.26 no.4
    • /
    • pp.7-34
    • /
    • 2009
  • Structures of stories, paragraphs, and sentences and inferences applied to indexing and searching were studied to construct the full-text and sentence retrieval system for storytelling. The system designed the database of stories, paragraphs, and sentences and the knowledge-base of inference rules to aid to write the story. The Knowledge-base comprised the files of story frames, paragraph scripts, and sentence logics made by mark-up languages like SWRL etc. able to operate in semantic web. It is necessary to establish more precise indexing language represented the sentences and to create a mark-up languages able to construct more accurate inference rules.

A study on DID metadata processing method according to distance learning data weight (원격교육 학습데이터 가중치에 따른 DID 메타데이터 처리방법 연구)

  • Youn-A Min
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.567-568
    • /
    • 2023
  • 본 논문에서는 블록체인 기반 DID기술을 이용하여 원격교육에서 발생하는 학습데이터를 효율적으로 관리하기 위한 방법으로, 학습데이터 가중치를 고려한 DID 메타데이터관리방법을 제안하였다. 메타데이터의 식별자에 대하여 특정위치로 데이터 가중치를 검색하도록 하고 해당 가중치에 따라 처리방법을 다양화 할 수 있다. 본문에서는 블록체인의 Zero Knowledge Proof 방식 처리에 차별화를 두어 메타데이터를 처리하였으며 데이터 처리속도 및 데이터관리에 효율성높일 수 있다.

  • PDF

2000년도 국립수의과학검역원 가금질병 검색결과

  • 모인필
    • KOREAN POULTRY JOURNAL
    • /
    • v.33 no.2 s.376
    • /
    • pp.148-153
    • /
    • 2001
  • 국립수의과학검역원에서는 다음의 3가지 목적을 가지고 매년 전국의 양계농가 혹은 양계관련회사, 수의사로부터 질병진단을 위하여 가검물을 의뢰 받고 있다. 이 사업은 1966년에 처음으로 시작하여 2000년 올해까지 35년이 되었다. 가. 가금질병의 국내 발생 동향 및 추세파악으로 방역지침자료 확보 나. 새로운 질병의 조기검색 및 연구자료 제공으로 질병 신속방제 다. 양계농가에 대한 질병 치료, 예방 및 위생기술 지도 지금부터 이야기하고자 하는 2000년도 질병분석은 1월부터 10월까지 국립수의과학검역원에 의뢰된 가검물을 기본으로 하였으며 이 자료에 대한 인용은 양계관련잡지, 업체, 개인 누구나 가능하다. 또한, 이 자료는 작성을 한 후 각 전문잡지에 공통으로 투고를 했기 때문에 본문내용이 모두 똑같은 점을 이해해 주었으면 한다. 2000년도 12월 31일까지 분석한 최종자료는 2001년 3월에 발간되는 국립수의과학검역원 정보지에 실릴 예정이다.

  • PDF

A Study of Web Navigation Design to Improve Usability of Old-aged Users (고령자의 사용편의성 향상을 위한 웹 네비게이션 디자인에 관한 연구)

  • Bae, Yoon-Sun;Lee, Hyun-Ju
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.209-214
    • /
    • 2006
  • 본 연구는 지식과 정보가 경쟁력이 되고 있는 현대 사회에서 고령자들이 웹을 통하여 보다 쉽게 정보를 찾을 수 있는 웹 네비게이션 디자인의 유형을 개발하고자하였다. 예비조사를 통하여 고령자를 위한 웹 네비게이션 디자인의 유형을 제안하였고 30 명의 고령자 그룹을 대상으로 정보 검색 소요 시간, 오류발생 측면, 웹 네비게이션 디자인 요소의 크기와 위치, 레이아웃에 관한 조사를 하였다. 측정된 정보 검색 소요 시간은 반복측정 이원변량분석에 의하여 분석하였고 비디오 분석과 사후 설문조사를 실시하였다. 고령자에게 이상적인 웹 네비게이션 디자인은 페이지의 상단에 가로로 길게 위치한 글로벌 메뉴 아래에 세로로 서브 카테고리 메뉴가 나타나는 유형이며 롤오버 메뉴와 단계적으로 분류된 메뉴, 크게 처리된 본문과 레이블, 움직이지 않는 이미지가 고령자가 정보를 쉽게 찾을 수 있도록 하였다. 이상에서 제시하는 바와 같이 사용편의성을 위한 웹 네비게이션 디자인에서는 고령자가 효율적으로 오류 없이 정보를 쉽고 편하게 찾을 수 있으며 고령자를 위한 웹 네비게이션 디자인의 개발은 고령화 사회에서 노인계층의 인터넷 사용을 활성화 시킬 수 있을 것이다.

  • PDF

Text Extraction and Summarization from Web News (웹 뉴스의 기사 추출과 요약)

  • Han, Kwang-Rok;Sun, Bok-Keun;Yoo, Hyoung-Sun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.5
    • /
    • pp.1-10
    • /
    • 2007
  • Many types of information provided through the web including news contents contain unnecessary clutters. These clutters make it difficult to build automated information processing systems such as the summarization, extraction and retrieval of documents. We propose a system that extracts and summarizes news contents from the web. The extraction system receives news contents in HTML as input and builds an element tree similar to DOM tree, and extracts texts while removing clutters with the hyperlink attribute in the HTML tag from the element tree. Texts extracted through the extraction system are transferred to the summarization system, which extracts key sentences from the texts. We implement the summarization system using co-occurrence relation graph. The summarized sentences of this paper are expected to be transmissible to PDA or cellular phone by message services such as SMS.

  • PDF

Implementation of an Information Retrieval System with Multiple Indexing (다중색인에 의한 정보검색 시스템 구현)

  • Lee, Jun-Young;Kang, Sang-Bae;Yang, Jang-Mo;Park, Seung;Park, Hyun-Joo;Kim, Min-Jung;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.63-67
    • /
    • 1996
  • 이 논문에서는 대량의 신문기사나 일반 텍스트 문서를 효율적으로 저장 및 검색 할 수 있는 정보검색 시스템을 구현한다. 이 시스템은 문서의 주제, 저자, 날짜, 출판사 또는 사용자 정의에 의한 속성과 본문에 대한 색인어와 색인관련정보를 생성한다. 모든 색인어는 최대 64가지의 속성정보와 문서별 단어빈도(tf)를 가질 수 있다. 색인은 형태소 분석을 이용하는 방법과 N-gram을 이용하는 방법이 동시에 사용되며, 색인어는 가중치를 가진다. 이 논문에서 구현한 시스템을 이용하여 7개월치 신문자료를 색인한 결과, 생성된 데이터베이스의 크기는 원래 문서의 약 22%이며 문서의 개수가 증가함에 따라 점점 그 비율은 감소한다.

  • PDF

A Study on the Korean University Students' Usage of Foreign Language Queries in Scholarly Information Retrieval (학술정보검색을 위한 국내 대학생의 외국어 탐색문 활용에 관한 연구)

  • Lee, Bo Eun;Lee, Jee Yeon
    • Journal of the Korean Society for information Management
    • /
    • v.36 no.1
    • /
    • pp.95-116
    • /
    • 2019
  • This study focused on understanding the Korean university students' (both undergraduates and graduates) use of foreign language for scholarly information retrieval especially in different search strategies employed based on users' characteristics. A new model was developed based on Ellis's behavioral model of information seeking strategies. The research applied both quantitative and qualitative methods to analyze the data. The students used a variety of foreign language information seeking strategies at different stages of academic information retrieval based on his/her field of study or level of education. The liberal arts and social science students had more difficulty in selecting proper search terms in the foreign language than the science and technology students. This difficulty resulted in less preference for using foreign language queries by the liberal arts and social science students. The students relied more on the bibliographic and citation information in scholarly information retrieval using foreign language queries than the Korean queries. The research outcomes should provide some guidelines on how the Korean university libraries offer information literacy programs and other services based on the patrons' characteristics.

The Design and Implementation of OWL Ontology Construction System through Information Extraction of Unstructured Documents (비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계 및 구현)

  • Jo, Dae Woong;Choi, Ji Woong;Kim, Myung Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.19 no.10
    • /
    • pp.23-33
    • /
    • 2014
  • The development of the information retrieval field is evolving to the research field searching accurately for the information from thing finding rapidly a large amount of information. Personalization and the semantic web technology is a key technology. The automatic indexing technology about the web document and throughput go beyond the research stage and show up as the practical service. However, there is a lack of research on the document information retrieval field about the attached document type of except the web document. In this paper, we illustrate about the method in which it analyzed the text content of the unstructured documents prepared in the text, word, hwp form and it how to construction OWL ontology. To build TBox of the document ontology and the resources which can be obtained from the document is selected, and we implement with the system in order to utilize as the instant of the constructed document ontology. It is effectually usable in the information retrieval and document management system using the semantic technology of the correspondence document as the ontology automatic construction of this kind of the unstructured documents.

A Similarity Valuating System using The Pattern Matching (패턴매칭을 이용한 유사도 비교 분석)

  • Ko, Bang-Won;Kim, Young-Chul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.1
    • /
    • pp.185-192
    • /
    • 2010
  • This research suggests that valuate similarities by using the matches of patterns which is appeared on different two documents. Statistical ways such as fingerprint method are mainly used for evaluate similarities of existing documents. However, this method has a problem of accuracy for the high similarity which is occurred when many similar words are appeared from two irrelevant documents. These issues are caused by simple comparing of statistical parameters of two documents. But the method using patterns suggested on this research solved those problems because it judges similarity by searching same patterns. This method has a defect, however, that takes long time to search patterns, but this research introduce the algorithms complement this defect.