• Title/Summary/Keyword: 본문 검색

Search Result 73, Processing Time 0.024 seconds

Information Retrieval Model Using Anchor Text Information and Link Information (Anchor Text 정보와 링크 정보를 이용한 정보 검색 모델)

  • 한기덕;정성원;허희근;이교운;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.916-918
    • /
    • 2004
  • 90년대 이전에 정보 검색에 대한 연구는 문서의 내용을 기반으로 한 연구가 주류였으며, 90년대에는 링크를 이용한 연구가 활발하였다. 90년대 말에 Page Rank와 HITS가 링크를 이용한 연구의 대표적 사례이며, 최근에는 문서의 내용과 링크 정보를 같이 이용하는 연구가 많이 발표되고 있다. 본 논문도 문서의 정보와 링크 정보를 이용한 새로운 검색 모델을 제시하고자 한다. 본 논문에서 사용하는 링크 정보는 수집된 문서에서 추출한 Page Rank의 가중치와 한 페이지를 가리키는 링크들의 목록이며, 상용하고자 하는 문서의 정보는 본문 내용과 Anchor Text이다. 링크 정보와 문서 정보를 이용하여 Anchor 벡터와 문서 벡터를 만들고, 각각 질의어 벡터와 Cosine Measure를 하여 값을 구한 후, 더한 값을 해당 문서의 가중치로 하여 검색에 이용한다.

  • PDF

Service for connecting Shopping mall using Image Search (이미지 검색을 이용한 쇼핑몰 연계 서비스)

  • Ha, Yan;Jeong, Ji-Won;Kim, Ru-Bi;Choi, Ji-Yeon;Heo, Jeong-Yun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.06a
    • /
    • pp.173-174
    • /
    • 2011
  • 본 논문에서는 그림을 그려서 원하는 이미지를 그리고, 이를 인식하여 상품을 찾아주는 정보전달 방식을 제안한다. 사용자가 원하는 이미지에 맞는 상품을 검색할 수 있도록 하는데, 그림 그리기가 가능하고, 개인의 "공감", "신뢰"를 실현하는 공간과 개인과 기업을 연결해주는 정보성 검색으로 쇼핑몰을 연계하는 것을 목표로 한다. 본문 내에서는 고객이 직접 찾는 디자인을 간단히 그리면 비슷한 그림의 상품이 나오게 되는 공간을 제작, 상품이 나오면 기업과의 연계를 통하여 구매로까지 이어질 수 있는 공간을 제시하는 것을 목표로 한다.

  • PDF

Dynamic index storage and integrated searching service development (동적 색인 스토리지 및 통합 검색 서비스 개발)

  • Lee, Wang-Woo;Lee, Seok-Hyoung;Choe, Ho-Seop;Yoon, Hwa-Mook;Kim, Jong-Hwan;Hur, Yoon-Young
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.346-349
    • /
    • 2007
  • In this paper, the integrated search system made for the web news and review retrieval service is introduced. We made XSLTRobot that extract title, date, author and content from html document like news or reviews for search service. XSLTRobot used the XSLT technology in order to extract desired part of html page. The Intergrated Information Retrieval System(IIRS) is suitable for various search data format. And we introduce Dynamic Index Storage which is module of IIRS. Dynamic Index Storage is used to environment which needs fast index update like news. And it's design focused on retrieval performance because there was not many document that it has to update on a real time.

  • PDF

Implementation of Analysis of Book Contents Genre and Visualization System based on Integrated Mining of Book Details and Body Texts (도서 데이터와 본문 텍스트 통합 마이닝을 기반으로 한 도서 콘텐츠 장르 분석 및 시각화 시스템 구현)

  • Hong, Min-Ha;Park, Kyoung-Hoon;Lee, Won-Jin;Kim, Seung-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.27-29
    • /
    • 2015
  • 최근 IT기술의 발달로 인하여 다양한 분야에서 IT기술을 활용한 융합기술의 시도가 많아지고 있다. 특히 인터넷의 발달과 전자책(e-Book) 시장규모가 커짐에 따라 도서에 대한 정보가 많아지고 있으며, 이러한 정보를 분석하여 활용하는 서비스 시스템에 대한 관심이 높아지고 있다. 하지만 현재 서비스되고 있는 대부분의 온라인 서점에서는 도서의 기본 서지정보와 같이 도서 본문 내용과는 무관한 출판사나 서점에서 도서를 관리하기 위한 정보만을 제공하고 있으며, 도서에 대한 다양한 정보를 활용한 키워드 추출 및 장르 분류를 통한 검색의 효율성 제공이 미흡한 현실이다. 본 논문에서는 도서의 본문 텍스트 정보를 마이닝 처리하여 도서 페이지의 흐름에 따라 포함되어있는 장르를 분류하고 이에 대한 결과를 사용자에게 친화적인 시각화 기법으로 제공되는 시스템을 설계하고 구축하였다. 제안한 서비스 시스템은 의미 분석을 기반으로 도서 정보의 구체적, 실제적, 직관적 정보를 제공하여 도서 추천 서비스에 활용될 것이다.

  • PDF

Design of a Korean Question-Answering System for News Item Retrieval (우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구)

  • Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.4 no.1
    • /
    • pp.3-23
    • /
    • 1987
  • This paper describes a question-answering system that can automatically analyze input texts and questions in Korean natural language. The particular texts used for the research were newspaper articles in the specific domain of sports news. The system consists of a set of Cobol programs and an associated set of data files containing lexicon, case grammar, linguistic rules. and data base. This system employs two retrieval functions of fact retrieval and passage retrieval. Therefore input questions can be answered in forms of either sentence or factual data.

  • PDF

A Study on the Implementation of an Efficient E-Book Editor and Viewer based on HTML5 (HTML5를 이용한 효율적 전자책 편집기와 검색기 구현에 관한 연구)

  • Park, Jong-Hyun;Kang, Hyun-Min;Hwang, Kyu-Chul;Lee, Kyung-Oh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.973-976
    • /
    • 2013
  • 전자책이 등장한지 15년이 지났지만, 아직도 전자책 시장에는 종이책의 틀에 갇혀 글로만 쓰인 책이 가득하다. 이러한 부분을 ePub 3.0의 기반이 되는 HTML5를 이용함으로 해결할 수 있으나, HTML5 역시 아직 활발히 사용되는 기술요소가 아니기에 전자책 시장에서 멀티미디어 요소와 함께 하는 전자책을 찾기란 쉽지 않다. 본 논문에서는 HTML5를 이용하여 전자책에 멀티미디어 요소를 추가할 수 있는 Editor와 전자책을 볼 수 있는 Viewer를 실험적으로 구현해보았다. 또한, 도서 검색의 편의를 위해 도서 본문을 이용한 Semantic 검색을 구현하였다.

A Study on the Implementation and Performance Evaluation of Full-text Information Retrieval System based on Scientific Paper′s Content Structure (학술논문의 내용구조에 의한 전문검색시스템 구현과 성능평가에 관한 연구)

  • 이두영;이병기
    • Journal of the Korean Society for information Management
    • /
    • v.15 no.3
    • /
    • pp.73-93
    • /
    • 1998
  • Conventional full-text information retrieval system has been proved with high recall ratio and low precision ratio. One of the disadvantages of full-text IR system is that it is not designed to reflect the user's information need. It is due to the fact that full-text IR system has been designed based on physical and logical structure of document without considering the content of document. The purpose of the study is to develop more effective full-text IR system by resolving such disadvantages of conventional system. The study has developed new method of designing full-text IR system by using Content Structure Markup Language(CSML) other than conventioanal SGML.

  • PDF

Method of Semantic Passage Generation and Retrieval for Encyclopedia QA system (백과사전 질의응답 시스템을 위한 의미적 단락 생성 및 검색 기법)

  • Lee, Chung-Hee;Oh, Hyo-Jung;Kim, Hyeon-Jin;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.159-166
    • /
    • 2004
  • 본 논문에서는 질의응답 시스템에서 질문의 주제와 개념적으로 일치하는 단락으로부터 정보를 추출할 경우에 보다 정확한 정답을 추출할 수 있다는 가정 하에 문장 주제를 활용한 의미적 단락 생성 및 검색 기법을 제안한다. 문장주제란 백과사전 문서 집합에서 공통으로 기술하는 내용이나 자주 언급하고 있는 사건 혹은 개념들의 집합을 의미하는 것으로, 주제별로 응집된 문장들로 재구성된 단락을 의미적 단락이라고 정의한다. 제안된 방법의 성능을 평가하기 위해 의미적 단락의 신뢰도를 파악하고, 백과사전 본문을 3문장 단위로 잘라서 고정길이 단락을 만든 후 의미적 단락의 검색결과와 비교하였다. 평가척도로는 TREC의 역순위평균(MRR : Mean Reciprocal Rank)과 상위 5개 단락 안에 정답유무를 측정하는 사용자 정답만족도를 사용하였다. ETRI 평가셋을 대상으로 한 실험 결과, 주제를 이용한 의미적 단락 검색 성능이 고정길이 단락 검색보다 우수함을 알 수 있었다.

  • PDF

Study on Corporate Facebook Posts and User Engagement of the KOSPI 100 Companies in Korea: Difference between B2B and B2C Companies (국내 100대 기업 페이스북 콘텐츠 전략과 인게이지먼트 연구: B2B·B2C 기업 간 차이를 중심으로)

  • Jo, Joohong;Ko, Chaeeun;Baek, Hyunmi
    • Knowledge Management Research
    • /
    • v.23 no.3
    • /
    • pp.65-88
    • /
    • 2022
  • Companies actively engage with the public through social media to enhance sales and promote brand awareness, which was further encouraged by the pandemic. However, previous studies tend to consider companies as a group of identical features. This study focuses on the differences between B2B and B2C companies' social media content strategy in relation to user engagement. This study categorized KOSPI 100 companies that manage Facebook corporate fan pages into B2B and B2C, and then analyzed the contents they posted from January 1 to December 31, 2020. The result showed that B2C companies tended to use videos over images, prefer hashtags, and comment its product name more often compared to B2B companies. B2B companies preferred images, used more hyperlinks, and mentioned its company name more often. In B2B companies, images and length of text had positive effects on user engagement, while hyperlink and URL had negative effects. B2C companies' text length had positive effect on user engagement. This study provides practical implications to PR practitioners for establishing a social media strategy which enhances user engagement.

A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment (조세심판 문서 검색 효율 향상 모델에 관한 연구)

  • Lee, Hoo-Young;Park, Koo-Rack;Kim, Dong-Hyun
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.6
    • /
    • pp.41-47
    • /
    • 2019
  • It is very important to search for and obtain an example of a similar judgment in case of court judgment. The existing judge's document search uses a method of searching through key-words entered by the user. However, if it is necessary to input an accurate keyword and the keyword is unknown, it is impossible to search for the necessary document. In addition, the detected document may have different contents. In this paper, we want to improve the effectiveness of the method of vectorizing a document into a three-dimensional space, calculating cosine similarity, and searching close documents in order to search an accurate judge's example. Therefore, after analyzing the similarity of words used in the judge's example, a method is provided for extracting the mode and inserting it into the text of the text, thereby providing a method for improving the cosine similarity of the document to be retrieved. It is hoped that users will be able to provide a fast, accurate search trying to find an example of a tax-related judge through the proposed model.