• 제목/요약/키워드: 본문 검색

검색결과 73건 처리시간 0.025초

Anchor Text 정보와 링크 정보를 이용한 정보 검색 모델 (Information Retrieval Model Using Anchor Text Information and Link Information)

  • 한기덕;정성원;허희근;이교운;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.916-918
    • /
    • 2004
  • 90년대 이전에 정보 검색에 대한 연구는 문서의 내용을 기반으로 한 연구가 주류였으며, 90년대에는 링크를 이용한 연구가 활발하였다. 90년대 말에 Page Rank와 HITS가 링크를 이용한 연구의 대표적 사례이며, 최근에는 문서의 내용과 링크 정보를 같이 이용하는 연구가 많이 발표되고 있다. 본 논문도 문서의 정보와 링크 정보를 이용한 새로운 검색 모델을 제시하고자 한다. 본 논문에서 사용하는 링크 정보는 수집된 문서에서 추출한 Page Rank의 가중치와 한 페이지를 가리키는 링크들의 목록이며, 상용하고자 하는 문서의 정보는 본문 내용과 Anchor Text이다. 링크 정보와 문서 정보를 이용하여 Anchor 벡터와 문서 벡터를 만들고, 각각 질의어 벡터와 Cosine Measure를 하여 값을 구한 후, 더한 값을 해당 문서의 가중치로 하여 검색에 이용한다.

  • PDF

이미지 검색을 이용한 쇼핑몰 연계 서비스 (Service for connecting Shopping mall using Image Search)

  • 하얀;정지원;김루비;최지연;허정윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제44차 하계학술발표논문집 19권2호
    • /
    • pp.173-174
    • /
    • 2011
  • 본 논문에서는 그림을 그려서 원하는 이미지를 그리고, 이를 인식하여 상품을 찾아주는 정보전달 방식을 제안한다. 사용자가 원하는 이미지에 맞는 상품을 검색할 수 있도록 하는데, 그림 그리기가 가능하고, 개인의 "공감", "신뢰"를 실현하는 공간과 개인과 기업을 연결해주는 정보성 검색으로 쇼핑몰을 연계하는 것을 목표로 한다. 본문 내에서는 고객이 직접 찾는 디자인을 간단히 그리면 비슷한 그림의 상품이 나오게 되는 공간을 제작, 상품이 나오면 기업과의 연계를 통하여 구매로까지 이어질 수 있는 공간을 제시하는 것을 목표로 한다.

  • PDF

동적 색인 스토리지 및 통합 검색 서비스 개발 (Dynamic index storage and integrated searching service development)

  • 이왕우;이석형;최호섭;윤화묵;김종환;허윤영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.346-349
    • /
    • 2007
  • 본 논문은 웹뉴스 및 리뷰 검색 서비스를 위해 만든 통합 검색 시스템을 소개한다. 검색 서비스를 위한 데이터 수집을 위해서 특정 사이트에서 수집한 뉴스와 리뷰 문서로부터 제목, 날짜, 저자, 본문처럼 특정한 영역의 데이터만 추출하는 XSLTRobot을 만들었다. XSLTRobot은 원하는 부분의 데이터만 추출하기 위해 XSLT 기술을 이용한다. 여러가지 검색 데이터 형식에 적합한 통합 검색엔진과 통합 검색엔진의 스토리지 모듈중 하나인 동적 색인 저장소(Dynamic Index Storage)를 소개한다. 동적 색인 저장소는 뉴스 데이터처럼 색인의 업데이트가 빨라야 하는 환경에 이용된다. 본 논문에서 제시하는 동적 색인 저장소는 대량의 실시간 업데이트 문서를 처리하지 않기 때문에 검색성능에 초점을 맞춰서 설계하였다.

  • PDF

도서 데이터와 본문 텍스트 통합 마이닝을 기반으로 한 도서 콘텐츠 장르 분석 및 시각화 시스템 구현 (Implementation of Analysis of Book Contents Genre and Visualization System based on Integrated Mining of Book Details and Body Texts)

  • 홍민하;박경훈;이원진;김승훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.27-29
    • /
    • 2015
  • 최근 IT기술의 발달로 인하여 다양한 분야에서 IT기술을 활용한 융합기술의 시도가 많아지고 있다. 특히 인터넷의 발달과 전자책(e-Book) 시장규모가 커짐에 따라 도서에 대한 정보가 많아지고 있으며, 이러한 정보를 분석하여 활용하는 서비스 시스템에 대한 관심이 높아지고 있다. 하지만 현재 서비스되고 있는 대부분의 온라인 서점에서는 도서의 기본 서지정보와 같이 도서 본문 내용과는 무관한 출판사나 서점에서 도서를 관리하기 위한 정보만을 제공하고 있으며, 도서에 대한 다양한 정보를 활용한 키워드 추출 및 장르 분류를 통한 검색의 효율성 제공이 미흡한 현실이다. 본 논문에서는 도서의 본문 텍스트 정보를 마이닝 처리하여 도서 페이지의 흐름에 따라 포함되어있는 장르를 분류하고 이에 대한 결과를 사용자에게 친화적인 시각화 기법으로 제공되는 시스템을 설계하고 구축하였다. 제안한 서비스 시스템은 의미 분석을 기반으로 도서 정보의 구체적, 실제적, 직관적 정보를 제공하여 도서 추천 서비스에 활용될 것이다.

  • PDF

우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구 (Design of a Korean Question-Answering System for News Item Retrieval)

  • 정영미
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.3-23
    • /
    • 1987
  • 이 연구에서 구현한 질문응답시스템은 한글 자연어로 된 텍스트와 질문을 자동으로 처리하는 지능형 정보시스템이다. 입력데이타는 스포츠관계 기사로 국한하였으며 프로그래밍 언어로는 코볼을 사용하였다. 이 시스템의 구문분석기는 격문법에 기초한 것으로서 어휘사전, 용언의 격프레임, 언어학적 규칙 등을 사용하여 문장을 분석한다. 본문검색과 사실검색이 모두 가능한 이 시스템에서는 질문에 대한 해답이 문장형태이거나 사실데이타 형태로 출력된다.

  • PDF

HTML5를 이용한 효율적 전자책 편집기와 검색기 구현에 관한 연구 (A Study on the Implementation of an Efficient E-Book Editor and Viewer based on HTML5)

  • 박종현;강현민;황규철;이경오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.973-976
    • /
    • 2013
  • 전자책이 등장한지 15년이 지났지만, 아직도 전자책 시장에는 종이책의 틀에 갇혀 글로만 쓰인 책이 가득하다. 이러한 부분을 ePub 3.0의 기반이 되는 HTML5를 이용함으로 해결할 수 있으나, HTML5 역시 아직 활발히 사용되는 기술요소가 아니기에 전자책 시장에서 멀티미디어 요소와 함께 하는 전자책을 찾기란 쉽지 않다. 본 논문에서는 HTML5를 이용하여 전자책에 멀티미디어 요소를 추가할 수 있는 Editor와 전자책을 볼 수 있는 Viewer를 실험적으로 구현해보았다. 또한, 도서 검색의 편의를 위해 도서 본문을 이용한 Semantic 검색을 구현하였다.

학술논문의 내용구조에 의한 전문검색시스템 구현과 성능평가에 관한 연구 (A Study on the Implementation and Performance Evaluation of Full-text Information Retrieval System based on Scientific Paper′s Content Structure)

  • 이두영;이병기
    • 정보관리학회지
    • /
    • 제15권3호
    • /
    • pp.73-93
    • /
    • 1998
  • 본 연구는 문헌의 내용구조와 이용자의 정보요구는 밀접한 관련성이 있기 때문에 문헌의 본문을 내용 단위구조로 분할하여 색인한다면 기존의 전문데이터베이스 구축방식에 비해 검색효율을 향상시킬 수 있다는 가설을 설정하고 이를 검증하는데 목적이 있다. 이 가설을 검증하기 위하여 먼저 학술논문의 내용구조 모델을 설정하고, 이 모델을 기반으로 컴퓨터 관련분야 70여편의 학술논문을 대상으로 실험용 전문데이터베이스를 구축한 다음, 이에 대한 검색효율을 측정하여 내용구조 기반 전문검색시스템의 성능을 실험적으로 평가하였다.

  • PDF

백과사전 질의응답 시스템을 위한 의미적 단락 생성 및 검색 기법 (Method of Semantic Passage Generation and Retrieval for Encyclopedia QA system)

  • 이충희;오효정;김현진;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.159-166
    • /
    • 2004
  • 본 논문에서는 질의응답 시스템에서 질문의 주제와 개념적으로 일치하는 단락으로부터 정보를 추출할 경우에 보다 정확한 정답을 추출할 수 있다는 가정 하에 문장 주제를 활용한 의미적 단락 생성 및 검색 기법을 제안한다. 문장주제란 백과사전 문서 집합에서 공통으로 기술하는 내용이나 자주 언급하고 있는 사건 혹은 개념들의 집합을 의미하는 것으로, 주제별로 응집된 문장들로 재구성된 단락을 의미적 단락이라고 정의한다. 제안된 방법의 성능을 평가하기 위해 의미적 단락의 신뢰도를 파악하고, 백과사전 본문을 3문장 단위로 잘라서 고정길이 단락을 만든 후 의미적 단락의 검색결과와 비교하였다. 평가척도로는 TREC의 역순위평균(MRR : Mean Reciprocal Rank)과 상위 5개 단락 안에 정답유무를 측정하는 사용자 정답만족도를 사용하였다. ETRI 평가셋을 대상으로 한 실험 결과, 주제를 이용한 의미적 단락 검색 성능이 고정길이 단락 검색보다 우수함을 알 수 있었다.

  • PDF

국내 100대 기업 페이스북 콘텐츠 전략과 인게이지먼트 연구: B2B·B2C 기업 간 차이를 중심으로 (Study on Corporate Facebook Posts and User Engagement of the KOSPI 100 Companies in Korea: Difference between B2B and B2C Companies)

  • 조주홍;고채은;백현미
    • 지식경영연구
    • /
    • 제23권3호
    • /
    • pp.65-88
    • /
    • 2022
  • 기업은 브랜드 인지도 제고와 제품 판매를 위한 공중과의 소통 창구로 소셜미디어를 적극 활용해 왔다. 특히 팬데믹은 효과적인 비대면 소통 채널로서 소셜미디어의 역할이 부상하는 계기가 되었다. 그러나 기업의 사업 성격에 따른 소셜미디어 활용 전략의 차이에 관한 연구는 부족한 실정이다. 이에 본 연구는 기업을 B2B와 B2C로 구분하여 두 집단 간 이용자 인게이지먼트에 영향을 미치는 소셜미디어 콘텐츠 구성 요소에 차이가 있는지를 실증적으로 알아보았다. 분석을 위해 국내 시가총액 상위 100대 기업 중 페이스북 팬페이지를 운영하는 기업 22개를 대상으로 2020년 1월 1일부터 12월 31일까지 게재한 콘텐츠를 살펴보았다. 그 결과 B2C 기업은 콘텐츠 제작 시 B2B 기업보다 동영상을 더 많이 사용해 생생함을 강조했으며, 정보 검색 용이성 측면에서 해시태그를 더 많이 사용했고, 본문에서는 제품명을 더 많이 언급한 것으로 나타났다. 반면 B2B 기업은 콘텐츠 제작 시 이미지를 선호했으며, 용이한 정보 검색을 위해 하이퍼링크를 더 많이 사용했고, 본문에서 제품보다는 회사명을 더 많이 언급했다. 콘텐츠 구성 요소와 인게이지먼트 간의 관계에서 B2B 기업은 이미지가 포함된 경우와 본문 길이가 긴 경우 인게이지먼트 지표(좋아요, 댓글, 공유 수)가 높아졌으나, 하이퍼링크와 URL이 포함된 경우 반대로 인게이지먼트가 낮아졌다. B2C 기업에서는 본문 길이가 길수록 인게이지먼트가 유의미하게 증가함을 확인하였다. 본 연구는 기업 실무자나 운영자가 회사의 특성에 맞춰 인게이지먼트를 높일 수 있는 소셜미디어 전략을 수립하는 데 실무적인 시사점을 제공한다.

조세심판 문서 검색 효율 향상 모델에 관한 연구 (A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment)

  • 이후영;박구락;김동현
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.41-47
    • /
    • 2019
  • 조세 심판에 대한 선결정례는 법원 판례의 경우 유사 심판례를 검색하여 파악하는 것이 매우 중요한 상황이다. 그러나 기존 심판문에 대한 검색은 사용자가 입력하는 키워드를 통하여 검색하는 방법을 사용하고 있으나, 정확한 키워드의 입력이 필요하며, 키워드를 모르는 경우 필요한 문서를 검색하는 것은 불가능하다. 또한 검색된 문서 중에는 내용이 다른 경우도 발생한다. 이에 본 논문에서는 정확한 심판례의 검색을 위하여 문서를 3차원 공간에 벡터화하고, 코사인 유사도를 계산하여, 거리상 가까운 문서를 검색하는 방법의 효율성을 향상시키기 위하여 심판례에서 사용되고 있는 단어들의 유사도를 분석한 후, 최빈값을 추출하여 본문의 텍스트에 삽입하는 방법으로 검색하고자 하는 문서의 코사인 유사도를 향상시키는 방안을 제안한다. 제안 모델을 통하여 조세와 관련된 심판례를 검색하고자 하는 사용자에게 신속하고, 정확한 검색을 제공할 수 있을 것으로 기대된다.