• 제목/요약/키워드: 웹 검색

검색결과 2,248건 처리시간 0.034초

웹 사이트 구조를 이용한 토픽 검색 연구 (An Experimental Study on Topic Distillation Using Web Site Structure)

  • 이지숙;정영미
    • 정보관리학회지
    • /
    • 제24권3호
    • /
    • pp.201-218
    • /
    • 2007
  • 이 연구에서는 TRBC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

하이퍼링크 구조를 이용한 웹 검색의 순위 알고리즘에 관한 연구 (The Study on the Ranking Algorithm of Web-based Sear ching Using Hyperlink Structure)

  • 김성희;오건택
    • 정보관리연구
    • /
    • 제37권2호
    • /
    • pp.33-50
    • /
    • 2006
  • 본 연구에서는 하이퍼 링크 구조를 이용한 웹 검색 알고리즘에 대해 살펴 본 후 페이지 품질을 측정하기 위해 웹의 하이퍼 구조를 이용하고 있는 알고리즘인 HITS와 PageRank를 분석하였다. 이어서 이들 방법을 이용한 검색 엔진인 Google과 Ask.com을 검색 알고리즘의 특성을 기준으로 분석하였다. 이런 연구는 미래의 웹 문서의 중요도를 평가하는 데 기초자료로 활용할 수 있으며, 웹 정보검색의 검색성능을 향상시키는 시스템 개발에 도움이 될 수 있을 것이라 생각한다.

서비스 제공자 목록에 의한 사용자 프로파일 기반 웹 서비스 검색의 정확도 향상 (Improvement of Searching Accuracy for Web Service based on User Profile with Service Provider List)

  • 이재원;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.66-70
    • /
    • 2006
  • 웹은 단순한 텍스트와 이미지의 저장소에서 서비스의 제공자로 진화하고 있다. 사용자들은 자신이 필요로 하는 서비스를 찾기 위해 웹 검색을 이용한다. 그러나, 현재의 검색 엔진은 주어진 질의어에 대해 모든 사람들에게 보편적으로 타당한 문서에 높은 우선 순위를 부여해 검색 결과의 상위에 위치시키기 때문에, 사용자의 관심과는 무관한 정보가 검색 결과의 상위에 나타나게 되는 단점이 있다. 이러한 문제를 해결하기 위해 사용자의 방문 내역을 사용자 프로파일에 저장하여, 이후 검색에서 사용자가 방문했던 웹 페이지들에 높은 우선 순위를 부여하여 검색 결과의 상위에 위치시키는 방식이 사용되고 있다. 기존의 사용자 프로파일은 단순 방문 페이지와 사용자가 실제 서비스를 제공받은 페이지에 대한 구별없이, 모든 검색 세션에 대해 동일한 방문 내역을 저장하고 있다. 그러나 이 경우, 잦은 방문 횟수를 가지나 실제 사용자가 서비스를 이용하지 않은 웹 페이지가 적은 방문 횟수를 가지나 실제 사용자가 서비스를 이용한 웹 페이지보다 높은 우선 순위를 갖게 될 수 있는 문제점을 지니고 있다. 본 논문에서는 필요로 하는 서비스를 웹에서 찾고자 할 때, 사용자가 과거에 이용했던 서비스 제공자들의 목록을 이용하여, 사용자 프로파일 기반 웹 서비스 검색의 정확도를 향상시키는 시스템을 설계하였다. 이를 위해 사용자가 웹 서핑 중 서비스를 이용했던 웹 페이지 정보를 서비스 제공자 목록에 저장하였다. 검색 엔진이 특정 질의어에 대해 제공하는 검색 결과는, 우선 사용자 프로파일을 이용해 과거에 자주 방문했던 웹 페이지가 높은 우선 순위를 갖도록 조정된 후, 서비스 제공자 목록을 이용해 과거에 사용자가 서비스를 이용했던 웹 페이지가 가장 높은 우선 순위를 갖도록 재조정된다. 사용자에게 제공되는 최종 검색 결과는 사용자의 과거의 방문 경향 및 실제 서비스 이용 경향을 모두 반영하게 된다.고려할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate 영상과 비교하여 더 빠른 시간 안에 우수한 영상을 얻을 수 있었다. 그러므로 $^{99m}Tc$-transierrin이 감염 병소의 영상진단에 사용될 수 있을 것으로 기대된다.리를 정량화 하였다. 특히 선조체에서의 도파민 유리에 의한 수용체 결합능의 감소는 흡연에 의한 혈중 니코틴의 축적 농도와 양의 상관관계를 보였다(rho=0.9, p=0.04). 결론: $[^{11}C]raclopride$ PET을 이용하여 비

  • PDF

사이트 검색을 위한 메타 검색 (Metasearch for Website Finding)

  • 이여진;강인호;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.245-252
    • /
    • 2002
  • 여러 검색 엔진이 낸 결과를 결합하여 성능의 향상을 얻고자 하는 정보 검색 방법을 메타 검색(metasearch)이라고 한다. 정보 검색에서의 사용자 요구가 다양화되고 있지만, 기존의 메타 검색에 관한 연구는 이를 제대로 반영하지 못하고 웹 문서를 대상으로 검색(topic relevance task)한 결과를 결합하는 데에만 치중해 있다. 최근에는 사이트 검색(entry page finding task)만을 목적으로 한 시스템도 개발되고 있다. 본 논문에서는 사이트 검색 엔진들의 결과를 결합하는 메타 검색 방법을 제시한다. 웹 문서 검색 결과를 결합시에는 여러 검색 엔진에서 중복(overlap)하여 나타난 문서에 가중치를 두는 방법이 효과적이다. 하지만 이 방법을 그대로 사이트 검색에 적용하면 웹 문서 검색에서와 같은 좋은 결과를 낼 수 없다. 본 논문에서는, 여러 검색 엔진에 중복하여 나타난 문서에 가중치를 두는 것보다는 그 문서가 속한 사이트를 고려하여 사이트 단위로 중복된 정도를 반영하는 것이 사이트 검색 엔진의 견과를 결합하는 데 더 효과적임을 보인다.

  • PDF

인트라넷 기반의 최적의 웹문서 자동 분류기법 선정 (The selection of Best suited Automatic Web Document Classification Based on Intranet)

  • 김국희;윤희병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.423-426
    • /
    • 2004
  • 인트라넷에서는 증가하는 웹문서의 검색을 목적으로 웹 검색엔진의 도입이 활발히 진행 중이며 대부분 찾아야할 키워드를 알고 접근하는 검색엔진 형태이다. 그러나 사용자가 무엇을 찾아야 하는지 모르는 경우 웹문서 분류체계는 효율적인 방법을 제시할 수 있다. 일부 구축되어 있는 분류체계는 수작업에 의한 분류로 인해 증가하는 웹문서의 양에 효율적으로 대처하기 곤란하므로 자동분류기법을 활용한 분류가 더 효율적일 것이다. 본 논문에서는 국방인트라넷의 수작업으로 구축된 분류체계를 대상으로 용어 가중치를 계산하는 방법을 달리하여 다양한 분류기법을 적용하여 성능을 비교평가하고 웹문서 자동분류시스템에 적용하여 분류성능의 향상을 도모하고자 한다.

  • PDF

유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링 (Web Service Information Clustering using Genetic Algorithm and Neural Network)

  • 황중연;유춘식;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.127-129
    • /
    • 2004
  • 오늘날, 웹서비스를 이용한 정보 검색을 하기 위해서는 UDDI 레지스트리의 전문적인 지식이 필요하다. 즉 웹 서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야 한다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하면 웹서비스에 대한 정보 검색을 쉽게 할 수 없다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 점보를 카테고리에 맞게 분류하여 검색을 용이하게 할 수가 있다. 따라서 본 논문에서는 보다 효율적으로 웹서비스 정보를 분류하기 위해서 유전자 알고리즘과 신경망을 이용한 클러스터링 기법을 제안하는데 목적이 있다.

  • PDF

웹 서비스 등록/검색 도구 기능 정의 (Characterization of a Client for Web Service Registry System)

  • 김미혜;이경하;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.106-108
    • /
    • 2002
  • 웹 서비스(web services)는 표준화된 XML 메시지를 통해 네트워크상에서 접근 가능한 연산들의 집합을 기술하는 인터페이스로 정의된다[1]. 이러한 웹 서비스는 크게 서비스 교환과 기술(description), 그리고 등록(registration)과 발견(discovery)이라는 개발 단계를 가지고 있으며, 각각의 단계에서 사용되어지는 기술에는 SOAP, WSDL, UDDI 등이 존재한다. 본 논문에서는 웹 서비스에 관한 정보를 저장하기 위해 개발된 UDDI 레지스트리에 웹 서비스에 관한 정보를 등록하고 검색/발견할 수 있도록 지원해주는 웹 서비스 등록/검색 도구의 기능들을 정의하고, 개발에 필요한 사항들을 기술한다.

  • PDF

예제 이미지와 사용자 스케치 질의에 의한 웹 기반 이미지 검색 시스템 (Web based Image Retrieval system using User Sketch and Example Image Queries)

  • 황병곤
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.26-31
    • /
    • 2004
  • 최근에 웹의 폭발적 사용의 증가에 따라, WWW에서 많은 정보를 좀 더 손쉽게 획득할 수 있다. 본 논문에서 H에서 웹 에이전트를 사용하여 이미지를 검색하는 일반적인 내용기반 이미지 검색 시스템을 제안한다. 웹 에이전트는 웹 상에서 HTML문서에 나타나는 텍스트 중 이미지 이름이나 링크에 붙어 있는 이미지를 의미하는 텍스트를 추출한다. 제안된 시스템은 웹 브라우저에서 사용자의 스케치와 예제 이미지 질의를 이용하여 데이터베이스에 있는 이미지를 검색하는 방법을 제시하여 실험결과를 통해서 질의 효율성을 나타내었다.

  • PDF

지식 정보를 이용한 웹 문서 순위 결정 방법 (A Web Document Ranking Method Using Knowledge Information)

  • 이용현;변영태;구연건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.135-137
    • /
    • 1998
  • 다양하고 방대한 양의 정보가 산재해 있는 웹의 정보 소스들 중 특정 도메인에 해당하는 문서를 판단하는 방법과 효과적인 검색을 지원하기 위한 웹 문서 순위 결정 방법을 제안한다. 웹에 산재되어 있는 정보들은 특정 도메인에 적합한 문서들만을 저장하기 위해 특정 지식 베이스를 기반으로 하는 지식 정보를 이용하여 문서의 평가 작업을 한다. 또한 효과적인 검색을 지원하기 위한 웹 문서 순위 결정 방법으로 두 단계의 처리를 거친다. 첫째, 사용자로부터 주어진 질의에 대해 그 질의를 이루고 있는 각 단어들에 대한 상대적인 중요도를 반영한 P-norm 모델을 적용하여 문서의 순위를 결정한다. 두 번째 단계로 관련 문서들간의 유용한 링크 정보를 이용한 재조정 작업에 의해 문서의 순위를 결정하는 방법을 제시한다. 본 논문에서 제시한 방법에 의해 적절한 문서의 판단과 더 나은 정보의 제공을 수행할 수 있는 효과적인 정보 검색 기능을 가진다. 정보 탐색자에게 정확하고 효과적인 정보를 제공할 수 있게 되었고, 일반적인 웹 검색 방법과의 비교에 의해 검색 효율이 향상됨을 보인다.

  • PDF

XML 기반 웹 사전 프레임워크 (The XML-based Web Dictionary Framework)

  • 유응구;구자룡;김고운;이금석;김병구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1025-1028
    • /
    • 2002
  • 인터넷이 널리 사용되면서 인터넷 사용자들의 웹 사전 사용 빈도가 크게 증가하였다. 현재 다양한 형태의 웹 사전들이 다양한 서비스를 제공하고 있지만, 대부분의 웹 사전들은 검색엔진 형태의 단순질의 검색과 인덱스를 이용한 검색 기능을 제공하고, 고정된 표현 형식만을 제공한다. 또한 사전내용, 인덱스, 참조 및 관련 사이트 정보를 관리하기 위한 도구의 부재로 관리가 어렵고, 저장형식으로 HTML 을 사용하기 때문에 사전 데이터의 재사용에 문제가 있다. 따라서 본 논문에서는 기존의 웹 사전들을 사용자-관리자 측면에서 분석하여 문제점을 제시하고, 이를 해결할 수 있도록 카테고리 검색 및 히스토리 검색 서비스를 지원하고, 데이터를 XML 문서로 저장하며, 전용의 사전 관리 도구를 제공하는 XML 기반 웹 사전 프레임워크를 제안하고 구현하였다.

  • PDF