• 제목/요약/키워드: Web engine

검색결과 485건 처리시간 0.031초

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

웹문서분류체계의 분석 및 새로운 설계 (Analysis and Design for the System of Korean Web Document Classification)

  • 남영준
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.207-230
    • /
    • 1998
  • 인터넷에 존재하는 웹문서와 사이트들은 충분히 학술적 가치를 갖고 있기 때문에 중요한 정보원으로 간주된다. 도서관은 이 새로운 정보원을 대상으로 도서관 이용자를 위한 새로운 검색기법과 관리기법을 개발할 필요가 증대되었다. 왜냐하면 현재 웹검색엔진에서 제공하는 분류체계는 도서관학적 관점에서 개발되지도 않았으며 또한 웹검색엔진간 분류체계의 설계원칙도 없기 때문이다. 본 논문에서는 이점에 착안하여 웹 문서를 효율적으로 검색할 수 있는 실험적인 새로운 웹문서 분류체계를 설계하였다. 설계는 해당 분류항목과 연관된 웹문서의 수와 접속비율에 근거하였으며, 설계의 수준은 1차적으로 류${\cdot}$강항목까지 제한하였다.

  • PDF

Hop 제약조건이 고려된 최적화 웹정보검색 (Optimized Structures with Hop Constraints for Web Information Retrieval)

  • 이우기;김기백;이화기
    • 한국경영과학회지
    • /
    • 제33권4호
    • /
    • pp.63-82
    • /
    • 2008
  • The explosively growing attractiveness of the Web is commencing significant demands for a structuring analysis on various web objects. The larger the substantial number of web objects are available, the more difficult for the clients(i.e. common web users and web robots) and the servers(i.e. Web search engine) to retrieve what they really want. We have in mind focusing on the structure of web objects by introducing optimization models for more convenient and effective information retrieval. For this purpose, we represent web objects and hyperlinks as a directed graph from which the optimal structures are derived in terms of rooted directed spanning trees and Top-k trees. Computational experiments are executed for synthetic data as well as for real web sites' domains so that the Lagrangian Relaxation approaches have exploited the Top-k trees and Hop constraint resolutions. In the experiments, our methods outperformed the conventional approaches so that the complex web graph can successfully be converted into optimal-structured ones within a reasonable amount of computation time.

모바일 웹서비스의 성능 향상을 위한 인터미디어리 기반의 프레임워크 설계 (A Design of Intermediary based Framework for Improving Mobile Web-Service Performance)

  • 김용태;정윤수;박길철
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2277-2285
    • /
    • 2008
  • 최근 많은 모바일 디바이스 환경에서 웹서비스 이용에 대한 요구가 증가하고 있지만 현실의 여러 가지 한계와 문제점들로 인해 무선 네트워크에서의 웹 브라우징은 많은 제약이 발생한다. 최근의 급속하게 변화하는 웹 환경에서 이전의 웹서버 성능으로는 다양한 요구 사항을 만족할 수 없기 때문에, 모바일 웹서비스 엔진의 성능 향상이 필요하다. 따라서 본 논문에서는 인터미디어리 기술을 모바일 웹 서비스에 도입하여 웹서비스 이용자를 위한 서비스 환경을 개선한다. 본 논문에서는 모바일 웹서비스의 성능 향상과 모바일 디바이스와 웹서버의 상호운용을 위한 인터미디어리 기반 웹서비스 프레임워크를 설계 구현한다.

질의어 의미별 사용자 선호도를 이용한 웹 검색의 성능 향상 (Improving Performance of Web Search using The User Preference in Query Word Senses)

  • 김형일;김준태
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1101-1112
    • /
    • 2004
  • 본 논문에서는 웹 검색의 성능 향상을 위해 질의어 의미별 사용자 선호도를 이용한 웹 페이지의 가중치 부여 방식을 제안한다. 일반적으로 검색엔진들은 검색 질의어와 웹 페이지의 어휘 비교에 의한 관련도 측정만을 사용하여 웹 페이지의 가중치를 부여한다. 웹과 같이 방대한 자료를 대상으로 검색을 할 경우 유사한 관련도를 가진 검색 결과가 매우 많으므로 어휘 비교만으로는 중요한 웹 페이지를 선별하기 어렵다. 본 논문에서는 질의어의 의미를 구분하도록 워드넷(WordNet)을 이용한 사용자 인터페이스를 구축하고, 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 검색 행위에 의한 묵시적 평가가 웹 페이지의 검색 순위에 반영되는 검색 시스템을 구현하였다. 클릭수의 누적에 있어서 질의 어 의미별로 가중치를 구분하여 저장함으로써 일반적인 검색엔진보다 정확한 검색이 되었으며, 웹 페이지의 범주별 가중치와 질의어의 의미별 사용자 선호도를 이용함으로써 검색 시스템의 성능을 향상시킬 수 있다는 것을 20개의 어휘에 관련된 41개의 의미들을 대상으로 실험한 결과로 확인하였다.

교수-학습 지원을 위한 웹 에이전트(web agent)의 개발 (Developing the Web Agent for Supporting and Facilitating Teaching and Learning on the Web)

  • 강신천;한승록;박정환
    • 컴퓨터교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.87-94
    • /
    • 2003
  • 최근 에이전트를 교육에 활용하려는 연구와 노력이 시도되고 있다. 에이전트는 컴퓨터가 사용자를 대신하여 주어진 일을 수행하는 대행자(proxy)나 중개자(middle ware) 역할을 하는 컴퓨터 프로그램을 통칭하는 개념이다. 근래에 다양한 장르에서 에이전트가 활용되고 있으며 교수 학습 분야 역시 그러한 것 중에 하나에 해당된다. 웹 상에서 교사의 역할을 대신할 수 있는 프로그램이나 엔진의 개념이 교수 학습을 지원하는 웹 에이전트이다. 웹 상에서 에이전트는 교사의 역할을 수행할 뿐만 아니라 학습자를 도와 주는 도우미 역할을 수행한다. 웹 에이전트가 적용된 웹 기반 교수 학습 환경은 학습자나 교사에게 적응적이고 개별화된 환경을 제공한다.

  • PDF

WebKit 모바일 웹 브라우저의 성능 향상을 위한 기법 연구 (A Study of High Performance WebKit Mobile Web Browser)

  • 김정길
    • 한국위성정보통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.48-52
    • /
    • 2012
  • 스마트폰의 급속한 보급 확산에 따라 모바일 기기에서 웹 브라우저는 주요한 기능으로 자리 잡고 있으며 사용자는 모바일 기기에서 PC 수준의 고속화된 성능을 기대하는 현실이다. 웹키트(WebKit)는 구글의 안드로이드(Android) 플랫폼에 사용되고 있는 웹 브라우저를 만드는 데 기반을 제공하는 오픈 소스 응용 프로그램 프레임워크이다. 본 논문에서는 WebKit 라이브러리의 연산의 병렬처리를 통한 성능 향상 기법을 제안하였다. 제안된 병렬처리 기법은 JPEG 라이브러리에 적용되었으며, 성능 검증은 PC 기반의 실험을 통하여 이기종 컴퓨팅 기반의 모바일 임베디드 시스템 환경에서의 예측 방법을 사용하였다. 실험 결과는 제안된 병렬화 기법이 이기종 컴퓨팅 환경의 모바일 임베디드 기기로의 적용을 통한 성능 향상 가능성을 보여주었다.

Adaptive User Profile for Information Retrieval from the Web

  • Srinil, Phaitoon;Pinngern, Ouen
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1986-1989
    • /
    • 2003
  • This paper proposes the information retrieval improvement for the Web using the structure and hyperlinks of HTML documents along with user profile. The method bases on the rationale that terms appearing in different structure of documents may have different significance in identifying the documents. The method partitions the occurrence of terms in a document collection into six classes according to the tags in which particular terms occurred (such as Title, H1-H6 and Anchor). We use genetic algorithm to determine class importance values and expand user query. We also use this value in similarity computation and update user profile. Then a genetic algorithm is used again to select some terms from user profile to expand the original query. Lastly, the search engine uses the expanded query for searching and the results of the search engine are scored by similarity values between each result and the user profile. Vector space model is used and the weighting schemes of traditional information retrieval were extended to include class importance values. The tested results show that precision is up to 81.5%.

  • PDF

데이터베이스 관리 시스템에 기반한 웹검색엔진의 구현 (Web Search Engine based on Database Management System)

  • 강병주;이지동;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-218
    • /
    • 1997
  • 웹검색엔진은 색인되는 웹문서가 많아질수록 시스템 확장성(scalability)이라든지, 데이터베이스 유지 관리의 용이성, 데이터의 안전성 문제, 등의 많은 문제가 웹검색엔진에 부담으로 주어지게 된다. 반면에 인트라넷(intranet)용 검색엔진의 경우는 확장성보다는 검색엔진 자체의 개발의 용이성이 더욱 중요하다. Oracle $ConText^{TM}$는 오라클 사(社의) RDBMS인 $Oracle7^{TM}$의 정보검색 확장 옵션으로 텍스트를 Oracle7의 기본 데이터 타입으로 사용될 수 있게 한다. Oracle7+ConText는 대용량의 문서 베이스와 개발의 용이성을 동시에 보장할 수 있는 매우 훌륭한 웹검색엔진 개발 도구이다. 우리는 이를 검증하기 위하여 Oracle7+ConText에 기반한 WEBSECT(Web Search Engine With ConText)라는 웹검색엔진을 개발하였다. 본 논문은 WEBSECT의 개발과 시험 운영을 통해 데이터베이스에 기반한 웹검색엔진의 우수한 확장성과 텍스트 애플리케이션 개발의 용이성 등을 소개한다.

  • PDF

인터넷 검색과 형태소분석을 이용한 표절검사시스템의 개발에 관한 연구 (Development of A Plagiarism Detection System Using Web Search and Morpheme Analysis)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제16권1호
    • /
    • pp.21-36
    • /
    • 2009
  • As the World Wide Web (WWW) has become a major channel for information delivery, the data accumulated in the Internet increases at an incredible speed, and it derives the advances of information search technologies. It is the search engine that solves the problem of information overloading and helps people to identify relevant information. However, as search engines become a powerful tool for finding information, the opportunities of plagiarizing have increased significantly in e-Learning. In this paper, we developed an online plagiarism detection system for detecting plagiarized documents that incorporates the functions of search engines and acts in exactly the same way of plagiarizing. The plagiarism detection system uses morpheme analysis to improve the performance and sentence-based comparison to investigate document comes from multiple sources. As a result of applying this system in e-Learning, the performance of plagiarism detection was improved.

  • PDF