• Title/Summary/Keyword: 웹 검색

Search Result 2,248, Processing Time 0.022 seconds

A Study on Keyword Extraction and Expansion for Web Text Retrieval (웹 문서 검색을 위한 검색어 추출과 확장에 관한 연구)

  • Yoon, Sung-Hee
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.9
    • /
    • pp.1111-1118
    • /
    • 2004
  • Natural language query is the best user interface for the users of web text retrieval systems. This paper proposes a retrieval system with expanded keyword from syntactically-analyzed structures of user's natural language query based on natural language processing technique. Through the steps combining or splitting the compound nouns based on syntactic tree traversal, and expanding the other-formed or shorten-formed keyword into multiple keyword, it shows that precision and correctness of the retrieval system was enhanced.

  • PDF

Community Retrieval Using the Web Services (웹 서비스를 이용한 커뮤니티 검색)

  • Jeong, Chan-Back;Kim, Tae-Hwan;Jeon, Ho-Chul;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.317-321
    • /
    • 2007
  • 가공해서 사용하는 정보량이 많아질수록 원하는 정보를 찾는데 더 많은 노력이 필요하게 되었다. 따라서 사람들은 인터넷상에서 원하는 정보를 검색하는 여러 방법들을 고안해 왔으며 이렇게 구현된 검색 알고리즘은 검색 질의와 유사한 문서가 대중에게 얼마나 관심을 받고 있는지 그 정도에 따라 검색순위 상위에 링크된다. 하지만 웹 문서의 폭발적인 증가로 해당 질의에 대한 검색 결과 문서의 수가 급격히 늘어나면서 사용자를 만족시키기가 점점 어렵게 되었다. 이러한 문제를 해결하기 위한 방안으로 네티즌들이 직접 정보를 생산, 공유하고 이들이 모여 활동할 수 있는 커뮤니티를 형성하기 시작했다. 이 논문에서는 정보의 공유를 목적으로 하는 커뮤니티를 인터넷상의 표준화된 웹 서비스(Web Services) 기술인 UDDI에 저장하고, SOAP 프로토콜을 이용하여 플랫폼에 상관없이 사용자 검색 질의와 가장 유사한 커뮤니티를 검색하여 제공하는 방법을 제안한다.

  • PDF

Prototype of Information Retrieval Agents Using Artificial Life Technologies (인공생명 기법을 이용한 정보검색 에이전트의 원형)

  • 김학균;조성배
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.10a
    • /
    • pp.391-394
    • /
    • 1997
  • 인터넷의 웹은 여러 곳에 분산되어 있을 뿐만 아니라 끊임없이 동적으로 변화하는 특성이 있기 때문에, 보통의 인덱스를 통한 정보검색 방법에는 한계가 있다. 이러한 웹의 특성을 적절히 살리면서 원하는 정보를 신속하게 검색하기 위하여, 본 논문에서는 여러 개의 에이전트가 인공생명 기법에 의해 조직되어 정보를 검색하는 온라인 에이전트를 소개한다. 이것은 각각의 에이전트에 의하여 검색된 문서가 얼마나 질의에 가까운가에 따라서 해당 에이전트를 만이 살아 남아 문서를 가져오도록 함으로써, 불필요한 문서를 검색하지 않게 되어 단위 시간에 원하는 문서를 많이 얻어올 수 있는 장점이 있다. 실제 웹 환경에서 실험한 결과 종래의 폭우선 검색이나 랜덤검색에 비하여 좋은 결과를 내는 것을 볼 수 있었다.

  • PDF

시맨틱 웹 기반의 협업적 교육을 위한 문제은행 시스템

  • O Gyeong-Jin;Kim Heung-Nam;Bae In-Gyeong;Jo Geun-Sik
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.270-276
    • /
    • 2006
  • 문제은행 시스템은 학습 평가를 위한 문제를 DB로 구성한 다음, 추후에 인터넷으로 검색하여 재 사용하게 하는 시스템이므로 교사 업무의 효율성 및 비용이 절감되며, 사용자에게 제공할 문제 정보들을 체계적으로 관리, 저장, 검색할 수 있는 환경을 제공한다. 하지만 기존에 구축되어 있는 문제 은행 시스템들의 데이터들은 컴퓨터가 그 의미를 처리할 수 없기 때문에 동의어, 유의어들에 대한 정확한 검색이 어렵고, 단순한 키워드 검색으로 인하여 학생들과 교사들은 수많은 불필요한 검색 결과 속에서 원하는 정보를 다시 재 검색해야 하는 시간 낭비를 초래하고 있다. 이러한 문제를 극복하기 위해 본 논문에서는 시맨틱 웹 기반 기술인 OWL을 사용해서 문제은행 시스템의 온톨로지를 구성하고 개념 정의, 구조 및 관계를 명시한다. 그리고 온톨로지 기반위에 OWL 개체를 생성하고, SWRL에 정의된 규칙과 함께 추론 통해 시맨틱 검색을 가능하도록 하였다. 그 결과 데이터의 관계 및 의미 분석을 통한 향상된 검색 결과와 학습자와 교사가 다양하게 문제를 공유하고 재 사용함으로써 협업적 학습에 대한 효과를 기대할 수 있다.

  • PDF

Design and Implementation of a Search Engine based on Apache Spark (아파치 스파크 기반 검색엔진의 설계 및 구현)

  • Park, Ki-Sung;Choi, Jae-Hyun;Kim, Jong-Bae;Park, Jae-Won
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.1
    • /
    • pp.17-28
    • /
    • 2017
  • Recently, a study on data has been actively conducted because the value of the data has become more useful. Web crawler that is program of data collection recently spotlighted because it can take advantage of the various fields. Web crawler can be defined as a tool to analyze the web pages and collects the URL by traversing the web server in an automated manner. For the treatment of Big-data, distributed Web crawler is widely used which is based on the Hadoop MapReduce. But, it is difficult to use and has constraints on the performance. Apache spark that is the In-memory computing platform is an alternative to MapReduce. The search engine which is one of the main purposes of web crawler displays the information you search by keyword gathered by web crawler. If search engines implement a spark-based web crawler instead of traditional MapReduce-based web crawler, it would be a more rapid data collection.

A Design and Implementation of Integrated Image Metadata for Semantic-based Image Search (의미기반 이미지 검색을 위한 통합 이미지 메타데이타의 설계 및 구현)

  • 권은영;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.145-147
    • /
    • 2004
  • 웹 상에서의 자료 검색 방법이 기존의 키워드 검색이나 단순 내용 기반 검색 방법에서 다양한 형태의 의미기반 검색으로 발전하고 있다. 멀티미디어 데이타를 효율적으로 저장, 검색하기 위해서는 표준화된 데이타 구조가 필요하다. 본 논문에서는 멀티미디어 자료 중에서 이미지의 의미기반 검색을 지원하기 위해 기존의 메타데이타 표준안을 반영한 확장성 있는 통합 이미지 메타데이타 구조를 정의하였다. 또한 통합 이미지 메타데이타를 웹 상에서 상호 교환하기 위해 XML 문서 형태로 표현하였으며, 이를 위해 VRA와 통합 이미지 메타데이타에 대한 XML 스키마를 정의하고 통합 이미지 메타데이타 XML 문서 생성기를 작성하였다

  • PDF

An Elementary Educational Contents Retrieval System Using Semantic Web (시맨틱웹을 활용한 초등학교 학습자료 검색시스템)

  • Lee, Hee-Kyoung;Jun, Woo-Chun
    • The KIPS Transactions:PartA
    • /
    • v.13A no.6 s.103
    • /
    • pp.545-554
    • /
    • 2006
  • Although the current Web search engines provide tremendous information, it is hard to find right information among the huge information. Users need to spend extra time to filter out unnecessary information. In order to overcome the limit of current Web search engines, Semantic Web was developed to provide efficient search, integration, and reuse of information by structuring semantic information from Web resources. In this paper, an elementary education contents retrieval system using Semantic Web is proposed. The proposed system emphasizes history contents that have high relevancy among data. For construction of the proposed system, ontology is proposed first for elementary study contents and ontology for historical contents is proposed for easy access to those contents using semantic relation among them. Based on the ontology, the proposed system is designed and implemented. The proposed system has the following characteristics. First, the system provides various query formats in detail so that search results can be refined efficiently. Second, the system presents only semantically information connected with key words or including key words using study contents ontology. Finally, the proposed system can increase study effects by presenting various contents that are related with query by users.

Fusion Approach for Optimizing Web Search Performance (웹 검색 성능 최적화를 위한 융합적 방식)

  • Yang, Kiduk
    • Journal of the Korean Society for information Management
    • /
    • v.32 no.1
    • /
    • pp.7-22
    • /
    • 2015
  • This paper describes a Web search optimization study that investigates both static and dynamic tuning methods for optimizing system performance. We extended the conventional fusion approach by introducing the "dynamic tuning" process with which to optimize the fusion formula that combines the contributions of diverse sources of evidence on the Web. By engaging in iterative dynamic tuning process, where we successively fine-tuned the fusion parameters based on the cognitive analysis of immediate system feedback, we were able to significantly increase the retrieval performance. Our results show that exploiting the richness of Web search environment by combining multiple sources of evidence is an effective strategy.

WebSES : Web Site Sensibility Evaluation System based on Color Combination (WebSES : 배색을 이용한 웹 사이트 감성 평가 시스템)

  • 유헌우;조경자;홍지영;박수이
    • Science of Emotion and Sensibility
    • /
    • v.7 no.1
    • /
    • pp.51-64
    • /
    • 2004
  • In this paper, we propose a web page retrieval system based on the sensibility evaluation induced by the color combination of web pages. The realized system consist of two modules - the indexing module that automatically extracts and indexes the color information from the web page and the retrieval module that retrieves web pages based on the color combination when sensibility adjective is presented. Also, to verify the system usefulness, we analyzed the ranking of web pages retrieved by the system and by human subjects (non-expels and experts for color web page design) using two statistical methods of correlation and paired-t test. Results by non-experts showed the realized system was suitable for 10 sensibility adjectives among 18 sensibility adjectives, and results by experts showed that the realized system was suitable for 14 sensibility adjectives among 18 sensibility adjectives.

  • PDF

Improving Performance of Web Search Engine using Query Word Senses and User Feedback (질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상)

  • Yoon, Sung-Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.8 no.2
    • /
    • pp.280-285
    • /
    • 2007
  • This paper proposes a technique improving performance using word senses and user feedback in web information retrieval, compared with the retrieval based on ambiguous user query and index. Disambiguation using word senses is very important processing for improving performance by eliminating the irrelevant pages from the result. According to semantic categories of nouns which are used as index for retrieval, we build the word sense knowledge-base and categorize the web pages. It can improve the performance of retrieval system with user feedback deciding the query sense and information seeking behavior to web pages.

  • PDF