• 제목/요약/키워드: Web Search Engine

검색결과 249건 처리시간 0.025초

정보검색에서 웹마이닝을 이용한 동적인 질의확장에 관한 연구 (A Study on Dynamic Query Expansion Using Web Mining in Information Retrieval)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제11권2호
    • /
    • pp.227-237
    • /
    • 2004
  • While the WWW offers an incredibly rich base of information, organized as a hypertext, it does not provide a uniform and efficient way to retrieve specific information. When one tries to find information entering several query terms into a search engine, the highly-ranked pages in the result usually contain many irrelevant or useless pages. The problem is that single-term queries do not contain sufficient information to specify exactly which web pages are needed by the user. The purpose of this paper is to describe the employment of association rules in data mining for developing networks and computing associative coefficient among the terms. And this paper shows how the dynamic query expansion and/or reduction can be performed in information retrieval.

  • PDF

후처리 웹 문서 클러스터링 알고리즘 (A Post Web Document Clustering Algorithm)

  • 임영희
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.7-16
    • /
    • 2002
  • 웹 검색 엔진의 검색 결과를 클러스터링하는 후처리 클러스터링 알고리즘은 그 특성상 일반적인 클러스터링 알고리즘과는 다른 요구조건을 갖는다. 본 논문에서는 이러한 후처리 클러스터링 알고리즘의 요구조건들을 최대한 만족하는 새로운 클러스터링 알고리즘을 제안하고자 한다. 제안된 Concept ART는 문서 클러스터링에 있어 여러 가지 장점을 갖는 개념 벡터와 실시간 클러스터링 알고리즘으로 알려진 Fuzzy ART를 결합한 형태로써, 후처리 클러스터링뿐 아니라 범용의 클러스터링 알고리즘으로도 응용이 가능하다.

아파트 정보화를 위한 시스템 개발 -개발 시스템의 적용- (The Development of Apartment Informationalization System)

  • 김한수
    • 한국주거학회논문집
    • /
    • 제12권3호
    • /
    • pp.85-95
    • /
    • 2001
  • This study was conducted to develop the Apartment Information System. This integrated information system is designed to provide a large number of users with the convenient, economical, and safe life in the apartment complex. The characteristics of this system are as follows; 1) The system was developed by CAD technology using 2D and 3D methods with Web base. 2) This system has 2-Tire structures which are able to embody the geographic information on the Web base without special Spatial Engine. 3) Since the spatial data applied to this system is a vector file format, the speed of electrical transmission is fast and it makes possible to search spatially for the client method. The results of this study may contribute to make use of the information system for apartment complex as follows; 1) This system can be used together by the communities of apartment residence, maintenance company and construction company. 2) Also this system can help residence to communicate sharing information and can support the apartment management with open information and clarity. Expecially, the practical data gathering was made for this study only.

  • PDF

웹마이닝을 위한 퍼지 클러스터링 알고리즘 (Fuzzy Clustering Algorithm for Web-mining)

  • 임영희;송지영;박대희
    • 한국지능시스템학회논문지
    • /
    • 제12권3호
    • /
    • pp.219-227
    • /
    • 2002
  • 웹 검색 엔진의 검색 결과를 클러스터링하는 후처리 클러스터링 알고리즘은 그 특성상 일반적인 클러스터링 알고리즘과는 다른 요구조건을 갖는다. 본 논문에서는 이러한 후처리 클러스터링 알고리즘의 요구조건들을 최대한 만족하는 새로운 클러스터링 알고리즘을 제안하고자 한다. 제안된 Fuzzy Concept ART는 무서 클러스터링에 있어 여러 가지 장점을 갖는 개념 벡터와 실시간 클러스터링 알고리즘으로 알려진 Fuzzy ART를 퍼지이론에 기반하여 결합한 형태로써, 후처리 클러스터링뿐 아니라 범용의 클러스터링 알고리즘으로도 응용이 가능하다.

질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상 (Improving Performance of Web Search Engine using Query Word Senses and User Feedback)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제8권2호
    • /
    • pp.280-285
    • /
    • 2007
  • 본 논문에서는 웹 정보검색 시스템의 사용자 질의어와 색인에 기반한 검색 과정에서 나타나는 중의성을 해소하기 위해 질의어 의미정보와 사용자 피드백을 사용하여 검색 성능을 향상시키기는 방법을 제안한다. 의미 정보를 이용한 질의어 중의성 해소 과정은 결과 문서집합에서 의미적으로 무관한 많은 문서들을 배제함으로써 검색 정확도를 크게 높일 수 있는 매우 중요한 처리 과정이다. 검색의 색인어가 되는 명사 중심의 의미범주 분류를 이용하여 의미정보 지식베이스를 구축하고, 웹 문서들을 색인어와 사용되는 의미범주로 분류한다. 사용자의 질의 의미 선택과 정답문서에 대한 참조 행위를 피드백 정보로 웹 페이지의 순위 결정에 반영하여 검색시스템의 성능을 향상시킬 수 있다.

  • PDF

Construction of web-based nutrition education contents and searching engine for usage of healthy menu of children

  • Hong, Soon-Myung;Lee, Tae-Kyong;Chung, Hea-Jung;Park, Hye-Kyung;Lee, Eun-Ju;Nam, Hye-Seon;Jung, Soon-Im;Cho, Jee-Ye;Lee, Jin-Hee;Kim, Gon;Kim, Min-Chan
    • Nutrition Research and Practice
    • /
    • 제2권2호
    • /
    • pp.114-120
    • /
    • 2008
  • A diet habit, which is developed in childhood, lasts for a life time. In this sense, nutrition education and early exposure to healthy menus in childhood is important. Children these days have easy access to the internet. Thus, a web-based nutrition education program for children is an effective tool for nutrition education of children. This site provides the material of the nutrition education for children with characters which are personified nutrients. The 151 menus are stored in the site together with video script of the cooking process. The menus are classified by the criteria based on age, menu type and the ethnic origin of the menu. The site provides a search function. There are three kinds of search conditions which are key words, menu type and "between" expression of nutrients such as calorie and other nutrients. The site is developed with the operating system Windows 2003 Server, the web server ZEUS 5, development language JSP, and database management system Oracle 10 g.

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.

온톨로지 기반의 문화·관광지 검색 어플리케이션 구현 (Ontology-based Culture·Tourist Attraction Search Application)

  • 황태원;서정희;박흥복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.772-774
    • /
    • 2017
  • 현재 지역 문화 관광에 대한 개괄적인 단순 검색들은 많이 있으나, 온톨로지 기술을 적용한 체계적인 정보검색은 미약한 수준이다. 기존의 검색방법인 키워드 중심의 검색은 사용자가 원하는 의도와는 다른 검색 결과를 도출한다. 반면에 온톨로지를 이용한 시맨틱 검색은 추출한 웹 데이터들을 온톨로지로 구축하여 단어와 단어 간의 관계를 만들어 검색어와 관련된 정보를 보여준다. 따라서 관광객들이 해당 지역의 문화 관광지에 대해 검색 할 때, 검색결과에 의미 연관성을 포함하는 내용을 제공한다면 온톨로지를 통해 해당 지역의 문화 관광지, 이동수단, 연계된 장소 혹은 관련 행사에 대한 정보 등을 보다 쉽게 파악할 수 있을 것이다. 본 논문에서는 사용자에게 정확하고 신뢰성 있는 정보를 제공하기 위해 기존의 내부 데이터베이스에만 의존하던 검색 시스템을 확장하여 공공기관의 데이터베이스를 활용한 문화 관광지에 특화된 온톨로지 기반의 검색 시스템을 모바일 애플리케이션을 이용하여 제안하고자 한다. 이러한 효율적인 온톨로지의 구성으로 사용자에게 적합한 정보를 빠르고 정확하게 제공할 수 있다.

  • PDF

KUGI: A Database and Search System for Korean Unigene and Pathway Information

  • Yang, Jin-Ok;Hahn, Yoon-Soo;Kim, Nam-Soon;Yu, Ung-Sik;Woo, Hyun-Goo;Chu, In-Sun;Kim, Yong-Sung;Yoo, Hyang-Sook;Kim, Sang-Soo
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.407-411
    • /
    • 2005
  • KUGI (Korean UniGene Information) database contains the annotation information of the cDNA sequences obtained from the disease samples prevalent in Korean. A total of about 157,000 5'-EST high throughput sequences collected from cDNA libraries of stomach, liver, and some cancer tissues or established cell lines from Korean patients were clustered to about 35,000 contigs. From each cluster a representative clone having the longest high quality sequence or the start codon was selected. We stored the sequences of the representative clones and the clustered contigs in the KUGI database together with their information analyzed by running Blast against RefSeq, human mRNA, and UniGene databases from NCBI. We provide a web-based search engine fur the KUGI database using two types of user interfaces: attribute-based search and similarity search of the sequences. For attribute-based search, we use DBMS technology while we use BLAST that supports various similarity search options. The search system allows not only multiple queries, but also various query types. The results are as follows: 1) information of clones and libraries, 2) accession keys, location on genome, gene ontology, and pathways to public databases, 3) links to external programs, and 4) sequence information of contig and 5'-end of clones. We believe that the KUGI database and search system may provide very useful information that can be used in the study for elucidating the causes of the disease that are prevalent in Korean.

  • PDF

웹 탐색 성능 향상을 위한 강화학습 이용과 기준 페이지 선택 기법 (The Use of Reinforcement Learning and The Reference Page Selection Method to improve Web Spidering Performance)

  • 이기철;이선애
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.331-340
    • /
    • 2002
  • 웹의 세계는 하루가 다르게 확장되고 있다. 이에 따라, 지능형 정보추출 기능이 없다면 우리는 넘쳐나는 데이터 앞에서 더욱 무기력해 질 수밖에 없다. 범용 탐색 엔진을 위한 기존의 웹 검색 기법은 특정 영역이나 특정 키워드에만 집중해야하는 특정 검색 엔진에는 너무 느린 경향이 있다. 본 논문에서는 웹 검색 능력을 개선하는 새 모델을 제시하고 실험하였다. 특정 영역과 관련된 초기의 관련 웹 페이지 집합에서 적절한 웹 페이지들을 선택하는 문제는 웹 검색 속도를 향상시키기 위해 매우 중요할 수 있다. 기준 웹 페이지 선택 기법 DOPS는 선택된 웹 페이지들이 가능한 한 직교성을 갖도록 동적으로 웹 페이지를 선택한다. 또한 새로 정의된 메져를 이용하여 적합한 기준 페이지들의 수도 결정해줄 수 있다. 매우 특화된 영역에 대한 실험을 통해서도, 본 방법은 거의 전문가 수준에 가까이 동작하였다. 전문가들이 초대형 초기 페이지 집합에 대해 일할 수 없다는 점과 그들도 기준 페이지 수의 최적치를 결정하기에 어려움을 느낀 다는 점을 고려하면, 본 방법은 매우 유망하다 할 수 있다. 또한 웹 환경에 강화학습도 적용하도록 하였고, DOPS에 기반을 둔 강화학습 실험을 통해 본 방법이 하이퍼링크 수나 시간 면에서 매우 양호한 결과를 보임을 알 수 있었다.

  • PDF