• Title/Summary/Keyword: 확장검색어

Search Result 200, Processing Time 0.023 seconds

Developing an Interactive User Interface System for Adaptive Semantic Information Retrieval (적응적인 시맨틱 정보 추출을 위한 대화형 사용자 질의 인터페이스 개발)

  • 조영현;손진현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.481-483
    • /
    • 2004
  • 기존의 웹 서비스는 않은 애플리케이션으로 개발되었고, 다양한 분야에서 잘 활용되어 왔다. 하지만, HTML을 기반 한 기존의 웹은 더 이상의 기능적 성장은 어렵게 되어 기존 웹 서비스의 성장에도 제악을 가져왔다. 이런 문제점을 극복하기 위해 시맨틱 웹이 대두되었다. 시맨틱 웹은 자원의 공유, 통합, 자동생성의 특징을 가진 기존 웹의 확장이다. 최근 기존의 웹 서비스는 시맨틱 웹의 이런 특성들을 받아들이려는 시도가 있었다. DAML-S가 대표적인 예이다. 본 논문은 기존 웹 서비스 검색처럼 일반 사용자도 편리하게 시맨틱 웹 서비스를 검색할 수 있도록 대화형 사용자 질의 인터페이스를 제시한다. 또, 사용자가 선택한 질의가 시맨틱 질의어(ROQL)로 자동 변환할 수 있는 시맨틱 질의어 자동 생성기 모듈을 제시한다.

  • PDF

Construction of an Information Retrieval Test Collection and its Validation (정보검색 테스트 컬렉션 구축 및 유효성 평가)

  • Myaeng, Sung-Hyon;Jang, Dong-Hyun;Song, Sa-Kwang;Kim, Ji-Young;Lee, Seok-Hoon;Lee, Joon-Ho;Lee, Eung-Bong;Seo, Jeong-Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.20-27
    • /
    • 1999
  • 본 논문은 정보검색 시스템 평가에 필요한 한국어 문서집합 구축과 적합 문서리스트(relevance file) 생성에 관한 기법을 문서 수집과정부터 평가작업까지 상세히 기술한다. 문서집합은 일반, 사회과학, 과학기술 분야에서 각각 4만 건으로 영역별로 균등히 구축하였으며, 질의 집합도 각 분야에 대해 10개씩 할당하여 총 30개의 질의 집합을 생성하였다. 또한 질의집합은 사용자의 수준을 고려하여 일반인, 영역 전문가, 중고등학생에 해당하는 질의를 생성함으로써 특정 영역, 특정 사용자에 독립적인 문서집합 및 질의집합을 구축하고자 하였다. 생성된 질의를 사용하여 여러 검색기에서 총 38가지의 방법으로 검색을 실시하였으며, 검색결과를 바탕으로 각 질의당 500개의 문서로 이루어진 후보 결과집합을 만든 후 이들을 대상으로 각 질의에 대한 문서의 적합성 평가를 실시하였다. 이 과정을 통해 생성된 적합문서 집합의 유효성을 보이기 위해 후보 문서 리스트 이외의 문서집합에서 적합문서가 존재할 가능성을 확인하였는데 그 방법으로 후보 리스트의 개수 증가에 따른 적합문서 개수의 변동 추세를 알아보았다. 현재 질의 개수를 50개로 확장하는 방향으로 테스트 컬렉션 구축에 대한 연구를 진행 중에 있으며, 일본 NACSIS와의 질의 교환을 통해 질의 개수를 확장할 뿐만 아니라 일본어 질의 또는 한국어 질의에 대해서 한국어 문서, 일본어 문서를 각각 검색할 수 있는 한일 교차언어 문서검색 환경을 구축하고 있다.

  • PDF

Fuzzy based Thesaurus Construction Supporting Component Retrieval (컴포넌트 검색을 지원하는 퍼지 기반 시소러스 구축)

  • Kim, Gui-Jung;Han, Jung-Soo;Song, Young-Jae
    • The KIPS Transactions:PartD
    • /
    • v.10D no.5
    • /
    • pp.753-762
    • /
    • 2003
  • Many Methodologies have proposed for component retrieval. Among them, thesaurus concept has introduced for similar component retrieval. This paper classified classes by concept according to inheritance relation for efficient retrieval of component, and applied fuzzy logic to thesaurus method and constructed object-oriented thesaurus. Proposed method could express category between concepts automatically, and calculate fuzzy degree between classes by comparing matching and mismatching degree to each class and category and construct thesaurus. Component retrieval is that using classes of component, candidate components are retrieved according to priority order using fuzzy similarity. Also, we improved retrieval performance by thesaurus greatly, setting critical of most suitable through simulation.

A Extension of XQuery for Integrated Geographic Information Retrieval of GML (GML 문서의 통합 지리 정보 검색을 위한 XQuery의 확장)

  • 안영수;박순영;정원일;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.617-619
    • /
    • 2003
  • GML(Geography Markup Language)은 XML(extensible Markup Language)의 장점을 이용하여 지리 데이터의 저장과 전송을 위해 OGC(Open GIS Consortium)에서 제안되었다 이러한 GML은 웹 환경의 발전에 따라 지리 정보 통합을 위해 널리 이용되고 있으나. GML 문서에 대한 지리 데이터 검색 기술은 미흡하다. 최근 W3C(World Wide Web Consortium)에서는 XML 문서로부터 데이터를 추출하기 위한 표준 질의어로 XQuery를 추천하기 위한 작업 초안(working draft) 상태에 있다. 그러나 이러한 XML 질의어는 지리 정보의 추출에 대한 고려는 하고 있지 않다. 따라서 본 논문에서는 지리 정보를 포함하고 있는 GML 문서를 기반으로 지리 정보를 검색. 추출할 수 있는 GML Query language인 GQuery를 제안하고자 한다. 본 논문의 GQuery는 서로 이질적인 공간 데이터베이스의 데이터를 통할하여. 통합된 문서내의 지리정보를 추출하기 위한 사용자 인터페이스로 이용할 수 있다.

  • PDF

Ontology-based User Customized Search Service Considering User Intention (온톨로지 기반의 사용자 의도를 고려한 맞춤형 검색 서비스)

  • Kim, Sukyoung;Kim, Gunwoo
    • Journal of Intelligence and Information Systems
    • /
    • v.18 no.4
    • /
    • pp.129-143
    • /
    • 2012
  • Recently, the rapid progress of a number of standardized web technologies and the proliferation of web users in the world bring an explosive increase of producing and consuming information documents on the web. In addition, most companies have produced, shared, and managed a huge number of information documents that are needed to perform their businesses. They also have discretionally raked, stored and managed a number of web documents published on the web for their business. Along with this increase of information documents that should be managed in the companies, the need of a solution to locate information documents more accurately among a huge number of information sources have increased. In order to satisfy the need of accurate search, the market size of search engine solution market is becoming increasingly expended. The most important functionality among much functionality provided by search engine is to locate accurate information documents from a huge information sources. The major metric to evaluate the accuracy of search engine is relevance that consists of two measures, precision and recall. Precision is thought of as a measure of exactness, that is, what percentage of information considered as true answer are actually such, whereas recall is a measure of completeness, that is, what percentage of true answer are retrieved as such. These two measures can be used differently according to the applied domain. If we need to exhaustively search information such as patent documents and research papers, it is better to increase the recall. On the other hand, when the amount of information is small scale, it is better to increase precision. Most of existing web search engines typically uses a keyword search method that returns web documents including keywords which correspond to search words entered by a user. This method has a virtue of locating all web documents quickly, even though many search words are inputted. However, this method has a fundamental imitation of not considering search intention of a user, thereby retrieving irrelevant results as well as relevant ones. Thus, it takes additional time and effort to set relevant ones out from all results returned by a search engine. That is, keyword search method can increase recall, while it is difficult to locate web documents which a user actually want to find because it does not provide a means of understanding the intention of a user and reflecting it to a progress of searching information. Thus, this research suggests a new method of combining ontology-based search solution with core search functionalities provided by existing search engine solutions. The method enables a search engine to provide optimal search results by inferenceing the search intention of a user. To that end, we build an ontology which contains concepts and relationships among them in a specific domain. The ontology is used to inference synonyms of a set of search keywords inputted by a user, thereby making the search intention of the user reflected into the progress of searching information more actively compared to existing search engines. Based on the proposed method we implement a prototype search system and test the system in the patent domain where we experiment on searching relevant documents associated with a patent. The experiment shows that our system increases the both recall and precision in accuracy and augments the search productivity by using improved user interface that enables a user to interact with our search system effectively. In the future research, we will study a means of validating the better performance of our prototype system by comparing other search engine solution and will extend the applied domain into other domains for searching information such as portal.

Design of a Extended Fuzzy Information Retrieval System using User한s Preference (사용자의 선호도를 반영한 확장 퍼지 정보 검색 시스템의 설계)

  • 김대원;이광형
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.4
    • /
    • pp.299-303
    • /
    • 2000
  • The goal of the information retrieval system is to search the docments which the user wants to obtain in fast and effiecient way. Many information retrieval models, including boolean models, vector models and fuzzy models based on the trasitional fuzzy set theory, have been proposed to achieve these kinds of objectives. However, the previous models have a limitation on the fact that they do not consider the users' preference in the search of documents. In this paper, we proposed a new extenced fuzzy information retrieval System which can handle the shortcomings of the previous ones. In the proposed model, a new similarity measure was applied in order to calculate the degree among documents, which can expliot the users' preference.

  • PDF

The System of customized Travel Information based on Ontology (온톨로지를 이용한 맞춤형 여행정보 시스템)

  • Cho Mi-Young;Choi Chang;Kim Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF

Thesaurus Construction Using Word Association (단어의 의미연상을 이용한 시소러스 설계)

  • Han Seung-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2006.08a
    • /
    • pp.233-238
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 작성해봄으로써 탐색 시소러스 구축에 있어 단어연상검사법의 적용가능성을 살펴보았다. 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 통제어휘를 비교 분석하였다. 실험 및 분석결과, 단어연상검사를 이용하면 다양한 연관관계 용어들을 시소러스에 포함시킬 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 단어의 의미연상을 이용하여 구축된 탐색 시소러스는 정보검색환경에서 질의확장에 응용될 수 있다.

  • PDF

Intelligent Information Retrieval Using Interactive Query Processing Agent (대화형 질의 처리 에이전트를 이용한 지능형 정보검색)

  • 이현영;이기오;한용기
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.12
    • /
    • pp.901-910
    • /
    • 2003
  • Generally, most commercial retrieval engines adopt boolean query as user's query type. Although boolean query is useful to retrieval engines that need fast retrieval, it is not easy for user to express his demands with boolean operators. So, many researches have been studied for decades about information retrieval systems using natural language query that is convenient for user. To retrieve documents that are suitable for user's demands, they have to express their demands correctly, So, this thesis proposes interactive query process agent using natural language. This agent expresses demands concrete through gradual interaction with user, When users input a natural language Query, this agent analyzes the query and generates boolean query by selecting proper keyword and feedbacks the state of the keyword selected. If the keyword is a synonymy or a polysemy, the agent expands or limits the keyword through interaction with user. It makes user express demands more concrete and improve system performance. So, this agent can improve the precision of Information Retrieval.

  • PDF

Mashup for Instant and Simple Search using OpenAPIs (OpenAPI를 이용하여 간결함과 즉시성을 가진 검색 매쉬업)

  • Hwang, Ki-Tae
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.2
    • /
    • pp.41-49
    • /
    • 2011
  • This paper introduces a new search model which can retrieve information instantly and easily about a given search word on Internet and control search spaces diversely. In the existing web searches, because the user has to stop his work, run web browsers, connect to special internet sites, and type the search word by keyboard. it is a long way and not a simple way. Also the search result is too much. The user suffers difficulties of multiple searches for different categories such as dictionary, image, video clips, etc. The software implemented in this paper enables for the user to select search word simply at any documents on the screen and make search started by simply pressing CRTL key and left button of the mouse simultaneously. The software is a mash up style using the Open API which is provided by a web site and can be freely available in any other sites. By calling different Open APIs of several web sites, the mash-up software can integrate search functions of many different sites. We evaluate that the software implemented in this paper will be a good reference of mash-up as one with characteristics of easy and instant search, simple result, diversity of search category, and scalability of search functions.