• 제목/요약/키워드: web test retrieval

검색결과 32건 처리시간 0.026초

사서들의 효율적인 인터넷 정보검색을 위한 WWW 탐색엔진 이용에 관한 연구 (A Study on the use of WWW search engines of librarians for the internet information retrieval)

  • 김성희
    • 정보기술과데이타베이스저널
    • /
    • 제6권1호
    • /
    • pp.27-46
    • /
    • 1999
  • This study was intended to find the use patterns of internet search engines of librarians and to measure the relationship between internet use frequency and the use behavior of internet search engines. The results showed that librarians use Web search engines for academic information retrieval and are satisfied with the search results. The major problems when librarians use search engines were that search engines retrieve many non-relevant documents. As a result of hypotheses test, the relationship between internet frequency and the preference of search engines was not significantly different. On the other hand, the hypotheses that internet frequency affects satisfaction of search results, recognition of importance of search engines, and the need of retraining of librarians for internet information retrieval were shown to be significant.

  • PDF

클라이언트 서버 환경에서 한글텍스트 검색을 위한 베스티매치 알고리즘의 구현 (An Implementation of Best Match Algorithm for Korean Text Retrieval in the Client/Server Environment)

    • 한국도서관정보학회지
    • /
    • 제32권1호
    • /
    • pp.249-260
    • /
    • 2001
  • This paper presents the application of best match search algorithm in the client/server system for natural language access to Web-based database. For this purpose, the procedures to process Korean word variants as well as to execute probabilistic weighting scheme have been implemented in the client/server system. The experimental runs have been done using a Korean test set which included documents, queries and relevance judgements. The experimental results demonstrate that best match retrieval with relevance information is better than the retrieval without it.

  • PDF

전자정부내 의미기반 기술 도입에 따른 기능 및 정책 연구 (Research on Function and Policy for e-Government System using Semantic Technology)

  • 고광섭;장영철;이창훈
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2007년도 춘계학술대회
    • /
    • pp.79-87
    • /
    • 2007
  • This paper aims to offer a solution based on semantic document classification to improve e-Government utilization and efficiency for people using their own information retrieval system and linguistic expression Generally, semantic document classification method is an approach that classifies documents based on the diverse relationships between keywords in a document without fully describing hierarchial concepts between keywords. Our approach considers the deep meanings within the context of the document and radically enhances the information retrieval performance. Concept Weight Document Classification(CoWDC) method, which goes beyond using exist ing keyword and simple thesaurus/ontology methods by fully considering the concept hierarchy of various concepts is proposed, experimented, and evaluated. With the recognition that in order to verify the superiority of the semantic retrieval technology through test results of the CoWDC and efficiently integrate it into the e-Government, creation of a thesaurus, management of the operating system, expansion of the knowledge base and improvements in search service and accuracy at the national level were needed.

  • PDF

전문용어기반 eDocument 관리 방안에 관한 연구 (A Study on eDocument Management Using Professional Terminologies)

  • 김명옥
    • 한국전자거래학회지
    • /
    • 제7권2호
    • /
    • pp.21-38
    • /
    • 2002
  • Document retrieval (DR) has been a serious issue for long in the field of Office Information Management. Nowadays, our daily work is becoming heavily dependent on the usage of information collected from the internet, and the DR methods on the Web has become an important issue which is studied more than any other topic by many researchers. The main purpose of this study is to develop a model to manage business documents by integrating three major methodologies used in the field of electronic library and information retrieval: Metadata, Thesaurus, and Index/Reversed Index. In addition, we have added a new concept of eDocument, which consists of metadata about unit documents and/or unit document themselves. eDocument is introduced as a way to utilize existing document sources. The core concepts and structures of the model were introduced, and the architecture of the eDocument management system has been proposed. Test (simulation) result of the model and the direction for the future studies were also mentioned.

  • PDF

이동 에이전트를 이용한 교육용 컨텐츠 공유 및 검색 시스템의 설계 및 구현 (Design and Implementation of Educational Contents Sharing and Retrieval System using Mobile Agent)

  • 이철환;한선관
    • 컴퓨터교육학회논문지
    • /
    • 제5권4호
    • /
    • pp.71-78
    • /
    • 2002
  • 교육시스템에서 분산된 교육 정보를 검색, 공유하는 새로운 기술로 이동 에이전트가 주목을 받고 있다. 효율적인 검색을 수행하기 위해 많은 양의 컨텐츠를 전송받는 대신 검색을 수행하는 에이전트를 직접 서버에 전달하는 방식을 이용한다. 본 연구에서는 이동 에이전트를 이용하여 교육용 사이트에 분산적으로 존재하는 질의응답 게시판과 유즈넷의 자료를 검색, 공유하는 시스템의 모델을 제안한다. 제안된 시스템의 효율성을 살펴보기 위해 기존의 검색 모델과의 비교 실험을 하였으며 교육용 서버로 에이전트가 이동함에 따라 네트워크 트래픽이 감소됨을 볼 수 있었다 또한 이동 에이전트가 검색 위치로 이동 후 게시판과 유즈넷의 자료 변환을 위한 최적 검색 시간이 단축되었다.

  • PDF

사무실 이벤트 검색을 위한 베이지안 네트워크 기반 사용자 선호도 모델링 (Modeling User Preference based on Bayesian Networks for Office Event Retrieval)

  • 임수정;박한샘;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권6호
    • /
    • pp.614-618
    • /
    • 2008
  • 인터넷 서비스의 급속한 발전으로 멀티미디어 데이타의 양이 크게 증가함에 따라, 이를 분석하여 유용한 정보를 얻기 위해 사용자 개개인에 초점을 맞춘 효율적인 검색기술이 필요하게 되었다. 하지만 최근 웹사이트에서 제공하는 사용자 모델링 서비스는 텍스트 기반 페이지 구성이나 추천 검색 등에만 국한되어 있는 단점이 있다. 본 논문에서는 사용자 모델링 기법을 동영상 검색에 적용하기 위해 사용자의 선호도를 베이지안 네트워크로 모델링하고, 추론된 확률 값을 검색에 반영하는 방법을 제안한다. 이를 위해 실제 연구실 환경 내에 존재하는 컨텍스트 정보를 정의하였고, 설치된 카메라로부터 얻어진 동영상이 포함하는 컨텍스트 정보를 텍스트의 형태로 주석을 달았다. 사용자로부터 입력받은 사용자 개인의 정보는 설계된 베이지안 네트워크 모델의 증거 값으로 사용되어, 그로부터 사용자의 선호도를 추론하도록 하였다. 베이지안 네트워크의 추론 결과로 얻어진 확률 값은 검색에 반영되어 각 사용자의 선호도에 맞는 검색 결과를 보여준다. 사용자 평가 결과, 제안하는 모델을 사용하여 선택된 결과의 만족도가 일반적인 검색의 결과에 비해 높음을 확인하였다.

공통기술표현포맷에 기반한 다매체자료의 검색효율 향상에 관한 연구 (A Study on the Improvement of Retrieval Efficiency Based on the CRFMD)

  • 박일종;정기태
    • 정보관리학회지
    • /
    • 제23권3호
    • /
    • pp.5-21
    • /
    • 2006
  • 최근 수년 동안 영상자료와 음성자료 분석에 대한 이론들이 텍스트자료 검색 시스템과 함께 사용되기 위해서 제안되어 왔으며 데이터 처리 속도의 급격한 향상과 함께 발전되어 왔다. 일반적 검색 방법들은 단지 텍스트만을 사용하지만 텍스트와 그림을 동시에 사용하는 검색 방법 또한 최근에 제안되어 왔다. 본 연구는 다매체자료의 공통기술표현포맷(CRFMD)이라는 이름으로 화상자료와 텍스트자료를 하나의 자료 구조로 통합하는 방법을 제안하고 있으며, 주어진 테스트자료에 대한 화상자료의 유사성 분석에서 텍스트와 그림의 형태소를 함께 사용하였을 때 현격히 개선되어 짐을 보여주고 있다. CRFMD는 의료문서 검색, WWW 검색, 박물관 소장품 검색과 같은 다양한 분야의 다매체자료 검색 및 처리에 응용될 수가 있을 것이다.

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

지식 검색 서비스 개선을 위한 문서의 적합도 및 신뢰도 분석 (Evaluation of the documents from the Web-based Question and Answer Service)

  • 박소연;이준호;전지운
    • 한국문헌정보학회지
    • /
    • 제40권2호
    • /
    • pp.299-314
    • /
    • 2006
  • 지식 검색 서비스가 국내 포탈들의 대표적인 서비스로 정착되었음에도 불구하고, 지금까지 지식 검색 서비스의 질적 향상을 위한 연구나 지식 검색 데이터베이스의 문서 평가에 대한 연구는 미흡한 실정이다. 이에 본 연구에서는 지식 검색 데이터베이스를 구성하는 지식 문서의 평가 기준을 제시하였다. 구체적으로 본 연구에서는 지식 문서를 구성하는 질문 제목, 질문 전체, 답변의 적합도 평가 기준을 제안하고, 답변의 신뢰도 평가 기준도 제시하였다. 이러한 평가 기준에 근거하여 본 연구에서는 지식 문서의 실제 평가를 수행하였다. 본 연구의 결과는 지식 검색 테스트 컬렉션 구축과 신뢰도 컬렉션 구축에 활용되어 궁극적으로 지식 검색 서비스 개선에 기여할 것으로 기대된다.

Web GIS를 위한 주기억 장치 기반 공간 색인 (Spatial Index based on Main Memory for Web CIS)

  • 김진덕;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.191-194
    • /
    • 2001
  • 최근 메모리 가격의 하락과 함께 주기억 장치 기반 데이터베이스 기술의 필요성이 대두되고 있다. 또한 불특정 다수가 인터넷 환경을 통해 이용하는 Web GIS(Geographical Information System)는 데이터의 변경보다는 분석을 위한 데이터 검색이 많으며 고속의 처리를 요구한다. 그러므로 Web GIS를 위한 데이터 저장 하부구조로서 디스크를 기반으로 하는 것보다 메모리를 기반으로 함이 바람직하다. 이 논문에서는 Web GIS에서 널리 사용되고 있는 다차원 공간 데이터를 주기억 장치에 보다 적은 저장 용량으로 표현할 수 있는 방법으로서 상대 좌표값과 MBR(Minimum Sounding Rectangle)의 크기를 이용한 데이터 표현법을 제안한다. 그리고 점 질의나 영역 질의를 간단한 방법으로 처리하는 메모리 기반 공간 색인 기법을 제안한다. 실험 결과 색인의 크기와 MBR 비교 연산의 횟수 측면에서 불균일 분포 데이터에서도 좋은 성능을 보임을 알 수 있다.

  • PDF