• 제목/요약/키워드: 정보검색 시스템

검색결과 5,081건 처리시간 0.035초

정보 검색에서 대량의 검색결과를 효과적으로 볼 수 있는 "결과 렌즈"의 설계 (A Design of "Results Lens" for Effective Viewing of Massive Results in Information Retrieval)

  • 강현규;홍성혁;김영섬;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-27
    • /
    • 1997
  • 정보검색 시스템이나 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에따라 간단한 조작만으로 원하는 정보를 얻어 낼 수 있는 도구의 개발이 점점 중요해지고 있다. 일반적으로 정보검색 시스템 (검색엔진 포함)의 검색되는 결과의 수는 정보검색 시스템 별로 다양하고 많은 시스템들이 검색을 못하거나 방대한 결과를 제시한다. 본 논문은 방대한 결과를 여러가지 다양한 view로 볼 수 있고 사용자의 피드백에 의해 정보를 재 검색함으로서 검색하고자 하는 문서를 보다 정확하게 검색할 수 있도록 도와주는 결과 렌즈 (Results Lens: RL)를 제안한다. 본 논문에서 제시한 결과 렌즈는 다양한 view로의 결과를 수정(refine) 할 수 있으며 웹을 기반으로하는 플러그인(plug-in)으로 제공함으로써 유용성 및 확장성이 크다.

  • PDF

검색 효과성에 영향을 미치는 시맨틱 검색 시스템 평가요인에 관한 실증적 연구

  • 한동일;홍일유
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.52-57
    • /
    • 2007
  • 본 연구는 검색의 궁극적인 니즈충족에 영향을 미치는 시맨틱 검색 시스템 품질 평가요인에 관한 실증적 연구이다. 시맨틱 검색 시스템 품질 평가요인을 위한 연구모델은 DeLone & McLean(2003)의 정보시스템 성공 모델을 기반하였다. 연구 결과, 상호작용성이 지식 충족도에, 정보의 재현성과 정보의 최신성이 각각 지식 충족도와 사용자 만족도에, 그리고 신뢰성이 사용자 만족도에 유의적인 영향을 보여주었으며, 또한 지식 충족도가 사용자 만족도에 영향을 미치는 것으로 나타났다. 본 연구에서 제시한 모델은 시맨틱 검색 시스템 성공측정을 위한 유용한 평가 프레임워크로 사용될 수 있을 것으로 기대된다.

  • PDF

CORBA/JAVA를 이용한 분산 서지정보 검색시스템 개발에 관한 연구 (A Study on the Development of Distributed Bibliographic Information Search System Using CORBA and JAVA)

  • 유재옥;박우창
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.7-20
    • /
    • 2000
  • 본 연구는 지리적으로 분산되어 있는 분산서버상태를 유지하면서 또한 분산되어 있는 데이터베이스 검색을 허용하는 통합 서지정보 검색시스템의 개발가능성을 모색하고자 하였다. 분산되어 있는 서지정보 데이터베이스와 검색시스템을 통합하기 위한 미들웨어로서 CORBA를 사용하였으며 검색시의 부하를 클라이언트에게 분산시키기 위해 JAVA를 채택하였다. 덕성여자대학교 도서관 정보검색시스템인 DISCOVER를 두 분산서버에 설치하고, 두 분산 데이터베이스를 대상으로 통합 검색할 수 있는 통합 서지정보 검색시스템 구축을 실험하였다. 시스템 구현결과 통합 인터페이스를 사용한 두 분산 서버에 대한 검색요청은 성공적으로 수행되었으며, 클라이언트는 검색결과를 성공적으로 종합하였다.

  • PDF

한글 인터넷 정보검색 시스템의 기술방향 (The State of the Art in Internet Information Retrieval System)

  • 이수현;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.59-62
    • /
    • 1996
  • 빠르고 다양하게 늘어나는 정보 더미 속에서 사용자가 원하는 정보를 쉽고 정확하게 찾아주는 방법이 바로 정보 검색이다. 최근에는 인터넷을 이용하여 세계 각처에 흩어져 있는 데이터를 찾거나 웹 홈 폐이지를 찾아 주는 인터넷 정보 검색 프로그램들이 각광을 받고 있다. 본 논문에서는 현재 국내외에서 상용되고 있는 인터넷 정보검색 시스템의 검색 방법에 따른 특성을 살펴보고 국내에서 개발된 한국어 정보검색 시스템과 외국에서 개발된 정보검색 시스템과의 기능을 비교함으로써, 한국어 정보검색 시스템의 처리 항목을 제시한다.

  • PDF

퍼지관계곱을 이용한 정보검색시스템의 성능 개선 (Performance Improvement of Information Retrieval System by means of Fuzzy Relational Product)

  • 김창민;김용기
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.242-251
    • /
    • 2000
  • 퍼지관계 개념을 응용한 BK-퍼지정보검색기법은 형태론에 입각하는 기존의 정보검색기법과는 달리 문서와 용어의 상대적 의미에 근거한 정보검색 기법이다. 그러나 BK-퍼지정보검색기법은 높은 시간복잡도(time complexity)의 검색 연산을 내재하고 있어 실제 대용량의 정보 검색은 사실상 불가능하다. 본 논문에서는 BK-퍼지검색정보모델의 시간복잡도를 낮추기 위해, 축소용어집합(reduced term set)을 이용한 개선된 BK-퍼지정보검색모델(A-FIRM)을 제안한다. 개선된 BK-FIRM은 시스템 처리시간과 신뢰도 간 상층점(trade-off)을 제공한다. 축소용어집합은 용어집합의 부분집합으로서 검색결과의 신뢰도와 밀접한 관계를 가진다. 동일한 크기의 축소용어집합이 주어질 때, 보다 적절한 용어들로 구성된 축소용어집합이 보다 나은 검색 신뢰도를 이끈다. 따라서 보다 적절한 축소용어집합 구성을 위한 축소용어집합 추출방법이 요구된다. 본 논문에서는 축소용어집합 추출방법을 크게 무작위 추출, 규칙에 의한 추출, 인간에 의한 직관적 추출 방법으로 구분하고 검색결과의 신뢰도 변화 형태를 분석한다.

  • PDF

미리내 검색시스템의 명사추출 시스템 (Noun Extraction System in Information retrieval System of "Mirine")

  • 김영관;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.89-91
    • /
    • 1999
  • 이 논문은 한국어 정보검색 시스템 "미리내"의 내부 모듈인 색인어 추출 시스템의 성능 평가에 관한 내용이다. 성능 평가를 위해서 99년 ETRI에서 실시한 "형태소분석기 및 태거 비교 분석대회(MATEC99)"의 시험어절을 사용하였다. 정보검색 시스템 "미리내"는 한국어 정보검색을 위해 부산대학교에서 개발한 시스템이다. 한국어 형태소분석 및 태거 대회(MATEC99)를 위해 미리내 검색엔진의 색인어 추출 모듈을 일부 수정하여 명사를 추출하였다. 명사추출기이든 형태소분석기이든 응용프로그램의 특성에 맞춰져서 동작한다. 정보검색의 하위 모듈인 색인어 추출 시스템은 정보검색을 위해 변형된 결과를 출력하므로 성능 비교를 위해 일부 모듈의 수정이 불가피하였다. ETRI에서 실시한 MATEC99는 지금까지 객관적인 평가 기준이 없었던 한국어 형태소분석기, 태거, 명사추출기의 표준화에 중요한 역할을 하였다.

  • PDF

한국어 정보검색 시스템을 위한 다양한 적합성 피드백 방법의 실험 (Relevance Feedback Experiments for Korean Information Retrieval Systems)

  • 박수현;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.682-691
    • /
    • 1999
  • 정보검색 시스템의 검색 효율 향상을 위해서 다양한 적합성 피드백 방법이 개발되었다. 그러나 한국어 정보검색 시스템을 위한 적합성 피드백에 대한 연구는 거의 이루어지지 않은 실정이다. 이 논문에서는 기존에 개발된 적합성 피드백 방법을 한국어 정보 시스템에 적용하여 검색 효율을 비교하고, 새로운 적합성 피드백 방법을 개발 적용하여 기존의 방법들과 검색 효율을 비교분석하였다. 적합성 피드백은 원질의문을 확장할 단어 선택과 선택된 단어 가중치 부여로 이루어진다. 원질의문이 입력되면 검색된 적합문서에서 원질의문을 단어와 밀접한 관계가 있는 단어를 선택하기 위하여 가중치를 부가한후, 원질의문에 추가하여 질의문을 확장한다. 이 논문에서는 원질의문 확장을 위한 단어 선택과 단어 가중치 부여를 위해 3가지 값을 사용한다. 첫째, TF는 적합문서 내의 단어 빈도의 총합이다. 둘째, idf는 해당 문서집단의 역문헌빈도이다. 셋째, r/R은 검색된 적합문서 중에서 해당단어가 있는 적합문서의 비율을 나타낸다. TF와 idf는 정보검색 시스템에서 일반적으로 사용되고있는 값이고 r/R은 이 논문에서 제안한 새로운 값이다.

병렬 정보검색 시스템의 순차적인 검색엔진 알고리즘의 병렬화를 위한 연구 (A Study for Parallelizing Sequential Algorithms of Search Engine in Parallel Information Retrieval System)

  • 김석영;박미영;박혁로;정인상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2007
  • 대규모 데이터를 효율적으로 검색하기 위한 병렬 정보검색 시스템에서는 하드웨어 확장으로 인한 병렬화로 시스템 전체의 작업 처리량을 증가시켰다. 그러나 병렬 시스템 상에서 수행되는 검색엔진의 알고리즘들은 여전히 순차적으로 수행되기 때문에, 사용자의 개별적인 질의처리 시간은 단축되지 않는다. 본 연구는 검색엔진의 병렬화를 위하여 사용자 질의처리 과정과 역색인 파일처리 과정의 순차 알고리즘들을 조사하여 병렬화의 필요성과 가능성을 평가한다. 이러한 평가는 병렬 정보검색 시스템에서 수행되는 순차 알고리즘들의 효과적이고 체계적인 병렬화를 도모하고, 보다 효율적인 병렬 정보검색 시스템의 구축을 가능하게 한다.

  • PDF

오디세우스/parallel-OOSQL: 오디세우스 객체 관계형 데이터베이스 관리 시스템을 사용한 병렬 정보 검색 시스템 (ODYSSEUS/Parallel-OOSQL: A Parallel Information Retrieval System Using the Odysseus Object-Relational Database Management System)

  • 류재준;이재길;이민재;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2002
  • 인터넷의 성장과 함께 전자적인 형태로 표현되는 정보의 양이 급격하게 증가함에 따라, 문서를 병렬적으로 검색하는 병렬 정보 검색이 많은 양의 문서에 대한 빠른 검색을 지원하는 것에 있어 더욱 중요한 역활을 하고 있다. 병렬 정보 검색 시스템을 구현하기 위해서는 역 색인을 분활하고 분활된 역 색인을 병렬적으로 검색하는 것이 필요하다 역 색인을 분활하는 방법으로는 다음과 같은 두 가지 방법이 있다: 1) 문서 식별자를 기반으로 하는 분활 방법과 2) 키워드 식별자를 기반으로 하는 분활 방법. 그러나 각 방법은 단점들을 가지고 있다. 본 논문에서는 정보 검색 기능이 밀결합된 데이터베이스 관리 시스템인 오디세우스를 사용하여 병렬 정보 검색 시스템을 설계하고 구현한다. 첫째로, 기존의 역 색인 분할 방법을 분석하고 각 분말 방법의 단점들을 보완할 수 있는 혼합 분활 방법을 제안한다. 둘째로, 많은 양의 문서에 대해 성능 저하의 원인이 되는 대형 포스팅을 분할 하는 방법을 제안한다. 마지막으로 제안된 시스템의 유용성을 보이기 위해 실험을 수행한다. 예제 데이터베이스로서는 이백만 건의 웹 페이지를 사용한다. 실험 결과, 질의 저리 시간이 역 색인 분말의 블록의 개수에 근사하게 비례하여 줄어들고 시스템이 좋은 확장성을 가짐을 보인다.

  • PDF

이용자기반 접근의 개념 변화와 정보검색시스템 설계요소의 도출 (A Change of Concept of User-Centered Approach and Derivation of Information Retrieval System Design Factors)

  • 노진구
    • 한국도서관정보학회지
    • /
    • 제31권3호
    • /
    • pp.89-113
    • /
    • 2000
  • 본 연구는 시스템기반의 정보검색시스템에서 이용자기반의 정보검색시스템으로의 페러다임이 이동을 개관하고 이용자기반 정보검색시스템의 기본 개념을 고찰하였다. 이어서 디지털 환경에서의 다양한 정보서비스 모델을 통하여‘이용자기반’에 대한 개념의 변화를 살펴보고 디지털 환경에 적합한 ‘이용자기반’개념을 새롭게 정립하였다. 또한 정보검색시스템 설계에 영향을 미치는 요소들에 관한 기존 연구를 토대로 이용자기반 정보검색시스템의 설계에 고려되어야 할 6가지의 이용자기반 정보검색시스템의 설계요소를 도출하였다.

  • PDF