• 제목/요약/키워드: Solr

검색결과 10건 처리시간 0.03초

사용자 중심 검색 시스템 설계 및 구현 (Search for a user-centered system design and implementation)

  • 김아용;이용우;배근호;정대진;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.619-621
    • /
    • 2014
  • 최근 IT기술의 발전과 더불어 정보화에 대한 기술들이 이슈화 되고 있다. 웹을 사용하는 사용자들을 개인들이 필요한 정보를 찾는데 있어 검색데이터를 선별하는 방법에 대해 많은 어려움을 겪고 있다. 본 논문에서는 사용자 중심 검색 시스템을 제안한다. 제안하는 검색 시스템은 아파치 프로젝트인 Lucene과 Hadoop의 MapReduce, HDFS, Nutch, Solr를 활용하여 설계 및 구현한다. 이는 웹 검색을 이용하고자 하는 사용자의 의도에 따라 데이터를 수집하고 색인하여 원하는 정보를 제공하는 검색분야에 활용될 것이다.

  • PDF

Apache-Solr를 이용한 KSCD 학술정보 통합관리시스템 고도화 (Enhancement of KSCD Information Integrated Management System using Apache-Solr)

  • 모은수;김병규;김정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.4-6
    • /
    • 2017
  • 학술정보 통합관리시스템 OCEAN(Online Collaborator for society & Association Network of KISTI)은 학회정보화지원사업의 일환으로 학술정보를 통합관리하기 위해 2007년부터 사용된 통합관리 시스템이다. 구 OCEAN은 Struts2 프레임워크 기반으로 설계되어, 노후화된 프레임워크는 끊임없는 유지보수에도 급변하는 정보기술 환경에 낙후되었고, 보안적 측면 및 신규 기능 구현에 어려움이 있어 2차년도(2015~2016)에 걸친 시스템 재정비를 통해 최신 프레임워크를 적용하여 신규 시스템 설계하고 구축하였다.

오픈 소스 프레임워크를 활용한 검색엔진 구현 (Implement on Search Machine using Open Source Framework)

  • 송현옥;김아용;정회경
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.552-557
    • /
    • 2015
  • IT 기술 발전과 스마트 기기들의 사용 증가로 인해 인터넷에서는 많은 데이터가 생산되고 소비된다. 이로 인해 정보 검색 기술의 중요성이 높아지고 있지만 정보 검색 기술은 많은 배경 지식을 요구하여 접근하기 어려운 기술로 인식되고 있다. 그러나 Luene의 등장으로 인해 검색 기술에 대한 배경 지식이 부족해도 Lucene을 사용하여 검색 엔진을 구현할 수 있는 배경을 마련되었다. 본 논문에서는 Lucene 기반으로 개발된 프레임워크들을 사용하여 검색엔진을 구현하는 방법에 대해 제안한다. 제안하는 검색엔진에 사용되는 프레임워크들은 Hadoop과 Nutch, Solr, Zookeeper를 사용하여 분산처리와 분산저장, 그리고 고가용성을 지원하는 서버 환경을 보장한다.

Keywords and Spatial Based Indexing for Searching the Things on Web

  • Faheem, Muhammad R.;Anees, Tayyaba;Hussain, Muzammil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1489-1515
    • /
    • 2022
  • The number of interconnected real-world devices such as sensors, actuators, and physical devices has increased with the advancement of technology. Due to this advancement, users face difficulties searching for the location of these devices, and the central issue is the findability of Things. In the WoT environment, keyword-based and geospatial searching approaches are used to locate these devices anywhere and on the web interface. A few static methods of indexing and ranking are discussed in the literature, but they are not suitable for finding devices dynamically. The authors have proposed a mechanism for dynamic and efficient searching of the devices in this paper. Indexing and ranking approaches can improve dynamic searching in different ways. The present paper has focused on indexing for improving dynamic searching and has indexed the Things Description in Solr. This paper presents the Things Description according to the model of W3C JSON-LD along with the open-access APIs. Search efficiency can be analyzed with query response timings, and the accuracy of response timings is critical for search results. Therefore, in this paper, the authors have evaluated their approach by analyzing the search query response timings and the accuracy of their search results. This study utilized different indexing approaches such as key-words-based, spatial, and hybrid. Results indicate that response time and accuracy are better with the hybrid approach than with keyword-based and spatial indexing approaches.

TLM 분석법을 통한 ITO - n emitter간, ITO - Ag 간 접촉 저항 특성 분석 (Contact property analysis of ITO - n type emitter, ITO - Ag by TLM)

  • 유경열;백경현;이준신
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2010년도 추계학술대회 초록집
    • /
    • pp.50.2-50.2
    • /
    • 2010
  • Indium Tin Oxide (ITO)는 투과도가 높고, 전기 전도도가 뛰어나 TFT, 태양전지 등 여러 가지 산업에서 전극의 재료로 널리 사용되고 있다. 전극의 재료로써 가장 중요하게 고려되어야 할 사항 중의 하나는 전극과 접촉하는 물질과의 접촉 저항이다. 특히, 태양전지에서 높은 접촉 저항은 셀을 직렬저항 요소를 증가시켜 태양전지의 효율 저하를 가져 온다. 본 연구에서는 ITO를 실리콘 태양전지에 적용하기 위하여, ITO - n-type emitter간, ITO - Ag 간의 접촉 특성을 Transfer Length Method(TLM)을 통하여 분석하였다. p-type 실리콘의 전면을 도핑하여 pn접합을 형성한 후, 그 위에 ITO 패턴을 형성하여 ITO-emitter 간의 접촉 특성을 측정하였고, 두껍게 증착한 SiNx 박막 전면에 ITO를 증착한 후, Ag 패턴을 형성하여 ITO-Ag간의 접촉 특성을 측정 하였다. 측정 결과, ITO와 emitter 간의 접촉 비저항은 $0.9{\Omega}-cm^2 $을 나타내었고, ITO와 Ag와의 접촉 비저항은 $0.096{\Omega}-cm^2 $을 나타내었다.

  • PDF

DBMS을 활용한 파일 검색엔진 연구 (A Study on File Search Engine Based on DBMS)

  • 김형석;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.548-551
    • /
    • 2016
  • 기존 그리드 기반의 전통적인 RDBMS는 비구조적 데이터에 대한 색인이 지원되지 않았다. 이러한 제약 조건들로 인해 파일 문서 및 비 구조화된 데이터의 검색 엔진으로는 부적합하였다. 최근에 다양한 검색 오픈소스(Solr, Lucene)등으로 검색 엔진이 개발되어 활용되고 있지만, 검색한 결과와 기존 데이터의 연동이 쉽지 않고 구조 변경이 어려우며, 사용자의 다양한 요구 사항 수용이 쉽지 않은 단점을 가지고 있다. 따라서 본 연구에서는 빠른 검색을 위한 색인 (index) 최적화와 대용량 데이터 처리를 위한 파티션 기반 데이터의 분할 및 정복 (divide and conquer) 처리, 이중화된 검색어 색인 기능을 구현하였다. 또한 동의어 사전을 구축하여 연관 관계 분석이 가능하도록 DB를 구축하여 검색어와 동의어의 상호 관계성을 유지하였으며 오픈 소스보다 발전한 형태의 검색 엔진을 개발하는 것을 목표로 하였다. 본 연구를 위해 약 400만건 이상의 다양한 포맷 (Ms-office, Hwp, Pdf, Text)등의 파일 문서를 샘플로 실험을 진행하였다.

사물 인터넷 환경에 적합한 커뮤니티 질의 응답 시스템 개발 (Development of Community Question Answering System suitable for Internet of Things Environment)

  • 김강섭;이호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.1005-1007
    • /
    • 2015
  • 사물 인터넷(Internet of Things)의 확산으로 가까운 미래에는 사물 인터넷 환경에서 질의 응답 시스템이 활발하게 이용될 것으로 예상된다. 본 논문에서는 사물 인터넷 환경에 적합한 초소형, 저사양 하드웨어를 이용하여 커뮤니티 질의 응답 시스템(Community Question Answering System)을 구축하는 방안에 대해 살펴본다. 하드웨어는 700Mhz 싱글 코어 CPU와 512MB의 메인 메모리를 장착한 라즈베리 파이를 이용하였고, 질의 응답 시스템으로는 Apache Solr를 기본 시스템으로 활용하였다. 성능 분석 결과 실시간 응답성은 매우 훌륭하지만 정확도는 앞으로 보완이 필요한 것으로 분석되었다.

루씬 기반의 최저가 상품 검색 시스템 설계 (Design of Search System Based on Lucene for Minimum Price Products)

  • 김아용;정대진;계민석;김창수;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.603-605
    • /
    • 2014
  • 인터넷 이용률 증가와 스마트 기기의 대중화로 인해 소비자는 매장에서 구매하던 비용을 온라인 쇼핑 시장으로 전환하고 있다. 이로 인해 사용자의 소비패턴과 소비문화도 변화하고 있다. 오픈 마켓은 웹과 모바일을 통해 유통 채널을 확장하고 소비자의 유치를 위해 다양한 이벤트와 최저가 정책, 안전 거래 등을 제공한다. 본 논문에서는 오픈 마켓에서 판매하는 상품의 정보를 수집하고 분석하여 사용자에게 최저가 상품 정보를 제공하는 검색 시스템을 설계한다.

  • PDF

아파치 스파크 기반 검색엔진의 설계 및 구현 (Design and Implementation of a Search Engine based on Apache Spark)

  • 박기성;최재현;김종배;박제원
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.17-28
    • /
    • 2017
  • 최근 데이터의 활용가치가 높아지면서 데이터에 관한 연구가 활발히 진행되고 있다. 데이터의 수집, 저장, 활용을 위한 대표적인 프로그램으로 웹 크롤러, 데이터베이스, 분산처리 등이 있으며, 최근에는 웹 크롤러가 다양한 분야에 활용할 수 있는 유용성으로 인해 크게 각광받고 있는 실정이다. 웹 크롤러란 자동화된 방법으로 웹서버를 순회하여 웹 페이지를 분석하고 URL을 수집하는 도구라고 정의할 수 있다. 인터넷 사용량의 증가로 매일 대량으로 생성되는 웹 페이지의 처리를 위해 하둡의 맵리듀스를 기반으로 하는 분산 웹 크롤러가 많이 사용되고 있다. 그러나 맵리듀스는 사용이 어렵고 성능에 제약이 있는 단점이 있다. 이러한 맵리듀스의 한계를 보완하여 제시된 인메모리 기반 연산 플랫폼인 아파치 스파크가 그 대안이 되고 있다. 웹 크롤러의 주요용도 중 하나인 검색엔진은 웹 크롤러로 수집한 정보 중 특정 검색어에 맞는 결과를 보여준다. 검색엔진을 기존 맵리듀스 기반의 웹 크롤러 대신 스파크 기반 웹 크롤러로 구현할 경우 더욱 빠른 데이터 수집이 가능할 것이다.

온톨로지 서버구축을 통한 시맨틱 웹 기반 정보검색 시스템 설계 (A System Design for Search of Semantic Web-based Information through the Server Ontology)

  • 양새동;김경환;김종문;김창수;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.626-628
    • /
    • 2014
  • 정보검색 시스템은 사용자가 검색하고자 하는 정보를 보다 정확하고 신속하게 전달하는 데 그 목적이 있다. 그러나 현재의 검색 시스템은 단순 구문 분석 방식으로 사용자가 원하는 정확한 정보를 제공하지 못하고 있다. 본 논문에서는 온톨로지 서버구축을 통한 정보검색 시스템을 제안한다. 제안하는 시스템은 시맨틱 웹 기반의 정보검색 기법을 이용하여 구조화된 문서뿐만 아니라 다양한 포맷의 데이터들의 처리를 극대화 시키고자 한다. 또한 상호 운용성 및 데이터 통합을 위해 RDF(Resource Description Framework) 방식의 문서저장을 지원하여 신속하고 정확한 정보검색이 가능하다. 이는 다양한 웹 브라우저를 지원하며 웹에서의 효율적인 데이터 검색 분야에 활용될 것이다.

  • PDF