• 제목/요약/키워드: Keyword search

검색결과 547건 처리시간 0.041초

암호화 문서상에서 효율적인 키워드 검색 프로토콜 설계 (A Design of Efficient Keyword Search Protocol Over Encrypted Document)

  • 변진욱
    • 전자공학회논문지CI
    • /
    • 제46권1호
    • /
    • pp.46-55
    • /
    • 2009
  • 본 논문에서는 공통의 키워드들을 포함하는 암호화 문서들을 검색하는 프로토콜에 대해서 연구한다. 공통의 키워드 검색 프로토콜은 자료 공급자 (data supplier), 자료 저장소 (database) 그리고 사용자 (user of database)로 이루어진다. 자료 공급자는 암호화된 문서를 자료 저장소에 저장하게 되고 정당한 사용자는 원하는 키워드들을 질의하여 해당 키워드들이 공통으로 포함된 암호화 문서들을 얻을 수 있다. 최근, 많은 공통의 키워드 검색 프로토콜들이 다양한 환경에서 제안되었다. 하지만, 제안된 프로토콜들은 자료 공급자 및 자료 저장소 관점에서 많은 계산적 비용을 필요로 한다. 더욱이 지금까지 제안된 프로토콜들의 안전성은 랜덤 오라클 (random oracle) 모델에서만 증명되었다. 본 논문에서는 암호화 문서상에서 효율적인 공통의 키워드 검색 프로토콜을 랜덤 오라클 가정 없이 설계한다. 또한 사용자의 자료 저장량 그리고 자료 저장소의 계산량, 통신량 비용이 상수양의 비용을 가진다 제안된 프로토콜의 안전성은 DBDH (Decisional Bilinear Diffie-Hellman) 문제의 어려움에 기반 한다.

URI를 이용한 개체 중심적 통합 검색 시스템 (An Entity-centric Integrated Search System Using URI)

  • 정한민;이미경;성원경
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권7호
    • /
    • pp.405-416
    • /
    • 2008
  • 본 연구는 기반 통합 검색의 한계를 극복하고자, 인스턴스를 등록하고 관리하는 URI 서버를 이용하여 개체 페이지를 구성하는 방식의 통합 검색 방안을 제안한다. 키워드로 구성된 사용자 질의어와 매칭된 URI 서버 내의 인스턴스를 분석하여 최적 개체를 선정하고 단위 서비스들을 동시에 호출하는 방식으로 개체 페이지를 구성한다. 또한, 논문으로부터 자동 추출된 주제 정보를 대상으로 추론을 수행함으로써 인물, 기관, 위치 등에 대해서도 주제 중심의 심층적 정보 제공이 가능하다. 해외에서 실 서비스되고 있는 Citeseer, Google Scholar와의 통합 검색 결과 비교 실험과 사용성 평가를 통해 본 연구의 효용성을 실증한다.

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

개념 망을 이용한 키워드 기반의 효율적인 정보 검색 시스템 설계 (Design of an Efficient Keyword-based Retrieval System Using Concept lattice)

  • 마진;전인호;최영근
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.43-57
    • /
    • 2015
  • 본 논문에서는 개념망을 이용한 효율적인 정보검색을 위한 방법을 제안한다. 본 논문은 일반적인 개념망을 기반으로 시스템을 설계하였기 때문에 온톨로지와 접근 방식은 같지만 사용자가 보다 효율적으로 정보검색을 하고자 하는 객체와 개념사이의 협업 관계를 구축하여 사용할 수 있도록 개념망을 제안한다. 제안한 시스템은 다음과 같다. 첫 번째, 입력 키워드 중심의 키워드 개념망과 전문가 그룹이 추천한 전문가 개념망 그리고 테마 개념망 이러한 세 종류의 개념을 이용하여 협업적 검색을 하며, 이를 기반으로 사용자가 원하는 정보를 검색할 수 있는 효율적인 검색 시스템을 제안한다. 그리고 전문가 개념과 키워드 개념이 결합되어 키워드의 빈도 및 카테고리의 빈도를 제공함으로써, 사용자가 입력한 검색어와 관련된 키워드를 추천하는 역할을 할 수 있다. 그리고 테마 개념망을 이용하여 사용자의 관심 테마에서 사용되는 키워드 또는 카테고리를 알려주는 기능도 제공한다. 두 번째, 사용자가 입력한 키워드가 없을 경우 2차 검색을 통해 입력 키워드와 관련 있는 키워드를 제공해줌으로써 관련키워드를 이용하여 검색의 목적달성이 가능하다. 세 번째, 이러한 정보들은 대부분 분산되어 관리되고 있기 때문에 이렇게 분산되어 관리되는 정보는 표현방식이 다를 뿐만 아니라 시간에 따라 정보가 변하게 된다. 따라서 분산된 정보의 효율적 데이터 접근 및 통합을 위해 XMDR(eXtended Mata-Data Registry)을 이용하였고, 본 논문에서는 분산된 데이터를 통합하기 위한 기법 및 검색 시스템을 제시한다.

트위터 API를 활용한 트위터 검색 기능 개선 (Improving Twitter Search Function Using Twitter API)

  • 남용욱;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.879-886
    • /
    • 2018
  • 트위터에서 제공해주는 기본 검색 기능은 검색어가 담긴 트윗 뿐 아니라 검색어를 포함하는 닉네임을 가진 유저가 쓰는 모든 트윗들을 보여준다. 따라서 검색 키워드와 관계 없는 트윗들도 검색 결과로 노출하게 되어 해당 키워드가 포함된 트윗 만을 검색하려고 하는 많은 사용자들에게 불편함을 주고 있다. 본 연구에서는 이러한 문제점을 해결하고자 검색 키워드가 들어있는 트윗만을 검색하는 알고리즘을 만들어 트위터 검색 기능을 개선하였다. 개선된 기능은 ASP.NET MVC5를 이용하여 웹 서비스로 구현하여 많은 사람들이 이용할 수 있다. 검색 결과를 모아놓은 객체에 C#의 강력한 컬렉션 메소드를 사용하여 '리트윗' 이나 '마음에 들어요' 의 개수가 많은 순서대로 출력할 수도 있고, 리트윗 숫자가 설정한 수치보다 적을 경우 검색 결과에서 제외할 수 있는 필터 기능도 추가하였다. 따라서 사람들에게 관심을 많이 받는 의견을 빠르게 탐색할 수도 있으며, 이는 검색 이용자와 데이터 분석가들이 트위터에서 검색하는데 편리함을 줄 것으로 기대된다.

AC 알고리즘을 이용한 정보검색 키워드 추출에 관한 연구 (A study about IR Keyword Abstraction using AC Algorithm)

  • 장혜숙;이진관;박기홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.667-671
    • /
    • 2002
  • 효율적인 키워드 추출이 정보검색 시스템에서 매우 중요한 일임에도 불구하고 원하는 목적의 적당한 키워드를 결정하는 것은 매우 어렵다. 왜냐하면 많은 복합어를 가지고 있기 때문이다. 기존 방법에서는 AC 머신의 경우 단일 키워드를 가지고 복합 키워드를 검색하지 못한다. 이러한 문제를 해결한 DER 구조의 경우에는 많은 검색시간이 걸리는 문제점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해 이들을 기반으로 한 DERtable (DER 구조의 검색방법을 가지고 테이블로 구성)구조를 제안한다.

  • PDF

개인검색기반 키워드광고 구매전환모형 개발 (Developing the Purchase Conversion Model of the Keyword Advertising Based on the Individual Search)

  • 이동일;김현교
    • 한국경영과학회지
    • /
    • 제38권1호
    • /
    • pp.123-138
    • /
    • 2013
  • Keyword advertising has been used as a promotion tool rather than the advertising itself to online retailers. This is because the online retailer expects the direct sales increase when they deploy the keyword sponsorship. In practice, many online sellers rely on keyword advertising to promote their sales in short term with limited budget. Most of the previous researches use direct revenue factors as dependent variables such as CTR (click through rate) and CVI (conversion per impression) in their researches on the keyword advertising[14, 16, 22, 25, 31, 32]. Previous studies were, however, conducted in the context of aggregate-level due to the limitations on the data availability. These researches cannot evaluate the performance of keyword advertising in the individual level. To overcome these limitations, our research focuses on conversion of keyword advertising in individual-level. Also, we consider manageable factors as independent variables in terms of online retailers (the costs of keyword by implementation methods and meanings of keyword). In our study we developed the keyword advertising conversion model in the individual-level. With our model, we can make some theoretical findings and managerial implications. Practically, in the case of a fixed cost plan, an increase of the number of clicks is revealed as an effective way. However, higher average CPC is not significantly effective in increasing probability of purchase conversion. When this type (fixed cost plan) of implementation could not generate a lot of clicks, it cannot significantly increase the probability of purchase choice. Theoretically, we consider the promotional attributes which influence consumer purchase behavior and conduct individuals-level research based on the actual data. Limitations and future direction of the study are discussed.

소수테이블을 이용한 실용적인 다중 키워드 검색가능 암호시스템 (Practical Conjunctive Searchable Encryption Using Prime Table)

  • 양유진;김상진
    • 정보보호학회논문지
    • /
    • 제24권1호
    • /
    • pp.5-14
    • /
    • 2014
  • 검색가능 암호시스템(searchable encryption system)은 암호화된 자료의 기밀성이 보장된 상태로 원하는 자료의 검색을 가능하게 해주는 기술이다. 클라우드 서비스의 대중화로 데이터 아웃소싱에 대한 관심이 높아지면서 외부 서버의 신뢰 문제를 해결하는 방법으로 최근에 많은 연구가 진행되고 있다. 하지만 대부분의 검색가능 암호시스템에 대한 연구는 하나의 키워드를 이용한 부울 검색만 제안되었고, 다중 키워드 검색에 대한 연구결과는 상대적으로 적을 뿐만 아니라 이 연구들은 대부분 고정 필드 환경을 가정하는 제한적 기법들이다. 이 논문에서는 고정 필드를 사용하지 않으며, 랭킹 정보까지 제공할 수 있는 새로운 다중 키워드 검색가능 암호시스템을 제안한다. 이 시스템은 키워드와 소수를 매핑한 소수테이블과 검색 연산으로 최대공약수 연산을 사용하기 때문에 기존 시스템보다 상대적으로 효율적이며, 복잡한 암호모듈이 필요 없어 비교적 쉽게 구현이 가능하다.

국내 과학기술콘텐츠 저자의 소속기관명 식별을 위한 소속기관명 자동 식별 알고리즘에 관한 연구 (A Study on the Identification Algorithm for Organization's Name of Author of Korean Science & Technology Contents)

  • 김진영;이석형;서동준;김광영;윤정선
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.373-382
    • /
    • 2017
  • 과학기술콘텐츠가 증가함에 따라 과학기술콘텐츠의 효율적인 검색을 지원하는 서비스가 요구되고 있다. 저자의 소속기관명을 키워드로 사용할 경우 한 기관에서 생산된 콘텐츠를 확인할 수 있을 뿐만 아니라 저자, 용어를 키워드로 사용한 검색 결과의 식별율을 향상 시킬 수 있다. 검색 키워드로 사용되는 데이터들의 중의성과 모호성으로 인해 검색 결과에 false negative, false positive가 포함될 수 있으므로 데이터의 식별을 통한 통제는 중요하다. 저자의 소속기관명의 식별을 통한 통제 역시 기관의 이명, 약어 검색을 지원가능하게 하므로 매우 중요하지만 기존의 데이터 식별을 통한 통제에 대한 연구는 저자, 용어에 대한 연구가 주를 이루었다. 본 연구에서는 기관명 식별 알고리즘을 제안하고, 한국과학기술정보연구원에서 보유하고 있는 국내 과학기술콘텐츠들에 대한 데이터를 이용한 실험 결과를 보인다.

시맨틱검색엔진의 성능평가에 관한 연구 (A Study on the Performance Evaluation of Semantic Retrieval Engines)

  • 노영희
    • 한국비블리아학회지
    • /
    • 제22권2호
    • /
    • pp.141-160
    • /
    • 2011
  • 본 연구에서는 유동성이 크고 데이터의 규모도 상당한 도서관에 일반화시켜 적용할 수 있는 지식베이스 및 검색엔진을 제안하였다. 이를 위해 총 세 개의 지식베이스(트리플 구조 온톨로지, 의미거리기반 의미망지식 베이스, 키워드중심의 도치색인파일)를 구축하였고, 이의 성능을 측정하기 위해 각각 세 개의 검색엔진(추론 규칙기반 제나검색엔진, 개념기반 검색엔진, 키워드기반 루씬검색엔진)을 구축하였다. 시스템 성능평가 결과, 종합적으로 개념기반 검색엔진이 가장 높은 성능을 보여주었고, 다음으로 온톨로지기반 제나검색엔진, 다음으로 일반 키워드 검색엔진 순으로 나타났다.