• 제목/요약/키워드: 키워드검색기법

검색결과 254건 처리시간 0.029초

전문가 검색 엔진에서 데이터 마이닝을 이용한 개념 관계 추출 (Extraction of conceptual relation using Data Mining in expert search engine)

  • 이권국;신일수;이상준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.298-300
    • /
    • 2000
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특별한 정보를 모야 특정 정보를 검색하기 위한 엔진이다. 인터넷의 홈페이지는 서로를 연결하는데 하이퍼링크(hyperlink)를 사용하는데 이런 하이퍼링크(hyperlink)에 있는 정보를 이용하여 홈페이지와 홈페이지 사이의 연결관계를 모은 결과를 전문가 검색 엔진에서 모은 키워드와 웹 사이트를 이용하여 각 키워드 간의 관련성을 데이터 마이닝 기법을 사용해서 각 키워드나 웹 페이지간의 상관관계에 대한 개념을 추출한다. 본 논문에서는 이런 홈페이지 간의 추출을 이용한 시스템 설계와 구현 결과를 보여준다.

  • PDF

사업 아이디어 매력도 평가를 위한 검색 데이터 활용에 관한 연구 (A Study on Use of Search Data for Evaluation of Business Idea Attractiveness)

  • 심재후;최명길
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.8-11
    • /
    • 2009
  • 성공적인 창업을 위해서는 창업가의 준비가 선행되어야 하지만, 매력적인 사업 아이디어의 계발이 뒤따라야 한다. 그러나 지금까지의 창업연구는 창업행동과 사업성과에 영향을 미치는 창업가 요인에 치우쳐 있으며, 사업 아이디어의 계발과 평가에 대한 연구는 부족한 실정이다. 이 연구는 고객이 상품을 구매하기 전 인터넷 검색엔진에서 해당 상품에 대한 검색을 하는 경우가 일반화되고 있다는 사실과 고객이 검색엔진에 입력하는 키워드는 고객의 의도를 대변한다는 사실을 기초로, 키워드로 표현된 사업 아이디어의 매력도를 객관적으로 측정하는 방법을 제시하는 것을 목적으로 한다.이 연구는 키워드로 표현된 사업 아이디어 매력도(BIA)를 구매의도를 가진 잠재고객의 자사 웹 사이트 방문수로 정의한다. 키워드로 표현된 사업 아이디어 매력도(BIA)는 [해당 키워드의 조회수(Q) ${\times}$ 구매의도 비율(R) / 경쟁 사이트의 수(S)]의 수식으로 나타낼 수 있으며, 수식을 구성하는 변수 중에서 해당 키워드의 조회수(Q)와 경쟁 사이트의 수(S)는 검색엔진에서 쉽게 제공 받을 수 있으므로, 구매의도 비율(R)만 알 수 있다면 BIA를 비교적 정확히 추정할 수 있다. 연구자는 특정 분야 키워드 100개를 선정한 다음, 전문가로 하여금 각 키워드의 구매의도 비율(R)을 추정하게 하고, 전문가 추정 없이도 구매의도 비율을 예측할 수 있도록 각 키워드의 구매의도 비율(R)을 예측하는 주요 데이터를 의사결정 나무 기법으로 도출하고, 의사결정 나무 기법으로 도출된 데이터로 구성된 회귀식을 제시함으로써 키워드로 표현된 사업 아이디어 매력도(BIA)를 객관적으로 평가하는 방법을 제시한다. 이 연구는 사업 아이디어의 계발과 평가에 대한 객관적인 기준을 제시함으로써 창업의 성공률을 높이는 데 기여할 수 있고, 창업연구에 새로운 방법론을 도입했다는 점에서 의의가있다.

  • PDF

검증 능력이 제한된 검색 가능한 공개키 암호시스템 (Public Key Encryption with Keyword Search for Restricted Testability)

  • 엄지은;이현숙;이동훈
    • 정보보호학회논문지
    • /
    • 제21권4호
    • /
    • pp.3-10
    • /
    • 2011
  • 공개키 기반의 키워드검색 시스템 (PEKS)은 암호화되어 저장된 데이터에 대한 효율적인 키워드 검색을 위해 Boneh 등에 의해 처음으로 제안되었다. 송신자는 메일내용과 키워드를 각각 수신자의 공개키로 암호화하여 서버에 전송하고, 수신자는 자신의 개인키로 키워드에 대한 트랩도어를 생성하여 키워드를 포함하는 메일을 검색할 수 있는 기법이다. 그러나 Byun 등은 PEKS 기법과 PEKS를 기반으로 한 몇 가지 기법들이 오프라인에서 키워드 추측 공격(keyword guessing attack)이 가능하다는 것을 보였다. 본 논문에서는 키워드 추측공격에 대한 안전성을 제공하는 검증 능력이 제한된 검색 가능한 공개키 암호시스템(Public Key Encryption with Keyword Search for Restricted Testability, PEKS-RT)을 제안한다.

멀티 온톨로지 기반의 키워드 연관성을 이용한 전문가 검색 시스템 (The Expert Search System using keyword association based on Multi-Ontology)

  • 정계동;황치곤;최영근
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.183-190
    • /
    • 2012
  • 본 연구는 연구논문 및 저자 프로파일을 기반으로 상호 협력이 가능한 전문가 검색 시스템을 구축한다. 제안한 방법론은 다음과 같다. 첫째, 입력 키워드와 가장 연관성 높은 키워드를 검색하기 위한 가중치 부여 기법을 제안하고, 둘째, 이 기법을 통해 전문가를 효율적으로 검색하는 방안을 제안한다. 우선적으로 논문에서 키워드와 저자 프로파일을 추출하고, 이를 통하여 전문가를 검색할 수 있도록 한다. 이것은 소셜 네트워크의 여러 분야에서 활용할 수 있다. 이러한 정보는 여러 시스템에 분산되어 있다. 이렇게 분산된 데이터를 통합하기 위한 기술로 멀티 온토롤지를 이용하는 기법을 제안한다. 멀티 온톨로지는 메타 온톨로지, 인스턴스 온톨로지, 로케이션 온톨로지와 연관관계 온톨로지로 구성되고, 연관관계 온톨로지는 동적으로 키워드 연관관계 분석을 통해 구축된다. 이 멀티 온톨로지를 이용하여 전문가 망을 제공하고, 이것은 키워드의 연관관계 추적을 통한 전문가 검색이 가능하도록 한다. 이를 통하여 전문가들의 연구물을 확인할 수 있도록 제공함으로써 세부 전문분야를 확인할 수 한다.

클러스터링 기법을 이용한 키워드 유사도 순위화 알고리즘에 따른 사용자 질의 확장 (User Query Expansion Through Keyword Similarity Ranking Algorithm Us ins Cluster ing Methods)

  • 이상훈;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.479-481
    • /
    • 2003
  • 본 논문에서는 여러 가지 클러스터링 기법들을 사용하여 키워드 유사도롤 순위화하여 사용자의 질의를 확장하는 기법을 제안한다. 클러스터링 기법에는 연관(Association) 클러스터링, 메트릭(Metric) 클러스터링, 스칼라(Scalar) 클러스터링 기법을 사용하고, 이들간의 가중치를 적절히 조절하여 검색 시스템을 만든다. 사용자의 질의가 주어졌을 때, 질의 키워드와 연관된 키워드들을 순위화 하여 사용자에게 보여주고, 사용자의 추가입력을 받아서 질의를 확장한다. 사용자가 적당한 질의어로 판단하여 확장된 질의로 검색을 수행할 때까지 이 과정을 반복한다. 실험에서 사용한 문헌집합은 Korea Herald의 2003년 1월과 2월의 경제 관련 기사들을 수집하여 사용하였고, 실험을 거쳐서 질의를 확장한 결과 만족할 만한 결과가 도출되었다.

  • PDF

객체 지향 멀티미디어 데이터베이스 모델하에서의 다중 키워드 검색 기법에 관한 연구 (A Study on the Multiple Keyword Retrieval Method under the Object-Oriented Multimedia Database Model)

  • 석상기;김경창;김기용
    • 한국통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.1176-1189
    • /
    • 1993
  • 본 논문에서는 객체 지향 멀티미디어 데이타베이스 모델 하에서 다중 키워드를 이용한 검색 기법을 제안하였다. 멀티미디어 데이타 검색에서의 부분 매칭 문제점을 가급적 줄이기 위한 다중 키워드 등록 띤 검색알고리즘을 개발하였으며, 이를 위해 적절한 탐색 테이블의 저장 구조를 설계하였다. 또한 미디어 데이타 화일을 B+ 트리로 구성하여 검색 시간이 일정하도록 하였다.

  • PDF

온톨로지를 통한 추론형 시멘틱 검색 시스템에 관한 연구 (Ontology Based Semantic Search System Using Inference)

  • 하상범;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.625-627
    • /
    • 2004
  • 시멘틱 웹의 등장으로 온톨로지를 통하여 에이전트가 이해할 수 있는 의미(semantic)를 갖는 문서를 생성하는 것이 가능해졌다. 이러한 시멘틱 웹의 영역은 비즈니스 업무 효율을 증가시키고 이를 통해 이윤을 극대화시키는 방법으로 시멘틱 검색을 통한 정보검색시스템으로 확대적용 될 수 있다. 데이터베이스를 활용하여 문서를 저장하고 데이터베이스의 질의문물 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 시스템은 다양한 분야에서 많이 연구되어 왔다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시멘틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다. 본 논문에서 제안하는 방식은 기존의 데이터베이스 질의문으로 검색이 불가능하거나 정보관리 시스템에서 단순히 키워드 매칭으로 검색되지 않는 문서에 대해서 본 시스템이 온톨로지라 추론을 통하여 문서의 검색에 가능함을 보인다. 이러한 방식은 자연어처리 검색과 유사한 검색영역을 갖는다. 이는 문서의 검색에 있어 단순히 키워드의 유사도에 의존하지 않고 Description Logic을 바탕으로 구성된 온톨로지에 미리 정의 되어있는 의미를 바탕으로 생성된 메타데이타를 가지고 추론을 하기 때문에 가능하다 또한 기존의 정보관리 시스템에서 채용한 데이터베이스를 통한 질의응답 시스템을 적용하여 온톨로지 표현언어에 대해 질의 응답이 가능한 DQL 인터페이스와 연동을 통하여 본 시스템의 속도와 효율성을 극대화시킨다.

  • PDF

키워드를 이용한 효율적인 웹서비스 및 openAPI 검색 엔진 개발 (Development of Efficient Search Engine for Web services and openAPIs by Keyword)

  • 천동석;차승준;김경옥;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.159-164
    • /
    • 2008
  • 최근 많이 주목을 받고 있는 웹 2.0은 사용자의 참여, 개방, 네트워크 효과에 기반하여 누구나 데이터를 생산하고 공유할 수 있는 사용자 중심의 인터넷 환경이다. openAPI는 웹 2.0의 근본 개념인 데이터의 개방 및 공유를 구현할 수 있는 핵심 기술로 포털은 자신의 서비스를 공개한다. 하지만 기존의 웹서비스와 openAPI 검색은 효율적인 검색 방법을 제공하지 않았다. 본 논문에서는 Lee[1]의 논문에서 제공하는 효율적인 웹서비스 검색 방법을 이용하여 검색 엔진을 개발하였다. 하지만 이 연구는 웹서비스와 유사한 구조를 가지는 openAPI를 수용하지 못한다. 따라서 본 논문에서는 openAPI의 정의 및 사용법이 웹서비스와 유사하다는 점을 활용하여 openAPI의 효과적인 검색을 위한 검색기법을 개발하였다. 이러한 검색기법은 사용자가 키워드를 입력하여 키워드 기반 검색을 통해 원하는 서비스를 찾아주고, 매쉬업 서비스나 다른 openAPI와의 조합(Composition)을 위해 템플릿 기반 검색을 통해 효과적인 검색을 제공해준다.

  • PDF

대용량 XML 문서의 키워드 검색을 위한 레이블링 기법 (A Labeling Methods for Keyword Search over Large XML Documents)

  • 선동한;황수찬
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.699-706
    • /
    • 2014
  • XML 문서가 점차 복잡해지면서 XML문서의 구조를 알 필요 없이 키워드로만 검색을 하는 키워드 검색 방식이 많이 사용되고 있다. XML문서 내에서 키워드 검색 방식을 사용하기 위해서는 문서 내의 모든 키워드에 레이블을 부여해야 하며, 구조적인 정보 또한 레이블 내에 충분히 표현해야한다. 하지만 기존 레이블링 방법들은 색인을 위한 단순정보만 레이블링 하거나, 증가하는 XML문서의 크기에 대응하기 어려운 형태로 구조적인 정보를 표현한다. 이는 XML문서가 커질수록 키워드검색성능이 떨어지거나, 공간 사용량이 기하급수적으로 증가하는 문제를 야기한다. 따라서 본 논문에서는 대용량 XML문서에 대한 키워드 검색 시 기존 레이블링 방식이 가지고 있던 문제점을 보완하는 새로운 레이블링 방식인 RPLS(Repetitive Prime Labeling Scheme)을 소개한다. 이 방법은 기존 소수 레이블방식을 개선하여 상위 레벨의 소수를 하위 레벨에서 반복 사용할 수 있도록 하여 레이블링을 위해 생성해야하는 소수의 수를 감소시키도록 한 것이다. 본 논문에서는 대용량 XML 문서의 키워드검색에 대한 RPLS 스킴의 효율성 검증을 위해 기존 레이블링 기법들과의 성능 비교 실험 결과도 제시한다.

RDF 데이타에 대한 효율적인 검색 기법 (An Efficient Keyword Search Method on RDF Data)

  • 김진하;송인철;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.495-504
    • /
    • 2008
  • 최근 문서나 웹 페이지뿐만 아니라 관계형 데이타나 XML 데이타, RDF 데이타 같은 구조화된 데이타에 대해서도 검색을 지원하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 RDF 데이타에 대한 효율적인 검색 기법을 제안한다. 제안하는 기법은 먼저 RDF 데이타의 크기를 줄여 검색 성능을 높이고 검색 결과로 관련 있는 정보를 함께 반환해 주기 위해 RDF 데이타에서 관련 있는 노드와 에지를 묶어 새로운 RDF 그래프를 생성한다. 또한 검색 과정에서 검색의 결과를 정렬하기 위해 RDF 데이타 그래프의 노드와 예지에 키워드와의 연관도를 부여할 때, RDF 온톨로지 데이타의 특성을 활용함으로써 보다 사용자의 의도에 부합하는 검색 결과를 반환한다. 실제 RDF 데이타를 사용한 성능 비교 결과는 제안하는 기법이 RDF 데이타의 크기를 최대 2배까지 줄이고 기존 기법에 비해 검색 속도가 최대 5배 빠르다는 것을 보여준다.