• Title/Summary/Keyword: 키워드 매칭

Search Result 95, Processing Time 0.024 seconds

Web Service Matching Algorithm using Cluster and Ontology Information (클러스터와 온톨로지 정보를 이용한 웹 서비스 매칭 알고리즘)

  • Lee, Yong-Ju
    • Journal of Internet Computing and Services
    • /
    • v.11 no.1
    • /
    • pp.59-69
    • /
    • 2010
  • With the growing number of web services, there arise issues of finding suitable services. But, the traditional keyword search method is insufficient for two reasons: (1) this does not capture the underlying semantics of web services. (2) this does not suffice for accurately specifying users' information needs. In order to overcome limitations of this keyword search method, we propose a novel syntactic analysis and ontology learning method. The syntactic analysis method gives us a breadth of coverage for common terms, while the ontology learning method gives a depth of coverage by providing relationships. By combining these two methods, we hope to improve both the recall and the precision. We describe an experimental study on a collection of 508 web services that shows the high recall and precision of our method.

Question Retrieval using Deep Semantic Matching for Community Question Answering (심층적 의미 매칭을 이용한 cQA 시스템 질문 검색)

  • Kim, Seon-Hoon;Jang, Heon-Seok;Kang, In-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

A content-based movie recommendation method for targeted advertising (맞춤형 광고를 위한 내용기반 영화 추천 기법)

  • Bong, Seong-Yong;Suh, In-Sik;Kim, Moon-Sik;Hwang, Kyu-Baek
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.269-272
    • /
    • 2011
  • 추천은 다양한 컨텐츠 중에서 사용자가 원하는 것을 선택할 수 있도록 돕는 것이다. 이러한 추천은 광고주가 자신의 광고에 적절한 컨텐츠를 찾을 때에도 활용될 수 있다. 본 논문에서는 광고를 표현하는 태그와 영화를 나타내는 주제어들을 매칭하여 광고에 적합한 영화를 추천하는 문제를 다룬다. 이 문제의 경우, 광고를 표현하는 태그의 개수가 적고, 영화의 주제어와 성격이 다른 경우가 많아 단순 매칭을 활용한 추천 기법으로는 결과를 얻을 수 없는 경우도 존재한다. 우리는 이러한 문제를 완화하기 위해 키워드 확장을 통한 추천 기법을 제안한다. 구체적으로 각 영화 컨텐츠가 가진 주제어를 위키피디아를 통해 검색하고 이를 통해 주제어를 확장한다. 광고의 태그 또한 위키피디아 검색을 통해 확장한다. 이렇게 확장된 영화 주제어와 광고 태그를 연관성 규칙에 기반하여 매칭한다. 실험 결과 단순 매칭보다 제안한 확장을 통한 매칭이 37.5%의 성능 향상을 보였다.

A Survey of Mashup Capable Services' Retrieval Methods for OpenAPI using Semantic Technology (시맨틱 기술을 활용한 OpenAPI 조합 가능 서비스 검색에 관한 연구)

  • Choi, Young-Ho;Cha, Seung-Jun;Lee, Kyu-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1234-1237
    • /
    • 2011
  • 본 논문은 시맨틱 기술을 활용한 OpenAPI 조합가능 서비스 검색 기법 개발을 위해 관련 연구들을 분석하여 적용방안을 도출하였다. OpenAPI 조합가능 서비스 검색이란 선택된 서비스의 출력과 매칭이 되는 입력을 가진 서비스나 선택된 서비스의 입력과 매칭되는 출력을 가진 서비스를 찾는 것이다. 본 논문에서는 기존의 키워드 기반의 조합 가능 서비스 검색 기법의 한계를 시맨틱 기술을 활용하여 해결하기 위한 관련연구로 SAWSDL-MX2와 LOG4SWS.KOM에 관한 논문들을 분석했다. SAWSDL-MX2에서는 세가지 매칭 기법과 이에 따른 유사도 분석 기법을 제시하였고, LOG4SWS.KOM에서는 두가지 매칭 기법과 이에 따른 유사도 분석 방법을 제시하였다. 관련 연구들에서 분석된 내용을 바탕으로 OpenAPI 조합 가능 서비스에 대한 매칭 기법의 정의, 유사도 분석 기법의 정의가 추후 진행되어야 한다.

Semantic Matching Engine for Searching Web Services (웹 서비스 검색을 위한 시맨틱 매칭 엔진)

  • Yang, Seung-Hoon;Lee, Dae-Wook;Kwon, Joon-Ho;Lee, Suk-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.267-272
    • /
    • 2006
  • 인터넷망의 지속적인 발달과 함께 웹 애플리케이션 개발 방법으로 XML 기반의 웹 서비스가 부각되면서 많은 웹 서비스들이 개발되었고, 점차 더 많은 웹 서비스들이 개발될 것으로 예상된다. 이처럼 급격하게 늘어나는 웹 서비스들 중에서 사용자가 원하는 웹 서비스 찾는 것이 중요한 이슈로 부각되고 있다. 그러나 현재의 웹 서비스 검색 표준인 UDDI 레지스트리는 키워드 기반이기 때문에 검색 성능의 한계점을 갖고 있다. 최근에 이러한 한계를 극복하고자 하는 많은 연구가 진행되고 있지만 아직은 많이 부족한 상황이다. 따라서 본 논문에서는 비록 키워드가 일치하지 않더라도 사용자가 원하는 웹 서비스를 찾을 수 있도록 웹 서비스 표준인 UDDI 레지스트리에 시맨틱 매칭 엔진(semantic matching engine)이라는 추가적인 시맨틱 레이어를 추가하여 재현율(recall)과 정확률(precision)을 모두 향상 시킬 수 있는 시스템을 제안한다.

  • PDF

Design and Implementation of a Mobile Search Method based on Images (이미지 기반 모바일 검색 방법의 설계 및 구현)

  • Song, Jeo;Jeon, Jin-Hwan;Song, Un-Kyung;Lee, Sang-Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.01a
    • /
    • pp.33-35
    • /
    • 2016
  • 본 논문에서는 모바일 디바이스를 이용하여 촬영한 이미지 또는 이미 모바일 디바이스에 저장된 이미지를 사용자가 검색을 위한 질의어로 사용할 수 있는 방법에 대하여 제안한다. 기존의 모바일 검색엔진을 그대로 활용하기 위해 이미지 어노테이션에 기반한 태깅 키워드를 검색 이미지와 매칭하여 질의하는 방식으로 구현하며, 이 과정에서 이미지의 분석과 분류를 위한 SVM(Support Vector Machine)과 SIFT(Scale Invariant Feature Transform) 알고리즘을 사용하였으며, 이미지 어노테이션 태깅에 대한 키워드 매칭을 위해 빅데이터에서의 MapReduce를 응용하였다.

  • PDF

Query Extending and Document Classification Using Fuzzy Logic (퍼지 논리를 이용한 질의어 확장과 문서 분류)

  • 은희주;이기영;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.195-197
    • /
    • 1999
  • 본 연구에서는 인터넷 상의 많은 문서들 중에서 사용자에게 보다 적합한 문서를 제공하기 위해 퍼지 관계성을 이용하여 검색 결과 집합의 문서에서 추출한 키워드간의 유사클래스를 생성한다. 또한, 기존의 키워드 직접 매칭에 의한 검색 방법의 단점이라 할 수 있는 의미적 관계를 가지는 문서에 대한 검색 방법도 제안한다. 생성된 유사 클래스는 사용자의 질의를 확장하여 사용자의 관심도를 보다 많이 반영하게 되고, 그 질의어가 포함된 단어나 구의 발생 빈도수가 높은 문서에 대해 의미적으로 서로 연결시켜 분류한다. 본 연구에서 제안한 알고리즘에 의해 문서를 사용자 관심 정도로 분류, 카테고리를 생성하여 검색 효율을 증대시키고 사용자의 요구에 적합한 결과를 제공하고자 한다.

  • PDF

A Conversational Agent based on Structured Pattern Matching (구조적 패턴매칭에 기반한 대화형 에이전트)

  • 이승익;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.409-411
    • /
    • 2001
  • 인터넷 사이트의 정보량이 증가함에 따라 사용자에게 필요한 정보를 검색할 수 있는 도구를제공해야 할 필요성이 증대되고 있다. 아직까지는 대부분의 사이트에서 키워드에 기반한 단순한 검색기법을 주로 사용하는데, 이 방식은 사용자의 의도를 제대로 표현하기 어렵기 때문에 검색결과가 지나치게 많거나 의도하지 않은 결과를 얻기 쉽고, 사용자가 자연스럽게 정보를 검색할 수 없는 문제가 있다. 이 논문에서는 자연어를 통하여 사용자에게 보다 정확하고 친절하게 적절한 정보를 제공해주는 대화형 에이전트를 제안한다. 이 시스템은 기존의 자연어처리 기법의 한계를 극복하기 위하여 질의-답변간의 융통성 있는 패턴매칭 기법을 사용하며, 효과적인 매칭을 위하여 포섭구조에 기반한 질의분류를 선행하는 구조적 패턴매칭 방식 사용한다. 간단한 웹 페이지를 소개하는 문제에 적용한 결과, 그 가능성 및 개선점을 파악할 수 있었다.

  • PDF

Design and Implemantation of Information Retrieval System based on Semantic Information (의미정보기반 검색시스템의 설계 및 구현)

  • Park, Chang-Keun;Yang, Gi-Chul
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2004.11a
    • /
    • pp.265-268
    • /
    • 2004
  • Keyword matching technique which is used in most information retrieval systems is unfit for efficient processing of geometrically increasing information. The problem can be solved by using semantic information and an efficient method of semantic processing is introduced in this paper. The technique uses conceptual graph to represent the semantic information and apply it for information retrieval. The implemented system can perform exact matching and partial matching. Partial matching has two different types. One is syntactic partial matching and the other is semantic partial matching. The semantic semilaries are measured by the subclass relations in the ontology. The introduced technique can be used not only information retrieval but also in various applications such as an implementation of dynamic hyperlinks.

  • PDF

A Proposal of a Keyword Extraction System for Detecting Social Issues (사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안)

  • Jeong, Dami;Kim, Jaeseok;Kim, Gi-Nam;Heo, Jong-Uk;On, Byung-Won;Kang, Mijung
    • Journal of Intelligence and Information Systems
    • /
    • v.19 no.3
    • /
    • pp.1-23
    • /
    • 2013
  • To discover significant social issues such as unemployment, economy crisis, social welfare etc. that are urgent issues to be solved in a modern society, in the existing approach, researchers usually collect opinions from professional experts and scholars through either online or offline surveys. However, such a method does not seem to be effective from time to time. As usual, due to the problem of expense, a large number of survey replies are seldom gathered. In some cases, it is also hard to find out professional persons dealing with specific social issues. Thus, the sample set is often small and may have some bias. Furthermore, regarding a social issue, several experts may make totally different conclusions because each expert has his subjective point of view and different background. In this case, it is considerably hard to figure out what current social issues are and which social issues are really important. To surmount the shortcomings of the current approach, in this paper, we develop a prototype system that semi-automatically detects social issue keywords representing social issues and problems from about 1.3 million news articles issued by about 10 major domestic presses in Korea from June 2009 until July 2012. Our proposed system consists of (1) collecting and extracting texts from the collected news articles, (2) identifying only news articles related to social issues, (3) analyzing the lexical items of Korean sentences, (4) finding a set of topics regarding social keywords over time based on probabilistic topic modeling, (5) matching relevant paragraphs to a given topic, and (6) visualizing social keywords for easy understanding. In particular, we propose a novel matching algorithm relying on generative models. The goal of our proposed matching algorithm is to best match paragraphs to each topic. Technically, using a topic model such as Latent Dirichlet Allocation (LDA), we can obtain a set of topics, each of which has relevant terms and their probability values. In our problem, given a set of text documents (e.g., news articles), LDA shows a set of topic clusters, and then each topic cluster is labeled by human annotators, where each topic label stands for a social keyword. For example, suppose there is a topic (e.g., Topic1 = {(unemployment, 0.4), (layoff, 0.3), (business, 0.3)}) and then a human annotator labels "Unemployment Problem" on Topic1. In this example, it is non-trivial to understand what happened to the unemployment problem in our society. In other words, taking a look at only social keywords, we have no idea of the detailed events occurring in our society. To tackle this matter, we develop the matching algorithm that computes the probability value of a paragraph given a topic, relying on (i) topic terms and (ii) their probability values. For instance, given a set of text documents, we segment each text document to paragraphs. In the meantime, using LDA, we can extract a set of topics from the text documents. Based on our matching process, each paragraph is assigned to a topic, indicating that the paragraph best matches the topic. Finally, each topic has several best matched paragraphs. Furthermore, assuming there are a topic (e.g., Unemployment Problem) and the best matched paragraph (e.g., Up to 300 workers lost their jobs in XXX company at Seoul). In this case, we can grasp the detailed information of the social keyword such as "300 workers", "unemployment", "XXX company", and "Seoul". In addition, our system visualizes social keywords over time. Therefore, through our matching process and keyword visualization, most researchers will be able to detect social issues easily and quickly. Through this prototype system, we have detected various social issues appearing in our society and also showed effectiveness of our proposed methods according to our experimental results. Note that you can also use our proof-of-concept system in http://dslab.snu.ac.kr/demo.html.