• 제목/요약/키워드: Relevant Keyword

검색결과 106건 처리시간 0.036초

클릭로그를 이용한 연관키워드 수집 (Relevant Keyword Collection using Click-log)

  • 안광모;서영훈;허정;이충희;장명길
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.149-154
    • /
    • 2012
  • 본 논문은 사용자가 웹 검색을 위해 입력한 키워드와 그 키워드에 의해서 접근한 웹문서의 URL을 이용하여 연관키워드(relevant keyword)를 수집하는데 목적이 있다. 서로 다른 키워드들이라 할지라도 각각의 키워드들이 동일하게 링크된 URL의 수가 많다면, 그 키워드들은 서로 관련성이 높을 것이라는 것이 본 논문의 주된 가정이다. 실제로 이를 검증하기 위해 사용자가 입력한 키워드와 이 키워드를 이용하여 접근한 URL의 정보가 담겨있는 포털사이트의 클릭로그 데이터를 이용하여 URL과 키워드들의 쌍을 추출한 후, 연관키워드 집합을 생성하였다. 그 결과, 실험에서는 최소지지도(minimum support)가 10일 때, 유사어휘 수준에서의 정확도는 89.32%를 보였으며, 유사 어휘는 아니나 관련성이 있는 어휘 수준에서는 99.03%의 정확도를 보였다. 본 논문에서 제안하는 접근 방법은 언어에 독립적이고, 실세계의 데이터로부터 관련성이 있는 단어를 수집할 수 있다는 장점이 있다.

온라인 키워드 광고 시장에서 광고 단가에 영향을 미치는 요인 분석 : 키워드 유형, 검색 횟수와 경쟁업체의 수를 중심으로 (Identifying Influencing Factors on the Price Per Click of Keyword Advertising : Focusing on Keyword Type, Search Number and Competition)

  • 이홍주
    • 한국IT서비스학회지
    • /
    • 제11권3호
    • /
    • pp.257-267
    • /
    • 2012
  • Many advertisers utilize sponsored search in search engines since customers want to find relevant information on their purchases from the search engines. Many factors have influences on price per click of the sponsored search. These influences are different based on the types of keywords such as search/experience or prominent/specific. However, differences of the influences have not been studied well. Thus, this study wants to identify the differences of the influences according the type of keywords. One month data of keyword advertising were collected from Naver. The influences of search number, click through rate, and competition on price per click were different according to the keyword types.

Conceptual Extraction of Compound Korean Keywords

  • Lee, Samuel Sangkon
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.447-459
    • /
    • 2020
  • After reading a document, people construct a concept about the information they consumed and merge multiple words to set up keywords that represent the material. With that in mind, this study suggests a smarter and more efficient keyword extraction method wherein scholarly journals are used as the basis for the establishment of production rules based on a concept information of words appearing in a document in a way in which author-provided keywords are functional although they do not appear in the body of the document. This study presents a new way to determine the importance of each keyword, excluding non-relevant keywords. To identify the validity of extracted keywords, titles and abstracts of journals about natural language and auditory language were collected for analysis. The comparison of author-provided keywords with the keyword results of the developed system showed that the developed system was highly useful, with an accuracy rate as good as up to 96%.

그래프 데이터에 대한 비-중복적 키워드 검색 방법 (A Method for Non-redundant Keyword Search over Graph Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.205-214
    • /
    • 2016
  • 최근 소셜 네트워크, 시맨틱 웹, 바이오 인포매틱스 등 여러 응용 분야에서 그래프 구조를 갖는 대용량 데이터들에 활용됨에 따라 이런 데이터들에 대한 키워드 기반 검색 방법이 많은 관심을 받고 있다. 본 논문에서는 그래프 구조 데이터에 대한 키워드 질의에 대해 질의와 연관성이 높으면서 구조적인 중복성을 갖지 않는 top-k 결과 집합을 효율적으로 검색하는 방법을 제안한다. 키워드 질의에 대한 비-중복적인 결과 트리 구조와 그것의 연관도 척도를 정의하고, 그래프 내에 포함된 유용한 경로 정보들에 대한 효과적인 인덱싱 방법을 제안한다. 그리고 기 생성된 인덱스를 활용하여 주어진 키워드 질의에 대해 비-중복적이면서 연관도가 큰 top-k 결과 집합을 생성하는 효율적인 질의 처리 알고리즘을 제시한다. 실 데이터를 이용한 실험을 통해 제안한 방법의 효과와 성능을 기존 방법과 비교 분석한다.

포털사이트, SNS의 빅데이터를 이용한 신화소재의 브랜드 캐릭터와 연관어, 연관도 분석 (A Study on analyzing brand character of myth material, relevant keyword and relevance with big data of portal site and SNS)

  • 오세종;두일철
    • 디지털산업정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.157-169
    • /
    • 2015
  • In digital marketing, means of public relations and marketing of enterprises are changing into marketing techniques of predictive analytics. A significant study can be carried out by an analysis of 'the patterns of customers' uses' using big data on major portal sites and SNSs and their correlation with related keywords. This study analyzes the origins of mythological characters in major brands such as Nike, Hermes, Versace, Canon and Starbucks. Also, it extracts related keywords and relevance using big data on portal sites and SNS and their correlation. Nike marketing that reminds people of 'the goddess of victory, Nike' formed a good combination of the brand with relevance. Most of them are based on Greek mythology and have rich materials for storytelling and artistic values in common. Hopefully, this case analysis of foreign brands would become a starting point of discovering the materials of the domestic mythological characters.

RDF 데이타에 대한 효율적인 검색 기법 (An Efficient Keyword Search Method on RDF Data)

  • 김진하;송인철;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.495-504
    • /
    • 2008
  • 최근 문서나 웹 페이지뿐만 아니라 관계형 데이타나 XML 데이타, RDF 데이타 같은 구조화된 데이타에 대해서도 검색을 지원하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 RDF 데이타에 대한 효율적인 검색 기법을 제안한다. 제안하는 기법은 먼저 RDF 데이타의 크기를 줄여 검색 성능을 높이고 검색 결과로 관련 있는 정보를 함께 반환해 주기 위해 RDF 데이타에서 관련 있는 노드와 에지를 묶어 새로운 RDF 그래프를 생성한다. 또한 검색 과정에서 검색의 결과를 정렬하기 위해 RDF 데이타 그래프의 노드와 예지에 키워드와의 연관도를 부여할 때, RDF 온톨로지 데이타의 특성을 활용함으로써 보다 사용자의 의도에 부합하는 검색 결과를 반환한다. 실제 RDF 데이타를 사용한 성능 비교 결과는 제안하는 기법이 RDF 데이타의 크기를 최대 2배까지 줄이고 기존 기법에 비해 검색 속도가 최대 5배 빠르다는 것을 보여준다.

Deep Learning Document Analysis System Based on Keyword Frequency and Section Centrality Analysis

  • Lee, Jongwon;Wu, Guanchen;Jung, Hoekyung
    • Journal of information and communication convergence engineering
    • /
    • 제19권1호
    • /
    • pp.48-53
    • /
    • 2021
  • Herein, we propose a document analysis system that analyzes papers or reports transformed into XML(Extensible Markup Language) format. It reads the document specified by the user, extracts keywords from the document, and compares the frequency of keywords to extract the top-three keywords. It maintains the order of the paragraphs containing the keywords and removes duplicated paragraphs. The frequency of the top-three keywords in the extracted paragraphs is re-verified, and the paragraphs are partitioned into 10 sections. Subsequently, the importance of the relevant areas is calculated and compared. By notifying the user of areas with the highest frequency and areas with higher importance than the average frequency, the user can read only the main content without reading all the contents. In addition, the number of paragraphs extracted through the deep learning model and the number of paragraphs in a section of high importance are predicted.

시맨틱 웹 문서에 대한 키워드 검색 및 랭킹 기법 (Keyword Search and Ranking Methods on Semantic Web Documents)

  • 김연희;오성균
    • 한국위성정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.86-93
    • /
    • 2012
  • 본 논문에서는 시맨틱 웹에서 온톨로지와 메타데이터를 기술하는 OWL 문서를 대상으로 하는 키워드 검색 기법과 랭킹 기법을 제안한다. 제안한 키워드 검색 기법은 OWL 문서에 대한 키워드 검색 결과의 단위를 정보 리소스로 정의하고 질의 키워드의 범위를 클래스와 프로퍼티의 이름은 물론 리터럴 데이터까지 확장하였다. 그리고 클래스나 프로퍼티의 계층 관계, 동등 관계 등 OWL 문서에 정의되어 있는 기본적인 추론 요소들을 고려하여 직접 기술되어 있지 않지만 새롭게 유도되는 정보도 키워드 검색에 반영하였다. 또한 키워드를 통해 간접적으로 의미적 관계를 맺고 있는 정보 리소스에 대한 검색이 가능하기 때문에 질의 키워드와 관련이 있는 많은 수의 정보 리소스들을 검색할 수 있다. 제안한 랭킹 기법은 OWL 문서의 특성을 고려하여 다양한 요소를 순위 결정에 참여시킴으로써 사용자의 검색 만족도를 높일 수 있다. 본 논문에서 제안한 키워드 검색 기법과 랭킹 기법은 방송 프로그램과 같은 디지털 콘텐츠의 검색 등 다양한 분야에서 활용될 수 있다.

예비 수학교사의 수학교육학 키워드 중심 학습 효과 (The Keyword-based Learning Effect of the discipline of Mathematics Education for Pre-service Mathematics Teachers)

  • 김창일;전영주
    • 한국학교수학회논문집
    • /
    • 제17권4호
    • /
    • pp.493-506
    • /
    • 2014
  • 본 연구는 예비 수학교사들에게 요구되는 여러 지식기반 중 하나인 교과교육 지식에 대한 학습방안 모색으로, 수학교육학의 주요 주제 및 연구자를 우선 선정하고 그 관련 내용을 키워드(keyword) 중심으로 제시한 학습 교재를 제작하였다. 그리고 재구성한 교재를 예비 수학교사들에게 투여하였다. 동시에 분절된 각 연구자의 이론을 교육적으로 연결하는 등 수학교과교육학의 개념과 원리를 예비교사들이 이해할 수 있도록 안내한 후, 키워드 중심의 교수 학습 방법이 예비 수학교사들에게 교육적인 효과가 있었는지를 조사하였다.

  • PDF

빅 데이터 기반 만성질환 관리 시스템 (A web-based Obesity Management system using Body variations)

  • 강희범;이종원;김경환;김창수;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.787-789
    • /
    • 2016
  • 오늘날 만성질환자에게 데이터를 제공해주고 관리하는 시스템의 필요성이 대두되고 있다. 그러나 대부분의 질병관리 시스템의 경우 사용자에게 광범위한 데이터를 제공하거나, 중요한 키워드 및 데이터를 제공해주지 않는 문제점이 존재하였다. 본 논문에서는 질병에 대한 데이터에 대해 R프로그래밍을 통해 분석하여 해당 질병에 가장 관련이 높은 키워드를 사용자에게 추천해준다. 이를 통해 사용자가 자신의 질병을 관리할 시 중요한 키워드들을 효율적으로 관리할 수 있는 빅 데이터 기반 만성질환 관리 시스템을 연구하였다. 제안하는 시스템을 활용하여 사용자는 불필요한 데이터나 키워드를 제외하고 필요로 하는 데이터와 키워드를 볼 수 있을 것으로 사료된다.

  • PDF