• 제목/요약/키워드: keyword

검색결과 2,066건 처리시간 0.033초

Fast Result Enumeration for Keyword Queries on XML Data

  • Zhou, Junfeng;Chen, Ziyang;Tang, Xian;Bao, Zhifeng;Ling, TokWang
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.127-140
    • /
    • 2012
  • In this paper, we focus on efficient construction of tightest matched subtree (TMSubtree) results, for keyword queries on extensible markup language (XML) data, based on smallest lowest common ancestor (SLCA) semantics. Here, "matched" means that all nodes in a returned subtree satisfy the constraint that the set of distinct keywords of the subtree rooted at each node is not subsumed by that of any of its sibling nodes, while "tightest" means that no two subtrees rooted at two sibling nodes can contain the same set of keywords. Assume that d is the depth of a given TMSubtree, m is the number of keywords of a given query Q. We proved that if d ${\leq}$ m, a matched subtree result has at most 2m! nodes; otherwise, the size of a matched subtree result is bounded by (d - m + 2)m!. Based on this theoretical result, we propose a pipelined algorithm to construct TMSubtree results without rescanning all node labels. Experiments verify the benefits of our algorithm in aiding keyword search over XML data.

베이지안 공액 사전분포를 이용한 키워드 데이터 분석 (Keyword Data Analysis Using Bayesian Conjugate Prior Distribution)

  • 전성해
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-8
    • /
    • 2020
  • 빅데이터 분석에서 텍스트 데이터의 활용이 증가하고 있다. 따라서 텍스트 데이터의 분석 기법에 관한 많은 연구가 이루어지고 있다. 본 논문에서는 텍스트 데이터로부터 추출된 키워드 데이터의 분석을 위하여 공액사전분포 기반의 베이지안 학습 방법이 연구된다. 베이지안 통계학은 기존의 데이터에 새로운 데이터가 추가될 때마다 모수를 갱신하는 데이터 학습을 제공하기 때문에 시간에 따라 대용량의 데이터가 생성 및 추가되는 빅데이터 환경에서 효율적인 방법을 제공한다. 제안 방법의 성능과 적용 가능성을 보이기 위하여 실제 특허 빅데이터를 전처리하여 구축된 정형화된 키워드 데이터를 분석하는 사례연구를 수행한다.

Automatic Display of an Additional Explanation on a Keyword Written by a Lecturer for e-Learning Using a Pen Capture Tool on Whiteboard and Two Cameras

  • Nishikimi, Kazuyuki;Yada, Yuuki;Tsuruoka, Shinji;Yoshikawa, Tomohiro;Shinogi, Tsuyoshi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.102-105
    • /
    • 2003
  • "e-Leaning" system is classified by lecture time into two types, that is, "synchronous type" spent the same lecture time between the lecturer and students, and "asynchronous type" spent the different lecture time. The size of image database is huge, and there are some problem on the management of the lecture image database in "asynchronous type" e-Learning system. The one of them is that the time tag for the database management must be added manually at present, and the cost of the addition of the time tag causes a serious problem. To resolve the problem, we will use the character recognition for the characters written by the lecturer on whiteboard, and will add the recognized character as a keyword to the tag of the image database. If the database would have the keyword, we could retrieve the database by the keyword efficiently, and the student could select the interested lecture scene only in the full lecture database.

  • PDF

개인화된 웹 검색 순위 생성 (Customized Web Search Rank Provision)

  • 강영기;배준수
    • 대한산업공학회지
    • /
    • 제39권2호
    • /
    • pp.119-128
    • /
    • 2013
  • Most internet users utilize internet portal search engines, such as Naver, Daum and Google nowadays. But since the results of internet portal search engines are based on universal criteria (e.g. search frequency by region or country), they do not consider personal interests. Namely, current search engines do not provide exact search results for homonym or polysemy because they try to serve universal users. In order to solve this problem, this research determines keyword importance and weight value for each individual search characteristics by collecting and analyzing customized keyword at external database. The customized keyword weight values are integrated with search engine results (e.g. PageRank), and the search ranks are rearranged. Using 50 web pages of Goolge search results for experiment and 6 web pages for customized keyword collection, the new customized search results are proved to be 90% match. Our personalization approach is not the way that users enter preference directly, but the way that system automatically collects and analyzes personal information and then reflects them for customized search results.

키워드의 유사도와 가중치를 적용한 연관 문서 추천 방법 (Method of Related Document Recommendation with Similarity and Weight of Keyword)

  • 임명진;김재현;신주현
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1313-1323
    • /
    • 2019
  • With the development of the Internet and the increase of smart phones, various services considering user convenience are increasing, so that users can check news in real time anytime and anywhere. However, online news is categorized by media and category, and it provides only a few related search terms, making it difficult to find related news related to keywords. In order to solve this problem, we propose a method to recommend related documents more accurately by applying Doc2Vec similarity to the specific keywords of news articles and weighting the title and contents of news articles. We collect news articles from Naver politics category by web crawling in Java environment, preprocess them, extract topics using LDA modeling, and find similarities using Doc2Vec. To supplement Doc2Vec, we apply TF-IDF to obtain TC(Title Contents) weights for the title and contents of news articles. Then we combine Doc2Vec similarity and TC weight to generate TC weight-similarity and evaluate the similarity between words using PMI technique to confirm the keyword association.

아토피 피부염의 레이저 치료에 관한 논문 경향 분석 (Reviewing Research on Laser Therapy of Atopic Dermatitis)

  • 조재명;홍은주;서형식
    • 한방안이비인후피부과학회지
    • /
    • 제26권1호
    • /
    • pp.82-96
    • /
    • 2013
  • Objective : The purpose of this study is to analyze research trends on the effects of laser therapy on atopic dermatitis. Methods : We searched papers using pubmed, First search used the keyword "Laser Therapy, Low-level and Atopic dermatitis". Inclusion criteria were last 10 years, RCT, Clinical trial, Human. Second search used the keyword "LLLT and Atopic dermatitis". Inclusion criteria were Human. Third search used the keyword "Laser and Atopic dermatitis". Inclusion criteria was the same as first search. Finally we searched papers using the keyword "Laser and Atopic dermatitis" in NDSL and RISS. Papers not matched with inclusion criteria were excluded. Results : A total 20 studies were found, 14 studies were excluded and 6 studies were selected and analyzed. They turned out to be effective and no serious side-effect, but there was mild side-effect in 2 papers out of 4 papers using high-level laser. Conclusions : Low-level laser and high-level laser therapy, both can be effectively used as an alternative to the treatment of atopic dermatitis. Thus further attention and studies are needed on this topic in order to reduce the side effects and demonstrate the effectiveness clearly.

부상기술 예측을 위한 특허키워드정보분석에 관한 연구 - GHG 기술 중심으로 (Patent Keyword Analysis for Forecasting Emerging Technology : GHG Technology)

  • 최도한;김갑조;박상성;장동식
    • 디지털산업정보학회논문지
    • /
    • 제9권2호
    • /
    • pp.139-149
    • /
    • 2013
  • As the importance of technology forecasting while countries and companies manage the R&D project is growing bigger, the methodology of technology forecasting has been diversified. One of the forecasting method is patent analysis. This research proposes quick forecasting process of emerging technology based on keyword approach using text mining. The forecasting process is following: First, the term-document matrix is extracted from patent documents by using text mining. Second, emerging technology keyword are extracted by analyzing the importance of word from utilizing mean values and standard deviation values of the term and the emerging trend of word discovered from time series information of the term. Next, association between terms is measured by using cosine similarity. finally, the keyword of emerging technology is selected in consequence of the synthesized result and we forecast the emerging technology according to the results. The technology forecasting process described in this paper can be applied to developing computerized technology forecasting system integrated with various results of other patent analysis for decision maker of company and country.

예비 수학교사의 수학교육학 키워드 중심 학습 효과 (The Keyword-based Learning Effect of the discipline of Mathematics Education for Pre-service Mathematics Teachers)

  • 김창일;전영주
    • 한국학교수학회논문집
    • /
    • 제17권4호
    • /
    • pp.493-506
    • /
    • 2014
  • 본 연구는 예비 수학교사들에게 요구되는 여러 지식기반 중 하나인 교과교육 지식에 대한 학습방안 모색으로, 수학교육학의 주요 주제 및 연구자를 우선 선정하고 그 관련 내용을 키워드(keyword) 중심으로 제시한 학습 교재를 제작하였다. 그리고 재구성한 교재를 예비 수학교사들에게 투여하였다. 동시에 분절된 각 연구자의 이론을 교육적으로 연결하는 등 수학교과교육학의 개념과 원리를 예비교사들이 이해할 수 있도록 안내한 후, 키워드 중심의 교수 학습 방법이 예비 수학교사들에게 교육적인 효과가 있었는지를 조사하였다.

  • PDF

한국어 정보검색 시스템을 위한 구 단위 색인 (Phrase-based Indexing for Korean Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권1호
    • /
    • pp.44-48
    • /
    • 2004
  • 본 논문에서는 자연언어 처리 기술인 구문 분석 모듈을 도입해 단어 이상의 단위인 구 단위를 색인과 검색의 단위로 삼는 구 단위 색인 및 검색 기법의 사용을 제안한다. 초기의 정보검색의 방법으로 단일 주제어를 키워드로 색인하여 검색하는 방식이 널리 사용되어 왔으나 문서의 내용을 정확히 표현하기 어렵고 검색 결과의 문서 집합 또한 너무 커서 사용자의 만족도가 낮다 고도의 문서 처리 측면에서는 웹 문서들 자체가 갖는 다양한 오류들로 인해 현실적으로 충분히 만족할 만할 우수한 성능의 구문 분석 모듈이 구현되기는 어려우므로 상향식 구문 분석 모듈을 구현하여 완전한 구문 분석 결과를 얻지 못하는 많은 문장에 대해서도 가능한 구 단위 색인을 이용하여 검색 정확률과 재현률이 향상되고 검색 과정의 처리 부하도 줄이는 장점을 얻는다.

  • PDF

포털사이트의 사전과 학술정보 연계 검색 방안 연구 (A Study on Service Integration of Research Information and Dictionary in Portal Site)

  • 양창진
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.7-22
    • /
    • 2011
  • 포털사이트는 검색엔진을 넘어 사이버스페이스 자체를 의미할 정도로 개념과 영역이 확대되었다. 일반인들뿐만 아니라, 필요로 하는 학술정보가 서비스되기 때문에 연구자도 포털사이트를 많이 이용한다. 그동안 포털의 검색은 얼마나 많은 정보를 검색하게 해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질에 보다 관심이 많아지고 있다. 이 논문은 포털이 제공하는 학술정보검색의 문제점을 분석하고, 비교적 신뢰성을 인정받는 사전 서비스와 학술정보를 연계함으로써 학술정보검색의 질을 향상하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와 해당 표제어를 키워드로 하는 권위 있는 연구 성과를 연계시킴으로써, 사전을 검색할 때 주제어 관련 연구 성과까지 검색할 수 있게 하는 방안을 제시하고자 한다.