• Title/Summary/Keyword: Keyword frequency

검색결과 362건 처리시간 0.03초

개념 망을 이용한 키워드 기반의 효율적인 정보 검색 시스템 설계 (Design of an Efficient Keyword-based Retrieval System Using Concept lattice)

  • 마진;전인호;최영근
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.43-57
    • /
    • 2015
  • 본 논문에서는 개념망을 이용한 효율적인 정보검색을 위한 방법을 제안한다. 본 논문은 일반적인 개념망을 기반으로 시스템을 설계하였기 때문에 온톨로지와 접근 방식은 같지만 사용자가 보다 효율적으로 정보검색을 하고자 하는 객체와 개념사이의 협업 관계를 구축하여 사용할 수 있도록 개념망을 제안한다. 제안한 시스템은 다음과 같다. 첫 번째, 입력 키워드 중심의 키워드 개념망과 전문가 그룹이 추천한 전문가 개념망 그리고 테마 개념망 이러한 세 종류의 개념을 이용하여 협업적 검색을 하며, 이를 기반으로 사용자가 원하는 정보를 검색할 수 있는 효율적인 검색 시스템을 제안한다. 그리고 전문가 개념과 키워드 개념이 결합되어 키워드의 빈도 및 카테고리의 빈도를 제공함으로써, 사용자가 입력한 검색어와 관련된 키워드를 추천하는 역할을 할 수 있다. 그리고 테마 개념망을 이용하여 사용자의 관심 테마에서 사용되는 키워드 또는 카테고리를 알려주는 기능도 제공한다. 두 번째, 사용자가 입력한 키워드가 없을 경우 2차 검색을 통해 입력 키워드와 관련 있는 키워드를 제공해줌으로써 관련키워드를 이용하여 검색의 목적달성이 가능하다. 세 번째, 이러한 정보들은 대부분 분산되어 관리되고 있기 때문에 이렇게 분산되어 관리되는 정보는 표현방식이 다를 뿐만 아니라 시간에 따라 정보가 변하게 된다. 따라서 분산된 정보의 효율적 데이터 접근 및 통합을 위해 XMDR(eXtended Mata-Data Registry)을 이용하였고, 본 논문에서는 분산된 데이터를 통합하기 위한 기법 및 검색 시스템을 제시한다.

대화 말뭉치 구축을 위한 반자동 의미표지 태깅 시스템 (A Semi-Automatic Semantic Mark Tagging System for Building Dialogue Corpus)

  • 박준혁;이성욱;임윤섭;최종석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권5호
    • /
    • pp.213-222
    • /
    • 2019
  • 지능형 음성 대화 인터페이스 구현에 있어 핵심어의 의미표지는 사용자 의도 파악을 위한 중요한 요소이다. 대화시스템은 사용자 발화의 의도를 파악하기 위해 핵심어와 그 의미표지를 이용하여 발화의 의도를 결정한다. 하나의 핵심어는 여러 개의 의미표지를 가질 수 있는 중의성을 지닌다. 이러한 중의성을 지닌 핵심어를 사용자의 의도와 일치하는 의미표지로 결정하는 것은 단어 의미 분별 문제와 유사하다. 우리는 전사된 대화 말뭉치의 약 23%를 수동으로 의미를 부착하여 핵심어에 대한 의미표지 사전, 유의어 사전, 문맥벡터 사전을 먼저 구축한 후, 나머지 77% 대화 말뭉치에 존재하는 핵심어의 의미를 자동으로 부착한다. 중의성을 가진 핵심어는 문맥벡터 사전으로부터 문맥 벡터 유사도를 계산하여 의미를 결정한다. 핵심어가 미등록어인 경우에는 유의어 사전을 이용하여 가장 유사한 핵심어를 찾아 그 핵심어의 의미를 부착한다. 중의성을 가진 고빈도 핵심어 3개와 저빈도 핵심어 3개를 말뭉치에서 선정하여 제안 시스템의 성능을 평가하였다. 실험결과, 수동으로 구축한 말뭉치를 사용하였을 때 약 54.4%의 정확도를 얻었고, 반자동으로 확장한 말뭉치를 사용하였을 때 약 50.0%의 정확도를 얻었다.

Nowcast of TV Market using Google Trend Data

  • Youn, Seongwook;Cho, Hyun-chong
    • Journal of Electrical Engineering and Technology
    • /
    • 제11권1호
    • /
    • pp.227-233
    • /
    • 2016
  • Google Trends provides weekly information on keyword search frequency on the Google search engine. Search volume patterns for the search keyword can also be analyzed based on category and by the location of those making the search. Also, Google provides “Hot searches” and “Top charts” including top and rising searches that include the search keyword. All this information is kept up to date, and allows trend comparisons by providing past weekly figures. In this study, we present a predictive model for TV markets using the searched data in Google search engine (Google Trend data). Using a predictive model for the market and analysis of the Google Trend data, we obtained an efficient and meaningful result for the TV market, and also determined highly ranked countries and cities. This method can provide very useful information for TV manufacturers and others.

A Method for Compound Noun Extraction to Improve Accuracy of Keyword Analysis of Social Big Data

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.55-63
    • /
    • 2021
  • 소셜 빅데이터는 신조어나 고유명사를 포함하는 경우가 많으며, 이들을 처리하기 위해 단어별 출현 빈도수를 기반으로 한 통계적인 형태소 분석 방법이 많이 활용되고 있다. 그러나 이들 방법에서는 복합 명사를 제대로 인지하지 못해, 키워드 추출의 정확도가 떨어지는 문제점이 지적되고 있다. 본 논문에서는 소셜 빅데이터의 키워드 분석에 있어 복합 명사를 추출하기 위한 방법을 제안한다. 제안 방법은 형태소 분석 단계를 통해 얻어진 단어를 조합하여 복합 명사 후보군을 만들고, 주어진 리뷰에서 이들의 출현 빈도를 조사하여 얻어진 빈도수를 기반으로 복합 명사를 추출한다. 복합 명사 후보군을 구성하는 방법에 따라 두 가지 알고리즘을 제안하였으며, 각 알고리즘의 성능을 수식으로 표현하고 비교한다. 그리고 온라인에서 수집된 실제 데이터를 대상으로 실험을 통해 비교 결과를 검증하는 동시에, 제안 방법이 실시간 처리에도 적합함을 보여준다.

빅데이터를 활용한 무인카페 소비자 인식에 관한 연구: 텍스트 마이닝과 의미연결망 분석을 중심으로 (A Study on the User Experience at Unmanned Cafe Using Big Data Analsis: Focus on text mining and semantic network analysis )

  • 이승엽;박병현;남장현
    • 아태비즈니스연구
    • /
    • 제14권3호
    • /
    • pp.241-250
    • /
    • 2023
  • Purpose - The purpose of this study was to investigate the perception of 'unmanned cafes' on the network through big data analysis, and to identify the latest trends in rapidly changing consumer perception. Based on this, I would like to suggest that it can be used as basic data for the revitalization of unmanned cafes and differentiated marketing strategies. Design/methodology/approach - This study collected documents containing unmanned cafe keywords for about three years, and the data collected using text mining techniques were analyzed using methods such as keyword frequency analysis, centrality analysis, and keyword network analysis. Findings - First, the top 10 words with a high frequency of appearance were identified in the order of unmanned cafes, unmanned cafes, start-up, operation, coffee, time, coffee machine, franchise, and robot cafes. Second, visualization of the semantic network confirmed that the key keyword "unmanned cafe" was at the center of the keyword cluster. Research implications or Originality - Using big data to collect and analyze keywords with high web visibility, we tried to identify new issues or trends in unmanned cafe recognition, which consists of keywords related to start-ups, mainly deals with topics related to start-ups when unmanned cafes are mentioned on the network.

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.

A study on Metaverse keyword Consumer perception survey after Covid-19 using big Data

  • LEE, JINHO;Byun, Kwang Min;Ryu, Gi Hwan
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권4호
    • /
    • pp.52-57
    • /
    • 2022
  • In this study, keywords from representative online portal sites such as Naver, Google, and Youtube were collected based on text mining analysis technique using Textom to check the changes in metqaverse after COVID-19. before Corona, it was confirmed that social media platforms such as Kakao Talk, Facebook, and Twitter were mentioned, and among the four metaverse, consumer awareness was still concentrated in the field of life logging. However, after Corona, keywords from Roblox, Fortnite, and Geppetto appeared, and keywords such as Universe, Space, Meta, and the world appeared, so Metaverse was recognized as a virtual world. As a result, it was confirmed that consumer perception changed from the life logging of Metaverse to the mirror world. Third, keywords such as cryptocurrency, cryptocurrency, coin, and exchange appeared before Corona, and the word frequency ranking for blockchain, which is an underlying technology, was high, but after Corona, the word frequency ranking fell significantly as mentioned above.

개인화된 웹 검색 순위 생성 (Customized Web Search Rank Provision)

  • 강영기;배준수
    • 대한산업공학회지
    • /
    • 제39권2호
    • /
    • pp.119-128
    • /
    • 2013
  • Most internet users utilize internet portal search engines, such as Naver, Daum and Google nowadays. But since the results of internet portal search engines are based on universal criteria (e.g. search frequency by region or country), they do not consider personal interests. Namely, current search engines do not provide exact search results for homonym or polysemy because they try to serve universal users. In order to solve this problem, this research determines keyword importance and weight value for each individual search characteristics by collecting and analyzing customized keyword at external database. The customized keyword weight values are integrated with search engine results (e.g. PageRank), and the search ranks are rearranged. Using 50 web pages of Goolge search results for experiment and 6 web pages for customized keyword collection, the new customized search results are proved to be 90% match. Our personalization approach is not the way that users enter preference directly, but the way that system automatically collects and analyzes personal information and then reflects them for customized search results.

키워드 네트워크 분석을 통한 "한국의학교육"과 "의학교육논단"의 연구동향 분석 (Analysis of Research Trends in the Korean Journal of Medical Education and Korean Medical Education Review Using Keyword Network Analysis)

  • 이애화;김순구;황일선
    • 의학교육논단
    • /
    • 제23권3호
    • /
    • pp.176-184
    • /
    • 2021
  • The aim of this study was to analyze the research trends in articles published in the Korean Journal of Medical Education (KJME) and Korean Medical Education Review (KMER) using keyword network analysis. The analyses included 507 papers from 2010 to 2019 published in KJME and KMER. First, keyword frequency analysis showed that the research topics that appeared in both journals were "medical student," "curriculum," "clinical clerkship," and "undergraduate medical education." Second, centrality analysis of a network map of the keywords identified "curriculum" and "medical student" as highly important research topics in both journals. Third, a cluster analysis of 20 core keywords in KMER identified research clusters related to academic motivation, achievement, educational measurement, medical competence, and clinical practice (centered on "learning," while in KJME, clusters were related to educational method and program evaluation, medical competence, and clinical practice (centered on "teaching"). In conclusion, future medical education research needs to expand to encompass other research areas, such as educational methods, student evaluations, the educational environment, student counseling, and curriculum.

키워드 네트워크 분석을 통한 『한국초등수학교육학회지』 연구의 동향 분석 (A Study on the Research Trends of 『Journal of Elementary Mathematics Education in Korea』 through a Keyword Network Analysis)

  • 문소영;조진석
    • 한국초등수학교육학회지
    • /
    • 제23권4호
    • /
    • pp.459-479
    • /
    • 2019
  • 본 연구에서는 키워드 네트워크를 통해 국내 초등수학교육 분야의 대표적인 학술지인 『한국초등수학교육학회지』에 수록된 논문의 키워드를 대상으로 본 학술지의 연구 동향을 살펴보았다. 자료수집은 창간호부터 2018년까지 총 378편의 논문을 대상으로 하였으며, 논문에 포함된 총 1140개의 키워드들에 대하여 Krkwic 프로그램과 NodeXL 프로그램을 활용하여 빈도 분석 및 키워드 네트워크 분석을 실시하였다. 연구 결과 첫째, 빈도분석 결과 최소 5회 이상 출현하여 나타난 키워드는 48개로 수학과교육과정, 수학교과서, 학교수학, 수학문제해결, 수학영재 등이 있었다. 둘째, 키워드 네트워크 분석 결과에서 중요성이 높게 나타난 키워드는 수학교과서, 학교수학, 수학과교육과정, 수학문제해결, 수학적의사소통 등이 나타났다. 이러한 연구 결과를 바탕으로 본 학술지의 연구의 주요한 연구 주제어를 파악하고 연구 동향을 논의하였으며 연구의 제한점을 바탕으로 제언을 할 수 있었다.

  • PDF