• 제목/요약/키워드: keyword-based analysis

검색결과 625건 처리시간 0.03초

Keyword Analysis Based Document Compression System

  • Cao, Kerang;Lee, Jongwon;Jung, Hoekyung
    • Journal of information and communication convergence engineering
    • /
    • 제16권1호
    • /
    • pp.48-51
    • /
    • 2018
  • The traditional documents analysis was centered on words based system was implemented using a morpheme analyzer. These traditional systems can classify used words in the document but, cannot help to user's document understanding or analysis. In this problem solved, System needs extract for most valuable paragraphs what can help to user understanding documents. In this paper, we propose system extracts paragraphs of normalized XML document. User insert to system what filename when wants for analyze XML document. Then, system is search for keyword of the document. And system shows results searched keyword. When user choice and inserts keyword for user wants then, extracting for paragraph including keyword. After extracting paragraph, system operating maintenance paragraph sequence and check duplication. If exist duplication then, system deletes paragraph of duplication. And system informs result to user what counting each keyword frequency and weight to user, sorted paragraphs.

프로파일링에 기초한 키워드 유형별 지적구조 분석에 관한 연구 - 국외 오픈액세스 분야를 중심으로 - (A Study on the Intellectual Structure Analysis by Keyword Type Based on Profiling: Focusing on Overseas Open Access Field)

  • 김판준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.115-140
    • /
    • 2021
  • 본 연구는 국외 오픈액세스 분야를 대상으로 LISTA 데이터베이스에서 추출한 키워드 집합을 두 가지 유형(통제키워드, 비통제키워드)으로 구분하고, 각 키워드 유형별로 프로파일링에 기초한 지적구조 분석을 수행한 결과를 검토하였다. 또한, 이를 동시출현단어 분석에 기초한 지적구조 분석의 결과와 비교하였다. 이를 통해 지적구조 분석의 또 다른 방법인 프로파일링에서도 이와 유사한 결과가 도출되는 지를 살펴보고, 동시출현단어 분석과 프로파일링의 차이점을 검토하고자 하였다. 그 결과, 두 가지 키워드 유형별로 프로파일링에 기초한 지적구조 분석의 결과는 동시출현단어 분석과 유사한 차이가 있었다. 또한 프로파일링과 동시출현단어 분석에 기초한 지적구조 분석의 결과 간에도 주목할 만한 차이가 있었다. 따라서 키워드를 사용하는 지적구조 분석은 연구 목적에 따라 키워드 유형별 특성을 고려하여야 하며, 특정 분야의 연구 동향을 보다 명확하게 파악하기 위해서는 동시출현단어 분석보다 프로파일링에 기초한 지적구조 분석을 사용하는 것이 더 나은 결과를 기대할 수 있다.

다학제 분야 학술지의 주제어 동시발생 네트워크를 활용한 기술예측 연구 (A Study on Technology Forecasting based on Co-occurrence Network of Keyword in Multidisciplinary Journals)

  • 김현욱;안상진;정우성
    • 한국경영과학회지
    • /
    • 제40권4호
    • /
    • pp.49-63
    • /
    • 2015
  • Keyword indexed in multidisciplinary journals show trends about science and technology innovation. Nature and Science were selected as multidisciplinary journals for our analysis. In order to reduce the effect of plurality of keyword, stemming algorithm were implemented. After this process, we fitted growth curve of keyword (stem) following bass model, which is a well-known model in diffusion process. Bass model is useful for expressing growth pattern by assuming innovative and imitative activities in innovation spreading. In addition, we construct keyword co-occurrence network and calculate network measures such as centrality indices and local clustering coefficient. Based on network metrics and yearly frequency of keyword, time series analysis was conducted for obtaining statistical causality between these measures. For some cases, local clustering coefficient seems to Granger-cause yearly frequency of keyword. We expect that local clustering coefficient could be a supportive indicator of emerging science and technology.

플립러닝 연구 동향에 대한 키워드 네트워크 분석 연구 (A Study on the Research Trends to Flipped Learning through Keyword Network Analysis)

  • 허균
    • 수산해양교육연구
    • /
    • 제28권3호
    • /
    • pp.872-880
    • /
    • 2016
  • The purpose of this study is to find the research trends relating to flipped learning through keyword network analysis. For investigating this topic, final 100 papers (removed due to overlap in all 205 papers) were selected as subjects from the result of research databases such as RISS, DBPIA, and KISS. After keyword extraction, coding, and data cleaning, we made a 2-mode network with final 202 keywords. In order to find out the research trends, frequency analysis, social network structural property analysis based on co-keyword network modeling, and social network centrality analysis were used. Followings were the results of the research: (a) Achievement, writing, blended learning, teaching and learning model, learner centered education, cooperative leaning, and learning motivation, and self-regulated learning were found to be the most common keywords except flipped learning. (b) Density was .088, and geodesic distance was 3.150 based on keyword network type 2. (c) Teaching and learning model, blended learning, and satisfaction were centrally located and closed related to other keywords. Satisfaction, teaching and learning model blended learning, motivation, writing, communication, and achievement were playing an intermediary role among other keywords.

A Keyword Network Analysis on Health Disparity in Korea: Focusing on News and its application to Physical Education

  • Kim, Woo-Kyung
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권3호
    • /
    • pp.143-150
    • /
    • 2019
  • This study aimed to analyze the keyword related to Health Disparity in Korea through the method of keyword network analysis and to establish a basic database for suggesting ideas for prospective studies in physical education. To achieve the goal, this study crawled co-occured keyword with 'health' and 'disparity' from news casted in 20 different channels. The duration of the news was 3 months, from September 11th, 2018 to December 11th. The results are as follows. First, among the news during recent 3 months, there were 1,383 keyword related to health disparity and this study selected 173 keyword which had co-occured over 3 times. Second, the inclusiveness of the network was 97.674% and the density was .038. Third, analyzing news related to health disparity, 'mortality' was the most co-occured keyword and 'disparity', 'reinforcement', 'the most', 'health', '6 times', 'Seoul', 'half', 'medicine', and 'local' were shown similarly. And common keyword in 4 centrality were 13 keyword. Lastly, by analyzing eigenvector centrality, significantly different result has shown. 'Disparity' was the most co-occured keyword. Based on this result, this study showed the necessity for reinforcing the public physical education in public education system in Korea. In order to achieve it, the field of physical education must look beyond present elite-focused physical education to public physical activity.

네트워크 분석을 통한 저자키워드 출현순서에 대한 의미 분석 (A Study on the Application to Network analysis on Importance of Author keyword based on Sequence of keyword)

  • 권선영
    • 한국융합학회논문지
    • /
    • 제9권9호
    • /
    • pp.9-14
    • /
    • 2018
  • 본 연구는 학술논문의 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 이를 위해 학술논문 저자키워드의 출현순서를 측정한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성 지수를 사용하여 저자키워드의 중요도를 측정해보았으며 다음으로 각각의 네트워크지수 값과 저자키워드의 출현순서와의 상관관계 분석을 수행하여 출현순서의 특징을 살펴보고자 하였다. 연구결과 연결정도중심성, 근접중심성, 매개중심성, 위세중심성 모두 4번 째 출현순서가 높은 군집의 논문수가 많은 것으로 나타났다. 다음으로 상관관계 분석결과 근접중심성을 제외한 연결정도중심성, 매개중심성, 위세중심성의 경우 출현순서의 뒷부분으로 갈수록 지수 값이 모두 높아지는 것을 볼 때 네트워크 상에서 상대적으로 중요한 용어가 뒷부분에 위치한다는 것을 알 수 있다. 본 연구는 대략적으로 연구자들의 저자키워드 부여 행태를 살펴볼 수 있었다는 점에서 의의를 지닌다. 향후 저자키워드의 전개양상을 심층적으로 살펴 보기 위해서는 상황적 요인, 행동, 심리 등을 파악하여 보완하는 후속 연구가 반드시 필요하다.

학술논문의 저자키워드 출현순서에 따른 저자키워드 중요도 측정을 위한 네트워크 분석방법의 적용에 관한 연구 (A Study on the Application to Network Analysis on the Importance of Author Keyword based on the Position of Keyword)

  • 권선영
    • 정보관리학회지
    • /
    • 제31권2호
    • /
    • pp.121-142
    • /
    • 2014
  • 본 연구는 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 먼저 출현순서에 따른 저자키워드의 특징을 분석한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성, 그리고 네트워크의 구조적공백성의 효과크기와 같은 지수를 사용하여 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보았으며 각각의 네트워크 지수와 저자키워드의 출현순서와의 상관관계분석을 수행하였다. 네트워크 분석 지수 중 연결정도중심성 지수, 매개중심성 지수의 경우 각 학문분야별 저자키워드의 출현순서와의 상관관계의 결과에서의 유의한 분야의 수가 비교적 다른 지수에 비해 많았다. 이와 같은 결과를 통해 저자키워드의 중요도를 단지 출현빈도만으로 판단했던 것에서 벗어나 저자키워드의 중요도 측정을 위한 방법으로 연결정도중심성 지수, 매개중심성 지수도 고려해 볼 수 있음을 알 수 있었다.

Secure and Efficient Conjunctive Keyword Search Scheme without Secure Channel

  • Wang, Jianhua;Zhao, Zhiyuan;Sun, Lei;Zhu, Zhiqiang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권5호
    • /
    • pp.2718-2731
    • /
    • 2019
  • Conjunctive keyword search encryption is an important technique for protecting sensitive data that is outsourced to cloud servers. However, the process of searching outsourced data may facilitate the leakage of sensitive data. Thus, an efficient data search approach with high security is critical. To solve this problem, an efficient conjunctive keyword search scheme based on ciphertext-policy attribute-based encryption is proposed for cloud storage environment. This paper proposes an efficient mechanism for removing the secure channel and resisting off-line keyword-guessing attacks. The storage overhead and the computational complexity are regardless of the number of keywords. This scheme is proved adaptively secure based on the decisional bilinear Diffie-Hellman assumption in the standard model. Finally, the results of theoretical analysis and experimental simulation show that the proposed scheme has advantages in security, storage overhead and efficiency, and it is more suitable for practical applications.

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF