• 제목/요약/키워드: Keyword Analysis

검색결과 1,128건 처리시간 0.03초

XML 문서 키워드 가중치 분석 기반 문단 추출 모델 (XML Document Keyword Weight Analysis based Paragraph Extraction Model)

  • 이종원;강인식;정회경
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2133-2138
    • /
    • 2017
  • 기존의 XML 문서나 다른 문서는 단어를 중심으로 분석이 진행되었다. 이는 형태소 분석기를 활용하여 구현이 가능하나 문서 내에 기재되어 있는 많은 단어를 분류할 뿐 문서의 핵심 내용을 파악하기에는 어려움이 있다. 사용자가 문서를 효율적으로 이해하기 위해서는 주요 단어가 포함되어 있는 문단을 추출하여 사용자에게 보여주어야 한다. 본 논문에서 제안하는 시스템은 정규화 된 XML 문서 내에 키워드를 검색하고 사용자가 입력한 키워드들이 포함되어 있는 문단을 추출하여 사용자에게 보여준다. 그리고 검색에 사용된 키워드들의 빈도수와 가중치를 사용자에게 알려주고 추출한 문단의 순서와 중복 제거 기능을 통해 사용자가 문서를 이해하는데 발생할 수 있는 오류를 최소화하였다. 제안하는 시스템은 사용자가 문서 전체를 읽지 않고 문서를 이해할 수 있게 하여 문서를 이해하는데 필요한 시간과 노력을 최소화할 수 있을 것으로 사료된다.

스타일 기반 키워드 추출 및 키워드 마이닝 프로파일 기반 웹 검색 방법 (An Efficient Web Search Method Based on a Style-based Keyword Extraction and a Keyword Mining Profile)

  • 주길홍;이준휘;이원석
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1049-1062
    • /
    • 2004
  • World Wide Web의 대중화로 인해 전자 정보량이 급속하게 증가하였고, 이러한 많은 양의 다양한 정보에 대한 효율적인 검색 시스템의 필요성이 증대되었다. 정확한 검색 결과를 제공하기 위해 사용자 요구 사항의 올바른 분석과 서술이 중요하게 인식되고 있으며, 분산 환경에서의 요구 사항 추출 및 분석의 필요성이 대두되고 있다. 본 논문에서는 웹 검색 방법에 있어서 목표 검색어만을 가지고 검색을 수행하는 기존 검색 방법과 달리 검색어가 나타나는 문맥 정보를 추가하여 검색하는 방법을 제안하고 구현하였다. 또한 본 논문에서는 제안된 새로운 키워드 추출 방법으로 추출된 키워드를 기반으로 키워드 마이닝 프로파일에 기반한 웹 검색 시스템을 제안하고 구현하였다. 이는 원하는 정보를 대표하는 목표 검색어만 가지고 검색을 수행하는 기존의 검색방법과 달리 검색어가 포함된 문맥정보를 추가하여 검색하기 때문에 기존의 검색방법보다 정확하고 효율적인 정보를 제공한다. 특정 도메인으로부터 순위가 매겨진 도메인 키워드 리스트를 작성하여 이를 기준으로 기존의 출현빈도기반의 차이를 실험을 통하여 보였으며, 예제 기반 질의를 바탕으로 키워드 마이닝 프로파일을 만들어 검색을 수행하는 검색 방법으로 이의 효용성을 실험을 통해 검증하였다.

컴퓨터공학 분야 학술 논문 데이터베이스를 이용한 키워드 연관 네트워크 기반 지식지도 (A Knowledge Map Based on a Keyword-Relation Network by Using a Research Paper Database in the Computer Engineering Field)

  • 정보석;권영근;곽승진
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.501-508
    • /
    • 2011
  • 최근 여러 분야에서 활용되고 있는 지식지도는 대량의 정보 속에 숨겨진 특징을 찾아서 그 의미를 파악할 수 있도록 가시적인 형태의 결과를 보여주는 것을 말한다. 본 논문에서는 2000년부터 2010년까지 컴퓨터 공학 분야의 국내 학술지에 게재된 논문들의 데이터베이스를 활용하여 연구동향 분석을 위한 키워드 연관 네트워크 기반의 지식지도를 제안하였다. 그 지식지도를 통해 키워드 연관 네트워크에서 개별 키워드가 속한 연결 요소의 크기 변화를 살펴봄으로써 관련 연구 주제의 영향력 변화를 추론할 수 있었다. 또한, 랜덤 네트워크와의 비교를 통해 키워드 연관 네트워크에서 최대 연결 요소의 크기가 상대적으로 매우 작으며, 상호 관련성이 높은 키워드 쌍들의 그룹이 밀집되어 있음을 보였다. 이는 최대 연결 요소에 대응하는 연구 분야가 크지 않으며 여러 소규모의 연구 주제들이 느슨한 형태로 연결되어 있음을 암시한다. 이러한 분석 결과들은 단순히 개별 키워드의 사용 빈도수 등을 분석하는 전통적인 방식으로는 얻기 어렵다는 점에서 본 논문에서 제안한 지식지도가 연구동향 분석의 방법이 될 수 있다.

베이지안 이산모형을 이용한 기술예측 (Technology Forecasting using Bayesian Discrete Model)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제27권2호
    • /
    • pp.179-186
    • /
    • 2017
  • 기술예측은 과거부터 현재까지의 기술개발 결과를 수집, 분석하여 특정 기술의 미래 추세 및 상태를 예측하는 것이다. 일반적으로 특허는 현재까지의 기술개발 결과를 가장 잘 가지고 있다. 왜냐하면 특허에 포함된 세부 기술은 일정기간 동안 배타적 권리가 법에 의해 보장되기 때문이다. 따라서 특허 데이터의 분석을 이용한 기술예측의 다양한 연구가 진행되었다. 특허문서의 분석을 위하여 널리 사용되는 특허 키워드 데이터는 주로 기술키워드에 대한 빈도 값으로 이루어진다. 기존의 많은 특허분석에서는 회귀분석, 박스-젠킨스 모형 등 연속형 데이터분석 기법이 적용하였다. 하지만 빈도 데이터는 이산형 데이터이기 때문에 이산형 데이터분석 방법을 사용해야 한다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여 베이지안 포아송 이산모형을 이용한 특허분석 방법을 제안한다. 연구방법의 성능평가를 위하여 지금까지 출원, 등록된 애플의 전체특허를 분석하여 향후 기술을 예측하는 사례분석을 수행한다.

Interactive Morphological Analysis to Improve Accuracy of Keyword Extraction Based on Cohesion Scoring

  • Yu, Yang Woo;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.145-153
    • /
    • 2020
  • 최근 소셜 빅데이터를 대상으로 한 키워드 분석은 고객 관점의 의견이나 불만 사항을 추출하기 위한 목적으로 광범위하게 활용되고 있다. 이와 관련하여, 이전 연구에서는 키워드 분석의 정확도를 높이기 위해 응집도 점수를 활용한 방법을 제안하였으나, 리뷰의 수가 적을 경우 오류율이 증가하는 문제가 있었다. 본 논문에서는 응집도 점수 기반 알고리즘으로부터 추출된 키워드에 대해 간소화된 형태소 분석 단계를 후처리 형태로 적용함으로써 키워드 추출의 정확도를 개선하고자 하였다. 제안 방법은 입력 데이터가 주어질 때마다 필요한 형태소 분석 규칙을 점증적으로 추가할 수 있도록 지원함으로써, 사전의 크기를 최소화하고 분석의 효율을 높이고자 하였다. 또한 대화형 규칙 입력 시스템을 제공하여 분석 규칙 추가에 드는 노력을 최소화하고자 하였다. 제안 방법을 검증하기 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법을 적용할 경우 오류율이 기존 10%에서 1%로 개선되는 동시에, 5,000개의 리뷰 처리에 450ms가 소요되어 실시간 처리가 가능한 수준임을 확인하였다.

키워드 네트워크 분석을 활용한 국내 공공도서관 연구 동향 분석 (An Analysis of Research Trends on Public Libraries in Korea Using Keyword Network Analysis)

  • 장로사
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.285-302
    • /
    • 2023
  • 본 연구는 키워드 네트워크 분석을 활용하여 국내 공공도서관 분야 연구 동향을 파악하였다. 2003년부터 2022년까지 20년 동안 우리나라 문헌정보학 분야 유수 4대 학술지에 출판된 공공도서관 관련 논문 총 752편을 대상으로 하였다. 연구결과는 다음과 같다. 첫째, 2003년부터 2022년까지 연평균 37.6편이 간행되었으며, 상승과 하락을 반복하는 출판양상을 보였다. 둘째, '서비스'와 '문화' 키워드는 출현 빈도와 연결중심성 및 매개중심성 분석결과 모두에서 상위 5위 이내로 파악됨으로써 가장 논의가 많이 된 핵심 키워드로 확인되었다. 셋째, 키워드 쌍의 동시 출현 빈도 분석결과에서 교육-프로그램 키워드 쌍과 서비스-이용자와 서비스-어린이 및 서비스-장애 키워드 쌍이 주목되었다.

키워드 네트워크 분석과 토픽모델링을 활용한 정보활용교육 연구 동향 분석 (Analysis of Research Trends in Information Literacy Education Using Keyword Network Analysis and Topic Modeling)

  • 임정훈
    • 정보관리학회지
    • /
    • 제39권4호
    • /
    • pp.23-48
    • /
    • 2022
  • 본 연구는 키워드 네트워크 분석과 토픽모델링을 활용하여 국내 정보활용교육 연구의 흐름을 살펴보고 향후 정보활용교육의 방향성을 모색하는데 목적이 있다. 이를 위하여 국내 문헌정보학 분야의 학술지에 게재된 정보활용교육과 관련된 논문 306편을 선정하고, 논문의 초록을 대상으로 전처리 과정을 거쳐 전체 키워드 출현 빈도, 시기별 키워드 출현 빈도, 키워드 동시출현 빈도분석을 수행하였다. 이어서 키워드 네트워크 분석을 통해 키워드의 연결중심성과 매개중심성, 위세중심성을 분석하였다. 또한 구조적 토픽모델링 분석을 활용하여 15개의 토픽(교육과정, 정보활용교육 효과, 정보활용교육 내용, 학교도서관 교육, 정보매체활용, 정보활용능력 평가 지표, 도서관 불안, 공공도서관 프로그램, 대학도서관 이용자교육, 건강정보 활용능력, 정보격차, 도서관활 용수업 개선, 연구 동향, 정보활용교육 모델, 교사 역할)을 도출하고, 토픽별로 비중의 변화를 확인하기 위해 연도별 토픽 추이를 분석하였다. 이러한 결과를 바탕으로 정보활용교육의 방향성과 후속 연구에 대한 제언을 제시하였다.

사물 인터넷에 대한 키워드 매핑을 통한 동태적 분석 (Dynamic Analysis via Keyword Mapping for Internet of Things)

  • 손영우
    • 한국전자통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.813-818
    • /
    • 2015
  • 사물 인터넷(IoT)은 물리적 객체나 전자 제품, 소프트웨어, 센서 및 제조업체, 운영자 또는 연결된 다른 장치와 데이터를 교환하여 더 큰 가치와 서비스를 달성 할 수 있도록 연결된 사물 네트워크를 말한다. 지금까지 계량 정보 분석과 미래 유망영역 탐지에 대한 연구는 키워드를 중심으로 수행해왔다. 본 논문에서는 문헌에서 키워드 매핑에 대한 동태적 분석을 통하여 최근에 관심 영역인 사물 인터넷에 대한 미래 유망 영역을 탐지하는 방법을 제시한다.

키워드 네트워크 분석을 통해 알아본 초등교사의 과학수업 전문성에 대한 학생의 인식 (The Perceptions of the Students about Professionalism on the Elementary Teachers' Science Teaching through Network Analysis of Keyword)

  • 성승민;여상인
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제37권1호
    • /
    • pp.27-38
    • /
    • 2018
  • The purpose of this study was to investigate the perceptions of the students about professionalism on the elementary teachers' science teaching through network analysis of keyword. For this study, questionnaires were conducted to elementary school students. The collected data were translated by coding and data cleaning. And then analyzed by Gephi 0.9.2 program as a tool of the network analysis. The results of this study were as follows: Top 5 words in betweenness centrality were 'smart, experiment, fun, various, and student understanding'. There was some difference of perceptions of students according to personal backgrounds(gender, grade and interest toward science class). Based on the result of this study, implications to improve elementary teachers' science teaching professionalism were suggested.

Analyzing Knowledge Structure of Defense Area using Keyword Network Analysis

  • Lee, Yong-Kyu;Yoon, Soung-Woong;Lee, Sang-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.173-180
    • /
    • 2018
  • In this paper, we analyzed key keywords and research themes in the field of defense research using keyword network analysis and tried to grasp the whole knowledge structure. To do this, we extracted data from 2,165 research data from defense related research institutes from 2010 to 2017 and applied the Pareto rule to the number of abstracts of words and the number of links between words, We extracted a total of 2,303 words based on the criterion and extracted 204 final key words through component analysis. By analyzing the centrality and cohesiveness through these key words, we confirmed the concept of core research in the defense field and derived a total of 7 large groups and 16 small groups of each group in the knowledge structure of the defense area.