• 제목/요약/키워드: 키워드분석

검색결과 1,685건 처리시간 0.03초

지적구조 규명을 위한 키워드서지결합분석 기법에 관한 연구 (Introducing Keyword Bibliographic Coupling Analysis (KBCA) for Identifying the Intellectual Structure)

  • 이재윤;정은경
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.309-330
    • /
    • 2022
  • 학문의 구조, 특성, 하위 분야 등을 계량적으로 규명하는 지적구조 분석 연구가 최근 급격히 증가하는 추세이다. 지적구조 분석 연구를 수행하기 위하여 전통적으로 사용되는 분석기법은 서지결합분석, 동시인용분석, 단어동시출현분석, 저자서지결합분석 등이다. 이 연구의 목적은 키워드서지결합분석(KBCA, Keyword Bibliographic Coupling Analysis)을 새로운 지적구조 분석 방식으로 제안하고자 한다. 키워드서지결합분석 기법은 저자서지결합분석의 변형으로 저자 대신에 키워드를 표지로 하여 키워드가 공유한 참고문헌의 수를 두 키워드의 주제적 결합 정도로 산정한다. 제안된 키워드서지결합분석 기법을 사용하여 Web of Science에서 검색된 'Open Data' 분야의 1,366건의 논문집합을 대상으로 분석하였다. 1,366건의 논문집합에서 추출된 7회 이상 출현한 63종의 키워드를 오픈데이터 분야의 핵심 키워드로 선정하였다. 63종의 핵심 키워드를 대상으로 키워드서지결합분석 기법으로 제시된 지적구조는 열린정부와 오픈사이언스라는 주된 영역과 10개의 소주제로 규명되었다. 이에 반해 단어동시출현분석의 지적구조 네트워크는 전체 구성과 세부 영역 구조 규명에 있어 미진한 것으로 나타났다. 이러한 결과는 키워드서지결합분석이 키워드 간의 서지결합도를 사용하여 키워드 간의 관계를 풍부하게 측정하기 때문이라고 볼 수 있다.

키워드 커뮤니티 네트워크의 소셜 네트워크 분석을 이용한 사물 인터넷 특허 분석 (Social network analysis of keyword community network in IoT patent data)

  • 김도현;김현희;김동건;조진남
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.719-728
    • /
    • 2016
  • 본 연구에서는 한국과 미국의 사물 인터넷 관련 특허 초록을 수집하여 키워드 네트워크 및 키워드 커뮤니티 네트워크를 구축하고 네트워크 분석을 실시하였다. 먼저 TF-IDF 가중치를 적용하여 중요 키워드를 추출하고 이 중요 키워드와 상관관계가 높은 키워드들을 재추출하여 핵심 키워드를 선정하였다. 선정된 키워드를 중심으로 키워드 네트워크를 구축한 다음 네트워크 탐지를 시행하여 키워드 커뮤니티 네트워크를 재구축하여 기술 간의 연결 관계를 분석하였다. 본 연구에서 생성한 키워드 커뮤니티 네트워크는 특허의 내용을 예측할 수 있을 뿐만 아니라 커뮤니티 간의 연결 관계를 분석함으로써 기술 간의 연관 관계도 파악할 수 있다. 키워드 커뮤니티 네트워크 분석 결과 한국은 보안, 반도체, 이미지 프로세스와 같은 사물 인터넷의 기반 기술 분야의 특허가 중요한 특허 기술로 나타난 반면 미국의 경우 스마트 홈, 대화형 매체 그리고 통신 등과 같은 사물 인터넷 환경, 응용 분야의 기술이 중요한 기술로서 자리잡고 있음을 알 수 있다.

토론 대화에서의 토픽 분석을 위한 키워드 추출 및 키워드 기반 감성분석 시스템 (A System for Keyword Extraction and Keyword-based Sentiment Analysis for Topic Analysis in Discussion)

  • 정용빈;오유진;박재완;장새미;함영균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-169
    • /
    • 2022
  • 토픽 모델링은 비즈니스 분석이나 기술 동향 파악 등 다방면에서 많이 사용되고 있는 기술이다. 하지만 대표적인 방법인 LDA와 같은 비지도학습의 경우, 그 알고리즘 구조상 문서의 수가 많을 때 토픽 모델링이 가능하다. 본 논문에서는 문서의 수가 적은 경우도, 키워드 및 키프레이즈를 이용한 군집화를 통해 토픽 모델링을 하고 감성분석을 통해 토픽에 대한 분석도 제시하였다. 이에 필요한 데이터 제작 및 키워드 추출, 키워드 기반 감성분석, 키워드 임베딩 및 군집화를 구현하였고, 결과를 정성적으로 보았을 때 유의미한 분석이 되는 것을 확인하였다.

  • PDF

검색 엔진을 이용한 키워드 연관성 분석 (The Keyword Relationship Analysis Using Searching Engine)

  • 이주연;노정현;조수현;이중화;박유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1077-1080
    • /
    • 2014
  • 대량으로 발생하는 키워드들 간의 연관성을 분석하고자 하는 연구는 꾸준히 진행되어 왔다. 많은 용어들의 관계를 분석하기 위한 방법으로 전문가 집단의 인력과 시간을 수행할 수 있지만, 시간과 비용이 많이 소모된다. 이를 해결하기 위한 방법으로 이미 관련 키워드 서비스를 제공하기 위한 시스템을 구축해 놓은 검색엔진을 사용해서 키워드들 간의 관계를 분석해 볼 수 있다. 본 논문에서는 IT분야의 논문에서 저자들이 자유롭게 작성하는 관심 분야를 키워드로 선정하고, 이 키워드들 간의 관계를 분석하기 위해 검색 엔진에서 출력하는 검색 결과 수를 사용한다. 검색 엔진에서 제공하는 검색 결과 수가 높을수록 다른 키워드와 연관성이 높은 키워드임을 알 수 있다.

사회적 핵심 이슈 키워드 정보를 활용한 채팅 프로그램 개발 (Development of chatting program using social issue keyword information)

  • 윤경섭;정원혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.307-310
    • /
    • 2020
  • 본 논문에서 이슈 키워드 추출을 위해 텍스트 마이닝(Text Mining) 기술을 요구한다. 사회적 이슈 키워드를 추출하기 위해 키워드 수집 모델이 되는 사이트에서 크롤링(crawling)을 수행한 뒤, 형태소 단위 의미있는 단어를 수집하기 위해 형태소 분석(morphological analysis)을 수행한다. 한국어 형태소 분석을 위해 파이썬의 코엔엘파이(KoNLPy) 패키지를 활용한다. 형태소 분석을 통해 나뉘어진 단어에서 통계를 내어 이슈 키워드 추출한다. 이슈 키워드를 뒷받침할 연관 단어를 분석하기 위해 단어 임베딩(Word Embedding)을 수행한다. 단어 임베딩 수행을 위해 Word2Vec 모델 중 Skip-Gram 방법론을 적용하여 연관 단어를 분석하도록 개발하였다. 웹 소켓(Web Socket) 통신을 통한 채팅 프로그램의 상단에 분석한 이슈 키워드와 연관 단어를 출력하도록 개발하였다.

  • PDF

키워드 네트워크 분석을 통한 세계 해운경제의 연구 주제와 동향에 대한 연구 (A Study of Themes and Trends in Research of Global Maritime Economics through Keyword Network Analysis)

  • 장세은;이수호
    • 한국항만경제학회지
    • /
    • 제32권1호
    • /
    • pp.79-95
    • /
    • 2016
  • 본 연구에서는 세계 해운경제관련 국제저널에 게재된 논문을 대상으로 5년 주기의 연도 기간별로 2000년~2004년, 2005년~2009년, 2010년~2014년 세 단계로 나누고 저자키워드를 추출하여 네트워크 분석방법인 연결중심성과 매개중심성 방법론을 활용하여 세계 해운경제의 연구동향을 양적인 관점에서 살펴본다. 빈도로 추출한 본 연구의 자료는 Zipf's의 법칙을 따르고 있으며, 키워드 노드들이 멱함수 분포를 가지므로 해운경제 키워드가 네트워크분석에 적합하다는 것을 보여주었다. 연도시기별로 공유되는 키워드 분석에 설명력을 더해 주기 위하여 Delta-C 알고리즘을 만들어서 시간에 따른 키워드의 변화 경향을 설명하고자 하였다. 본 연구의 결과는 다음과 같다. 해운경제 키워드를 세 개의 연도시기별로 분석한 결과 두 개의 서로 다른 패턴을 발견하였다. 첫 번째 패턴은 세 개의 모든 기간에 공유되는 키워드이고 두 번째 패턴은 두 개 시기에 연속적으로 혹은 불연속적으로 나타나는 키워드였다. 모든 시기에 연속적으로 사용된 키워드는 연결중심성 값이 불규칙하게 변화하는 양상을 보인다. 주기가 연속인 경우는 세 가지이다. 첫 번째 경우는 2000년~2004년과 2005년~2009년 연속으로 걸쳐서 사용된 키워드의 특징은 처음에 사용된 키워드의 중심성이 다음 연도기간에 사용될 때에는 낮은 연결중심성을 가졌다. 두 번째 경우는 2005년~2009년과 2010년~2014년 연속으로 걸쳐서 나타난 키워드에서는 후반기에 사용된 키워드가 더 높은 연결중심성을 보였다. 세 번째 경우는 2000년~2004년과 2010년~2014년의 불연속으로 나타난 경우인데 과거에 사용된 모든 키워드의 연결중심성은 가장 최근에는 모두가 낮은 연결 중심성 값을 가졌다. 매개중심성을 사용한 연도시기별 키워드분석결과 이 방법은 연결중심성에 비해서 더 많은 비공유 키워드를 상위에 나타났다. 이러한 연구의 결과의 의의는 네트워크분석을 통하여 향후 연구동향 예측의 기초 자료로 활용할 수 있다는 점이다. 즉, 연결중심성은 연도 기간별 주요 연구주제를 파악할 수 있는데 도움을 줄 수 있고 매개중심성은 특정기간에 등장하는 특이한 주제 파악에 도움이 된다는 것이다.

학술논문의 저자키워드 출현순서에 따른 저자키워드 중요도 측정을 위한 네트워크 분석방법의 적용에 관한 연구 (A Study on the Application to Network Analysis on the Importance of Author Keyword based on the Position of Keyword)

  • 권선영
    • 정보관리학회지
    • /
    • 제31권2호
    • /
    • pp.121-142
    • /
    • 2014
  • 본 연구는 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 먼저 출현순서에 따른 저자키워드의 특징을 분석한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성, 그리고 네트워크의 구조적공백성의 효과크기와 같은 지수를 사용하여 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보았으며 각각의 네트워크 지수와 저자키워드의 출현순서와의 상관관계분석을 수행하였다. 네트워크 분석 지수 중 연결정도중심성 지수, 매개중심성 지수의 경우 각 학문분야별 저자키워드의 출현순서와의 상관관계의 결과에서의 유의한 분야의 수가 비교적 다른 지수에 비해 많았다. 이와 같은 결과를 통해 저자키워드의 중요도를 단지 출현빈도만으로 판단했던 것에서 벗어나 저자키워드의 중요도 측정을 위한 방법으로 연결정도중심성 지수, 매개중심성 지수도 고려해 볼 수 있음을 알 수 있었다.

키워드 분석에 대한 최신 접근법 비교 연구: 성경 코퍼스를 중심으로 (A Comparative Study of a New Approach to Keyword Analysis: Focusing on NBC)

  • 하명호
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.33-39
    • /
    • 2021
  • 본 연구는 구약 성경 코퍼스와 신약 성경 코퍼스, 그리고 구약과 신약 성경을 통합한 코퍼스에서 추출된 키워드 목록의 어휘적 특징을 분석하고, 또 사용빈도 기반의 키워드 분석보다 분포도 기반 키워드 분석이 더 우수한 분석 방식임을 밝히고자 하였다. 이를 위해 Bible Hub의 NLT 웹사이트에서 성경 파일을 다운받아 약 57만 어절의 구약 성경 코퍼스와 약 20만 어절의 신약 성경 코퍼스를 구축하였다. 목표 코퍼스와 참조 코퍼스의 비교를 통한 키워드 목록을 추출하기 위해서 Scott(2020)의 WordSmith 8.0 프로그램을 사용하였다. 그 결과, 분포도 기반 키워드 분석이 사용빈도 기반의 키워드 분석보다 키워드 목록의 어휘적 특징을 보다 더 잘 나타낼 수 있었고, 또 코퍼스 내용의 대표성과 변별성을 충분히 충족시킬 수 있는 최적의 키워드 목록을 추출하기 위해서는 분포도 기반 키워드 분석이 더 우수한 방식임을 밝혔다.

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

영화 리뷰 감성 분석을 통한 키워드 추출 및 시각화 (Keyword Extraction and Visualization of Movie Reviews through Sentiment Analysis)

  • 박종찬;김성진;윤영현;백재순
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.261-262
    • /
    • 2023
  • 본 연구에서는 감성 분석 기반의 키워드 도출형 영화 리뷰 웹사이트를 개발하였다. 사용자들은 영화에 대한 리뷰를 작성할 때, 자동으로 키워드를 추출하는 기능을 활용하여 다양하면서도 빠르게 정보를 얻을 수 있다. 사용자가 작성한 리뷰를 시스템에 입력하면, 내부적으로 ChatGPT를 활용하여 텍스트를 분석하고 키워드를 추출한다. 이를 통해 사용자는 별다른 노력 없이도 키워드를 통해 영화의 장르, 감독, 배우, 플롯 요소 등 다양한 정보를 빠르게 확인할 수 있다. 추출된 키워드는 저장되어 시각화에 활용되며, 사용자들은 리뷰에 대한 원하는 정보를 쉽게 얻을 수 있다. 개발된 키워드 도출형 영화 리뷰 웹사이트는 사용자들에게 빠르고 다양한 정보를 제공하며, 영화 관련 결정을 내리는 데에 도움을 줄 것으로 기대된다.

  • PDF