• 제목/요약/키워드: 키워드분석

검색결과 1,680건 처리시간 0.03초

그래프 마이닝을 이용한 뉴스 데이터 분석 기법 (News Data Analysis Technique using Graph Mining)

  • 이창주;박기성;한용구;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.730-733
    • /
    • 2015
  • 대용량의 인터넷 뉴스 데이터로부터 유용한 정보를 찾기 위해 연관 키워드, 핫 키워드 분석과 같은 다양한 분석 기술들이 연구되고 있다. 기존의 토픽 모델 기반의 기법은 키워드들간의 연관성을 제대로 표현하지 못하여 마이닝한 연관 키워드와 핫 키워드의 정확도가 낮은 문제점이 있다. 최근, 뉴스 데이터를 뉴스 내의 단어를 버텍스로, 같은 문장내의 단어들을 에지로 연결하는 그래프 기반의 모델링기법이 연구되었다. 이러한 뉴스 그래프 DB에서 그래프 마이닝 기술을 적용하면 연관 키워드, 핫 키워드를 마이닝 할 수 있다. 본 논문은 그래프 마이닝 기술 기반의 효과적인 뉴스 데이터 분석 기술을 제안한다. 실제 뉴스 데이터를 통해 마이닝한 유용한 뉴스 그래프 패턴들을 보이고 뉴스 데이터 분석에 효과적으로 활용될 수 있음을 보인다.

프로파일링에 기초한 키워드 유형별 지적구조 분석에 관한 연구 - 국외 오픈액세스 분야를 중심으로 - (A Study on the Intellectual Structure Analysis by Keyword Type Based on Profiling: Focusing on Overseas Open Access Field)

  • 김판준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.115-140
    • /
    • 2021
  • 본 연구는 국외 오픈액세스 분야를 대상으로 LISTA 데이터베이스에서 추출한 키워드 집합을 두 가지 유형(통제키워드, 비통제키워드)으로 구분하고, 각 키워드 유형별로 프로파일링에 기초한 지적구조 분석을 수행한 결과를 검토하였다. 또한, 이를 동시출현단어 분석에 기초한 지적구조 분석의 결과와 비교하였다. 이를 통해 지적구조 분석의 또 다른 방법인 프로파일링에서도 이와 유사한 결과가 도출되는 지를 살펴보고, 동시출현단어 분석과 프로파일링의 차이점을 검토하고자 하였다. 그 결과, 두 가지 키워드 유형별로 프로파일링에 기초한 지적구조 분석의 결과는 동시출현단어 분석과 유사한 차이가 있었다. 또한 프로파일링과 동시출현단어 분석에 기초한 지적구조 분석의 결과 간에도 주목할 만한 차이가 있었다. 따라서 키워드를 사용하는 지적구조 분석은 연구 목적에 따라 키워드 유형별 특성을 고려하여야 하며, 특정 분야의 연구 동향을 보다 명확하게 파악하기 위해서는 동시출현단어 분석보다 프로파일링에 기초한 지적구조 분석을 사용하는 것이 더 나은 결과를 기대할 수 있다.

키워드 네트워크 분석을 통한 난독증과 학습장애 관련 연구 동향 분석 (A Study on the Research Trend in the Dyslexia and Learning Disability Trough a Keyword Network Analysis)

  • 이우진;김태강
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.91-98
    • /
    • 2019
  • 본 연구는 난독증과 학습장애 관련 연구 동향과 키워드 네트워크 분석을 통한 관련 변인의 중심성을 알아보는데 그 목적이 있다. 2008년부터 2018년까지 학술교육학술정보원에서 제공하는 학술연구정보서비스 사이트 데이터베이스를 활용하여 연구 목록을 수집하였다. 분석대상으로 선정된 407편의 연구 주제는 키워드 클렌징 작업을 거쳐 KrKwic 프로그램을 이용하여 주요 키워드를 추출하였고 키워드 간 연결중심성을 시각화를 하기 위해 NodeXL프로그램을 활용하였다. 분석결과 다음과 같은 연구결과를 도출하였다. 첫째, 난독증과 학습장애 연구주제 총 72개의 키워드가 추출되었고 주요키워드에는 학습장애, 읽기장애, 난독증, 중재반응모형 순으로 제시하고 있었다. 둘째, 난독증과 학습장애의 관련 매개 키워드 중심성을 분석한 결과 학습장애가 국내 난독증 및 학습장애 관련 연구에서 주요한 키워드로 볼 수 있다. 이러한 연구결과를 통해 난독증과 학습장애와 관련해 정량적 분석과 정성적 분석을 절충한 연구동향 분석방법을 제시하였다는 점에서 의의가 있다고 할 수 있다.

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.

오피니언 마이닝 기법을 이용한 키워드 분석 시스템 설계 (The Design of Keyword Analysis System using a Opinion Mining Scheme)

  • 문희준;김동현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.141-142
    • /
    • 2022
  • 최근 빅데이터를 통해 여러 가지 분석을 진행하고 있다. 다만 이러한 방식으로는 키워드에 대해 여론에 대한 분석을 거치지 않아 정확한 분석이 힘들다는 문제점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점의 개선을 위해 데이터를 수집하고 이에 대해 감정분석을 수행하는 컨테이너 기반의 시스템을 제안한다. 감정분석 시스템을 적용한다면 키워드에 대해 분석 시에 정확도가 더욱 높아질 것으로 전망된다.

  • PDF

키워드 연결 관계를 통한 계량정보 분석 (Scientometric Analysis through Linkage Relation of Keyword)

  • 신현식;권오진;구영덕;손영우;배영철
    • 한국전자통신학회논문지
    • /
    • 제8권10호
    • /
    • pp.1467-1475
    • /
    • 2013
  • 본 논문에서는 논문 문헌을 중심으로 키워드를 선정하여 사용할 때 키워드 간의 상호 연관 관계를 조사한다. 조사 대상은 마이크로 배터리와 에너지 하비스팅을 중심으로 핵심 키워드와 핵심 키워드를 중심으로 한서브 핵심 키워드의 상호 연관이 어떻게 구성되는지를 제안한다.

실시간 트위터 분석을 통한 트렌드 및 연관키워드 추출 (Trend and related keyword extraction based on real-time Twitter analysis)

  • 김대용;김대훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1710-1712
    • /
    • 2012
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS상에서의 단문 글들을 실시간으로 분석하여 최신의 트렌드를 추출해 낼 수 있다면, 사용자에게 유용한 정보를 제공하는 것이 가능하다. 본 논문에서는 다량의 Tweet글들에 대한 실시간 분석을 바탕으로 트렌드를 추출하고 연관된 키워드를 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet내에서 영어의 언어적 특성을 활용하여 최근 이슈화된 트렌드 키워드를 추출해낸다. 또한, Tweet 내에서 각 트렌드 키워드간 관계를 분석하여 연관 키워드를 제공하며, 동시에 Wikipedia와 Google에서의 검색을 통하여 다른 형태의 연관 키워드도 추출한다. 이 모든 과정은 제안된 트렌드 추출 알고리즘을 통해 실시간으로 제공된다. 제안된 기법을 바탕으로 시스템을 구현하고 다양한 실험을 통하여 키워드의 유효성 및 처리 속도 면에서 시스템의 성능을 평가한다.

동시출현단어 분석에 기초한 지적구조 분석에서 키워드 유형별 특성에 관한 연구 - 국외 오픈액세스 분야를 중심으로 - (A Study on the Characteristics by Keyword Types in the Intellectual Structure Analysis Based on Co-word Analysis: Focusing on Overseas Open Access Field)

  • 김판준
    • 한국문헌정보학회지
    • /
    • 제55권3호
    • /
    • pp.103-129
    • /
    • 2021
  • 본 연구는 동시출현단어 분석에 기초한 지적구조 분석에서 주제를 표현하는 두 가지 키워드 유형의 특성에 관하여 국외 오픈액세스 분야를 중심으로 살펴보았다. 구체적으로 문헌정보학 분야 LISTA 데이터베이스에서 추출한 키워드 집합을 두 가지 유형(통제키워드, 비통제키워드)으로 구분하고, 동시출현단어 분석에 기초한 지적구조 분석을 수행한 결과를 비교하였다. 그 결과, 각 키워드 유형별로 키워드 집합, 연구지도와 영향력, 그리고 시기에 따라 상당한 차이가 있는 것으로 나타났다. 따라서 동시출현단어 분석에 기초한 지적구조 분석에서는 연구 목적에 따라 키워드 유형별 특성을 고려하여야 한다. 즉 전체 학문분야 관점에서 특정분야의 전반적인 연구 동향을 살펴보는 목적으로는 통제키워드를, 해당 분야 관점에서 연구 영역별로 세부적인 동향을 파악하는 목적으로는 비통제키워드를 사용하는 것이 더 적절할 것이다. 또한 양자의 관점을 모두 반영하는 종합적인 지적구조 분석을 위해서는 통제키워드와 비통제키워드를 개별적으로 사용한 결과를 상호 비교하여 분석하는 것이 가장 바람직하다고 할 수 있다.

키워드 네트워크 분석을 활용한 세계 크루즈산업 연구동향 (Research Trends in Global Cruise Industry Using Keyword Network Analysis)

  • 장세은;이수호
    • 한국항해항만학회지
    • /
    • 제38권6호
    • /
    • pp.607-614
    • /
    • 2014
  • 세계적으로 해양산업은 크루즈산업에 많은 관심과 연구가 대폭적으로 이루어지고 있고 우리나라도 미래의 잠재력 있는 국가동력산업의 하나로 인식하고는 있으나 크루즈산업의 연구동향 분석 연구는 국내외에 활발히 이루어지고 있지 않다. 따라서 우선 세계 크루즈산업을 연구하고 이해하기 위해서는 최근에 다양한 산업에 대한 연구동향을 분석한 방법을 활용하여 크루즈산업에도 적용할 필요가 있다. 본 논문의 목적은 외국 유명저널에 발표된 크루즈산업과 관련된 학술논문에서 제시하고 있는 키워드와 논문을 매개로 한 키워드 네트워크를 구축하여 복잡계의 네트워크 분석에서 사용하는 연결 중심성과 매개 중심성 분석방법으로 시대별로 나누어 시각화하여 살펴봄으로써 세계 크루즈산업의 연구동향을 심층적으로 관찰하여 논의하는 것이다. 본 연구에서 제시된 키워드 빈도는 Zipf의 법칙을 따르고 노드의 연결정도는 멱함수 분포를 보여주고 있어 언어네트워크에서 분석하는 키워드 네트워크와 동일함을 관찰한다. 연구방법론으로는 키워드 네트워크 분석을 위하여 사회연결망 프로그램인 넷마이너 4.0을 사용하여 여러 가지 중심성 측정방법 중 키워드 상위 20개의 빈도순위를 비교하여 빈도순위와 가장 가까운 중심성 측정방법을 선택하여 크루즈산업의 연구동향을 분석한다. 특히 크루즈산업의 연구동향이 연도 기간별로 어떠한 변화를 가져왔는지를 살펴보기 위해 2000년 이전과 2000년 이후로 크게 대별하여 나누고 2000년 이후에는 5년 주기로 각 기간별 공통적으로 나타나는 연결 중심성이 높은 최상위의 키워드인 cruise와 tourism 노드를 중심으로 매개 중심성이 높은 것들의 키워드 네트워크를 시각화하여 논의한다. 연구결과에서 흥미롭게도 2010-2014의 기간에 새로운 노드로 China가 등장하여 최상위의 키워드들을 연결하고 있는 것은 최근 급성장하고 있는 중국의 크루즈산업의 발전 양상을 보여준다. 그러므로 본 연구에서 사용하는 키워드 네트워크 분석은 각 연도 기간별 네트워크의 다른 종류의 숫자와 크고 작은 중심축 군집 네트워크의 숫자의 증감뿐 아니라 중심축 군집 네트워크의 중심에 있는 키워드 간의 연결 분석을 용이하게 해주어 기간별 연구동향을 파악하는데 유용한 방법임을 확인할 수 있었다.

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석 (Patent data analysis using clique analysis in a keyword network)

  • 김현;김동건;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1273-1284
    • /
    • 2016
  • 본 연구에서는 기계 학습 분야의 특허를 수집하여 키워드 네트워크를 구축하고 클릭 분석을 실시하였다. 먼저 텍스트 마이닝 기법을 적용하여 핵심 키워드들을 선정한 다음, 이 키워드를 기반으로 키워드 네트워크를 구축하였다. 다음으로 네트워크 구조 분석, 중요 키워드 분석 및 클릭 분석을 시행하여 2005년도와 2015년도에 출원된 기계 학습 특허의 동향을 파악하였을 뿐만 아니라 양해년도의 분석 결과를 통해 특허 경향을 파악하였다. 분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에서 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 클릭 분석 결과 2005년도 클릭 분석에 의해 발견된 주제는 뉴스메이커 검증, 상품 소비 예측, 바이러스 공격 예방, 바이오마커, 그리고 워크플로우 관리였으며, 2015년도 기계 학습 특허 주제는 디지털 이미지 편집, 직불카드, 수신자 인라이닝 시스템, 유방 촬영 시스템, 재고 관리 시스템, 이미지 편집 시스템, 비행기 티켓 가격 예측, 그리고 문제 예측 시스템으로 나타났다. 2005년도에 비하여 2015년도의 근접 중앙성은 낮아지고 매개 중심성은 높아진 것으로 보아 최근의 특허 경향은 보다 다양한 분야에서 출원되고 있으며 이들 간의 연결이 활발해지고 있음을 알 수 있다. 클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것으로 기대된다.