• 제목/요약/키워드: 중심성 분석

검색결과 15,545건 처리시간 0.043초

의미적 토픽 기반 지식모델의 통합에 관한 연구 (A study on integration of semantic topic based Knowledge model)

  • 전승수;이상진;배상태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.181-183
    • /
    • 2012
  • 최근 자연어 및 정형언어 처리, 인공지능 알고리즘 등을 활용한 효율적인 의미 기반 지식모델의 생성과 분석 방법이 제시되고 있다. 이러한 의미 기반 지식모델은 효율적 의사결정트리(Decision Making Tree)와 특정 상황에 대한 체계적인 문제해결(Problem Solving) 경로 분석에 활용된다. 특히 다양한 복잡계 및 사회 연계망 분석에 있어 정적 지표 생성과 회귀 분석, 행위적 모델을 통한 추이분석, 거시예측을 지원하는 모의실험(Simulation) 모형의 기반이 된다. 본 연구에서는 이러한 의미 기반 지식모델을 통합에 있어 텍스트 마이닝을 통해 도출된 토픽(Topic) 모델 간 통합 방법과 정형적 알고리즘을 제시한다. 이를 위해 먼저, 텍스트 마이닝을 통해 도출되는 키워드 맵을 동치적 지식맵으로 변환하고 이를 의미적 지식모델로 통합하는 방법을 설명한다. 또한 키워드 맵으로부터 유의미한 토픽 맵을 투영하는 방법과 의미적 동치 모델을 유도하는 알고리즘을 제안한다. 통합된 의미 기반 지식모델은 토픽 간의 구조적 규칙과 정도 중심성, 근접 중심성, 매개 중심성 등 관계적 의미분석이 가능하며 대규모 비정형 문서의 의미 분석과 활용에 실질적인 기반 연구가 될 수 있다.

네트워크 분석을 통한 융합연구 구조 분석: 첨단융합기술개발사업을 중심으로 (Applying Network Analysis in Convergent Research Relationships: The Case of High-Tech Convergence Technology Development Program)

  • 허정은;양창훈
    • 기술혁신학회지
    • /
    • 제16권4호
    • /
    • pp.883-912
    • /
    • 2013
  • 최근 경쟁우위 확보를 위한 급격한 경쟁 환경 속에서 과학기술혁신 분야의 경쟁력 제고를 위해서는 미래 주도형 원천 융합기술 개발 및 융합신산업을 육성할 수 있는 환경이 구축되어야 한다는 논의가 활발히 진행되고 있다. 이에 융합기술에 대한 지원 확대는 선택이 아닌 필수로 간주되고 있으며, 규모가 커지고 있는 융합기술 관련 R&D에 대한 투자의 효율적인 방향 모색의 필요성도 크게 대두되고 있다. 본 연구에서는 네트워크 분석을 통해서 연구 분야간에 어떤 유기적 관계를 형성하면서 융합연구가 이루어지고 있는지를 분석하였다. 대표적인 융합연구 사업인 첨단융합기술개발사업에 대한 네트워크 분석 결과, 연구 분야들간에 융합이 고르게 연계되어 이루어지고 있는 것으로 나타났다. 그러나 연계의 응집성을 나타내는 밀도분석 결과, 핵심군집에 속한 연구 분야들간에는 강한 연계성을 보이는 반면 핵심과 주변군집간의 연계 분포성은 상대적으로 미약한 것으로 나타났다. 또한 중심성과 연구 분야간 융합과제 비율에 대한 상관관계 분석결과, 연결 중심성이 낮은 분야들에서도 융합연구에 필요한 연구 역량이나 지식 자원을 보유하고 있는 것으로 나타났으며, 중심성이 높더라도 융합연구에 대한 지원 미비로 융합연구 활동이 활성화되지 못하는 경우가 있음을 본 연구결과는 제시하고 있다.

  • PDF

가중치 워크플로우 소셜 네트워크의 사이중심도 분석방법 (A Betweenness Centrality Analysis Method in Valued Workflow-supported Social Networks)

  • 김미선;김광훈
    • 인터넷정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.65-71
    • /
    • 2016
  • 본 논문에서는 가중치 및 방향성 워크플로우 소셜네트워크의 사이중심도 분석방법과 그에 따른 알고리듬을 제안한다. 기존의 워크플로우 소셜네트워크는 워크플로우 모델을 구성하는 단위업무를 처리하는 과정에서 수행자들간의 업무전달관계 유무를 이진 소셜네트워크 모델로 표현한 것이다. 그러나, 워크플로우 기반 조직을 구성하는 수행자들간의 업무전달관계를 효과적으로 분석하기 위해서는 기존의 수행자들간의 관계유무를 기본으로 하는 이진 소셜네트워크 정보 뿐 만 아니라 수행자들간의 정량적 업무전달관계와 그 업무전달관계의 방향성 또한 효과적인 분석결과를 획득하는데 있어서 매우 중요한 요인이다. 결과적으로, 본 논문에서는 수행자 그룹의 효과적인 업무전달관계 분석을 수행하기 위하여 정량적 업무전달관계 수준과 그의 방향성을 고려한 가중치 및 방향성 워크플로우 소셜네트워크 개념과 수행자 그룹의 사이중심도 분석방법 및 알고리듬을 제안한다. 특히, 제안한 분석방법을 검증하기 위하여 기존의 이진 워크플로우 소셜네트워크에 대한 사이중심도 분석방법과 본 논문에서 제안한 가중치 및 방향성 워크플로우 소셜네트워크에 대한 사이중심도 분석방법을 특정 워크플로우 모델에 적용하여 그 분석결과를 비교한다.

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구 (A Study on the Application of Topic Modeling for the Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.1-18
    • /
    • 2016
  • 이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

빅데이터 분석을 활용한 주짓수의 사회적 인식 연구 (A Study on the Social Perception of Jiu-Jitsu Using Big data Analysis)

  • 김건희
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.209-217
    • /
    • 2024
  • 본 연구의 목적은 빅데이터 분석을 이용하여 주짓수에 대한 사회적 관심과 인식을 분석해 발전방안을 모색하는데 있다. 최근 10년간 국내 주요 포털 사이트의 데이터를 수집해 네트워크 분석, 중심성 분석, CONCOR 분석을 실시하였다. 먼저 네트워크 분석과 연결 중심성 분석에서 '유도' 가 가장 중요한 연관어로 나타났으며, 근접 중심성 분석에서는 '디펜더'가, 매개 중심성 분석에서는 '스포츠'가 가장 중요한 연관어였다. CONCOR 분석결과 4개의 군집(관련 운동 및 마케팅, 주짓수 대회, 승급, 용품 및 비용)이 형성되었다. 연구의 결론으로 첫째, '유도', '운동', '대회', '도복', '체육관', '승급' 등의 단어를 활용한 홍보가 필요하다. 둘째, 수련 비용 등에 대해 정보를 다양한 루트로 공유하고, 승급과정이나 방법에 대한 인식이 보편화 될 수 있도록 하는 방안이 마련되어야 하며, 안전용품개발 및 안전한 수련 문화를 만들어나갈 필요가 있다. 셋째, 꾸준히 대회를 유치해 새로운 수련생들의 유입을 지속적으로 늘리는 방안을 모색할 필요가 있다.

학술논문의 저자키워드 출현순서에 따른 저자키워드 중요도 측정을 위한 네트워크 분석방법의 적용에 관한 연구 (A Study on the Application to Network Analysis on the Importance of Author Keyword based on the Position of Keyword)

  • 권선영
    • 정보관리학회지
    • /
    • 제31권2호
    • /
    • pp.121-142
    • /
    • 2014
  • 본 연구는 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 먼저 출현순서에 따른 저자키워드의 특징을 분석한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성, 그리고 네트워크의 구조적공백성의 효과크기와 같은 지수를 사용하여 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보았으며 각각의 네트워크 지수와 저자키워드의 출현순서와의 상관관계분석을 수행하였다. 네트워크 분석 지수 중 연결정도중심성 지수, 매개중심성 지수의 경우 각 학문분야별 저자키워드의 출현순서와의 상관관계의 결과에서의 유의한 분야의 수가 비교적 다른 지수에 비해 많았다. 이와 같은 결과를 통해 저자키워드의 중요도를 단지 출현빈도만으로 판단했던 것에서 벗어나 저자키워드의 중요도 측정을 위한 방법으로 연결정도중심성 지수, 매개중심성 지수도 고려해 볼 수 있음을 알 수 있었다.

키워드 빈도와 중심성 분석에 기반한 사물인터넷 국내 연구 동향 (Domestic Research Trend of Internet of Things based on Keyword Frequency and Centrality Analysis)

  • 이택균
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.23-35
    • /
    • 2020
  • 본 연구는 산업과 사회 전반에 걸쳐서 많은 영향을 미칠 사물인터넷에 관한 국내 논문들을 수집하고 분석하여 사물인터넷 분야의 동향을 살펴보고자 한다. 본 연구를 위한 조사 기간은 2015년에서 2019년까지로 하였으며 네이버의 학술정보를 이용하여 사물인터넷에 관한 국내 논문들을 수집하였다. 기간별로 수집된 국내 논문으로부터 빈도가 높은 키워드들을 추출하였으며 빈도가 높은 키워드 중에서 중심적인 키워드를 파악하기 위해서 중심성 분석을 하였다. 키워드 빈도에서는 2015년부터 2017년까지는 '센서', '보안' 그리고 2017년부터는 '차', '지능'이 빈도가 높은 상위 키워드로 나타났다. 키워드 중심성에서는 2015년부터 2016년까지 '보안', '센서' 그리고 2017년부터는 '지능', '차', '산업혁명'이 중심성이 높은 키워드로 나타났다.

웹 크롤링에 의한 네이버 뉴스에서의 한국농수산대학 - 키워드 분석과 의미연결망분석 - (Korea National College of Agriculture and Fisheries in Naver News by Web Crolling : Based on Keyword Analysis and Semantic Network Analysis)

  • 주진수;이소영;김승희;박노복
    • 현장농수산연구지
    • /
    • 제23권2호
    • /
    • pp.71-86
    • /
    • 2021
  • 빅데이터 분석기술인 웹 크롤링 기술을 이용하여 네이버 뉴스 데이터 내에 담겨 있는 '한농대' 에 대한 이미지 단어를 추출하였다. 뉴스 기사에서 언급된 빈도에 따라 중요한 단어로 평가는 단어빈도 분석에서는 청년농업인을 육성하는 한농대의 특성을 잘 설명하는 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등의 단어가 자주 사용되는 것으로 나타났다. 또한 '디지털', '스마트', '드론', '졸업생', '창업', '새만금', '교육과정' 등 디지털 농업 전문 인재를 육성하기 위한 학교의 교육, 지원, 비전 등과 관련한 단어들이 추출되었다. 모든 기사 데이터의 단어 빈도(TF) 및 역 문서 빈도(IDF)를 이용한 TF-IDF 가중치의 전체 순위는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 한농대와 관련된 뉴스 기사에서 중요한 핵심어 역할을 하는 것으로 나타났다. 단어 빈도에서 '드론', '농림축산식품부', '전북', '청년농업인', '전주', '장치, '파종' 등은 순위가 매우 낮았으나 TF-IDF 가중치 순위에서는 한농대를 표현하는 핵심어로 나타났다. TF-IDF 평가에서 '교육', '지원', '청년', '사업', '농촌' 등의 키워드는 단어빈도가 높으면서 많은 문서에서 자주 등장하는 키워드로서 핵심어 역할은 크지 않은 것으로 나타났다. 단어 간 연계성을 파악하기 위한 의미연결망 분석에서 추출한 바이그램은 '청년'-'농업인', '디지털'-'농업', '영농'-'정착', '농업'-'농촌', '디지털'-'전환' 등의 순으로 빈도가 높게 나타났다. 중심성 지표로 키워드의 영향력을 평가한 결과 모든 지표에서 '농업'이 1위로 나타났으며, 2위에는 '농업인'(근접 중심성, 매개 중심성), '교육'(연결 중심성, 페이지랭크 중심성) 및 '미래'(고유벡터 중심성)으로 나타났다. 스피어먼 순위 상관계수에 의한 중심성 지표별 키워드의 순위의 유사성은 연결 중심성과 페이지랭크 중심성이 0.89 전후의 가장 높은 상관관계를 보였다. 이상으로 네이버 뉴스의 한농대 관련 기사에서 단어 빈도로 보면 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등이 중요한 단어로 평가되었으나, 문서빈도를 함께 고려한 평가에서는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 핵심어 역할을 하는 것으로 나타났다. 한편 단어나 문서의 빈도가 아니라 단어 간 네트워크 연계성을 고려한 중심성 분석에서는 연결 중심성과 페이지랭크 중심성에 의한 평가가 적합한 것으로 나타났으며, '농업', '교육', '미래', '농업인', '디지털', '지원', '활용' 등이 중심성이 강한 단어로 나타났다.

가중 네트워크 분석을 위한 최근접이웃중심성 척도의 일반화 (Generalizing Nearest Neighbor Centrality for Weighted Network Analysis)

  • 이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.19-22
    • /
    • 2013
  • 네트워크 분석이 확산되면서 여러 분야에서 다양한 중심성 척도가 개발되어 활용되고 있으나 가중 네트워크에서 지역중심성을 측정할 수 있는 척도로는 최근접이웃중심성 이외에는 거의 알려져 있지 않다. 최근접이웃중심성 척도는 동률값이 흔히 나타나므로 변별력이 낮다는 단점을 가지고 있다. 이 연구에서는 최근접이웃중심성 척도를 일반화한 이웃중심성 척도를 제안하고 가상 자료 및 실제 자료에 대해 적용하여 검증해보았다.

  • PDF

문헌 단위 인용 네트워크 내 인용과 중심성 지수 간 관계 추정에 관한 연구 (Curve Estimation among Citation and Centrality Measures in Article-level Citation Networks)

  • 유소영
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.193-204
    • /
    • 2012
  • 이 연구에서는 인용 및 동시인용 문헌 네트워크에서의 중심성 지수를 사용한 추론 통계 적용의 첫 번째 단계로써 이들 간 관계의 선형성을 살펴보고자 하였다. 703개의 문헌 동시인용 네트워크를 활용하여 인용 빈도, 연결정도 중심성, 인접 중심성, 매개 중심성 간의 4가지 주요 관계의 패턴을 살펴본 결과, 모든 인용 및 중심성 간 관계가 선형모델보다는 비선형적 모델로 더 잘 설명될 수 있음을 통계적으로 확인되었다. 따라서 이들 간의 인과관계에 대한 다중회귀분석과 같은 추론 통계 분석의 기반이 되는 선형성을 확보하기 위해서는 논리적인 기준에 근거한 데이터 변환이나 실제값을 구간값으로 변환하는 과정이 필요하다고 할 수 있다.