• 제목/요약/키워드: Betweenness centrality words

검색결과 28건 처리시간 0.021초

정보조직 지식구조에 대한 연구 - 2000년~2011년 학술논문을 중심으로 - (Knowledge Structures in Knowledge Organization Research: 2000-2011)

  • 박옥남
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.247-267
    • /
    • 2011
  • 본 연구는 내용분석과 네트워크 분석을 사용하여 국내 정보조직분야 지식구조를 조사하고자 하였다. 이를 위해 2000년부터 최근까지 정보조직분야 논문을 바탕으로 저자키워드, 초록, 저자, 저자소속기관을 추출하여 용어의 빈도를 측정하는 것은 물론 용어 간 연관관계를 분석하였다. 이를 위해 네트워크상에서 각 노드의 연결중심성, 근접중심성, 위세중심성을 산출하였다. 그 결과 정보조직 연구주제어는 좁고 복잡한 네트워크를 형성하고 있으며 주제어 사이에 직접적인 연결이 많이 이루어지고 있음을 알 수 있다. 목록과 분류는 여전히 정보조직의 중심축을 담당하고 있는 반면, 메타데이터, 온톨로지가 새로운 연구 분야로 부상하였다. 반면에 저자소속기관 및 저자는 넓은 네트워크를 형성하고 있었으며 협력이 활발하지 않았다.

Smart Store in Smart City: 소비자 감성기반 상권분석 시스템 개발 (Smart Store in Smart City: The Development of Smart Trade Area Analysis System Based on Consumer Sentiments)

  • 유인진;서봉군;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.25-52
    • /
    • 2018
  • 본 연구는 소비자들이 상권에 대하여 수행하는 웹 탐색 활동과 감성평가를 반영하는 데이터인 지역구 연관감성어휘를 기반으로 서울시 내 대형 상업 공간으로 정의할 수 있는 각 지역구 간의 연관 감성 네트워크에 대하여 소셜 네트워크 분석을 수행하였다. 나아가 도출한 소셜 네트워크 지표를 지역구 공공 데이터와 결합하여 보다 다각적 측면을 고려한 지역구 상권의 매출액에 영향을 미치는 요인들을 검증하였고 그 영향력의 변화 또한 확인해 보았다. 정적 데이터로 표현되는 공공 데이터만을 통해 구성된 모형으로도 높은 설명력을 가지는 것을 확인할 수 있었으나, 소셜 네트워크 분석 결과로 도출된 네트워크 지표와 결합된 모형에서는 그 설명력이 더욱 향상된 것이 확인되었다. 공공 데이터에 대한 회귀 분석 결과, 투입된 22개의 요인들 중 '골목 상권 수,' '1인당 거주면적,' '주거환경만족도,' '거래증감률,' '3년 이상 생존율'의 5개의 요인이 지역구 상권 매출액에 유의한 영향을 미치는 것이 확인되었다. 이후 공공 데이터와 네트워크 지표 결합 모형에서 투입된 지표들은 '에고 네트워크의 밀도,' '연결 중심성,' '근접 중심성,' '매개 중심성,' '아이겐벡터 중심성'이며, 이 중 '연결 중심성'과 '아이겐벡터 중심성'이 매출액에 유의한 영향을 미치며 모형 내에서 가장 높은 영향력을 보유한 것이 확인되었다. 본 연구는 각 상권이 소비자가 원하는 감성을 고려한 도시 전략 계획 수립과 이행의 실증적 근거로 활용될 수 있을 것이며, 상권에 진입하거나 재창업하는 자영업자나 잠재 창업자를 바탕으로 지역구 상권이 보유한 감성과 그 관계 구조를 고려한 상권 진입 방향성을 제공할 수 있을 것이다.

사회네트워크분석과 텍스트마이닝을 이용한 배구 경기력 분석 (Performance analysis of volleyball games using the social network and text mining techniques)

  • 강병욱;허만규;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.619-630
    • /
    • 2015
  • 본 연구의 목적은 '사회네트워크분석'과 '텍스트마이닝'을 이용하여 국내 남자프로배구 구단의 공격, 패스 패턴을 찾아내고, 배구경기력과 관련된 핵심 키워드 추출하여 경기력을 평가하여 향후 구단의 경기 전력을 수립하는데 기초자료로 활용하는데 있다. 본 연구에서는 '사회네트워크분석'을 통해 도출된 그룹변수들을 '텍스트마이닝' 기법의 결과인 경기의 '승패'에 차이를 검정하기 위해 '0' 그룹 (6명)과 '1' 그룹 (11명)으로 재구성하였다. 연구의 결과로서 '사회네트워크분석'의 연결중심성과 중개중심성의 순위로 판단하면, '0' 그룹 보다 '1' 그룹이 우수한 경기력을 보였다. '사회네트워크분석'에 의해서 재구성된 '0' 그룹과 '1' 그룹에 따라서 '텍스트마이닝'에 의해서 생성된 '승패' 그룹에 대한 유의성 검정 결과 유의한 차이가 있는 것으로 나타났다 (p값: 0.001). '그룹별' 클러스터링 결과, '0' 그룹의 경우 'D' 선수와 'E' 선수가 '세트' 플레이를 통하여 정확하게 득점한다고 할 수 있다. '1' 그룹의 경우 'K' 선수가 '디그'에 의해서 '공격'을 하는 경우 실패하는 경우가 많고, 'C' 선수와 'P' 선수는 '세트' 정확한 플레이를 한 것으로 나타났다.

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (2) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (2))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권2호
    • /
    • pp.99-114
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 자소서에 서술된 학생들의 다양한 교내외 활동, 대학 지원 동기, 학업계획 및 향후 영농·영어계획 등의 텍스트 데이터를 대상으로 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 텍스트 마이닝 결과에서 문항 3의 동아리 활동을 비롯한 다양한 활동 사례와 그 과정에서 배우고 느낀 점에 대한 키워드는 '친구' 빈도가 압도적으로 높았으며, '생각', '시간', '의견', '활동', '사람', '학교', '선생님', '학생', '동아리' 등의 키워드 순으로 많이 사용되었다. 문항 4의 대학 지원동기 및 졸업 후 진로계획에 대한 서술 데이터에는 '생각', '농업', '한농대', '농장', '지식', '공부', '사람', '관심', '전문', '아버지' 등의 키워드 빈도가 높게 나타났으며, 이 가운데 '아버지', '한농대', '전문', '농장' 등의 키워드는 다른 질문에 비하여 상위에 나타나는 특징을 보였다. 연관규칙 분석 결과에서 키워드 간 규칙의 발생 빈도이자 중요성을 나타내는 지지도는 문항 3에서 {친구} <=> {생각}, 문항 4에서 {생각} <=> {한국농수산대학} 규칙에서 가장 높게 나타났다. 두 단어 사이 연관성을 나타내는 신뢰도는 문항 3에서 {선생님} => {친구}, 문항 4에서 {농업, 한국농수산대학} => {생각}에서 높게 나타났다. 두 단어 간 밀접성을 나타내는 향상도는 문항 3에서 {친구} <=> {선생님}, 문항 4에서 {지식} <=> {전문}에서 높게 나타났다. 즉 두 단어는 우연히 함께 사용되지 않고 한 단어가 나타나면 뒤에 반드시 나머지 단어가 사용되었다는 것을 의미한다. 또한 키워드 간의 매개체 역할의 분석, 즉 키워드들 사이에 최단 경로를 파악하는 관계 중심성 분석과 연결 edge 수를 평가하는 연결 중심성 분석에서 문항 3은 '친구', '생각', '학교', '시간' 및 '사람', 문항 4는 '생각', '한국농수산대학', '지식' 및 '지원' 등의 키워드의 중심성이 매우 높은 결과를 나타냈다.

연구비 지원 여부에 따른 공동연구의 네트워크구조와 연구성과 관계 분석: CT분야를 중심으로 (An Analysis on the Relation between Network Structure and Research Performance of Joint Researches in Accordance with the Matter of Supporting Research Funds: Focusing on the CT Area)

  • 김민기;김동현;조근태
    • 기술혁신연구
    • /
    • 제23권4호
    • /
    • pp.63-87
    • /
    • 2015
  • 연구성과를 향상시키는 데 중요한 요인은 연구자의 역량, 연구비 등의 자원 투입 등이 지적되었다. 하지만 최근에는 공동연구가 활성화되면서 연구자 사이의 구조적 특성을 통해 지속적 상호관계를 형성하여 과학적 지식을 생산하고 있기 때문이다. 하지만 이러한 연구비 지원이 지원 자체에 그치는 것이 아니라 연구비 지원으로 인해 다수의 기관이 협력하여 연구를 수행할 수 있는 발판이 된다는 점에서 연구성과에 영향을 미치는 것으로 볼 수 있다. 즉 연구비 지원이 공동연구의 연결구조에 차이를 발생시켜 연구성과에 영향을 미치기 때문으로 추정할 수 있다. SCIE DB에서 2009년부터 2013년까지 5년간 문화기술(CT) 분야의 공동연구 논문을 대상으로 연구비 지원 여부에 따른 네트워크 구조와 연구성과의 관계를 분석한 결과 다수의 연구기관이 연결되어 있을수록 논문 편수가 증가하고 사이 중심성이 증가할수록 논문 편수는 감소하는 것으로 분석되었다. 또한 연구비 지원 여부가 네트워크 구조, 연구성과에 영향을 미치는 것으로 분석되었다.

정보자원으로서 '밈'의 맥락과 실재 - 국내 연구동향 분석을 중심으로 - (The Context and Reality of Memes as Information Resources: Focused on Analysis of Research Trends in South Korea)

  • 홍소람
    • 한국비블리아학회지
    • /
    • 제34권3호
    • /
    • pp.227-253
    • /
    • 2023
  • 이 연구는 디지털 혁명으로 인해 변화한 정보 환경에서 리터러시 교육을 위한 정보자원으로 밈을 개념화하기 위한 시론적 연구이다. 이 연구의 목적은 정보자원으로서 밈의 활용을 촉진하기 위해 밈의 맥락과 실재를 규명하는 데에 있다. 이를 연구문제로 환원시키면 다음과 같다. 첫째, '밈'은 어떠한 주제들과 함께 연구되는가? 둘째, 어떠한 것들이 '밈'으로 포착되어 연구되는가? 연구문제를 소명하기 위해 국내 밈 연구 145건을 대상으로 빈도분석과 동시출현빈도 네트워크 분석을 실시하였고, 이 중 73건을 대상으로 밈 사례 275개를 추출하여 내용 분석을 실시하였다. 그 결과는 다음과 같다. 첫째, 밈은 인문학, 사회과학, 복합학, 예술체육학 분야에서 주로 연구되고 있었다. 또한 연구 초기에는 Dawkins의 밈 개념을 토대로 한 이론 연구(2012년 전후), 한류 콘텐츠 확산을 설명하기 위한 밈 개념 도입 연구(2015년 전후), 문화사회학의 주요 연구 주제로서 밈 개념의 독자적 연구(2019년 전후)가 이루어졌다. 둘째, 밈은 언어적 특성을 중점적으로 가지고 있었다. 언어 밈(L-meme)(102건, 37%)과 언어·시각 밈(LV-meme)(23건, 8%), 언어·시·청각 밈(LVM-meme)(21건, 8%) 등 언어 양식에 기반한 밈이 다수였고, 동시출현빈도 네트워크의 빈도·연결중심성·매개중심성 상위 노드에도 language meme(언어 밈) 키워드가 등장했다. 즉, 밈은 언어적 특성을 토대로 한 문화사회학의 고유한 정보 현상 개념으로 확장되고 있다. 리터러시 교육을 위한 정보자원으로서뿐만이 아니라 정보 리터러시의 관점에서 밈 리터러시를 개념화할 필요가 있다.

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (1) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (1))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권1호
    • /
    • pp.113-129
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 비정형 텍스트인 자소서에서 의미 있는 정보 혹은 규칙을 추출하기 위하여 고교 재학 중 '학업 및 학습경험'과 '교내 활동'을 기술한 두 개 문항에 대하여 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 모집 전형을 구분하지 않은 텍스트 마이닝 분석 결과에서 '학업 및 학습 경험' 항목과 관련된 주요 키워드는 '공부', '생각', '노력', '문제', '친구' 등의 순으로 많이 나타났으며, '교내 활동' 항목과 관련된 주요 키워드는 '활동', '생각', '친구', '동아리', '학교' 등의 순으로 빈도가 높게 나타났다. 그러나 도시 인재 전형과 농수산 인재 전형 신입생들의 키워드 빈도 순위는 두 항목 모두 전형 특성에 따른 약간의 차이를 나타냈다. 빈도 분석에 결과는 빈도수 상위 50위까지의 키워드를 워드 클라우드로 시각화하여 키워드를 알기 쉽게 표현하였다. 연관 분석은 apriori() 함수를 사용하였으며 적정한 계산을 위하여 support(지지도)와 confidence(신뢰도)의 기준값을 항목별로 설정하였다. 먼저 '학업' 항목에 대한 연관 규칙은 46개를 추출하였으며, 그 가운데 {공부} => {생각}, {성적} => {공부} 및 {과목} => {공부} 등의 규칙에서 높은 연관성을 볼 수 있었다. 이 규칙을 바탕으로 매개체 역할의 키워드를 평가하는 관계 중심성 평가와 노드에 연결된 edge의 수에 따라 중요도를 파악하는 연결 중심성 평가에서는 '생각', '공부', '노력', '시간' 등의 키워드가 중심적인 역할을 하는 정보를 획득하였다. 다음으로 '교내 활동' 항목에서는 45개의 연관 규칙을 생성하여 {활동} => {생각}, {동아리} => {활동} 등의 규칙에서 높은 연관성을 볼 수 있었으며, 관계 중심성 평가와 연결 중심성 평가에서는 '생각', '활동', '학교', '시간', '친구' 등의 키워드가 중심 키워드라는 결과를 얻었다. 다음 연구에서는 자소서의 나머지 두 개의 문항 '배려·나눔·협력·갈등관리' 항목과 한농대 '지원동기와 향후 진로계획' 항목을 분석한다. 분석에는 '키워드의 빈도'에 '문서 빈도의 역수'를 곱하여 주로 다량의 문서에서 핵심어를 추출하는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 추가한다.

키워드 네트워크 분석을 통해 살펴본 기술경영의 최근 연구동향 (A Study on Recent Research Trend in Management of Technology Using Keywords Network Analysis)

  • 고재창;조근태;조윤호
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.101-123
    • /
    • 2013
  • 최근 경제 패러다임의 변화로 인해 기업이 글로벌 경쟁우위 및 미래 성장동력 확보하기 위해서는 기술과 경영을 통합적으로 이해할 수 있는 학제적 지식을 바탕으로 기술연구의 동향을 파악하고 융합기술 및 유망기술 예측하여 지속적 혁신, 핵심역량 강화, 핵심기술 보유, 기술 융합 등을 통해 새로운 가치를 창출할 필요가 있다. 따라서 본 연구는 기술경영관련 연구의 거시적인 흐름을 분석하기 위해 동시단어 분석기반의 계량서지학적 방법론을 사용하였다. 즉, 최근 10년 동안 기술경영분야의 주요 해외 저널에 게재된 논문의 키워드를 수집한 다음, 빈도 분석, 초기 키워드 네트워크의 구조 분석, 시간이 지남에 따른 새로 생성된 키워드의 선호적 연결 및 성장 분석, 전체 네트워크에 대한 컴포넌트 분석 및 중심성 분석을 수행하였다. 이를 통해 기술경영분야의 논문에 대한 구체적인 연구 주제를 파악할 수 있고, 이들 간의 관계를 파악함으로써, 학제적 연구와 통섭을 위한 구체적인 연구주제들의 조합을 제시할 수 있다. 본 연구결과를 살펴보면 다음과 같다. 첫째, 논문 별 키워드는 1개~23개의 분포를 지니고 있으며, 평균적으로 논문 당 4.574개의 키워드가 있다. 또한 키워드 중 90%가 10년 동안 3번 이하로 사용되었다. 특히 1번만 사용된 키워드는 약 75%의 비중을 차지하고 있음을 확인하였다. 둘째, 키워드 네트워크는 좁은 세상 네트워크 및 척도 없는 네트워크의 특징을 따르고 있음을 확인하였다. 특히 기술경영관련 논문에 사용된 키워드 중 소수의 키워드의 독점화 경향이 높음을 확인할 수 있었다. 셋째, 선호적 연결 및 성장 분석을 통해 기술경영분야의 키워드는 시간이 지남에 따라 선호적 연결을 통한 생존과 소멸 과정에 의해 부익부 빈익빈 현상이 고착되고 있고 있음을 확인하였다. 또한 신규 키워드의 선호적 연결 정도 분석을 통해 신규 연구분야 또는 새로운 연구영역을 창출할 가능성이 있는 키워드 관련 연구 주제에 대한 관심이 시간이 지남에 따라 증가하다가 일정 시점이 지나면 감소함을 확인하였다. 넷째, 컴포넌트 분석 및 중심성 분석을 통해 기술경영관련 연구 동향을 확인하였다. 특히 중심성 분석을 통해 Innovation(혁신), R&D(연구개발), Patent(특허), Forecast(예측), Technology transfer(기술이전), Technology(기술), SME(중소기업) 등의 키워드가 연결중심성, 매개중심성, 근접중심성이 높음을 확인하였다. 본 연구의 분석결과는 기술경영의 연구 동향, 타 학문과의 통섭 및 신규 연구주제 선정 시 참고할 수 있는 유용한 정보로 활용될 수 있다.