• 제목/요약/키워드: 네트워크 군집 분석

검색결과 242건 처리시간 0.024초

Mendeley co-readership 정보를 활용한 한국 관련 논문의 글로벌 독자 국가 네트워크 분석 (Network Analysis of Readers' Countries of Korean Studies using Mendeley Co-readership Data)

  • 조재인;박종도
    • 정보관리학회지
    • /
    • 제35권4호
    • /
    • pp.107-124
    • /
    • 2018
  • Mendeley의 독자 정보는 학계 밖에서 학문의 결과물이 어떻게 소비되고 있는지 다각도로 파악하여 피인용도로는 해석할 수 없었던 미지의 세계를 예측하는데 활용될 수 있다. 본 연구는 Mendeley의 co-readership 데이터를 활용해 한국 관련 논문의 독자 국가 네트워크 분석을 수행하여 공통의 학문적 관심사를 공유하는 국가 군집을 이해하고 이들 국가가 네트워크 상에서 어떠한 영향력을 가지는지 확인하였다. 그 결과 전 분야에서 미국을 비롯한 선진국은 대체로 높은 전역중심성을 보여 한국 관련 연구에 대한 전반적인 협력과 잠재적 교류 가능성을 가지는 것으로 나타났으며, 일부 개발도상국은 높은 지역중심성을 보여 상호간 공통의 학문적 관심사로 연계되어 있는 것으로 확인되었다. 한편 의학과 사회과학 분야는 OECD 국가와 개발도상국이 분리된 독자층을 이루었으며, 공학 분야는 신흥경제개발국이 대규모 독자 군집으로 형성되는 특징을 보였다. 또한 공학은 네트워크 밀도가 상대적으로 높게 나타나 국가간 학문적 교류와 지식의 확산, 협력의 가능성이 높은 것으로 분석되었다.

연구소기업 네트워크의 ERGM 분석 연구: 대덕연구개발특구를 중심으로 (A Study on the ERGM on Innopolis Start-ups Networks: Focusing on Daedeok Innopolis)

  • 구장원;임재빈
    • 산업진흥연구
    • /
    • 제9권2호
    • /
    • pp.45-58
    • /
    • 2024
  • 본 연구는 대전 지역에 위치한 연구소기업과 전국에 있는 연구소기업 고객사 간의 사회적 네트워크 구조 특성을 동종 기술 간 지역적 군집화 경향으로 모형화했고, ERGM(Exponential Random Graph Model) 분석 모형 대비 관측값이 95% 신뢰구간 내 포함되었다. 기업 모두 대전 유성구에 위치한 경우, 다른 행정구역에 속한 경우보다 연결 확률이 약 13배 높았을 뿐만 아니라 동종 기술을 가진 기업 간에는 구색성 및 동질성 값이 부의 값(0.1904)으로 활발한 연결 경향을 보였으며, 특히 6대 기술 중 '환경·에너지기술(ET)' 기업 간에 P값이 0.035로 가장 유의하였다. 유성구에 속하지 않은 기업 사이에는 음의 값(-0.0035)을 보이고, 군집 경향도 적었다. 이를 통해 대덕연구개발특구가 입지한 대전광역시 유성구가 혁신클러스터의 중심지 역할을 형성하고 있음을 확인할 수 있었다.

엔트로피 거리와 SVM를 이용한 SNP 군집분석과 천식 유형 예측 (Cluster Analysis of SNPs with Entropy Distance and Prediction of Asthma Type Using SVM)

  • 이중섭;신기섭;위규범
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.67-72
    • /
    • 2011
  • 단일염기다형성은 인간 게놈 구조 연구의 중요한 도구이다. 대량의 유전자 표현형 데이터에서의 군집 분석은 생물학적으로 연관이 있는 유전자 군을 발견하거나 유전자간 상호작용 네트워크를 생성하는데 유용하다. 본 논문에서는 엔트로피 거리를 기반으로 계층적 군집 분석 방법을 사용하여 천식환자군과 정상대조군의 군집을 형성하고 비교하였고 5개짜리 군집에서 두 군의 의미 있는 차이점이 나타남을 보였다. 천식환자군의 각 군집에서의 대표 SNP들의 조합의 질병 예측 정확도를 지지벡터기계를 이용하여 측정하여, 천식의 두 유형을 진단할 수 있는 최상의 조합을 찾았다. 최상의 조합은 유전자 ALOX12에 있는 단일염기다형성을 포함한 5개로 구성된 모델이며 66.41%의 아스피린 내성 천식 질병에 대한 예측 정확도를 갖는다.

지역 연구에 대한 계량정보적 분석 - 인천 지역을 중심으로 - (Informetric Analysis of Regional Studies: Focused on Incheon Area)

  • 조재인
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.323-341
    • /
    • 2021
  • 대규모 항만과 공항, 다도해, 도시재생 등의 이슈를 가진 인천 지역을 중심으로 인문, 역사, 항공/항만, 지역개발분야 등에서 다양한 연구 성과들이 발표되고 있다. 본 연구는 인천 지역을 둘러싼 연구의 규모와 주제 범위, 연구자 분포를 계량정보적 방법을 사용해 탐색하였다. 구체적으로 한국학술지인용색인에 등재된 500여건의 인천 관련 연구 논문에서 저자를 추출하여, 공저 관계 네트워크 분석을 수행함으로써 핵심 연구 주체와 기관 간 협력 행태를 파악하고 키워드간의 관계에 대한 가중 네트워크(PFNET) 분석을 수행함으로써 지적 구조를 이해하였다. 분석 결과, 인하대학교와 인천대학교가 높은 전역중심성을, 인천발전연구원이 높은 지역중심성을 보이고 있는 것으로 나타났다. 지적구조는 11개의 주제 군집으로 구성되었으며, 인천의 인문사회이슈, 항만, 항공 분야가 대표적인 연구 주제 군집으로 분석되었다.

중심성 척도 TBC를 이용한 저자동시인용 네트워크 분석 (Author Co-citation Network Analysis Using Triangle Betweenness Centrality Measure)

  • 이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.357-364
    • /
    • 2005
  • 저자동시인용 자료에 대한 분석 도구로 삼각매개중심성 (triangle betweenness centrality; TBC) 척도를 비롯하여 네 가지 새로운 척도를 제안하고 정보학 분야의 지적 구조 분석에 적용해보았다. 제안한 척도는 사회네트워크 분석 분야에서 사용되고 있는 여러 중심성 척도를 참고하여 동시인용 데이터에 적합하도륵 고안되었다. 검증을 위해서 이은숙, 정영미(2002)의 연구에서 수집한 1990년부터2000년까지 11년간 Journal of America Society for Information Science에 인용된 주요 저자50명의 동시인용 네트워크를 여러 중심성 척도를 사용해서 분석하였다. 전통적인 분석 도구인 다차원척도법이나 군집분석과 달리 중심성 척도를 통해서는 저작물에 반영된 개별 저자의 입지와 영향력에 대한 구체적인 분석이 가능하였다. 특히 삼각매개중심성 척도는 측정 범위의 조절이 자유로와서 지역적 중심성과 전역적 중심성을 모두 파악할 수 있는 것으로 나타났다.

  • PDF

한반도 도서지역의 식물사회네트워크 분석 (Analysis of Plants Social Network on Island Area in the Korean Peninsula)

  • 이상철;강현미;박석곤
    • 한국환경생태학회지
    • /
    • 제38권2호
    • /
    • pp.127-142
    • /
    • 2024
  • 본 연구는 난온대림에 속한 도서지역에서 조사한 대량의 식생 데이터로 식물사회네트워크 분석을 통해 식물군락의 수종간 상호관계를 파악하고자 했다. 상록활엽수 성숙림에 출현하는 교목성 후박나무·구실잣밤나무·생달나무·광나무, 관목성 돈나무·자금우, 덩굴성 마삭줄·멀꿀이 서로 강한 양성결합(+)을 보였다. 이 수종들은 낙엽활엽수종과는 음성결합(-)하거나 친소관계가 없었는데 이는 입지환경 차이가 크기 때문이다. 식물사회네트워크 소시오그램에서 4개의 그룹으로 묶어 상록활엽수종인 그룹I과 낙활엽수종인 그룹II의 수종간에는 중심성과 연결성이 높게 나타났다. 소시오그램의 수종(노드) 배치와 연결정도(그룹화)는 DCA분석와 같이 환경요인과 식물군집의 특성을 간접적으로 추정 가능한 것으로 분석됐다. 식물사회네트워크상 중심성과 영향력이 큰 수종은 마삭줄·사스레피나무·생강나무·때죽나무 등이었다. 이 수종은 생태적 지위의 범위가 넓은 일반종이면서 숲틈과 훼손지 등에 흔히 출현하는 기회종의 특성과 생존전략을 갖는 것으로 보인다. 이 수종들이 식물군집의 종간 상호작용과 군집의 구조와 기능 변화에 그 역할이 클 것이다. 하지만 실제 식물사회에서 어떤 상호작용을 통해 식물군집 변화에 영향을 미치는지는 장기적인 연구와 심도 있는 논의가 필요하다.

텍스트마이닝 기법을 이용한 한국 사회의 혐오 양상 분석 (Analyzing the Phenomena of Hate in Korea by Text Mining Techniques)

  • 김혜진
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.431-453
    • /
    • 2022
  • 혐오는 타인에 대한 배타성이 집단적으로 표출된 것으로, 잘못된 대중적 인식을 통하여 양산되고 재생산된다. 이 연구는 우리사회에서 언급되고 있는 '혐오' 양상을 거시적으로 탐색하고자 1990년부터 2020년까지 발행된 뉴스데이터 17,867건을 대상으로 텍스트마이닝 기법을 활용하여 키워드 네트워크와 군집 분석을 수행하였다. 그리고 단어를 추출하기 전에 먼저 기사를 문장으로 분리하는 전처리 과정을 거쳐 '혐오', '편견', '차별'이라는 단어를 포함하고 있는 문장 총 52,520개를 추출하여 분석에 활용함으로써 '혐오'라는 단어와 인접한 단어들로 구성된 키워드 네트워크를 구축하였다. 수집한 뉴스데이터의 단어 동시출현빈도 분석 결과, 우리 사회에서 혐오와 관련되어 가장 빈번하게 등장하는 대상은 여성, 인종, 성소수자 등이며, 관련된 이슈는 이들 집단과 관련된 법과 범죄 등이었다. 키워드 네트워크 군집 분석 결과, 성별(41.4%), 소수자(28.7%), 인종·민족(15.1%), 선택적·이해관계적(8.5%), 정치·이념(5.7%), 환경·생존적(0.3%) 혐오 등 총 6개의 혐오 군집들이 발견되었다. 논의에서는 군집 분석 결과 구체적으로 드러나지 않은 혐오의 표적(대상)을 모두 추출하여 분석하였다.

분산 인 메모리 DBMS 기반 병렬 K-Means의 In-database 분석 함수로의 설계와 구현 (Design and Implementation of Distributed In-Memory DBMS-based Parallel K-Means as In-database Analytics Function)

  • 구해모;남창민;이우현;이용재;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.105-112
    • /
    • 2018
  • 데이터의 양이 증가하면서 단일 노드 데이터베이스로는 저장과 처리를 동시에 수행하기에는 부족하다. 따라서, 데이터를 분산시켜 복수 노드로 구성된 분산 데이터베이스에 저장되고 있으며 분석 역시 효율성을 위해 병렬 기능을 제공해야한다. 전통적인 분석 방식은 데이터베이스에서 분석 노드로 데이터를 이동시킨 후 분석을 수행하기 때문에 네트워크의 비용이 발생하며 사용자가 분석을 위해 분석 프레임 워크도 다를 수 있어야한다. 본 연구는 군집화 분석 기법인 K-Means 군집화 알고리즘을 관계형 데이터 베이스와 칼럼 기반 데이터베이스를 이용한 분산 데이터베이스 환경에서 SQL로 구현하는 In-database 분석 함수로의 설계와 구현 그리고 관계형 데이터베이스에서의 성능 최적화 방법을 제안한다.

무선 센서 네트워크에서 전송 효율과 에너지 소비에 대한 블록 FEC 심볼 크기 영향 분석 (Analysis of Block FEC Symbol Size's Effect On Transmission Efficiency and Energy Consumption over Wireless Sensor Networks)

  • 안종석;윤종혁;이영수
    • 정보처리학회논문지C
    • /
    • 제13C권7호
    • /
    • pp.803-812
    • /
    • 2006
  • 본 논문에서는 저속의 무선 센서 네트워크(WSN: Wireless Sensor Network)에서 블록 FEC(Forward Error Correction) 알고리즘의 심볼 크기의 변화에 따른 802.11 MAC 프로토콜의 전송 효율과 전송 에너지를 해석적으로 분석한다. 블록 FEC 알고리즘은 심볼(symbol) 단위로 오류를 복원하므로, 주어진 무선 센서 채널에서 같은 FEC 체크 비트(check bit) 량을 사용하더라도 블록 FEC 알고리즘의 오류 패킷 복원률은 블록 FEC 심볼 크기에 의존적이다. 즉, 같은 양의 FEC 체크 비트를 사용하는 경우에, 연속된 군집 오류 길이는 작으면서 군집 오류가 자주 발생하는 채널에서는 작은 FEC 심볼이, 이에 반해 군집 오류의 길이는 크고 군집 오류 개수가 작은 군집적 분포를 보이는 채널에서 큰 FEC 심볼이 효율적이다. 심볼 크기의 영향을 평가하기 위해서 본 논문에서는 센서 노드 TIP50CM을 사용하는 WSN에서 수집한 패킷 트레이스를 기반으로 WSN 채널을 Gilbert 모델로 모델링하고, 심볼 크기가 다른 RS(Reed-Solomon) 코드를 생성하고 해석하기 위한 에너지를 측정하였다. 이러한 모델링된 채널과 각 RS 코드 생성과 해석 에너지를 이용하여 FEC 심볼 크기에 따른 RS FEC 코드를 채택한 802.11 MAC 프로토콜의 전송 효율과 전송 에너지를 계산하였다. 실제 측정 데이터와 해석적으로 계산한 데이터를 결합한 계산에 의하면 비슷한 FEC 체크 비트 량을 사용하더라도 FEC 심볼 크기에 따라 전송 효율은 최대 4.2%, 그리고 소요 에너지는 최대 35%의 차이가 발생한다.

개선된 ISODATA 알고리즘을 이용한 공격 자동탐지 (Automatic Attack Detection based on Improved ISODATA Algorithm)

  • 김애숙;최재영;최형일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.169-172
    • /
    • 2010
  • 본 논문에서는 기존의 ISODATA 알고리즘을 네트워크 공격탐지에 더욱 적합하도록 개선하여 공격을 탐지하는 새로운 방법을 제안한다. 수많은 인터넷상의 트래픽 정보들을 군집화하여 유사도를 비교하는 방법을 통해 공격을 판단한다. 기본적인 절차는 송신자 IP와 Port, 수신자 IP와 Port 정보를 이용하여 송신자와 수신자 사이의 관계를 분석하고 그 특징 값들을 이용하여 개선된 군집화 알고리즘을 이용하여 군집화를 수행한다. 그리고 얻어진 패턴의 특징값을 인공신경망에 학습하여 공격유형을 분류하고 탐지하도록 한다. 기존의 공격탐지 방법과 비교했을 때, 계산양이 적고 속도가 빠르다는 장점이 있으며 제안하는 방법의 우수성을 실험을 통해 증명하였다.

  • PDF