• 제목/요약/키워드: 텍스트네트워크분석

검색결과 380건 처리시간 0.027초

효과적인 가짜 뉴스 탐지를 위한 텍스트 분석과 네트워크 임베딩 방법의 비교 연구 (A Comparative Study of Text analysis and Network embedding Methods for Effective Fake News Detection)

  • 박성수;이건창
    • 디지털융복합연구
    • /
    • 제17권5호
    • /
    • pp.137-143
    • /
    • 2019
  • 가짜 뉴스는 소셜 미디어와 같이 사용자가 상호작용하는 미디어 플랫폼에서 정보가 빠른 속도로 확산되는 이점을 가지는 오류 정보(misinformation)의 한 형태이다. 최근 가짜 뉴스의 증가로 인해 사회적으로 많은 문제가 발생하고 있다. 본 논문에서는 이러한 가짜 뉴스를 탐지하는 방법을 제안한다. 이전의 가짜 뉴스 탐지는 텍스트 분석을 사용한 연구가 주로 수행되었다. 본 연구는 소셜 미디어의 뉴스가 확산되는 네트워크에 초점을 두고, 네트워크 임베딩 방법인 DeepWalk 로 자질을 생성하고 로지스틱 회귀분석을 사용하여 가짜 뉴스를 분류한다. 인터넷에 공개된 뉴스 211개와 120만개의 뉴스 확산 네트워크 데이터를 사용한 가짜 뉴스 탐지에 대한 실험을 수행하였다. 연구 결과 텍스트 분석에 비하여 네트워크 임베딩을 사용한 가짜 뉴스 탐지의 정확도가 최소 1.7%에서 최대 10.6% 더 높게 나타났다. 또한, 텍스트 분석과 네트워크 임베딩을 결합한 가짜 뉴스 탐지는 네트워크 임베딩에 비해 정확도의 상승이 나타나지 않았다. 본 연구의 결과는 기업이나 조직은 온라인 상에서 확산되는 가짜 뉴스 탐지에 효과적으로 활용될 수 있다.

네트워크 텍스트 분석을 통한 문헌정보학 최근 연구 경향 분석 (A Study for Research Area of Library and Information Science by Network Text Analysis)

  • 조재인
    • 정보관리학회지
    • /
    • 제28권4호
    • /
    • pp.65-83
    • /
    • 2011
  • 본 연구는 최근 7년간 문헌정보학분야에 게재된 논문 1,752건을 대상으로 빈도 분석과 네트워크텍스트 분석을 실시하여 다양한 주제 개념의 분포와 그 관계성을 도출하였다. 더불어 보다 최근의 연구 경향을 분석하고 변화 양상을 살펴보기 위해, 최근 2년 사이에 연구된 482건을 추출하여 2차 분석을 실시하였다. 분석 결과, 최근 7년간 문헌정보학 분야는 "공공도서관"과 "대학도서관" 개념을 중심으로 하는 연구가 가장 높은 출현 빈도를 보였으며, "평가", "교육", "웹"은 가장 높은 연결 중심성을 나타내 다양한 문헌정보학의 주제 개념들과 관련을 맺고 연구되고 있는 개념으로 파악할 수 있었다. 최근 2년간을 대상으로 한 2차 분석 결과에서는 "웹", "분류" 개념이 종전보다 높은 상대 빈도를 보였으며, 네트워크 텍스트 분석 결과에서는 "이용자" 연구와 "공공도서관" 개념이 종전보다 더 다양한 주제 개념들과 관련을 맺고 수행되고 있음을 확인할 수 있었다.

마이스터고 연구의 동향과 과제: 네트워크 텍스트 분석 및 내용분석 (The Trend and Tasks of Meister High School Research: Network Text Analysis and Content Analysis)

  • 배상훈;장창성;이태희;조성범
    • 직업교육연구
    • /
    • 제33권3호
    • /
    • pp.83-104
    • /
    • 2014
  • 본 연구는 2008년 마이스터고 도입 이래 지금까지 수행된 마이스터고 연구를 종합하여 연구동향을 탐색하고 향후 연구과제를 제시하는데 목적이 있다. 학술지와 학위논문으로 나누어 기성 연구자와 학문 후속세대의 연구관심을 비교하였다. 학술지 논문 33편, 학위논문 24편 등 총 57편이 분석되었다. 주제어의 빈도와 연결중심성을 탐색하는 네트워크 텍스트 분석과 분석 준거별 빈도를 살펴보는 내용분석을 실시하였다. 네트워크 텍스트 분석 결과, 마이스터고 연구는 학생과 교원 등 학교 구성원을 대상으로 한 연구가 다수였으며, 학술지 논문이 학위논문보다 연구분야가 다양하였다. 주제어의 연결중심성을 분석한 결과, 학교 구성원의 심리적, 정서적 요인에 대한 연구가 많음을 알 수 있었다. 연구주제는 학교 구성원(56.1%)에 대한 논문이 가장 많았고, 다음으로 교육과정(17.6%), 학교운영 및 조직(14.0%), 정책분석 및 평가(12.3%)에 관한 연구가 많았다. 연구방법은 양적 연구(59.6%)가 많았고, 서술적 연구(21.1%)나 질적 연구(12.3%)는 적었다. 이러한 결과를 바탕으로 본 연구는 향후 마이스터고 연구의 저변 확대를 위한 과제를 제시하였다.

다중 인스턴스 학습 기반 사용자 프로파일 식별 (Discriminating User Attributes in Social Text based on Multi-Instance Learning)

  • 송현제;김아영;박성배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.47-52
    • /
    • 2012
  • 본 논문에서는 소셜 네트워크 서비스에서 사용자가 작성한 텍스트로부터 그 사용자 프로파일 식별하는 문제를 다룬다. 프로파일 식별 관련 기존 연구에서는 개별 텍스트를 하나의 학습 단위로 간주하고 이를 기반으로 학습 모델을 구축한다. 프로파일을 식별하고자 하는 사용자의 텍스트들이 주어지면 각 텍스트마다 프로파일을 식별하고, 식별된 결과들을 합쳐 최종 프로파일로 선택한다. 하지만 SNS 특성상 프로파일을 식별하는 데에 영향을 끼치지 않는 텍스트들이 다수 존재하며, 기존 연구들은 이 텍스트들을 특별한 처리없이 학습 및 테스트에 사용함으로 인해 프로파일 식별 성능이 저하되는 문제점이 있다. 본 논문에서는 다중 인스턴스 학습(Multi-Instance Learning)을 기반으로 사용자 프로파일을 식별한다. 제안한 방법은 사용자가 작성한 텍스트 전체, 즉 텍스트 집합을 학습 단위로 간주하고 다중 인스턴스 학습 문제로 변환하여 프로파일을 식별한다. 다중 인스턴스 학습을 사용함으로써 프로파일 식별에 유의미한 텍스트들만이 고려되고 그 결과 프로파일 식별에 영향을 끼치지 않는 텍스트로부터의 성능 하락을 최소화할 수 있다. 실험을 통해 제안한 방법이 기존 학습 방법보다 성별, 나이, 결혼/연애 상태를 식별함에 있어서 더 좋은 성능을 보인다.

  • PDF

WordNet과 텍스트 코퍼스에 기반한 의미 관계를 활용한 웹 텍스트 조사 기법 (A Web Text Mining Technique using Semantic Relations based on WordNet and Text Corpus)

  • 이호석;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.181-184
    • /
    • 2007
  • 본 논문은 문장 분석에 의하여 의미 관계를 생성하고 의미 네트워크에 의하여 유사한 의미 관계를 고려하는 의미 중심의 웹 텍스트 검색 기법에 대하여 논의한다. 기존의 웹 텍스트 검색은 단어만을 혹은 의미 관계만을 고려한 검색이었다고 할 수 있다. 그러나 문장 분석에 의한 의미 관계의 생성과 의미 네트워크에 의한 유사한 의미 관계의 고려는 기존의 단어 중심 혹은 의미 관계 중심의 검색 한계를 넘어서 유사한 의미 관계를 고려한 좀 더 포괄적이고 계층적인 검색을 가능하게 할 것으로 생각된다.

  • PDF

공급사슬관리 국내연구동향 분석: 네트워크 분석을 활용하여 (A Study on the Research Trends in Supply Chain Management in Korea using Network Text Analysis)

  • 나진성
    • 한국산업정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.41-53
    • /
    • 2020
  • 공급사슬관리는 기업 경영의 핵심 성공요소 중 하나가 되었다. 이에 따라서 많은 연구자들이 지속적으로 공급사슬관리와 관련한 연구를 진행하였다. 본 연구에서는 지난 10년 동안 국내 학술지에 발표한 공급사슬관리 분야 연구논문을 대상으로 네트워크 텍스트 분석 방법으로 연구 동향을 분석하였다. RISS 학술 데이터 베이스에서 총 586편의 관련 논문을 검색하여 개별 연구논문의 키워드 노드를 중심으로 키워드 네트워크를 구축하여 네트워크 분석을 시행하였다. 분석결과에 따르면 지난 10년 동안 국내 공급사슬관리 연구는 물류, 정보시스템, 파트너십, 위험관리, 지속가능 분야를 중심으로 연구되었음을 확인할 수 있었다.

코로나19 시대의 공급사슬관리 관련 이슈 분석: 기사자료 네트워크 텍스트 분석을 중심으로 (Analysis on Issues Related to Supply Chain Management in the Era of Covid19 using Network Text Analysis)

  • 나진성
    • 한국산업정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.109-123
    • /
    • 2020
  • 코로나19의 여파 속에 전 인류의 생활과 사고방식, 기업경영 환경에 큰 변화가 있었다. 특히, 판데믹으로 인한 글로벌 공급사슬단절, 대금결제 지연, 통상 마찰 등 공급사슬관리 관련 이슈들이 연일 주목받고 있다. 이에 따라 코로나19에 따른 공급사슬관련 이슈에 대한 정리와 이에 대한 해결방안에 대해서 다수의 연구들이 진행되고 있으나, 아직은 미비한 실정이다. 본 연구에서는 코로나19 판데믹 상황에서 공급사슬관리와 관련하여 작성된 뉴스기사들은 중심으로 네트워크 텍스트 분석을 시행한다. 기사자료 네트워크 텍스트 분석을 중심으로 위드 코로나19 상황의 공급사슬관리 관련 이슈들을 정리한다. 분석결과 글로벌 공급사슬의 재편, 리쇼어링 고려, 공급사슬관리를 위한 새로운 기술도입, 코로나 뉴노멀에 대한 대비 등의 내용이 기사에서 주로 언급되었음을 확인하였고, 향후 필요한 연구과제들을 제시하였다.

텍스트 마이닝과 네트워크 군집 분석을 활용한 한국의 데이터 관련 정책사업 분석 (Analyzing data-related policy programs in Korea using text mining and network cluster analysis)

  • 최성준;신기윤;오윤환
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.63-81
    • /
    • 2023
  • 본 연구는 우리나라 데이터 관련 정책사업에 대한 텍스트 정보를 기반으로 네트워크 군집 분석을 통해 유사한 사업들을 분류하고 유형화하였다. 이를 위해 2022년에 우리나라에서 추진된 데이터 관련 재정사업 설명자료를 수집하고 사업 내용으로부터 키워드를 추출, TF-IDF로 각 사업 간 유사도를 도출하였으며, 이를 기반으로 정책사업 네트워크를 구축하였다. 이후 정책사업 네트워크의 구조적 특징을 분석하고, 네트워크 군집 분석을 통해 유사한 정책사업들을 군집화하여 유형화 하였다. 총 97개의 사업을 분석한 결과, 7개의 주요 군집이 식별되었으며, 이를 통해 비슷한 주제나 목표를 가진 사업들이 응용 분야 혹은 데이터가 활용되는 서비스 관점에서 유형화가 이루어진 것을 확인하였다. 본 연구의 결과는 현재 우리나라 데이터 관련 정책사업의 현황을 보여줌과 동시에 향후 국가데이터전략 수립 및 사업 기획에 있어서 전략적 접근을 위한 정책적 시사점을 제공하며 증거기반 정책 확립에 기여한다.

사회네트워크분석과 텍스트마이닝을 이용한 배구 경기력 분석 (Performance analysis of volleyball games using the social network and text mining techniques)

  • 강병욱;허만규;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.619-630
    • /
    • 2015
  • 본 연구의 목적은 '사회네트워크분석'과 '텍스트마이닝'을 이용하여 국내 남자프로배구 구단의 공격, 패스 패턴을 찾아내고, 배구경기력과 관련된 핵심 키워드 추출하여 경기력을 평가하여 향후 구단의 경기 전력을 수립하는데 기초자료로 활용하는데 있다. 본 연구에서는 '사회네트워크분석'을 통해 도출된 그룹변수들을 '텍스트마이닝' 기법의 결과인 경기의 '승패'에 차이를 검정하기 위해 '0' 그룹 (6명)과 '1' 그룹 (11명)으로 재구성하였다. 연구의 결과로서 '사회네트워크분석'의 연결중심성과 중개중심성의 순위로 판단하면, '0' 그룹 보다 '1' 그룹이 우수한 경기력을 보였다. '사회네트워크분석'에 의해서 재구성된 '0' 그룹과 '1' 그룹에 따라서 '텍스트마이닝'에 의해서 생성된 '승패' 그룹에 대한 유의성 검정 결과 유의한 차이가 있는 것으로 나타났다 (p값: 0.001). '그룹별' 클러스터링 결과, '0' 그룹의 경우 'D' 선수와 'E' 선수가 '세트' 플레이를 통하여 정확하게 득점한다고 할 수 있다. '1' 그룹의 경우 'K' 선수가 '디그'에 의해서 '공격'을 하는 경우 실패하는 경우가 많고, 'C' 선수와 'P' 선수는 '세트' 정확한 플레이를 한 것으로 나타났다.

한국 플랫폼 정부의 방향성 모색 : 공공기관 연구보고서에 대한 토픽 모델링과 네트워크 분석 (An Exploratory Study of Platform Government in Korea : Topic Modeling and Network Analysis of Public Agency Reports)

  • 남현동;남태우
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.139-149
    • /
    • 2020
  • 새로운 플랫폼 정부는 지능적인 정보기술을 활용하여 정부와 국민이 서로 협력하는 새로운 생태계 기반 정부 혁신과 지속 가능한 발전을 견인하는 역할을 할 것이다. 이에 플랫폼 정부의 플랫폼 구축을 위해 최근 관련 연구 동향에 대해 살펴보고 향후 미래정책 방향 및 연구기반을 마련하기 위한 토대를 구축하고자 한다. 연구 분석을 위해 각 부처와 정부산하기관에서 발행된 연구보고서를 텍스트마이닝 기법을 활용하여 텍스트 자료를 수집하고, 수집된 텍스트 자료를 토픽 모델링과 네트워크 분석을 시행하였다. 분석결과 미래전략과 집단 내에서의 네트워크 연결이 제대로 이루워지지 않고 있으며 연결 중심성이 강할수록 관계성이 약해지는 것을 도출하였다. 이는 정부가 플랫폼을 설계하고 데이터와 서비스를 공급하는 공급 역할에서 통합적, 상호 교류적 접점이 필요하며 정부와 시민, 기업의 협치가 가능한 생태계가 조성되어야 할 것이다. 본 연구를 통해 플랫폼 정부의 공급과 수요적 접근의 이해를 높이고 잠재적 토픽에 따라 적절한 변경관리 방법을 구현하기 위한 논의가 다각적으로 이루어지길 기대한다.