• 제목/요약/키워드: Co-word Occurrence

검색결과 104건 처리시간 0.024초

빅데이터 기반한 미세플라스틱 지적네트워크 분석 (Microplastics Intellectual Network Analysis based on Bigdata)

  • 김영희;장관종
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.239-259
    • /
    • 2022
  • 2019년 이후부터 전 세계적으로 미세플라스틱(Microplastics)에 관한 연구가 활발하게 진행되고 있어 국내·외 미세플라스틱 연구에 대한 차이점을 분석하는 것은 국내연구 방향 수립에 이정표가 될 수 있다. 본 연구에서는 KCI와 WoS에서 미세플라스틱 논문들을 발췌하여 저자 키워드동시출현단어분석, 논문동시인용분석, 저자동시인용분석 등 빅데이터를 기반으로 한 네트워크 분석방법론으로 국내외 연구 차이점을 분석했다. 분석결과, 연구주제 분석은 인간의 생체에 영향을 미칠 수 있는 연구와 일상에서의 미세플라스틱의 처리에 관한 연구가 국내에서 추가로 필요함을 확인하였다. 연구 품질을 살펴보는 논문 인용 깊이 분석에서는 국외 2.25와 국내 1.39로 국내가 아직 부족함을 보였고, 다양한 연구자들이 참여하고 정보를 공유하는 공동연구전선 구성형태 분석은 국내는 22개 군집 중에서는 3개가 Star형 구조가 있고, 국외의 경우는 19개 군집 모두가 Mesh 구조로 되어 있어 국내는 특정 연구 분야에서는 정보의 흐름과 공유가 부족함도 확인할 수 있었다. 이런 연구 결과는 미세플라스틱의 연구주제 확장과 연구 질의 향상, 더불어 다양한 연구자들이 참여하는 연구 추진체계 개선 등이 필요함을 확인하였다. 추가로 주제 모델링(Topic Modeling)을 기반으로 자동화 프로그램 개발을 한다면 실시간 분석이 가능한 시스템 구축도 가능할 것이다.

이용자 중심의 이미지 접근과 이용 분석을 통한 차세대 멀티미디어 검색 패러다임 요소에 관한 연구 (Towards Next Generation Multimedia Information Retrieval by Analyzing User-centered Image Access and Use)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.121-138
    • /
    • 2017
  • 멀티미디어 정보환경의 발전과 다양한 요구를 지닌 정보이용자는 멀티미디어의 접근과 이용에 있어서 기존 정보검색 패러다임에서 중요시하지 않았던 요소를 사용하는 추세이다. 특히 이미지를 포함한 멀티미디어의 감정 접근과 이용은 다양한 정보환경에서 이루어지고 있다. 따라서 효율적으로 추상적 개념인 감정을 이용자에게 접근점으로 제공할 필요성이 증가한다. 본 연구는 감정으로 접근이 가능한 게티 이미지 뱅크의 이미지를 5가지 기본 감정으로 검색하여 부여된 색인어 총 22,675건을 추출하였다. 추출된 색인어는 전체감정, 긍정감정, 부정감정의 세 가지 데이터셋으로 구분하여 분석되었다. 분석을 위해서는 동시출현단어행렬로 작성되어 가중 네트워크와 군집화기법으로 시각화되었다. 분석결과를 살펴보면, 전체감정은 대분류로써 긍정감정, 부정감정, 가족의 3개 군집과 하위 20개의 군집으로 나타났다. 긍정감정은 10개의 군집이며, 부정감정은 10개의 군집으로 구성되었다. 이와 같은 가중 네트워크와 군집구성 분석을 통해, 세 가지 중요한 차세대 멀티미디어 검색을 위한 요소로 논의하였다. 첫째는 이미지 감정 표현을 위한 인물 색인어 특성이다. 둘째는 명시적 단어와 감정을 표현하는 함축적 단어와의 네트워크 구성을 통해서 상대적으로 색인이 용이한 명시적 단어만으로도 함축적 단어 추론 가능성이다. 셋째는 감정으로 표현하는 함축적 단어의 유사어/동의어로의 확장은 이용자 중심의 접근을 제공하는 측면에서 중요하다는 점이다.

토픽 모델링과 동시출현 단어 분석을 활용한 환자안전 관련 사회적 이슈의 변화 (An Analysis of Changes in Social Issues Related to Patient Safety Using Topic Modeling and Word Co-occurrence Analysis)

  • 김나리;이남주
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.92-104
    • /
    • 2021
  • 본 연구의 목적은 온라인 뉴스 기사를 분석하여 환자안전에 대한 사회적 이슈를 확인하고, 환자안전법 시행 이전과 시행 이후 사회적 이슈의 변화를 확인하기 위함이다. R 프로그램을 이용하여 2010년 1월 1일부터 2020년 3월 5일까지 총 7600건의 온라인 뉴스 기사를 수집하였으며, 키워드 분석, 토픽 모델링, 동시출현 네트워크 분석을 시행하였다. 2609개의 키워드는 다음의 8가지 주제로 범주화되었다 : "의료행위", "의료인력", "감염 및 시설", "간호·간병통합서비스", "의약품", "개선을 위한 시스템 개발 및 구축", "환자안전법", "의료기관 인증". 그리고 환자안전법 시행 이전에는 환자안전 인식, 감염관리, 의료기관 인증 등의 키워드가 등장하였으나 시행 이후에는 환자안전 문화, 투약 등의 키워드가 등장하였으며 간호의 중요도 순위가 상승하였다. 의료계뿐 아니라 대중에게도 환자안전에 관한 관심은 높아지고 있으며, 환자안전 향상에 간호의 역할은 중요하다. 따라서 환자안전을 간호의 핵심 역량으로 삼고 지속적인 교육을 해나가야 할 것이다.

소셜 빅데이터 기반 2016리우올림픽 축구 관련 이슈 및 인물에 대한 연관단어 분석 (Social Big Data-based Co-occurrence Analysis of the Main Person's Characteristics and the Issues in the 2016 Rio Olympics Men's Soccer Games)

  • 박성건;이수원;황영찬
    • 한국체육학회지인문사회과학편
    • /
    • 제56권2호
    • /
    • pp.303-320
    • /
    • 2017
  • 본 연구의 목적은 소셜 빅데이터를 기반으로 리우올림픽 축구 관련 이슈 및 인물에 대한 대중들의 주요 관심사를 알아보는 것이다. 본 연구를 위해 수집된 데이터는 2016 리우올림픽 한국축구 경기와 관련된 웹 뉴스 및 댓글이다. 경기별 주요 이슈 및 대중들의 관심사를 알아보기 위해 연관단어 분석을 실시하고, NodeXL을 이용하여 시각화하였다. 연구 결과, 대중들에게 높은 관심을 받은 경기는 피지와의 경기, 한국축구대표팀 관련 인물은 손흥민, 해설위원은 이영표, 캐스터는 조우종으로 나타났다. 리우올림픽에 출전한 한국축구대표팀에 대한 대중들의 생각은 일부 부정적인 평가가 나타났지만, 대체로 긍정적인 것으로 평가할 수 있다. 해설위원 및 캐스터에 대한 대중들의 관심은 경기결과 및 예측, 설명에 대한 재치, 해설위원 및 캐스터의 호흡, 즐거움 요소(예능)로 나타났다. 결론적으로, 스포츠빅이벤트에 대한 대중들의 관심을 높일 수 있는 방안은 다양한 스포츠 분석 콘텐츠 제공, 전문성과 예능감 등을 겸비한 방송해설자 선정이 될 수 있다.

단어 간 관계 패턴 학습을 통한 하이퍼네트워크 기반 자연 언어 문장 생성 (Hypernetwork-based Natural Language Sentence Generation by Word Relation Pattern Learning)

  • 석호식;작가멧;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.205-213
    • /
    • 2010
  • 본 논문에서는 단어간 관계 패턴을 학습한 후 이에 기반하여 자연 언어 문장을 생성하는 방법을 소개한다. 기존의 문장 생성 방법론에서는 내재된 문법 규칙의 존재를 가정하거나 템플릿을 사용하고 있으나, 본 논문에서 소개하는 방법론에서는 태깅 등의 부가 정보 없이 단어의 동시 등장 빈도만을 활용하여 단어간 관계 패턴을 학습한다. 단어간 관계 패턴은 하이퍼네트워크 방법론에 기반하여 학습되었다. 학습이 진행됨에 따라 하이퍼네트워크의 복잡도가 높아지며, 학습 모델에 축적되는 언어 관계 패턴의 수가 증가한다. 학습된 모텔의 유효성은 학습 패턴에 기반한 자연 언어 문장 생성을 통해 확인하였다. 실험 결과 학습이 진행됨에 따라 문법적으로 성립하는 문장의 비율이 향상하였다. 파서를 이용하여 생성된 문장을 구성하는 문법 규칙을 분석한 후 문법 규칙의 분포를 학습에 사용한 코퍼스의 문법 규칙 분포와 비교한 결과 학습에 사용된 코퍼스의 문법적 특성을 학습할 수 있는 잠재력을 갖고 있음을 확인하였다.

GCNXSS: An Attack Detection Approach for Cross-Site Scripting Based on Graph Convolutional Networks

  • Pan, Hongyu;Fang, Yong;Huang, Cheng;Guo, Wenbo;Wan, Xuelin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.4008-4023
    • /
    • 2022
  • Since machine learning was introduced into cross-site scripting (XSS) attack detection, many researchers have conducted related studies and achieved significant results, such as saving time and labor costs by not maintaining a rule database, which is required by traditional XSS attack detection methods. However, this topic came across some problems, such as poor generalization ability, significant false negative rate (FNR) and false positive rate (FPR). Moreover, the automatic clustering property of graph convolutional networks (GCN) has attracted the attention of researchers. In the field of natural language process (NLP), the results of graph embedding based on GCN are automatically clustered in space without any training, which means that text data can be classified just by the embedding process based on GCN. Previously, other methods required training with the help of labeled data after embedding to complete data classification. With the help of the GCN auto-clustering feature and labeled data, this research proposes an approach to detect XSS attacks (called GCNXSS) to mine the dependencies between the units that constitute an XSS payload. First, GCNXSS transforms a URL into a word homogeneous graph based on word co-occurrence relationships. Then, GCNXSS inputs the graph into the GCN model for graph embedding and gets the classification results. Experimental results show that GCNXSS achieved successful results with accuracy, precision, recall, F1-score, FNR, FPR, and predicted time scores of 99.97%, 99.75%, 99.97%, 99.86%, 0.03%, 0.03%, and 0.0461ms. Compared with existing methods, GCNXSS has a lower FNR and FPR with stronger generalization ability.

심리학적 언어분석 프로그램 개발을 위한 융합연구: 기존 프로그램의 비교와 관련 문헌의 동향 분석 (A Convergence Study for Development of Psychological Language Analysis Program: Comparison of Existing Programs and Trend Analysis of Related Literature)

  • 김영준;최원일;김태훈
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.1-18
    • /
    • 2021
  • 내용어 기반 빈도 분석은 의도적 기만이나 반어적 표현에 분명한 한계가 있지만, 많이 사용되는 한국어 분석 프로그램인 KLIWC는 기능어 분석을, KrKwic는 동시출현빈도를 시각화하는 방법으로 발전했다. 하지만 개발된 지 십수 년이 지나 여러 문제점으로 개선이 필요한 상황이다. 그래서 KLIWC와 KrKwic를 분석하여 새 심리학적 언어분석 프로그램을 개발하고자 하였다. 첫째로 두 프로그램의 특징을 분석하였다. 특히, 기능어 분석기능 제고를 위해서 KLIWC와 한국어 형태소 분석기의 형태소 분류를 비교하였고, 심리적 분석의 강화를 위해 심리사전의 구조와 체계를 분석하였다. 분석 결과 한나눔 품사 분석기가 가장 세분화되었지만, 인칭대명사에서는 KLIWC가, 어미와 어말어미에서는 KKMA의 품사 분류가 더 세분화되어 있어, 기능어 분석 강화를 위해 여러 품사 분석기의 통합적 사용을 제안하였다. 둘째로 이 프로그램들로 텍스트를 분석한 연구들의 연구동향을 분석하였다. 분석 결과 두 프로그램이 복합학 분야 등 다양한 학술분야에서 사용되고 있었다. 특히 논문과 보고서의 분석에는 KrKwic가 많이 사용되었고, 글쓴이의 생각, 정서, 성격 비교 연구에는 KLIWC가 많이 사용되었다. 이 결과를 바탕으로 새로운 심리학적 언어분석 프로그램의 필요성과 개발 방향에 대해 제언하였다.

Arab Spring Effects on Meanings for Islamist Web Terms and on Web Hyperlink Networks among Muslim-Majority Nations: A Naturalistic Field Experiment

  • Danowski, James A.;Park, Han Woo
    • Journal of Contemporary Eastern Asia
    • /
    • 제13권2호
    • /
    • pp.15-39
    • /
    • 2014
  • This research conducted a before/after naturalistic field experiment, with the early Arab Spring as the treatment. Compared to before the early Arab Spring, after the observation period the associations became stronger among the Web terms: 'Jihad, Sharia, innovation, democracy and civil society.' The Western concept of civil society transformed into a central Islamist ideological component. At another level, the inter-nation network based on Jihad-weighted Web hyperlinks between pairs of 46 Muslim Majority (MM) nations found Iran in one of the top two positions of flow betweenness centrality, a measure of network power, both before and after early Arab Spring. In contrast, Somalia, UAE, Egypt, Libya, and Sudan increased most in network flow betweenness centrality. The MM 'Jihad'-centric word co-occurrence network more than tripled in size, and the semantic structure more became entropic. This media "cloud" perhaps billowed as Islamist groups changed their material-level relationships and the corresponding media representations of Jihad among them changed after early Arab Spring. Future research could investigate various rival explanations for this naturalistic field experiment's findings.

언어 네트워크 분석을 이용한 과학의 본성에 관한 국내연구 동향 (Research Trends of Studies Related to the Nature of Science in Korea Using Semantic Network Analysis)

  • 이상균
    • 대한지구과학교육학회지
    • /
    • 제9권1호
    • /
    • pp.65-87
    • /
    • 2016
  • The purpose of this study is to examine Korean journals related to science education in order to analyze research trends into Nature of science in Korea. The subject of the study is the level of Korean Citation Index (KCI-listed, KCI listing candidates), that can be searched by the key phrase, "Nature of science" in Korean language through the RISS service. In this study, the Descriptive Statistical Analysis Method is utilized to discover the number of research articles, classifying them by year and by journal. Also, the Sementic Network Analysis was conducted to Word Cloud Analysis the frequency of key words, Centrality Analysis, co-occurrence and Cluster Dendrogram Analysis throughout a variety of research articles. The results show that 91 research papers were published in 25 journals from 1991 to 2015. Specifically, the 2 major journals published more than 50% of the total papers. In relation to research fields., In addition, key phrases, such as 'Analysis', 'recognition', 'lessons', 'science textbook', 'History of Science' and 'influence' are the most frequently used among the research studies. Finally, there are small language networks that appear concurrently as below: [Nature of science - high school student - recognize], [Explicit - lesson - effect], [elementary school - science textbook - analysis]. Research topic have been gradually diversified. However, many studies still put their focus on analysis and research aspects, and there have been little research on the Teaching and learning methods.

Research on Brand Value Dimensions of Employers: Based on Online Reviews by the Employees

  • XU, Meng
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권10호
    • /
    • pp.215-225
    • /
    • 2022
  • This study investigates employees' online reviews, conducts in-depth text topic mining, effectively summarizes the dimensions of employer brand value, and seeks effective ways to build employer brands from a multi-dimensional perspective. This study employs samples of employer reviews, filter keywords according to word frequency-inverse document frequency, builds a review network containing the same keywords, explore the community and summarize the theme dimensions. Simultaneously, it makes a dynamic comparison and analysis of the employer brand value dimension of different industries and enterprises. The study shows that the community exploration theme can be summarized into 11 dimensions of employer brand value, and the dimensions of employer brand value are significantly different across industries and among different enterprises within the industry. The attention to the employer brand value dimension has a significant time change. Various industries pay increasing attention to the dimension of work intensity and career development, while employers pay steady attention to the dimension of welfare benefits. The findings of this study suggest that seeking the heterogeneity of employer brand resources from the multi-dimensional differences and changes is an effective way to improve the competitiveness of enterprises in the human capital market.