• 제목/요약/키워드: Co-word Analysis

검색결과 193건 처리시간 0.032초

텍스트마이닝을 활용한 북한 관련 뉴스의 기간별 변화과정 고찰 (An Investigation on the Periodical Transition of News related to North Korea using Text Mining)

  • 박철수
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.63-88
    • /
    • 2019
  • 북한의 변화와 동향 파악에 대한 연구는 북한관련 정책에 대한 방향을 결정하고 북한의 행위를 예측하여 사전에 대응 할 수 있다는 측면에서 매우 중요하다. 현재까지 북한 동향에 대한 연구는 전문가를 중심으로 과거 사례를 서술적으로 분석하여, 향후에 북한의 동향을 분석하고 대응하여 왔다. 이런 전문가 서술 중심의 북한 변화 및 동향 연구에서 비정형데이터를 이용한 텍스트마이닝 분석이 더해지면 보다 과학적인 북한 동향 분석이 가능할 것이다. 특히 북한의 동향 파악과 북한의 대남 관련 행위와 연관된 연구는 통일 및 국방 분야에서 매우 유용하며 필요한 분야이다. 본 연구에서는 북한의 신문 기사 내용을 활용한 텍스트마이닝 방법으로 북한과 관련한 핵심 단어를 구축하였다. 그리고 본 연구는 김정은 집권 이후 최근의 남북관계의 극적인 관계와 변화들을 기반으로 세 개의 기간을 나누고 이 기간 내에 국내 언론에 나타난 북한과 관련성이 높은 단어들을 시계열적으로 분석한 연구이다. 북한과 관련한 주요 단어들을 세 개의 기간별로 분류하고 당시에 북한의 태도와 동향에 따라 해당 단어와 주제들의 관련성이 어떻게 변화하였는지를 파악하였다. 본 연구는 텍스트마이닝을 이용한 연구가 남북관계 및 북한의 동향을 이해하고 분석하는 방법론으로서 얼마나 유용한 것이지를 파악하는 것이었다. 앞으로 북한의 동향 분석에 대한 연구는 물론 대북관계 및 정책에 대한 방향을 결정하고, 북한의 행위를 사전에 예측하여 대응 할 수 있는 북한 리스크 측정 모델 구축을 위한 연구로 진행 될 것이다.

소셜미디어를 통한 우울 경향 이용자 담론 주제 분석 (An Analysis of the Discourse Topics of Users who Exhibit Symptoms of Depression on Social Media)

  • 서하림;송민
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.207-226
    • /
    • 2019
  • 우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 '우울' 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.

지적구조 규명을 위한 키워드서지결합분석 기법에 관한 연구 (Introducing Keyword Bibliographic Coupling Analysis (KBCA) for Identifying the Intellectual Structure)

  • 이재윤;정은경
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.309-330
    • /
    • 2022
  • 학문의 구조, 특성, 하위 분야 등을 계량적으로 규명하는 지적구조 분석 연구가 최근 급격히 증가하는 추세이다. 지적구조 분석 연구를 수행하기 위하여 전통적으로 사용되는 분석기법은 서지결합분석, 동시인용분석, 단어동시출현분석, 저자서지결합분석 등이다. 이 연구의 목적은 키워드서지결합분석(KBCA, Keyword Bibliographic Coupling Analysis)을 새로운 지적구조 분석 방식으로 제안하고자 한다. 키워드서지결합분석 기법은 저자서지결합분석의 변형으로 저자 대신에 키워드를 표지로 하여 키워드가 공유한 참고문헌의 수를 두 키워드의 주제적 결합 정도로 산정한다. 제안된 키워드서지결합분석 기법을 사용하여 Web of Science에서 검색된 'Open Data' 분야의 1,366건의 논문집합을 대상으로 분석하였다. 1,366건의 논문집합에서 추출된 7회 이상 출현한 63종의 키워드를 오픈데이터 분야의 핵심 키워드로 선정하였다. 63종의 핵심 키워드를 대상으로 키워드서지결합분석 기법으로 제시된 지적구조는 열린정부와 오픈사이언스라는 주된 영역과 10개의 소주제로 규명되었다. 이에 반해 단어동시출현분석의 지적구조 네트워크는 전체 구성과 세부 영역 구조 규명에 있어 미진한 것으로 나타났다. 이러한 결과는 키워드서지결합분석이 키워드 간의 서지결합도를 사용하여 키워드 간의 관계를 풍부하게 측정하기 때문이라고 볼 수 있다.

국가직무능력 분석을 통한 4차산업 혁명의 교육방향 제안 (Suggestion of Education Direction of 4th Industrial Revolution through Analysis of the National Competency Standards)

  • 임성욱;윤성필;백창화
    • 품질경영학회지
    • /
    • 제45권4호
    • /
    • pp.709-716
    • /
    • 2017
  • Purpose: NCS(National Competency Standards) is a systematic organization of knowledge, skills, and literacy required for performing tasks in industrial settings. This research aims to search for keywords that are important to us and to present key directions of education for the fourth industrial age in the future. Methods: The systematic classification system of NCS was investigated and the classification code structure was analyzed. Among them, the frame and structure analysis of the classification code of quality was analyzed using R-program. Results: This study grasped the quality classification situation of NCS and suggested improvement plan from the operational aspect of the fourth industrial revolution era. Conclusion: In conclusion, this study suggested the idea of education direction of SMEs(Small and Medium-sized Enterprises) in the era of the 4th industrial revolution by understanding NCS which reflects Korean characteristics.

인터넷 오픈마켓 의류상품의 사용후기를 통한 부정적 구전 (Negative e-WOM based consumer reviews of clothing on Internet open market site)

  • 김성희
    • 패션비즈니스
    • /
    • 제14권5호
    • /
    • pp.49-65
    • /
    • 2010
  • The purpose of this paper is to derive the categories of negative e-WOM (electronic word of mouth) via consumer review. Disclosing the details of negative e-WOM based consumer reviews has never been done before. For this reason, a content analysis was adopted to provide knowledge and understanding of the phenomenon. This paper analyzes the content of 630 consumer reviews posted on the open market internet site, www.auction.co.kr. The analysis was conducted from October 20th, 2008 to March 10th, 2009. The results indicated that the negative e-WOM based consumer reviews can be divided into two categories: the cognitive evaluation and the expression of consumer's emotion. The category of cognitive evaluation is consisted of negative e-WOM of product, negative e-WOM of service, and warning about the risk of purchasing products. The category of expressing consumers' emotion are composed of venting customers' dissatisfaction and passive response of dissatisfaction. Investigating the details of negative e-WOM has a number of implications. Most importantly, the results revealed multidimensional structure of negative e-WOM. This understanding of negative e-WOM communication allows marketers to improve products and services that better meet customers' current and future needs.

Study on mechanical properties of Yellow River silt solidified by MICP technology

  • Yuke, Wang;Rui, Jiang;Gan, Wang;Meiju, Jiao
    • Geomechanics and Engineering
    • /
    • 제32권3호
    • /
    • pp.347-359
    • /
    • 2023
  • With the development of infrastructure, there is a critical shortage of filling materials all over the word. However, a large amount of silt accumulated in the lower reaches of the Yellow River is treated as waste every year, which will cause environmental pollution and waste of resources. Microbial induced calcium carbonate precipitation (MICP) technology, with the advantage of efficient, economical and environmentally friendly protection, is selected to solidify the abandoned Yellow River silt with poor mechanical properties into high-quality filling material in this paper. Based on unconfined compressive strength (UCS) test, determination of calcium carbonate (CaCO3) content and scanning electron microscope (SEM) test, the effects of cementation solution concentration, treatment times and relative density on the solidification effect were studied. The results show that the loose silt particles can be effectively solidified together into filling material with excellent mechanical properties through MICP technology. The concentration of cementation solution have a significant impact on the solidification effect, and the reasonable concentration of cementation solution is 1.5 mol/L. With the increase of treatment times, the pores in the soil are filled with CaCO3, and the UCS of the specimens after 10 times of treatment can reach 2.5 MPa with a relatively high CaCO3 content of 26%. With the improvement of treatment degree, the influence of relative density on the UCS increases gradually. Microscopic analysis revealed that after MICP reinforcement, CaCO3 adhered to the surface of soil particles and cemented with each other to form a dense structure.

딥러닝 자동 분류 모델을 위한 공황장애 소셜미디어 코퍼스 구축 및 분석 (Building and Analyzing Panic Disorder Social Media Corpus for Automatic Deep Learning Classification Model)

  • 이수빈;김성덕;이주희;고영수;송민
    • 정보관리학회지
    • /
    • 제38권2호
    • /
    • pp.153-172
    • /
    • 2021
  • 본 연구는 공황장애 말뭉치 구축과 분석을 통해 공황장애의 특성을 살펴보고 공황장애 경향 문헌을 분류할 수 있는 딥러닝 자동 분류 모델을 만들고자 하였다. 이를 위해 소셜미디어에서 수집한 공황장애 관련 문헌 5,884개를 정신 질환 진단 매뉴얼 기준으로 직접 주석 처리하여 공황장애 경향 문헌과 비 경향 문헌으로 분류하였다. 이 중 공황장애 경향 문헌에 나타난 어휘적 특성 및 어휘의 관계성을 분석하기 위해 TF-IDF값을 산출하고 단어 동시출현 분석을 실시하였다. 공황장애의 특성 및 증상 간의 관련성을 분석하기 위해 증상 빈도수와 주석 처리된 증상 번호 간의 동시출현 빈도수를 산출하였다. 또한, 구축한 말뭉치를 활용하여 딥러닝 자동 분류 모델 학습 및 성능 평가를 하였다. 이를 위하여 최신 딥러닝 언어 모델 BERT 중 세 가지 모델을 활용하였고 이 중 KcBERT가 가장 우수한 성능을 보였다. 본 연구는 공황장애 관련 증상을 겪는 사람들의 조기 진단 및 치료를 돕고 소셜미디어 말뭉치를 활용한 정신 질환 연구의 영역을 확장하고자 시도한 점에서 의의가 있다.

ICPSR 데이터 재이용 저작물 분석을 통한 사회과학 분야의 지적구조 분석 (An Investigation on Intellectual Structure of Social Sciences Research by Analysing the Publications of ICPSR Data Reuse)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제52권1호
    • /
    • pp.341-357
    • /
    • 2018
  • 오픈 사이언스 패러다임과 발달된 디지털 정보기술의 영향으로 여러 학문 분야에서 데이터의 공유와 재이용이 활발해지고 있으며, 데이터 중심(data intensive)의 학술 커뮤니티로 변모하고 있다. 본 논문은 사회과학 분야의 대규모 데이터 리파지토리인 Inter-university Consortium for Political and Social Research(ICPSR)에 수록된 데이터를 재이용한 저작물이 구현한 지적구조를 규명하고자 하였다. 이를 위하여 ICPSR 사이트의 2017년 발간된 데이터 재이용 저작물 570건을 분석의 대상으로 하였다. 분석의 과정은 두 단계를 거쳤다. 첫 번째 단계는 총 570건의 저작물에 대해서 저자, 저작물 형태, 저작물 자체의 주제 분석을 수행하였다. 저자를 살펴보면, 미국 대학과 연구기관 소속 연구자가 출현빈도 비중이 높은 것으로 나타났다. 저작물의 형태는 대부분은 학술지였으며, 이를 학술지 주제 분야로 분석하면, 사회과학, 의학, 심리학 분야로 나타났다. 두 번째 단계의 분석은 저작물의 제목에서 추출한 단어를 대상으로 동시출현단어 분석을 수행하여 군집과 네트워크로 시각화하였다. 이러한 결과는 보다 미시적인 주제 분야의 규명을 위해서 수행되었다. 분석결과 총 12군집인 정신건강, 담배영향, 학교/유년기/청년기장애, 청년기 성적위험, 아동부상, 육체활동, 폭력행동, 서베이, 가족역할, 여성, 문제행동, 성별차이로 구성되었음을 밝혔다. 이러한 결과를 종합적으로 살펴보면, ICPSR 데이터의 재이용을 통해 사회과학적 시각으로 의학 주제 분야의 연구가 비중있게 이루어지고 있음을 알 수 있다.

텍스트마이닝과 동시출현단어분석을 이용한 한국, 중국, 일본의 우제목 연구 동향 분석 (The Tresnds of Artiodactyla Researches in Korea, China and Japan using Text-mining and Co-occurrence Analysis of Words)

  • 이병주;김백준;이제민;어수형
    • 한국환경생태학회지
    • /
    • 제33권1호
    • /
    • pp.9-15
    • /
    • 2019
  • 우제목은 짝수 개의 발굽을 갖는 포유동물로 다양한 종이 전 세계적으로 광범위하게 서식하고 있다. 최근 국내에서는 멧돼지, 고라니와 같은 야생 우제목 동물에 의한 농작물 피해, 로드킬 등의 급증과 산양, 사향노루 등 일부 종의 개체수 급감으로 사회적 관심을 받고 있다. 그러나 이러한 사회적 관심에도 불구하고 우제목 관련 국내 연구는 매우 부족하며, 국내 우제목의 연구 동향 분석도 이루어지지 않아 실질적인 문제점을 파악하는데 어려움이 있다. 최근 연구 동향분석에 있어 텍스트마이닝과 동시출현단어분석은 연구 문헌들에서 나타나는 주요 단어들을 추출하고 단어들 간의 연관성을 정량화하는데 활용되고 있으며, 연구 주제의 분류에 있어 객관성을 증가시킨다. 본 연구에서는 텍스트마이닝과 동시출현단어분석을 통해 한국, 중국, 일본 3국의 우제목 연구 논문을 분석하고 국가별 연구 주제를 비교하여, 국내 우제목 연구에서의 부족한 점과 향후 필요한 점을 알아보고자 하였다. 각 국가별로 우제목과 관련된 연구 논문을 검색하여 수집한 665편의 논문들에 대한 텍스트마이닝 결과, 총 199개 단어가 추출되었다. 추출된 단어들에 대한 동시출현단어분석 결과 3개의 단어군이 형성되었다. 각 단어군에 포함된 단어들을 살펴본 결과, 단어군1은 "서식환경/생태", 단어군2는 "질병", 단어군3은 "보전유전학/분자생태"와 관련 있는 것으로 판단된다. 국가별로 각 단어군의 비율을 살펴본 결과, 중국과 일본은 비교적 고른 단어군 비율을 나타낸 반면, 한국은 "질병"과 관련된 단어군2의 비율이 69%로 상당히 큰 편중을 나타내었다. 연도에 따른 각 단어군별 단어수 회귀 분석 결과에서도 중국과 일본은 3개의 단어군에 해당하는 단어수가 시간 경과에 따라 비교적 고르게 증가하였지만, 한국은 단어군2의 증가율이 나머지 단어군의 5배 이상을 나타냈다. 국내 우제목 연구는 중국과 일본에 비해 질병과 관련된 연구 위주로 진행된 것으로 판단되며, 서식 특성, 행동, 분자생태를 포함한 연구는 매우 적게 수행된 것으로 판단된다. 향후 국내 야생 우제목 동물에 의한 피해 조절과 멸종위기종 보호를 위한 합리적인 정책 수립을 위해, 야생 우제목에 대한 생태 연구를 집중적으로 실시하여 기초생태 자료를 축적시켜 나가야 할 것이다.

Identifying Top K Persuaders Using Singular Value Decomposition

  • Min, Yun-Hong;Chung, Ye-Rim
    • 유통과학연구
    • /
    • 제14권9호
    • /
    • pp.25-29
    • /
    • 2016
  • Purpose - Finding top K persuaders in consumer network is an important problem in marketing. Recently, a new method of computing persuasion scores, interpreted as fixed point or stable distribution for given persuasion probabilities, was proposed. Top K persuaders are chosen according to the computed scores. This research proposed a new definition of persuasion scores relaxing some conditions on the matrix of probabilities, and a method to identify top K persuaders based on the defined scores. Research design, data, and methodology - A new method of computing top K persuaders is computed by singular value decomposition (SVD) of the matrix which represents persuasion probabilities between entities. Results - By testing a randomly generated instance, it turns out that the proposed method is essentially different from the previous study sharing a similar idea. Conclusions - The proposed method is shown to be valid with respect to both theoretical analysis and empirical test. However, this method is limited to the category of persuasion scores relying on the matrix-form of persuasion probabilities. In addition, the strength of the method should be evaluated via additional experiments, e.g., using real instances, different benchmark methods, efficient numerical methods for SVD, and other decomposition methods such as NMF.