• 제목/요약/키워드: language network analysis

검색결과 368건 처리시간 0.029초

Analysis of Keywords and Language Networks of Pedagogical Problems in the Secondary-School Teacher's Employment Exam : Focusing on the 2019~2022 School Year Exam

  • Kwon, Choong-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.115-124
    • /
    • 2022
  • 본 연구의 목적은 2019~2022학년도 중등교사 임용시험 교육학문제의 연도별 핵심어와 그 경향, 핵심어들의 언어네트워크를 분석하여 그 결과를 제시하는 것이다. 주요 연구방법론은 텍스트 마이닝 기법과 언어네트워크 분석방법이었으며, 분석프로그램으로는 KrKwic, Wordcloud Maker, Ucinet6, NetDraw 등이었다. 연구결과는 다음과 같다. 첫째, 연도별 교육학문제의 상위출현빈도 핵심어는 교사, 학생, 교육과정, 수업, 평가 등의 기존 상위출현빈도 핵심어들이었으며, 최근 코로나 19 상황의 온라인수업 진행을 반영한 핵심어(온라인, 위키, 토의식, 정보 등)들도 추가로 등장하는 경향을 보였다. 4개년도 통합 텍스트에서의 상위출현빈도 핵심어는 학생(44), 교사(39), 수업(27), 학교(18), 교육과정(16), 온라인(10), 토의식(8) 등이었다. 둘째, 4개년도 상위출현빈도 핵심어들의 전체 언어네트워크는 상당한 수준의 밀도(0.566), 총연결수(492), 평균연결정도(16.4)로 분석되었다. 연결정도 중심성은 교사(199.0), 수업(197.0), 학생(185.0), 학교(150.0) 순으로 나타났으며, 매개 중심성은 교사(30.859), 수업(18.956), 학생(16.054), 학교(15.745) 순으로 나타났다. 본 연구결과는 중등교사 임용시험 수험생인 예비교사, 해당 시험 출제 관리하는 기관과 관련자, 중등학교 예비교사 양성기관의 교수자와 행정가들에게 고려해볼 만한 자료가 되길 기대한다.

한글 감정단어의 의미적 관계와 범주 분석에 관한 연구 (A Study on the Analysis of Semantic Relation and Category of the Korean Emotion Words)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권2호
    • /
    • pp.51-70
    • /
    • 2016
  • 이 연구의 목적은 한글로 된 주요감정단어들의 리스트를 대상으로 의미적 관계의 네트워크와 극성과 각성의 범주를 분석하는데 있다. 분석결과는 다음과 같다. 첫째, 감정단어 네트워크에서 각 감정단어들은 의미적으로 연결되어 있었다. 이것은 의미적 유사성에 따라 감정단어들의 유형을 구분하는 것을 어렵게 하는 특징이다. 대신에 의미적 관계의 감정단어 네트워크에서 중심적인 역할을 수행하는 감정단어들을 확인할 수 있었다. 둘째, 극성과 각성의 차원을 혼합한 범주에서, 많은 감정단어들은 부정적인 극성과 높은 각성의 단어들 집단과 부정적인 극성과 중간수준 각성의 단어들 집단으로 분류되었다. 이러한 한글감정단어의 특성들은 도서관이나 문헌정보에 나타나는 각종 텍스트 데이터의 감정분석에 유용하게 활용될 것이다.

뉴스 기사 텍스트 마이닝과 네트워크 분석을 통한 폭염의 사회·경제적 영향 유형 도출: 2012~2016년 사례 (Text Mining and Network Analysis of News Articles for Deriving Socio-Economic Damage Types of Heat Wave Events in Korea: 2012~2016 Cases)

  • 정재인;이경준;김승범
    • 대기
    • /
    • 제30권3호
    • /
    • pp.237-248
    • /
    • 2020
  • In order to effectively prepare for damage caused by weather events, it is important to proactively identify the possible impacts of weather phenomena on the domestic society and economy. Text mining and Network analysis are used in this paper to build a database of damage types and levels caused by heat wave. We collect news articles about heat wave from the SBS news website and determine the primary and secondary effects of that through network analysis. In addition to that, based on the frequency with which each impact keyword is mentioned, we estimate how much influence each factor has. As a result, the types of impacts caused by heat wave are efficiently derived. Among these types of impacts, we find that people in South Korea are mainly interested in algae and heat-related illness. Since this technique of analysis can be applied not only to news articles but also to social media contents, such as Twitter and Facebook, it is expected to be used as a useful tool for building weather impact databases.

The Impact of Transforming Unstructured Data into Structured Data on a Churn Prediction Model for Loan Customers

  • Jung, Hoon;Lee, Bong Gyou
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4706-4724
    • /
    • 2020
  • With various structured data, such as the company size, loan balance, and savings accounts, the voice of customer (VOC), which is text data containing contact history and counseling details was analyzed in this study. To analyze unstructured data, the term frequency-inverse document frequency (TF-IDF) analysis, semantic network analysis, sentiment analysis, and a convolutional neural network (CNN) were implemented. A performance comparison of the models revealed that the predictive model using the CNN provided the best performance with regard to predictive power, followed by the model using the TF-IDF, and then the model using semantic network analysis. In particular, a character-level CNN and a word-level CNN were developed separately, and the character-level CNN exhibited better performance, according to an analysis for the Korean language. Moreover, a systematic selection model for optimal text mining techniques was proposed, suggesting which analytical technique is appropriate for analyzing text data depending on the context. This study also provides evidence that the results of previous studies, indicating that individual customers leave when their loyalty and switching cost are low, are also applicable to corporate customers and suggests that VOC data indicating customers' needs are very effective for predicting their behavior.

동사 어휘의미망의 반자동 구축을 위한 사전정의문의 중심어 추출 (The Extraction of Head words in Definition for Construction of a Semi-automatic Lexical-semantic Network of Verbs)

  • 김혜경;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제10권1호
    • /
    • pp.47-69
    • /
    • 2006
  • Recently, there has been a surge of interests concerning the construction and utilization of a Korean thesaurus. In this paper, a semi-automatic method for generating a lexical-semantic network of Korean '-ha' verbs is presented through an analysis of the lexical definitions of these verbs. Initially, through the use of several tools that can filter out and coordinate lexical data, pairs constituting a word and a definition were prepared for treatment in a subsequent step. While inspecting the various definitions of each verb, we extracted and coordinated the head words from the sentences that constitute the definition of each word. These words are thought to be the main conceptual words that represent the sense of the current verb. Using these head words and related information, this paper shows that the creation of a thesaurus could be achieved without any difficulty in a semi-automatic fashion.

  • PDF

NLP기반 NER을 이용해 소셜 네트워크의 조직 구조 탐색을 위한 협력 프레임 워크 (A Collaborative Framework for Discovering the Organizational Structure of Social Networks Using NER Based on NLP)

  • 프랭크 엘리호데;양현호;이재완
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.99-108
    • /
    • 2012
  • 방대한 양의 데이터로부터 정보추출의 정확도를 향상시키기 위한 많은 방법이 개발되어 왔다. 본 논문에서는NER(named entity recognition), 문장 추출, 스피치 태깅과 같은 여러 가지의 자연어 처리 작업을 통합하여 텍스트를 분석하였다. 데이터는 도메인에 특화된 데이터 추출 에이전트를 사용하여 웹에서 수집한 텍스트로 구성하였고, 위에서 언급한 자연어 처리 작업을 사용하여 비 구조화된 데이터로부터 정보를 추출하는 프레임 워크를 개발하였다. 조직 구조의 탐색을 위한 택스트 추출 및 분석 관점에서 연구의 성능을 시뮬레이션을 통해 분석하였으며, 시뮬레이션 결과, 정보추출에서 MUC 및 CoNLL과 같은 다른 NER 분석기 보다 성능이 우수함을 보였다.

빅데이터를 위한 트랜스포머 기반의 언어 인식 기법 (Transformer-based Language Recognition Technique for Big Data)

  • 황치곤;윤창표;이수욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.267-268
    • /
    • 2022
  • 최근, 빅데이터 분석은 기계학습의 발전에 따른 다양한 기법들을 이용할 수 있다. 현실에서 수집된 빅데이터는 단어 간의 관계성에 대한 의미적 분석을 바탕으로 같거나 유사한 용어에 대한 자동화된 정제기법이 부족하다. 빅데이터는 보통 문장의 형태로 구성되어 있고, 이에 대한 형태소 분석이나 문장의 이해가 필요하다. 이에 자연어를 분석하기 위한 기법인 NLP는 단어의 관계성과 문장을 이해할 수 있다. 본 논문에서는 빅데이터를 시계열 접근법인 RNN의 단점을 보완한 기법인 트랜스포머와 리포머의 장단점에 대해 연구한다.

  • PDF

언어 네트워크 분석을 통한 온라인게임 유저의 과금 성향 분석 (The Study on Game Users' Payment Intention through Language Network Analysis)

  • 김은비;위정현
    • 한국게임학회 논문지
    • /
    • 제21권4호
    • /
    • pp.117-130
    • /
    • 2021
  • 본 연구는 언어 네트워크 분석을 활용하여 기능성 아이템과 장식용 아이템, 두 집단 간의 아이템 중요도 및 과금에 대한 생각을 연구하였다. 분석 결과로는 기능성 아이템을 구매하는 유저는 유료 아이템을 구매할 때 경쟁에 영향을 줄 수 있는 전투력과 능력치 요소가 함유된 유료 아이템의 영향을 많이 받는 것으로 나타났다. 이에 반해 장식용 아이템을 구매하는 유저는 자기만족감을 최우선으로 여기며, 캐릭터의 외형 변화를 통한 치장과 이러한 치장용 아이템 수집욕을 중시하는 것으로 나타났다. 또한 이들은 결과에 영향을 미치지 않는 아이템 구매를 통해 게임의 재미를 느끼고 있었으며, 나아가 게임 캐릭터를 통해 자기 자신의 투영과 '또 다른 나'를 인식했다,

Bistatic 레이다 통합 정보처리망의 설계에 관한 연구 (A Study on the Design of the Bistatic Radar Integrated Data Network)

  • 김춘길;이형재
    • 한국통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.307-322
    • /
    • 1992
  • For designing the radar integrated data network, we construct the network structure with a spatial hieratchy decomposition scheme. The RIDN can be decomposed into several subent classes, those of which are composed of the several group classes of radar sites, In a group class. The communication nodes of a radar site are modeled by the software modules formulated with the statistical attributes of discrete events. And we get the analysis over the network through the separately constructed infra group level models which were coded with the C language.From the result of the simulation. We could findthe fact that the data integration system;s performance approaches to the theordtically calculated value after being stable. And also we could get the packet processing status of a communication module’s inner processor which is difficult to oberve through the mathematical calculation tin the subnet model of the integrated data network.

  • PDF

Performance Analysis of SyncML Server System Using Stochastic Petri Nets

  • Lee, Byung-Yun;Lee, Gil-Haeng;Choi, Hoon
    • ETRI Journal
    • /
    • 제26권4호
    • /
    • pp.360-366
    • /
    • 2004
  • Synchronization Markup Language (SyncML) is a specification of a common data synchronization framework for synchronizing data on networked devices. SyncML is designed for use between mobile devices that are intermittently connected to a network and network services that are continuously available on the network. We have designed and developed a data synchronization system based on the SyncML protocol and evaluated the throughput of the system using the stochastic Petri nets package (SPNP) and analyzed the relationship between the arrival rate and the system resources. Using this model, we evaluate various performance measures in different situations, and we estimate the relationship between the arrival rate and the system resources. From the results, we can estimate the optimal amount of resources due to the arrival rate before deploying the developed system.

  • PDF