• 제목/요약/키워드: Language Networks Analysis

검색결과 93건 처리시간 0.027초

양방향 장단기 메모리 신경망을 이용한 욕설 검출 (Abusive Detection Using Bidirectional Long Short-Term Memory Networks)

  • 나인섭;이신우;이재학;고진광
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.35-45
    • /
    • 2019
  • 욕설과 비속어를 포함한 악성 댓글에 대한 피해는 최근 언론에 나오는 연애인의 자살뿐만 아니라 사회 전반에서 다양한 형태로 증가하고 있다. 이 논문에서는 양방향 장단기 메모리 신경망 모델을 이용하여 욕설을 검출하는 기법을 제시하였다. 웹 크룰러를 통해 웹상의 댓글을 수집하고, 영어나 특수문자 등의 사용하지 않은 글에 대해 불용어 처리를 하였다. 불용어 처리된 댓글에 대해 문장의 전·후 관계를 고려한 양방향 장단기 메모리 신경망 모델을 적용하여 욕설 여부를 판단하고 검출하였다. 양방향 장단기 메모리 신경망을 사용하기 위해 검출된 댓글에 대해 형태소 분석과 벡터화 과정을 거쳤으며 각 단어들에 욕설 해당 여부를 라벨링하여 진행하였다. 실험 결과 정제하고 수집된 총 9,288개의 댓글에 대해 88.79%의 성능을 나타내었다.

  • PDF

Risk Communication on Social Media during the Sewol Ferry Disaster

  • Song, Minsun;Jung, Kyujin;Kim, Jiyoung Ydun;Park, Han Woo
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권1호
    • /
    • pp.189-216
    • /
    • 2019
  • The frequent occurrence of overwhelming disasters necessitates risk communication systems capable of operating effectively in disaster contexts. Few studies have examined risk communication networks during disasters through social networking services (SNS). This study therefore investigates the patterns of risk communication by comparing Korean and international networks based on the social amplification of risk communication in the context of the Sewol ferry disaster (SFD). In addition, differences in language use and patterns between Korean and international contexts are identified through a semantic analysis using KrKwick, NodeXL, and UCINET. The SFD refers to the sinking of the ferry while carrying 476 people, mostly secondary school students. The results for interpersonal risk communication reveal that the structure of the Korean risk communication network differed from that of the international network. The Korean network was more fragmented, and its clustering was more sparsely knitted based on the impact and physical proximity of the disaster. Semantic networks imply that the physical distance from the disaster affected the content of risk communication, as well as the network pattern.

순환 신경망에서 LSTM 블록을 사용한 영어와 한국어의 시편 생성기 비교 (Psalm Text Generator Comparison Between English and Korean Using LSTM Blocks in a Recurrent Neural Network)

  • 에런 스노버거;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.269-271
    • /
    • 2022
  • 최근 몇 년 동안 LSTM 블록이 있는 RNN 네트워크는 순차적 데이터를 처리하는 기계 학습 작업에 광범위하게 사용되어왔다. 이러한 네트워크는 주어진 시퀀스에서 가능성이 다음으로 가장 높은 단어를 기존 신경망보다 더 정확하게 예측할 수 있기 때문에 순차적 언어 처리 작업에서 특히 우수한 것으로 입증되었다. 이 연구는 영어와 한국어로 된 150개의 성경 시편에 대한 세 가지 다른 번역에 대해 RNN/LSTM 신경망을 훈련하였다. 그런 다음 결과 모델에 입력 단어와 길이 번호를 제공하여 훈련 중에 인식한 패턴을 기반으로 원하는 길이의 새 시편을 자동으로 생성하였다. 영어 텍스트와 한국어 텍스트에 대한 네트워크 훈련 결과를 상호 비교하고 개선할 점을 기술한다.

  • PDF

언론의 '해양환경'에 대한 의제설정 언어 네트워크 분석 (Language Network Analysis of 'Marine Environment' in News Frame)

  • 김호경;권기석;장덕희
    • 한국콘텐츠학회논문지
    • /
    • 제16권5호
    • /
    • pp.385-398
    • /
    • 2016
  • 이 연구에서는 해양환경에 대한 언론의 의제설정 경향을 연도별로 분석하여, 해양환경이 국내 언론을 통해 어떻게 의미화 되는지를 분석하였다. 지난 10년(2005-2014년)간 국내 4개 종합일간지(동아 중앙 경향 한겨레)에 해양환경에 관해 보도된 기사에 대해 R 프로그램과 넷마이너 프로그램을 활용하여 언어 네트워크 분석을 실시하였다. 연구 결과, 국내 언론에서 해양환경은 경제적 차원에서 의미화되었다. 지난 10년간 연도별 구분 없이, 언론은 해양환경에 대한 '개발'이슈를 주요하게 다루고 있는 것으로 나타났다. 해양 환경의 개발을 중심으로 다양한 '계획'과 단위 '사업'들이 중요한 상관관계를 가진 영역으로 다루어졌다. 하지만 해양환경의 '보전'이슈는 국내 언론에서 주요 의제로 언급되지 않았다. 해양환경은 효과적인 보전을 기반으로, 이와 동시에 합리적인 개발이 필요한 분야이다. 개발이슈만을 지나치게 부각하는 국내 언론보도의 의제설정경향은 해양환경을 개발의 대상으로 인식하는 데 막대한 영향을 미친다. 향후 해양환경 분야에 대한 언론보도의 방향성과 정보제공의 시사점에 대해 논의하였다.

미국 내 한국 이민자 자녀의 교육을 위한 사회적 자본 (Social Capital for Korean Immigrant Children's Education in the U.S.)

  • 박원순;윤영순
    • 한국산학기술학회논문지
    • /
    • 제15권4호
    • /
    • pp.2074-2084
    • /
    • 2014
  • 대부분의 이민자들은 새로운 언어와 문화에 익숙하지 않기 때문에 미국의 한국 이민자 자녀들에게는 사회적 자본이 절실하다. 그러나 이민자 부모들과 그 자녀들은 학교 안팎에서 사회 관계망을 형성하는데 제한적일 수밖에 없다. 이 연구를 위해 연구자들은 개방적 심층면담과 근거이론에 기반한 자료의 코딩과 분석과 같은 질적연구 방법을 사용하였다. 연구 결과 한국 이민자 부모들이 동족 관계망을 형성해 교육적 정보를 획득하고 교육적 의사결정을 내린다는 것을, 그리고 영어가 이러한 교육적 의사결정에 중요한 영향을 미치는 것이 밝혀졌다.

KMMR: An Efficient and scalable Key Management Protocol to Secure Multi-Hop Communications in large scale Wireless Sensor Networks

  • Guermazi, Abderrahmen;Belghith, Abdelfettah;Abid, Mohamed;Gannouni, Sofien
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권2호
    • /
    • pp.901-923
    • /
    • 2017
  • Efficient key distribution and management mechanisms as well as lightweight ciphers are the main pillar for establishing secure wireless sensor networks (WSN). Several symmetric based key distribution protocols are already proposed, but most of them are not scalable, yet vulnerable to a small number of compromised nodes. In this paper, we propose an efficient and scalable key management and distribution framework, named KMMR, for large scale WSNs. The KMMR contributions are three fold. First, it performs lightweight local processes orchestrated into upward and downward tiers. Second, it limits the impact of compromised nodes to only local links. Third, KMMR performs efficient secure node addition and revocation. The security analysis shows that KMMR withstands several known attacks. We implemented KMMR using the NesC language and experimented on Telosb motes. Performance evaluation using the TOSSIM simulator shows that KMMR is scalable, provides an excellent key connectivity and allows a good resilience, yet it ensures both forward and backward secrecy. For a WSN comprising 961 sensor nodes monitoring a 60 hectares agriculture field, KMMR requires around 2.5 seconds to distribute all necessary keys, and attains a key connectivity above 96% and a resilience approaching 100%. Quantitative comparisons to earlier work show that KMMR is more efficient in terms of computational complexity, required storage space and communication overhead.

인플루언서 속성 분석 기반 추천 시스템 (Influencer Attribute Analysis based Recommendation System)

  • 박정련;박지원;김민우;오하영
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1321-1329
    • /
    • 2019
  • 소셜 정보망의 발달로 마케팅의 방법도 다양하게 변화되고 있다. 기존의 유명인, 경제적 지원 기반의 성공적인 마케팅방법론과 달리, 최근 인플루언서 기반 유튜브 마케팅이 큰 대세를 이루고 있다. 본 논문 에서는 처음으로 유튜브 양적 정보 및 댓글분석 기반 다각도 질적 분석을 활용하여 54개 이상의 유튜브 채널에서 인플루언서 특징을 추출하고 대표적인 주제들을 모델링하여 개인 맞춤형 영상 만족도 극대화는 물론 기업체가 새로운 아이템을 마케팅 할 때 기존의 인플루언서 특징을 참고하여 새로운 아이템의 영상을 제작하고 배포함으로써 성공적인 홍보 효과를 누릴 수 있도록 보조 수단 제공을 목적으로 한다. 유튜브 채널 별 다양한 영상의 모든 댓글을 각 문서로 가정하고 TF-IDF 및 LDA알고리즘을 적용하여 성능 극대화 향상을 보였다.

정상 노년층의 인지-언어 능력과 인지 보존능력 간 상관성에 관한 메타분석 (Meta-analysis of Correlation between Cognitive-linguistic Ability and Cognitive Reserve in Normal Aging)

  • 이미숙
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.359-373
    • /
    • 2015
  • 인지 보존능력(CR)이란 보완적 뇌 연결망을 통해 인지적 수행력을 최적화 또는 극대화시키는 능력이다. CR은 노화에 따른 인지-언어 능력의 저하를 완화 또는 지연시키는 데 기여한다. CR 및 정상 노년층의 인지-언어 능력 간 상관성을 체계적으로 살펴본 국내 메타분석 연구는 거의 드문 편이다. 본 연구에서는 2000년 이후 게재된 국내외 문헌 중 총 32개 논문을 대상으로 메타분석을 실시하여 상관성을 체계적으로 검증하고자 하였다. 그 결과, CR의 유형은 교육수준과 인지자극 활동, 다중언어 사용, 직업 순으로 많았고, 인지-언어의 하위 영역 중에는 기억력, 전반적 인지능력, 언어능력이 대다수를 차지하였다. 또한, CR과 인지-언어 능력 간 상관성은 '중간' 정도였으며, 기억력, 언어능력 등이 여러 CR 유형과 유의한 상관성을 보였다. 본 연구는 CR이 정상 노년층의 인지-언어 능력에 미치는 효과성을 체계적으로 분석함으로써 증거 기반적 자료를 제공할 수 있다는 점에서 의의가 있다.

A Network Packet Analysis Method to Discover Malicious Activities

  • Kwon, Taewoong;Myung, Joonwoo;Lee, Jun;Kim, Kyu-il;Song, Jungsuk
    • Journal of Information Science Theory and Practice
    • /
    • 제10권spc호
    • /
    • pp.143-153
    • /
    • 2022
  • With the development of networks and the increase in the number of network devices, the number of cyber attacks targeting them is also increasing. Since these cyber-attacks aim to steal important information and destroy systems, it is necessary to minimize social and economic damage through early detection and rapid response. Many studies using machine learning (ML) and artificial intelligence (AI) have been conducted, among which payload learning is one of the most intuitive and effective methods to detect malicious behavior. In this study, we propose a preprocessing method to maximize the performance of the model when learning the payload in term units. The proposed method constructs a high-quality learning data set by eliminating unnecessary noise (stopwords) and preserving important features in consideration of the machine language and natural language characteristics of the packet payload. Our method consists of three steps: Preserving significant special characters, Generating a stopword list, and Class label refinement. By processing packets of various and complex structures based on these three processes, it is possible to make high-quality training data that can be helpful to build high-performance ML/AI models for security monitoring. We prove the effectiveness of the proposed method by comparing the performance of the AI model to which the proposed method is applied and not. Forthermore, by evaluating the performance of the AI model applied proposed method in the real-world Security Operating Center (SOC) environment with live network traffic, we demonstrate the applicability of the our method to the real environment.

Point of Interest Recommendation System Using Sentiment Analysis

  • Gaurav Meena;Ajay Indian;Krishna Kumar Mohbey;Kunal Jangid
    • Journal of Information Science Theory and Practice
    • /
    • 제12권2호
    • /
    • pp.64-78
    • /
    • 2024
  • Sentiment analysis is one of the promising approaches for developing a point of interest (POI) recommendation system. It uses natural language processing techniques that deploy expert insights from user-generated content such as reviews and feedback. By applying sentiment polarities (positive, negative, or neutral) associated with each POI, the recommendation system can suggest the most suitable POIs for specific users. The proposed study combines two models for POI recommendation. The first model uses bidirectional long short-term memory (BiLSTM) to predict sentiments and is trained on an election dataset. It is observed that the proposed model outperforms existing models in terms of accuracy (99.52%), precision (99.53%), recall (99.51%), and F1-score (99.52%). Then, this model is used on the Foursquare dataset to predict the class labels. Following this, user and POI embeddings are generated. The next model recommends the top POIs and corresponding coordinates to the user using the LSTM model. Filtered user interest and locations are used to recommend POIs from the Foursquare dataset. The results of our proposed model for the POI recommendation system using sentiment analysis are compared to several state-of-the-art approaches and are found quite affirmative regarding recall (48.5%) and precision (85%). The proposed system can be used for trip advice, group recommendations, and interesting place recommendations to specific users.