• 제목/요약/키워드: Word learning system

검색결과 202건 처리시간 0.027초

이상 탐지를 위한 시스템콜 시퀀스 임베딩 접근 방식 비교 (Comparison of System Call Sequence Embedding Approaches for Anomaly Detection)

  • 이근섭;박경선;김강석
    • 융합정보논문지
    • /
    • 제12권2호
    • /
    • pp.47-53
    • /
    • 2022
  • 최근 지능화된 보안 패러다임의 변화에 따라, 다양한 정보보안 시스템에서 발생하는 각종 정보를 인공지능 기반 이상탐지에 적용하기 위한 연구가 증가하고 있다. 따라서 본 연구는 로그와 같은 시계열 데이터를 수치형 특성인 벡터로 변환하기 위하여 딥러닝 기반 Word2Vec 모델의 CBOW와 Skip-gram 추론 방식과 동시발생 빈도 기반 통계 방식을 사용하여 공개된 ADFA 시스템콜 데이터에 대하여, 벡터의 차원, 시퀀스 길이 및 윈도우 사이즈를 고려한 다양한 임베딩 벡터로의 변환에 대한 실험을 진행하였다. 또한 임베딩 모델로 생성된 벡터를 입력으로 하는 GRU 기반 이상 탐지 모델을 통해 탐지 성능뿐만 아니라 사용된 임베딩 방법들의 성능을 비교 평가하였다. 통계 모델에 비해 추론 기반 모델인 Skip-gram이 특정 윈도우 사이즈나 시퀀스 길이에 치우침 없이 좀 더 안정되게(stable) 성능을 유지하여, 시퀀스 데이터의 각 이벤트들을 임베딩 벡터로 만드는데 더 효과적임을 확인하였다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

대학의 평생교육체제 성인학습자 입시홍보 융합전략 (Convergence Strategy for Promoting the Admissions of Adult Learning in the College of Lifelong Education)

  • 김인숙
    • 사물인터넷융복합논문지
    • /
    • 제5권2호
    • /
    • pp.89-94
    • /
    • 2019
  • 대학의 평생교육체제 성인학습자 입시홍보 융합 전략 수립에 중요한 자료를 제시하고자 성인학습자를 대상으로 대학의 평생교육 참여 동기, 선택 시 중요하게 인식하는 요인 등을 실증 분석하고자 하였다. 성인학습자의 참여동기에서는 1순위로 새로운 지식과 기술 습득, 2순위로 새로운 것을 배우는 것 자체가 좋아서, 3순위로 함께 배우는 활동을 하기 위해로 나타났다. 전문성 확보를 통한 프로그램 다양성과 질을 높이기 위해 교수 및 직원에 대한 학교의 적극적인 투자가 필요할 것이다. 성인학습자들은 자신과 교류하고 있는 체계에서 정보를 습득하고 있으며, 나아가 대학의 교수 등의 홍보로부터 정보를 파악하는 것으로 나타났다. 지인을 통해 경로 및 정보를 습득하고 있기 때문에 불특정 다수의 성인학습자들에게 지속적으로 맞춤형 교육과정 개발 등이 필요할 것이다. 입시홍보는 다양한 융합전략으로 지역의 현수막 거치와 지하철 홍보, 지역신문, 구전, SNS, 인터넷 등으로 다양한 융합 전략을 적극 활용해야 할 것이다.

한국 전통문화 말뭉치구축 및 Bi-LSTM-CNN-CRF를 활용한 전통문화 개체명 인식 모델 개발 (Constructing for Korean Traditional culture Corpus and Development of Named Entity Recognition Model using Bi-LSTM-CNN-CRFs)

  • 김경민;김규경;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.47-52
    • /
    • 2018
  • 개체명 인식(Named Entity Recognition)시스템은 문서로부터 고유한 의미를 가질 수 있는 인명(PS), 지명(LC), 기관명(OG) 등의 개체명을 추출하고 추출된 개체명의 범주를 결정하는 시스템이다. 최근 딥러닝 방식을 이용한 개체명 인식 연구에서 입력 데이터의 앞, 뒤 방향을 고려한 LSTM 기반의 Bi-LSTM 모델로부터 출력 데이터 간의 전이 확률을 이용한 CRF를 결합한 방식의 Bi-LSTM-CRF가 우수한 성능을 보이고, 문자 및 단어 단위의 효율적인 임베딩 벡터생성에 관한 연구와 CNN, LSTM을 활용한 모델에서도 좋은 성능을 보여주고 있다. 본 연구에서는 한국어 개체명 인식시스템 성능 향상을 위해 자질을 보강한 Bi-LSTM-CNN-CRF 모델에 관해 기술하고 전통문화 말뭉치구축 방식에 대해 제안한다. 그리고 구축한 말뭉치를 한국어 개체명 인식 성능 향상을 위한 자질 보강 모델 Bi-LSTM-CNN-CRF로 학습한 결과에 대해 제안한다.

Structuring of Unstructured SNS Messages on Rail Services using Deep Learning Techniques

  • Park, JinGyu;Kim, HwaYeon;Kim, Hyoung-Geun;Ahn, Tae-Ki;Yi, Hyunbean
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권7호
    • /
    • pp.19-26
    • /
    • 2018
  • This paper presents a structuring process of unstructured social network service (SNS) messages on rail services. We crawl messages about rail services posted on SNS and extract keywords indicating date and time, rail operating company, station name, direction, and rail service types from each message. Among them, the rail service types are classified by machine learning according to predefined rail service types, and the rest are extracted by regular expressions. Words are converted into vector representations using Word2Vec and a conventional Convolutional Neural Network (CNN) is used for training and classification. For performance measurement, our experimental results show a comparison with a TF-IDF and Support Vector Machine (SVM) approach. This structured information in the database and can be easily used for services for railway users.

웹 기반 수업을 위한 유해 단어 관리 게시판의 설계 및 구현 (Design and Implementation of Harmful Word Management Board for Web-based Instruction)

  • 박지현;곽미라;조동섭
    • 컴퓨터교육학회논문지
    • /
    • 제5권1호
    • /
    • pp.109-115
    • /
    • 2002
  • 인터넷이 교육에 사용됨으로써 학습자의 자기주도학습, 개별학습, 완전학습, 그리고 탐구형 학습 등이 효과적으로 이루어질 수 있다. 특히 이러한 장점을 취하기 위하여 게시판 시스템이 웹 기반 학습에 널리 사용되고 있다. 그러나, 게시판의 활용은 인터넷이 가지는 익명성으로 인해 자유로운 의견의 교환이라는 장점 외에, 부정적이거나 폭력적인 언어 사용이 쉽게 일어난다는 단점을 가진다. 본 연구는 인터넷을 활용한 학습에서 커뮤니케이션 도구로 널리 사용되고 있는 게시판이 유해단어 관리 기능을 가지도록 함으로써, 유해한 내용을 포함하는 내용의 게시를 제재하고 학생들의 언어 습관을 교정 할 수 있게 하였다.

  • PDF

개인화 스토리텔링 수학 학습 시스템 (Personalized Storytelling Mathematics Learning System)

  • 이정환;한기준;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.981-984
    • /
    • 2014
  • 개인화된 서술형 수학 문제(mathematics word problem)는 오랫동안 연구된 분야로 학생들의 학업 성취도와 수학에 대한 태도에 관심을 가져왔다. 본 연구에서는 2013년 도입된 스토리텔링 수학에 개인화된 콘텐츠를 접목하여 그 효과를 알아보고자 하였다. 초등학생 26명을 대상으로 하여 약 110분 동안 수업을 진행하였으며, 무게에 대한 새로운 개념을 배우는 데 그 목적을 두었다. 각각 13명씩 개인화 그룹과 비 개인화 그룹으로 나누어 수업을 진행하였다. 학업 성취도(Learning Achievement)에서는 사전 시험(pre-test) 점수가 너무 높아 두 그룹 간에 서로간의 유의한 차이점을 발견하지 못했다. 수학에 대한 태도 부분과 몰입도(Flow) 부분에서는 다소 개인화 그룹의 값이 높았지만, 통계적으로 유의한 정도는 차이는 아니었다. 하지만 정성적 분석에서는 차이가 있었다. 개인화 그룹(Personalized group)은 비 개인화 그룹(non-personalized group)에 비해 개인화(personalization)가 수업의 재미있는 요소로서 보다 중요한 작용을 했다고 느꼈다. 또한, 테스트나 측정(measure) 부분에서 생겼던 문제점을 개선하여 재 실험이 있을 시엔 유의미한 값을 나타낼 것으로 기대된다.

Fast Convergence GRU Model for Sign Language Recognition

  • Subramanian, Barathi;Olimov, Bekhzod;Kim, Jeonghong
    • 한국멀티미디어학회논문지
    • /
    • 제25권9호
    • /
    • pp.1257-1265
    • /
    • 2022
  • Recognition of sign language is challenging due to the occlusion of hands, accuracy of hand gestures, and high computational costs. In recent years, deep learning techniques have made significant advances in this field. Although these methods are larger and more complex, they cannot manage long-term sequential data and lack the ability to capture useful information through efficient information processing with faster convergence. In order to overcome these challenges, we propose a word-level sign language recognition (SLR) system that combines a real-time human pose detection library with the minimized version of the gated recurrent unit (GRU) model. Each gate unit is optimized by discarding the depth-weighted reset gate in GRU cells and considering only current input. Furthermore, we use sigmoid rather than hyperbolic tangent activation in standard GRUs due to performance loss associated with the former in deeper networks. Experimental results demonstrate that our pose-based optimized GRU (Pose-OGRU) outperforms the standard GRU model in terms of prediction accuracy, convergency, and information processing capability.

빅데이터 분석에 기반한 아동학대의 이해 -머신러닝 알고리즘 개발 기초연구- (Understanding Child Abuse Based on Big Data Analysis -A Basic Study on the Development of Machine Learning Algorithm-)

  • 배정호;범은애
    • 사물인터넷융복합논문지
    • /
    • 제8권4호
    • /
    • pp.57-63
    • /
    • 2022
  • 본 연구의 목적은 아동학대 예방을 위한 방안 마련의 일환으로 빅데이터 분석과 머신러닝 알고리즘을 활용한 정책개발의 기초자료를 제공하는데 있다. 아동학대 예방을 위한 머신러닝 알고리즘 개발을 위한 빅데이터 분석을 위해 학술데이터베이스와 사회관계망서비스 자료를 빅데이터로 정의하고 빈도, 연관어, 감성분석을 시행하였다. 연구결과 예방적 아동학대 알고리즘은 학술빅데이터 분석에 나타난 아동학대 관련 세 주체 피해아동, 가해양육자, 정부당국의 관점에서 아동학대 예방을 위한 데이터 수집 및 공유 네트워크 시스템 마련을 통해 개발이 가능할 것이다. 또한 아동학대 피해아동의 특성에서 자아개념 저하 등으로 우울 및 불안이 나타남을 단서로 영유아 자아존중감 및 우울, 불안 검사를 제도화함으로써 가능할 것이다. 아동학대 예방을 위한 빅데이터 수집 및 분석, 알고리즘 개발 연구의 지속적 진행을 제안하며 아동학대 예방을 위한 실효적 정책 마련이 실현되어 아동학대범죄가 근절되기를 기대한다.

딥러닝 방식의 웨어러블 센서를 사용한 미국식 수화 인식 시스템 (American Sign Language Recognition System Using Wearable Sensors with Deep Learning Approach)

  • 정택위;김범준
    • 한국전자통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.291-298
    • /
    • 2020
  • 수화는 청각 장애인이 다른 사람들과 의사소통할 수 있도록 설계된 것이다. 그러나 수화는 충분히 대중화되어 있지 않기 때문에 청각 장애인이 수화를 통해서 일반 사람들과 원활하게 의사소통하는 것은 쉽지 않은 문제이다. 이러한 문제점에 착안하여 본 논문에서는 웨어러블 컴퓨팅 및 딥러닝 기반 미국식 수화인식 시스템을 설계하고 구현하였다. 이를 위해서 본 연구에서는 손등과 손가락에 장착되는 총 6개의 IMUs(Inertial Measurement Unit) 센서로 구성된 시스템을 구현하고 이를 이용한 실험을 수행하여 156개 특징이 수집된 데이터 추출을 통해서 총 28개 단어에 대한 미국식 수화 인식 방법을 제안하였다. 특히 LSTM (Long Short-Term Memory) 알고리즘을 사용하여 최대 99.89%의 정확도를 달성할 수 있었고 향후 청각 장애인들의 의사소통에 큰 도움이 될 것으로 예상된다.