• 제목/요약/키워드: supervised learning

검색결과 747건 처리시간 0.031초

향상된 TextRank 알고리즘을 이용한 자동 회의록 생성 시스템 (Automatic Meeting Summary System using Enhanced TextRank Algorithm)

  • 배영준;장호택;홍태원;이해연
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.467-474
    • /
    • 2018
  • 다양한 업무 수행에 있어서 회의나 토론 등의 내용을 정리하여 문서화하는 것의 중요성은 매우 높다. 그러나 기존에는 사람이 직접 내용에 대한 정리를 수작업으로 수행하였다. 본 논문에서는 TextRank 알고리즘을 이용하여 자동으로 회의록을 생성하는 시스템의 개발에 대하여 설명한다. 제안한 시스템은 발언자의 모든 발언 내용을 실시간으로 기록하고, 문장들을 출현 빈도수에 기초하여 유사도를 계산한 후, 문서 데이터 안에서 문장들 간의 관계를 찾아내는 비지도 학습 알고리즘을 통해 중요 단어 혹은 문장을 추출함으로서 자동으로 회의록을 생성하도록 하였다. 특히, PageRank 알고리즘을 단어와 문장에 적합하도록 재구성한 TextRank 알고리즘에 대하여 핵심어의 가중치 조정 기법을 도입함으로서 성능 향상을 모색하였다.

악성코드 분류를 위한 중요 연산부호 선택 및 그 유용성에 관한 연구 (A Study on Selecting Key Opcodes for Malware Classification and Its Usefulness)

  • 박정빈;한경수;김태근;임을규
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.558-565
    • /
    • 2015
  • 최근 새롭게 제작되는 악성코드 수의 증가와 악성코드 변종들의 다양성은 악성코드 분석가의 분석에 소요되는 시간과 노력에 많은 영향을 준다. 따라서 효과적인 악성코드 분류는 악성코드 분석가의 악성코드 분석에 소요되는 시간과 노력을 감소시키는 데 도움을 줄 뿐만 아니라, 악성코드 계보 연구 등 다양한 분야에 활용 가능하다. 본 논문에서는 악성코드 분류를 위해 중요 연산부호를 이용하는 방법을 제안한다. 중요 연산부호란 악성코드 분류에 높은 영향력을 가지는 연산부호들을 의미한다. 실험을 통해서 악성코드 분류에 높은 영향력을 가지는 상위 10개의 연산부호들을 중요 연산부호로 선정할 수 있음을 확인하였으며, 이를 이용할 경우 지도학습 알고리즘의 학습시간을 약 91% 단축시킬 수 있었다. 이는 향후 다량의 악성코드 분류 연구에 응용 가능할 것으로 기대된다.

Small Sample Face Recognition Algorithm Based on Novel Siamese Network

  • Zhang, Jianming;Jin, Xiaokang;Liu, Yukai;Sangaiah, Arun Kumar;Wang, Jin
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1464-1479
    • /
    • 2018
  • In face recognition, sometimes the number of available training samples for single category is insufficient. Therefore, the performances of models trained by convolutional neural network are not ideal. The small sample face recognition algorithm based on novel Siamese network is proposed in this paper, which doesn't need rich samples for training. The algorithm designs and realizes a new Siamese network model, SiameseFacel, which uses pairs of face images as inputs and maps them to target space so that the $L_2$ norm distance in target space can represent the semantic distance in input space. The mapping is represented by the neural network in supervised learning. Moreover, a more lightweight Siamese network model, SiameseFace2, is designed to reduce the network parameters without losing accuracy. We also present a new method to generate training data and expand the number of training samples for single category in AR and labeled faces in the wild (LFW) datasets, which improves the recognition accuracy of the models. Four loss functions are adopted to carry out experiments on AR and LFW datasets. The results show that the contrastive loss function combined with new Siamese network model in this paper can effectively improve the accuracy of face recognition.

폐암환자 생존분석에 대한 TNM 병기 군집분석 평가 (Accessing the Clustering of TNM Stages on Survival Analysis of Lung Cancer Patient)

  • 최철웅;김경백
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.126-133
    • /
    • 2020
  • 병원에서는 폐암 환자의 최종병기를 기준으로 치료방침 및 예후를 결정하고 있다. 폐암 환자의 최종병기는 미국 암 연합회(AJCC)에서 제공하는 TNM 분류방법을 바탕으로 7단계로 나누어 진단된다. 이런 접근 방법은 환자의 치료, 예후 및 생존일 예측 등 다양한 분야에서 사용하기에 한계가 있다. 이 논문에서는 데이터 과학적 접근을 통해 T, N, M병기를 사용하여 생존일수별 환자집단을 나눌 수 있는지 알아보기 위해 비지도 학습 중 하나인 군집분석(Clustering)을 진행한 후 군집분석의 결과를 Cox비례위험모형을 사용하여 비교 하였다. 환자들의 최종병기를 사용하지 않고, T, N, M병기 정보만 사용하였을 때 생존시간 예측정확도가 더 높은 것을 확인하였다. 특히, AJCC의 최종병기 7단계와 같이 군집의 개수를 7로 설정했을 때보다 군집의 수를 축소하거나 확장했을 때 T, N, M 병기 군집분석을 통한 생존시간 예측정확도가 향상하는 것을 확인하였다.

정적 드레이프를 이용한 니트 옷감의 시뮬레이션 파라미터 추정 (Estimating Simulation Parameters for Kint Fabrics from Static Drapes)

  • 주은정;최명걸
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권5호
    • /
    • pp.15-24
    • /
    • 2020
  • 본 연구에서는 주어진 옷감 시료의 정적 드레이프 모양으로부터 해당 옷감을 시뮬레이션하기 위해 필요한 시뮬레이션 파라미터를 추정하는 데이터 기반 학습법을 제시한다. 정적 드레이프의 모양을 형성하기 위해 의류 산업계에서 옷감을 물성에 따라 분류하기 위해 사용하는 쿠식 드레이프 (Cusick's drape)에서 착안한 방법을 사용한다. 학습 모델의 입력 벡터는 특정 옷감의 정적 드레이프 모양에서 추출한 특징 벡터와 옷감의 밀도 값으로 구성되고, 출력 벡터는 해당 드레이프 결과를 도출하는 여섯가지 시뮬레이션 파라미터로 구성된다. 실제에 가깝고 편향되지 않은 학습 데이터를 생성하고자 먼저 400가지의 실제 니트 옷감에 대한 시뮬레이션 파라미터를 수집하고 이로부터 GMM (Gaussian mixture model) 생성 모델을 만든다. 다음, GMM 확률분포에 따라 대량의 시뮬레이션 파라미터를 무작위 샘플링한다. 샘플링된 각각의 시뮬레이션 파라미터에 대해 옷감 시뮬레이션을 수행하여 가상의 정적 드레이프 결과를 만들고 이로부터 특징 벡터를 추출한다. 생성된 데이터를 로그선형회기(log-linear regression) 모델로 피팅한다. 학습의 수치적 정확도를 검증하고 시뮬레이션 결과의 시각적 유사도를 비교하여 제시된 방법의 유용성을 확인한다.

The Nature of a Method Course for Prospective Secondary Mathematics Teachers

  • Kim, Seong-A;Lee, Sun Hee
    • 한국수학교육학회지시리즈D:수학교육연구
    • /
    • 제23권4호
    • /
    • pp.235-254
    • /
    • 2020
  • Through this study, we aimed to capture the nature of a mathematics method course, called "the Curriculum Development and Teaching Methods in Mathematics Education" which is a pedagogy course for teaching for secondary school mathematics taught at a university located in a south eastern part of South Korea. The research participants include three junior students who took the methods course and a local high school math teacher with two professors. The research has three parts. First, we designed a method course to prepare the junior or senior students for a teaching practicum. The individual students gave a mini lecture about a secondary mathematical topic as a course requirement. Second, the three students watched a classroom video-clip of the high school teacher and analyzed his instruction before the actual classroom visits. Furthermore, by "Let's Learn" program for students, the course was associated with a local community through the students and so that they could visit the teacher's classroom three times to observe his math classroom teaching. The students discussed the difference between their own mini lectures and the actual math classroom teaching to develop an understanding of what it entails to teach an actual math class. Third, the first author supervised the students' activities in the program including their report for it to bring out their findings to the class of the method course. We found out this method course provided the students with the experience of various aspects of actual math lesson as well as learning theories about the pedagogy for teaching for secondary school mathematics. We conclude that this course gives a model for the method course in mathematics education for secondary school mathematics.

소프트맥스 함수 특성을 활용한 침입탐지 모델의 공격 트래픽 분류성능 향상 방안 (Improvement of Attack Traffic Classification Performance of Intrusion Detection Model Using the Characteristics of Softmax Function)

  • 김영원;이수진
    • 융합보안논문지
    • /
    • 제20권4호
    • /
    • pp.81-90
    • /
    • 2020
  • 현실 세계에서는 기존에 알려지지 않은 새로운 유형의 변종 공격이 끊임없이 등장하고 있지만, 인공신경망과 지도학습을 통해 개발된 공격 트래픽 분류모델은 학습을 실시하지 않은 새로운 유형의 공격을 제대로 탐지하지 못한다. 기존 연구들 대부분은 이러한 문제점을 간과하고 인공신경망의 구조 개선에만 집중한 결과, 다수의 새로운 공격을 정상 트래픽으로 분류하는 현상이 빈번하게 발생하여 공격 트래픽 분류성능이 심각하게 저하되었다. 한편, 다중분류 문제에서 각 클래스에 대한 분류가 정답일 확률을 결과값으로 출력하는 소프트맥스(softmax) 함수도 학습하지 않은 새로운 유형의 공격 트래픽에 대해서는 소프트맥스 점수를 제대로 산출하지 못하여 분류성능의 신뢰도 또는 정확도를 제고하는데 한계를 노출하고 있다. 이에 본 논문에서는 소프트맥스 함수의 이러한 특성을 활용하여 모델이 일정 수준 이하의 확률로 판단한 트래픽을 공격으로 분류함으로써 새로운 유형의 공격에 대한 탐지성능을 향상시키는 방안을 제안하고, 실험을 통해 효율성을 입증한다.

지능형 IoT를 융합한 장비 운용 시스템의 예지 보전을 위한 연구 (A Study on Predictive Preservation of Equipment Management System with Integrated Intelligent IoT)

  • 이상덕;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.83-89
    • /
    • 2022
  • 최근 정보통신기술의 발전에 따라 사물인터넷 기술이 비약적으로 발전하고 있다. IoT 기술은 다양한 센서들을 활용하여 각 센서의 고유한 데이터를 발생시켜 시스템 상태의 진단을 가능하도록 한다. 하지만, 현재 적용되고 있는 장비운용 시스템은 장비에 문제가 발생한 후 관리자가 해당 문제를 처리해야하는 사후보전 방식의 개념이며, 이는 시스템의 에러로 인한 시스템의 신뢰성 및 가용성 문제점을 의미할 수 있으며, 정비를 위한 시스템 중단으로 생산성에 부정적 영향으로 인한 경제적 손실을 초래할 수 있다. 따라서, 본 연구에서는 지능형 IoT(AIoT) 기술을 적용하여 공장 내 정류기를 보다 효율적으로 운용하기 위한 엣지 컨트롤러 제어 의사 결정 알고리즘과, 정류기 부품별 고장 상황 정보에 대한 도메인 지식 기반의 모델링을 작성하여, 이를 바탕으로 수집된 각 센서 데이터에 대한 상관관계 분석을 통해 시나리오별 Abnormal 데이터에 대하여 적정 수준의 상태 메시지를 출력함을 확인할 수 있었으며, 이를 통한 기존 현장의 장비 운용 시스템의 가용성과 생산성이 향상됨을 확인하였다.

A semi-supervised interpretable machine learning framework for sensor fault detection

  • Martakis, Panagiotis;Movsessian, Artur;Reuland, Yves;Pai, Sai G.S.;Quqa, Said;Cava, David Garcia;Tcherniak, Dmitri;Chatzi, Eleni
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.251-266
    • /
    • 2022
  • Structural Health Monitoring (SHM) of critical infrastructure comprises a major pillar of maintenance management, shielding public safety and economic sustainability. Although SHM is usually associated with data-driven metrics and thresholds, expert judgement is essential, especially in cases where erroneous predictions can bear casualties or substantial economic loss. Considering that visual inspections are time consuming and potentially subjective, artificial-intelligence tools may be leveraged in order to minimize the inspection effort and provide objective outcomes. In this context, timely detection of sensor malfunctioning is crucial in preventing inaccurate assessment and false alarms. The present work introduces a sensor-fault detection and interpretation framework, based on the well-established support-vector machine scheme for anomaly detection, combined with a coalitional game-theory approach. The proposed framework is implemented in two datasets, provided along the 1st International Project Competition for Structural Health Monitoring (IPC-SHM 2020), comprising acceleration and cable-load measurements from two real cable-stayed bridges. The results demonstrate good predictive performance and highlight the potential for seamless adaption of the algorithm to intrinsically different data domains. For the first time, the term "decision trajectories", originating from the field of cognitive sciences, is introduced and applied in the context of SHM. This provides an intuitive and comprehensive illustration of the impact of individual features, along with an elaboration on feature dependencies that drive individual model predictions. Overall, the proposed framework provides an easy-to-train, application-agnostic and interpretable anomaly detector, which can be integrated into the preprocessing part of various SHM and condition-monitoring applications, offering a first screening of the sensor health prior to further analysis.

CNN-based Adaptive K for Improving Positioning Accuracy in W-kNN-based LTE Fingerprint Positioning

  • Kwon, Jae Uk;Chae, Myeong Seok;Cho, Seong Yun
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제11권3호
    • /
    • pp.217-227
    • /
    • 2022
  • In order to provide a location-based services regardless of indoor or outdoor space, it is important to provide position information of the terminal regardless of location. Among the wireless/mobile communication resources used for this purpose, Long Term Evolution (LTE) signal is a representative infrastructure that can overcome spatial limitations, but the positioning method based on the location of the base station has a disadvantage in that the accuracy is low. Therefore, a fingerprinting technique, which is a pattern recognition technology, has been widely used. The simplest yet widely applied algorithm among Fingerprint positioning technologies is k-Nearest Neighbors (kNN). However, in the kNN algorithm, it is difficult to find the optimal K value with the lowest positioning error for each location to be estimated, so it is generally fixed to an appropriate K value and used. Since the optimal K value cannot be applied to each estimated location, therefore, there is a problem in that the accuracy of the overall estimated location information is lowered. Considering this problem, this paper proposes a technique for adaptively varying the K value by using a Convolutional Neural Network (CNN) model among Artificial Neural Network (ANN) techniques. First, by using the signal information of the measured values obtained in the service area, an image is created according to the Physical Cell Identity (PCI) and Band combination, and an answer label for supervised learning is created. Then, the structure of the CNN is modeled to classify K values through the image information of the measurements. The performance of the proposed technique is verified based on actual data measured in the testbed. As a result, it can be seen that the proposed technique improves the positioning performance compared to using a fixed K value.