• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.029초

Light-weight Classification Model for Android Malware through the Dimensional Reduction of API Call Sequence using PCA

  • Jeon, Dong-Ha;Lee, Soo-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.123-130
    • /
    • 2022
  • 최근 API Call 정보를 기반으로 안드로이드 악성코드를 탐지 및 분류하는 연구가 활발하게 진행되고 있다. 그러나 API Call 기반의 악성코드 분류는 방대한 데이터 양과 높은 차원 특성으로 인해 악성코드 분석과 학습 모델 구축 과정에서 과도한 시간과 자원이 소모된다는 심각한 제한사항을 가진다. 이에 본 연구에서는 방대한 API Call 정보를 포함하고 있는 CICAndMal2020 데이터세트를 대상으로 PCA(Principal Component Analysis, 주성분분석)를 사용하여 차원을 대폭 축소시킨 후 LightGBM, Random Forest, k-Nearest Neighbors 등의 다양한 분류 기법 모델을 적용하여 결과를 분석하였다. 그 결과 PCA가 원본 데이터의 특성을 유지하면서 데이터 특성의 차원은 획기적으로 감소시키고 우수한 악성코드 분류 성능을 달성함을 확인하였다. 이진분류 및 다중분류 모두 데이터 특성을 전체 크기의 1% 수준 이하로 줄이더라도 이전 연구 결과보다 높은 수준의 정확도를 나타내었다.

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF

준비시간이 있는 혼합모델 조립라인의 제품투입순서 결정 : Tabu Search 기법 적용 (Sequencing in Mixed Model Assembly Lines with Setup Time : A Tabu Search Approach)

  • 김여근;현철주
    • 한국경영과학회지
    • /
    • 제13권1호
    • /
    • pp.13-13
    • /
    • 1988
  • This paper considers the sequencing problem in mixed model assembly lines with hybrid workstation types and sequence-dependent setup times. Computation time is often a critical factor in choosing a method of determining the sequence. We develop a mathematical formulation of the problem to minimize the overall length of a line, and present a tabu search technique which can provide a near optimal solution in real time. The proposed technique is compared with a genetic algorithm and a branch-and-bound method. Experimental results are reported to demonstrate the efficiency of the technique.

JIT 생산 시스템에서의 혼합모델 조립라인을 위한 일정계획 (Scheduling for Mixed-Model Assembly Lines in JIT Production Systems)

  • 노인규;김준석
    • 대한산업공학회지
    • /
    • 제17권1호
    • /
    • pp.83-94
    • /
    • 1991
  • This study is concerned with the scheduling problem for mixed-model assembly lines in Just-In-Time(JIT) production systems. The most important goal of the scheduling for the mixed-model assembly line in JIT production systems is to keep a constant rate of usage for every part used by the systems. In this study, we develop two heuristic algorithms able to keep a constant rate of usage for every part used by the systems in the single-level and the multi-level. In the single-level, the new algorithm generates sequence schedule by backward tracking and prevents the destruction of sequence schedule which is the weakest point of Miltenburg's algorithms. The new algorithm gives better results in total variations than the Miltenburg's algorithms. In the multi-level, the new algorithm extends the concept of the single-level algorithm and shows more efficient results in total variations than Miltenburg and Sinnamon's algorithms.

  • PDF

프로세서의 수가 한정되어있는 병렬계산모델에서 유전알고리즘을 이용한 스케쥴링해법 (A Scheduling Method on Parallel Computation Models with Limited Number of Processors Using Genetic Algorithms)

  • 성기석;박지혁
    • 한국경영과학회지
    • /
    • 제23권2호
    • /
    • pp.15-27
    • /
    • 1998
  • In the parallel processing systems, a compiler partitions a loaded program into tasks, allocates the tasks on multiple processors and schedules the tasks on each allocated processor. In this paper we suggest a Genetic Algorithm(GA) based scheduling method to find an optimal allocation and sequence of tasks on each Processor. The suggested method uses a chromosome which consists of task sequence and binary string that represent the number and order of tasks on each processor respectively. Two correction algorithms are used to maintain precedency constraints of the tasks in the chromosome. This scheduling method determines the optimal number of processors within limited numbers, and then finds the optimal schedule for each processor. A result from computational experiment of the suggested method is given.

  • PDF

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF

밀링 공정설계의 특징형상 데이터 모델 (A feature data model in milling process planning)

  • 이충수;노형민
    • 대한기계학회논문집A
    • /
    • 제21권2호
    • /
    • pp.209-216
    • /
    • 1997
  • A feature is well known as a medium to integrate CAD, CAPP and CAM systems. For a part drawing including both simple geometry and compound geometry, a process plan such as the selection of process, machine tool, cutting tool etc. normally needs simple geometry data and non-geometry data of the feature as the input. However, a extended process plan such as the generation of process sequence, operation sequence, jig & fixture, NC program etc. necessarily needs the compound geometry data as well as the simple geometry data and non-geometry data. In this paper, we propose a feature data model according to the result of analyzing necessary data, including the compound geometry data, the simple geometry data and the non-geometry data. Also, an example of the feature data model in milling process planning is described.

Optical Burst Switching Network에서 TCP 성능을 고려한 Drop Policy (Drop Policy Considering Performance of TCP in Optical Burst Switching Networks)

  • 송주석;김래영;김현숙;김효진
    • 한국통신학회논문지
    • /
    • 제29권2B호
    • /
    • pp.203-209
    • /
    • 2004
  • OBS 네크워크에서 contention으로 인한 burst의 drop은 TCP의 성능에 중요한 영향을 끼치는 요소이나, 기존의 drop policy에서는 이를 고려하지 않으며 TCP에 대한 연구로는 burst의 assembling이 주를 이루고 있다. 본 논문에서는 OBS 네트워크에서 TCP의 재전송 문제를 drop policy와 연계하여 TCP의 성능을 향상시키고자 한다. 본 논문에서 제안하는 drop policy는 burst의 재전송 횟수가 drop을 결정하는데 있어서 priority로 작용하는 Retransmission Count-based DP(RC-based DP)이다. RC-based DP 모델과 general DP 모델의 성능을 ns-2를 이용한 시뮬레이션을 통해 평가하며, 이 때 시간의 변화에 따른 TCP throughput, 목적지에서 수신한 최고 Sequence 번호, 패킷의 drop rate을 비교 분석한다.

예비중등교사의 수학화 학습을 위한 교수단원의 설계: 분할모델과 일반화된 피보나치 수열 사이의 관계 탐구 (A Design of Teaching Unit to Foster Secondary pre-service Teachers' Mathematising Ability : Exploring the relationship between partition models and generalized fobonacci sequences)

  • 김진환;박교식
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제18권3호
    • /
    • pp.373-389
    • /
    • 2008
  • 이 연구에서는 예비중등교사들의 수학화 학습을 위해 분할모델과 일반화된 피보나치 수열 사이의 관계를 탐구하는 교수단원을 설계한다. 이 교수단원에서는 먼저 예비중등교사들이 조직해야 할 현상을 탐구문제의 형태로 제공한다. 그들은 이 탐구문제를 해결하면서, 그것을 조직하는 본질 즉, 분할의 수에 대한 패턴을 찾게 된다. 이 과정에서 점차 커지는 분할될 수의 집합에 따라 분할모델의 유형도 다양해진다. 이러한 분할모델에 대한 분할의 수를 구하고, 이 수들 사이의 패턴을 찾아 공식을 만들고, 이 공식들이 일반화된 피보나치 수열과 관계가 있음을 찾는다. 분할모델과 피보나치 수열 사이의 이러한 관계는 이전에 알려지지 않은 소재인 만큼, 그것은 예비중등교사들로 하여금 수학화를 가상적으로 연습하게 하는 것이 아니라, 실제처럼 연습할 수 있게 된다.

  • PDF

효과적인 인터랙티브 비디오 저작을 위한 얼굴영역 기반의 어노테이션 방법 (Annotation Method based on Face Area for Efficient Interactive Video Authoring)

  • 윤의녕;가명현;조근식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.83-98
    • /
    • 2015
  • TV를 보면서 방송에 관련된 정보를 검색하려는 많은 시청자들은 정보 검색을 위해 주로 포털 사이트를 이용하고 있으며, 무분별한 정보 속에서 원하는 정보를 찾기 위해 많은 시간을 소비하고 있다. 이와 같은 문제를 해결하기 위한 연구로써, 인터랙티브 비디오에 대한 연구가 활발하게 진행되고 있다. 인터랙티브 비디오는 일반적인 비디오에 추가 정보를 갖는 클릭 가능한 객체, 영역, 또는 핫스팟을 동시에 제공하여 사용자와 상호작용이 가능한 비디오를 말한다. 클릭 가능한 객체를 제공하는 인터랙티브 비디오를 저작하기 위해서는 첫째, 증강 객체를 생성하고, 둘째, 어노테이터가 비디오 위에 클릭 가능한 객체의 영역과 객체가 등장할 시간을 지정하고, 셋째, 객체를 클릭할 때 사용자에게 제공할 추가 정보를 지정하는 과정을 인터랙티브 비디오 저작 도구를 이용하여 수행한다. 그러나 기존의 저작 도구를 이용하여 인터랙티브 비디오를 저작할 때, 객체의 영역과 등장할 시간을 지정하는데 많은 시간을 소비하고 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 유사한 샷들의 모임인 샷 시퀀스의 모든 샷에서 얼굴 영역을 검출한 샷 시퀀스 메타데이터 모델과 객체의 어노테이션 결과를 저장할 인터랙티브 오브젝트 메타데이터 모델, 그리고 어노테이션 후 발생될 수 있는 부정확한 객체의 위치 문제를 보완할 사용자 피드백 모델을 적용한 얼굴영역을 기반으로 하는 새로운 형태의 어노테이션 방법을 제안한다. 마지막으로 제안한 어노테이션 방법의 성능을 검증하기 위해서 인터랙티브 비디오 저작 시스템을 구현하여 기존의 저작도구들과 저작 시간을 비교하였고, 사용자 평가를 진행 하였다. 비교 분석 결과 평균 저작 시간이 다른 저작 도구에 비해 2배 감소하였고, 사용자 평가 결과 약 10% 더 유용한다고 평가 되었다.