• 제목/요약/키워드: 결합 커널

검색결과 54건 처리시간 0.025초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

GEase-K: 부가 정보를 활용한 선형 및 비선형 오토인코더 기반의 추천시스템 (GEase-K: Linear and Nonlinear Autoencoder-based Recommender System with Side Information)

  • 이태범;이승학;마민정;조윤호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.167-183
    • /
    • 2023
  • 최근 추천시스템 분야에서는 희소한 데이터를 효과적으로 모델링하기 위한 다양한 연구가 진행되고 있다. GLocal-K(Global and Local Kernels for Recommender Systems)는 그중 하나의 연구로 전역 커널과 지역 커널을 결합하여 데이터의 전역적인 패턴과 개별 사용자의 특성을 모두 고려해 사용자 맞춤형 추천을 제공하는 모델이다. 하지만 GLocal-K는 커널 트릭을 사용하기 때문에 매우 희소한 데이터에서 성능이 떨어지고 부가 정보를 사용하지 않아 새로운 사용자나 아이템에 대한 추천을 제공하는 데 어려움이 있다. 본 논문에서는 이러한 GLocal-K의 단점을 극복하기 위해 EASE(Embarrassingly Shallow Autoencoders for Sparse Data) 모델과 부가 정보를 활용한 GEase-K(Global and EASE kernels for Recommender Systems) 모델을 제안한다. 우선 GLocal-K의 지역 커널 대신 EASE를 활용하여 매우 희소한 데이터에서 추천 성능을 높이고자 하였다. EASE는 단순한 선형 연산 구조로 이루어져 있지만, 규제화와 아이템 간 유사도 학습을 통해 매우 희소한 데이터에서 높은 성능을 내는 오토인코더이다. 다음으로 Cold Start 완화를 위해 부가 정보를 활용하였다. 학습 과정에서 부가 정보를 추가하기 위해 조건부 오토인코더 구조를 적용하였으며 이를 통해 사용자-아이템 간의 유사성을 더 잘 파악할 수 있도록 하였다. 결론적으로 GEase-K는 선형 구조와 비선형 구조의 결합, 부가 정보의 활용을 통해 매우 희소한 데이터와 Cold Start 상황에서 강건한 모습을 보인다. 실험 결과, GEase-K는 매우 희소한 GoodReads, ModCloth 데이터 세트에서 RMSE, MAE 평가 지표 기준 GLocal-K 보다 높은 성능을 보였다. 또한 GoodReads, ModCloth 데이터 세트를 4개의 집단으로 나누어 실험한 Cold Start 실험에서도 GLocal-K 대비 Cold Start 상황에서 좋은 성능을 보였다.

레벨셋과 무요소법을 결합한 위상 및 형상 최적설계 (Level Set Based Topological Shape Optimization Combined with Meshfree Method)

  • 안승호;하승현;조선호
    • 한국전산구조공학회논문집
    • /
    • 제27권1호
    • /
    • pp.1-8
    • /
    • 2014
  • 레벨셋 기법과 무요소법을 결합한 위상 및 형상 최적설계 기법을 개발하여 선형 탄성문제에 적용하였다. 설계민감도는 애드조인트법을 사용하여 효율적으로 구하였다. 해밀턴-자코비 방정식을 업-윈드 기법을 이용하여 수치적으로 풀었으며, 구조물의 경계는 레벨셋 함수를 이용하여 암시적으로 표현하였다. 구조물의 응답과 설계민감도를 얻기 위하여 암시적 함수를 사용하여 명시적 경계를 생성하였다. 재생 커널 기법에 기초하여 얻어진 전역 절점 기저함수를 사용하여 연속체 지배방정식의 변위장을 이산화하였다. 따라서 질점들을 연속체 영역의 어느 곳이든 위치시킬 수 있으며, 이는 통해 명시적 경계를 생성하는 것이 가능하며, 결과적으로 정확한 설계를 얻을 수 있다. 개발된 방법은 제한 조건이 있는 최적설계 문제에 대하여 라그랑지안 범함수를 정의한다. 이는 경계의 변화를 통하여 허용 부피 제한조건을 만족시키면서 컴플라이언스를 최소화한다. 최적설계 과정 동안 라그랑지안 범함수의 최적화조건을 만족시킴으로써 해밀턴-자코비 방정식을 풀기 위한 속도장을 얻는다. 기존의 형상 최적설계 기법에 비하여, 본 방법론은 위상과 형상의 변화를 쉽게 얻어낼 수 있다.

가스터빈 엔진의 복합 결함 진단을 위한 SVM과 MLP의 성능 비교 (A Performance Comparison of SVM and MLP for Multiple Defect Diagnosis of Gas Turbine Engine)

  • 박준철;노태성;최동환
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2005년도 제25회 추계학술대회논문집
    • /
    • pp.158-161
    • /
    • 2005
  • 본 연구에서는 Support Vector Machine (SVM)을 이용하여 가스 터빈 엔진의 결함 진단을 시도하였다. SVM은 벡터 공간에서 임의의 비선형 경계인 Hyperplane을 찾아 두 개의 집합을 분류하는 방법으로 수학적으로 최적의 해를 찾을 수 있다고 알려져 있다. 이러한 이진 분류용 SVM을 다층으로 결합하여 가스 터빈의 결함을 정량적으로 판단해 내는 방법을 제안하였으며 기존의 Multi Layer Perceptron(MLP)보다 빠르고 신뢰성 있는 진단 결과를 보여주었음을 확인하였다.

  • PDF

Support vector regression과 최적화 알고리즘을 이용한 하천수위 예측모델 (River stage forecasting models using support vector regression and optimization algorithms)

  • 서영민;김성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.606-609
    • /
    • 2015
  • 본 연구에서는 support vector regression (SVR) 및 매개변수 최적화 알고리즘을 이용한 하천수위 예측모델을 구축하고 이를 실제 유역에 적용하여 모델 효율성을 평가하였다. 여기서, SVR은 하천수위를 예측하기 위한 예측모델로서 채택되었으며, 커널함수 (Kernel function)로서는 radial basis function (RBF)을 선택하였다. 최적화 알고리즘은 SVR의 최적 매개변수 (C?, cost parameter or regularization parameter; ${\gamma}$, RBF parameter; ${\epsilon}$, insensitive loss function parameter)를 탐색하기 위하여 적용되었다. 매개변수 최적화 알고리즘으로는 grid search (GS), genetic algorithm (GA), particle swarm optimization (PSO), artificial bee colony (ABC) 알고리즘을 채택하였으며, 비교분석을 통해 최적화 알고리즘의 적용성을 평가하였다. 또한 SVR과 최적화 알고리즘을 결합한 모델 (SVR-GS, SVR-GA, SVR-PSO, SVR-ABC)은 기존에 수자원 분야에서 널리 적용되어온 신경망(Artificial neural network, ANN) 및 뉴로퍼지 (Adaptive neuro-fuzzy inference system, ANFIS) 모델과 비교하였다. 그 결과, 모델 효율성 측면에서 SVR-GS, SVR-GA, SVR-PSO 및 SVR-ABC는 ANN보다 우수한 결과를 나타내었으며, ANFIS와는 비슷한 결과를 나타내었다. 또한 SVR-GA, SVR-PSO 및 SVR-ABC는 SVR-GS보다 상대적으로 우수한 결과를 나타내었으며, 모델 효율성 측면에서 SVR-PSO 및 SVR-ABC는 가장 우수한 모델 성능을 나타내었다. 따라서 본 연구에서 적용한 매개변수 최적화 알고리즘은 SVR의 매개변수를 최적화하는데 효과적임을 확인할 수 있었다. SVR과 최적화 알고리즘을 이용한 하천수위 예측모델은 기존의 ANN 및 ANFIS 모델과 더불어 하천수위 예측을 위한 효과적인 도구로 사용될 수 있을 것으로 판단된다.

  • PDF

사이버 물리 시스템에서 효율적인 파일 전송을 위한 커널 레벨 분할 및 결합 연산의 설계와 구현 (Design and Implementation of Kernel-Level Split and Merge Operations for Efficient File Transfer in Cyber-Physical System)

  • 박현찬;장준희;이준석
    • 대한임베디드공학회논문지
    • /
    • 제14권5호
    • /
    • pp.249-258
    • /
    • 2019
  • In the cyber-physical system, big data collected from numerous sensors and IoT devices is transferred to the Cloud for processing and analysis. When transferring data to the Cloud, merging data into one single file is more efficient than using the data in the form of split files. However, current merging and splitting operations are performed at the user-level and require many I / O requests to memory and storage devices, which is very inefficient and time-consuming. To solve this problem, this paper proposes kernel-level partitioning and combining operations. At the kernel level, splitting and merging files can be done with very little overhead by modifying the file system metadata. We have designed the proposed algorithm in detail and implemented it in the Linux Ext4 file system. In our experiments with the real Cloud storage system, our technique has achieved a transfer time of up to only 17% compared to the case of transferring split files. It also confirmed that the time required can be reduced by up to 0.5% compared to the existing user-level method.

특이값 분해와 점증적 클러스터링을 이용한 뉴스 비디오 샷 경계 탐지 (News Video Shot Boundary Detection using Singular Value Decomposition and Incremental Clustering)

  • 이한성;임영희;박대희;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권2호
    • /
    • pp.169-177
    • /
    • 2009
  • 본 논문에서는 뉴스 기사 분할 관점에서, 뉴스 비디오 샷 경계 탐지 알고리즘의 특성을 고려한 다음과 같은 설계 기준을 제시하고, 이를 모두 만족하는 새로운 샷 경계 탐지 알고리즘을 제안하고자 한다. 1) 뉴스 비디오 샷 경계 탐지의 재현율을 높임으로써, 앵커 샷 탐지 단계에서 입력으로 사용될 데이타의 오류를 최소화한다; 2) 급격한 장면 변환과 점증적 장면 변환을 하나의 알고리즘으로 탐지함으로써 한번의 데이타 탐색으로 샷 분할을 수행한다; 3) 분할된 샷들을 정적 샷과 동적 샷으로 분류함으로써 앵커샷 탐지 단계의 탐색 공간을 축소한다. 제안된 뉴스 비디오 샷 경계 탐지 알고리즘은 특이간 분해를 기반으로 점증적 클러스터링 알고리즘과 머서 커널을 결합한 구조로서, 위에서 제시한 기준을 모두 만족하도록 설계되었다. 제안된 방법론은 특이간 분해를 통해 특징 벡터의 차원축소 뿐만 아니라, 뉴스 비디오를 구성하는 연속적인 프레임에서의 잡음과 아주 작은 변화를 제거함으로써 분류 성능을 높일 수 있다. 또한 머서 커널의 도입은 쉽게 분류되지 않는 데이타를 고차원 공간으로 매핑함으로써 구분하기 어려운 샷 경계의 탐지 가능성을 높여준다. 실험을 통하여 제안된 방법론이 매우 높은 재현율을 보이며, 앵커 샷 탐지를 위한 탐색 공간 축소를 효과적으로 수행함을 보인다.

선박패스(V-Pass) 자료를 활용한 어업활동 지도 제작 연구 - 남해동부해역을 중심으로 - (A Study on the Mapping of Fishing Activity using V-Pass Data - Focusing on the Southeast Sea of Korea -)

  • 한재림;김태훈;최은영;최현우
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.112-125
    • /
    • 2021
  • 해양공간계획은 해양을 체계적이고 합리적으로 관리하기 위해 9가지 용도구역으로 지정한다. 그 중 하나가 어업활동의 보호와 육성을 비롯한 수산물의 지속 가능한 생산을 위해 필요한 어업활동 보호구역이다. 본 연구는 V-Pass 자료를 활용하여 어업활동 지도를 제작하고 어업활동 밀집 공간을 도출함으로써 어업활동보호구역 지정에 필요한 요소 중 하나인 어업활동 공간을 정량적으로 파악하고자 한다. 이를 위해 V-Pass 자료를 정적 정보와 동적 정보가 결합된 데이터셋 구축, 어선 속도 계산, 어업활동 지점 추출, 비어업활동 공간 내의 자료 제거와 같은 전처리를 수행하였다. 최종적으로 선별된 V-Pass 점 자료를 이용하여 커널밀도추정으로 어업활동 지도를 제작하고 어업활동이 밀집된 공간을 분석하였다. 또한 어선의 업종과 계절에 따라 어업활동의 공간분포는 차이가 있음을 확인하였다. 본 연구를 통해 수행한 대용량 V-Pass 자료의 전처리 기법과 어업활동의 공간밀도 분석 방법은 향후 어업활동에 대한 공간특성평가 연구에 기여할 것으로 기대된다.

네트워크 디바이스의 프로토타입 개발 환경을 위한 시스템-온-칩 시뮬레이터와 네트워크 시뮬레이터의 통합 시뮬레이터 설계 및 구현 (A Design of a Co-simulator Integrates a System-on-Chip Simulator and Network Simulator for Development Environments of Prototype Network Devices)

  • 이호웅;박수진;곽동은;박현주
    • 한국정보통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.754-766
    • /
    • 2010
  • 무선 통신 프로토콜에서 하위 계층을 담당하는 부분은 네트워크 디바이스이다. 네트워크 디바이스는 하드웨어/소프트웨어로 구성되기 때문에 시스템-온-칩 시뮬레이터를 이용하여 설계할 수 있다. 하지만 네트워크 디바이스는 다양한 상위 계층 통신 프로토콜과 상호 동작하기 때문에 시스템-온-칩 시뮬레이터뿐 아니라 네트워크 시뮬레이터의 지원이 필요하다. 그러므로 이 두개의 시뮬레이터를 결합하면, 이러한 요구를 만족하는 네트워크 디바이스의 개 발 환경이 될 수 있다. 본 논문에서는 이러한 환경을 제공하는 통합 시뮬레이터를 제안한다. 제안하는 통합 시뮬레이터는, 통합으로 인한 성능 저하가 발생하지 않는다. 또한, 각 시뮬레이터의 커널 구현에 독립적이므로 통합이 용이하다.

Security Assessment Technique of a Container Runtime Using System Call Weights

  • Yang, Jihyeok;Tak, Byungchul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권9호
    • /
    • pp.21-29
    • /
    • 2020
  • 본 연구에서는 보안 컨테이너 런타임 간의 직접적인 보안성 비교를 가능하게 하는 정량 평가기법을 제안한다. 보안 컨테이너 런타임(Security Container Runtime) 기술들은 컨테이너가 호스트 커널을 공유하여 발생하는 컨테이너 탈출(Container escape)과 같은 보안 이슈를 해결하기 위하여 등장하였다. 하지만 대부분의 문헌들에서 컨테이너 기술들의 보안성에 대하여 사용 가능한 시스템 콜 개수와 같은 대략적인 지표를 이용한 분석만을 제공하고 있어서 각 런타임에 대한 정량적인 비교 평가가 힘든 실정이다. 반면에 제안 모델은 호스트 시스템 콜의 노출 정도를 다양한 외부 취약점 지표들과 결합하는 새로운 방식을 사용한다. 제안하는 기법으로 runC(도커 기본 런타임) 및 대표적인 보안 컨테이너 런타임인 gVisor, Kata container의 보안성을 측정하고 비교한다.