• 제목/요약/키워드: Processing

검색결과 69,659건 처리시간 0.084초

비지도 학습 기반의 임베딩과 오토인코더를 사용한 침입 탐지 방법 (Intrusion Detection Method Using Unsupervised Learning-Based Embedding and Autoencoder)

  • 이준우;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.355-364
    • /
    • 2023
  • 최근 지능화된 사이버 위협이 지속적으로 증가함에 따라 기존의 패턴 혹은 시그니처 기반의 침입 탐지 방식은 새로운 유형의 사이버 공격을 탐지하는데 어려움이 있다. 따라서 데이터 학습 기반 인공지능 기술을 적용한 이상 징후 탐지 방법에 관한 연구가 증가하고 있다. 또한 지도학습 기반 이상 탐지 방식은 학습을 위해 레이블 된 이용 가능한 충분한 데이터를 필요로 하기 때문에 실제 환경에서 사용하기에는 어려움이 있다. 최근에는 정상 데이터로 학습하고 데이터 자체에서 패턴을 찾아 이상 징후를 탐지하는 비지도 학습 기반의 방법에 대한 연구가 활발히 진행되고 있다. 그러므로 본 연구는 시퀀스 로그 데이터로부터 유용한 시퀀스 정보를 보존하는 잠재 벡터(Latent Vector)를 추출하고, 추출된 잠재 벡터를 사용하여 이상 탐지 학습 모델을 개발하는데 있다. 각 시퀀스의 특성들에 대응하는 밀집 벡터 표현을 생성하기 위하여 Word2Vec을 사용하였으며, 밀집 벡터로 표현된 시퀀스 데이터로부터 잠재 벡터를 추출하기 위하여 비지도 방식의 오토인코더(Autoencoder)를 사용하였다. 개발된 오토인코더 모델은 시퀀스 데이터에 적합한 순환신경망 GRU(Gated Recurrent Unit) 기반의 잡음 제거 오토인코더, GRU 네트워크의 제한적인 단기 기억문제를 해결하기 위한 1차원 합성곱 신경망 기반의 오토인코더 및 GRU와 1차원 합성곱을 결합한 오토인코더를 사용하였다. 실험에 사용된 데이터는 시계열 기반의 NGIDS(Next Generation IDS Dataset) 데이터이며, 실험 결과 GRU 기반의 오토인코더나, 1차원 합성곱 기반의 오토인코더를 사용한 모델보다 GRU와 1차원 합성곱을 결합한 오토인코더가 훈련 데이터로부터 유용한 잠재 패턴을 추출하기 위한 학습 시간적 측면에서 효율적이었고 이상 탐지 성능 변동의 폭이 더 작은 안정된 성능을 보였다.

확률적 교차 연산을 이용한 보편적 관계 추출 (General Relation Extraction Using Probabilistic Crossover)

  • 이제승;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.371-380
    • /
    • 2023
  • 관계 추출은 텍스트로부터 개체(named entity) 사이의 관계를 추출하는 과정이다. 전통적으로 관계 추출 방법은 주어와 목적어가 미리 정해진 상태에서 관계만 추출한다. 그러나 종단형 관계 추출에서는 개체 쌍마다 주어와 목적어의 위치를 고려하여 가능한 모든 관계를 추출해야 하므로 이 방법은 시간과 자원을 비효율적으로 사용한다. 본 논문에서는 이러한 문제를 완화하기 위해 문장에서 주어와 목적어의 위치에 따른 방향을 설정하고, 정해진 방향에 따라 관계를 추출하는 방법을 제안한다. 제안하는 방법은 기존의 관계 추출 데이터를 활용하여 문장에서 주어가 목적어를 가리키는 방향을 나타내는 방향 표지를 새롭게 생성하고, 개체 위치 토큰과 개체 유형 정보를 문장에 추가하는 작업을 통해 사전학습 언어모델 (KLUE-RoBERTa-base, RoBERTa-base)을 이용하여 방향을 예측한다. 그리고 확률적 교차 연산을 통해 주어와 목적어 개체의 표상을 생성한다. 이후 이러한 개체의 표상을 활용하여 관계를 추출한다. 실험 결과를 통해, 제안 모델이 하나로 통합된 라벨을 예측하는 것보다 3 ~ 4%p 정도 더 우수한 성능을 보여주었다. 또한, 제안 모델을 이용해 한국어 데이터와 영어 데이터를 학습할 때, 데이터 수와 언어적 차이로 인해 한국어보다 영어에서 1.7%p 정도 더 높은 성능을 보여주었고, 최상의 성능을 내는 매개변수의 값이 다르게 나타나는 부분도 관찰할 수 있었다. 제안 모델은 방향에 따른 경우의 수를 제외함으로써 종단형 관계 추출에서 자원의 낭비를 줄일 수 있다.

시뮬레이션 기법을 이용한 철도차량 중정비 공장 설계검증 - 디젤동차 및 발전차 중정비 공장을 중심으로 - (An Evaluation of Development Plans for Rolling Stock Maintenance Shop Using Computer Simulation - Emphasizing CDC and Generator Car -)

  • 전병학;장성용;이원영;오정헌
    • 한국시뮬레이션학회논문지
    • /
    • 제18권3호
    • /
    • pp.23-34
    • /
    • 2009
  • 철도차량기지에서는 철도차량의 안전한 운행을 위해 연간검수 이상의 기기보전(지정보전, 장치보전), 차체 보전을 위한 장기계획에 의해 종합적인 유지보수 혹은 중대사고에 의한 차량의 파손으로 인한 차량의 보수작업이 이루어지는 중수선 작업을 수행한다. 본 연구에서는 용산기지 이전과 관련하여 대전철도차량관리단 부지 내에 계획 중인 CDC(Commuter Diesel Car)와 발전차를 정비하는 중수선 시설의 설계안에 대한 검증을 위한 시뮬레이션 모델을 개발하고 시뮬레이션 실험을 통하여 중수선 시설의 용량을 검증하였다. 시뮬레이션 모델은 철도공사의 중정비 검수공정도를 바탕으로 2가지 설계안의 설계용량을 검증하였다. 2가지 설계안을 평가하기 위하여 검수 완료 차량, 재장일, 작업장 점유율, 공정진행 차량수 및 입장검사 대기차량수 등 5가지를 분석하여 연간 검수용량이 충분한 설계안을 선정 하였다. 또한 우수한 결과를 보인 설계안의 연간 최대 검수 가능한 차량 수는 현재 연간 검수량 보다 약 15% 많은 총 340량임을 확인할 수 있었다.

무선센서네트워크에서 LEACH 라우팅 프로토콜을 적용한 파티클 센서의 에너지 효율적인 알고리즘 (The Algorithm for an Energy-efficient Particle Sensor Applied LEACH Routing Protocol in Wireless Sensor Networks)

  • 홍성화;김훈기
    • 한국시뮬레이션학회논문지
    • /
    • 제18권3호
    • /
    • pp.13-21
    • /
    • 2009
  • 무선 센서 네트워크 환경에서 네트워크를 구성하는 센서 노드들은 라우팅 및 센싱 역할을 함께 수행해야 하기 때문에 각 센서 노드들은 항상 에너지 부담을 가지고 있다. 이러한 무선 센서 네트워크에 사용되는 센서는 무인으로 동작 되거나 사람이 접근하기 힘든 환경에서 동작하는 경우가 대부분이다. 또한 다량의 센서를 배치하여 무선 센서 네트워크를 형성 하는 경우가 많아 센서 노드의 크기가 작아야 하고, 가격이 저렴해야 하므로 노드에 공급할 수 있는 전원의 양과 데이터 처리 능력에 제한이 있게 된다. 본 논문에서는 무선 센서 네트워크 환경에서 센서 노드의 전력 소모를 줄이고, 망을 효율적으로 관리할 수 있는 알고리즘과 효율적인 라우팅 프로트콜을 제안하고, 제안한 알고리즘을 LEACH 프로토콜에 적용시켜 에너지 효율성을 검증하였다. Particle Sensor에서 이전 주기에 측정된 값과 현재 주기에 측정된 값을 비교하여 현재 측정된 값이 작거나 같으면 먼지가 감소하고 있다고 가정하고 다음 주기에 sleep모드를 설정해 주어 센서 노드의 에너지 소비를 줄여주는 알고리즘이다. 제안한 알고리즘의 시뮬레이션 결과를 보면 센서 노드의 에너지 소모를 향상시켜 주었고, LEACH 라우팅 프로토콜에 적용시킨 결과 네트워크의 수명을 향상 시켰다.

시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델 및 시뮬레이션 (Semantic Computing-based Dynamic Job Scheduling Model and Simulation)

  • 노창현;장성호;김태영;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권2호
    • /
    • pp.29-38
    • /
    • 2009
  • 이기종의 자원들로 이루어진 컴퓨팅 환경에서 효율적인 자원 활용과 대용량의 데이터를 고속으로 처리하기 위해서는 실시간으로 변화하는 자원의 상태에 따라 대처 할 수 있는 동적인 작업 스케줄링 모델이 필요하다. 현재 이기종의 자원들에게 작업을 어떻게 분배 및 할당 할 것인지에 대하여 많은 자원 평가 방법 및 휴리스틱 기법들이 연구되었으나 이러한 방법들은 표준언어를 사용하지 않기 때문에 시스템 호환 및 확장에 어려움이 많다. 또한 다양한 자원들의 상태가 실시간으로 동적으로 변화하기 때문에 기존 연구에서 제안한 방법으로는 효율적인 처리가 불가능하거나 자원의 상태 변화에 동적으로 대처할 수 없다. 본 논문은 이러한 기존 연구들의 문제에 대한 해결책으로 W3C에서 제정한 온톨로지 표준 언어인 OWL을 이용하여 자원 온톨로지를 구축함으로써 이기종의 자원 관리를 손쉽게 할 수 있으며, 자원의 동적인 변화에 따라 작업 스케줄링하는 방법을 지식기반의 다양한 규칙들로 정의하여 추론을 통해서 최적의 자원에게 작업을 할당하는 시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 모델을 제안한다. 시뮬레이션 실험 결과는 본 논문에서 제안한 작업 스케줄링 모델이 기존 모델에 비하여 낮은 작업 손실과 높은 작업 처리율 및 짧은 응답시간을 제공함으로써 이기종의 자원들로 구성된 시스템 전반에 걸쳐 안정적이고 고속의 데이터 처리를 제공할 수 있다는 사실을 증명한다.

농촌공간계획 데이터 수급에 대한 이해당사자 인식조사 (Stakeholder Awareness of Rural Spatial Planning Data Utilization Based on Survey)

  • 리재웅;이상현;이성윤;김진성;취뤼;배승종;김수진;김상범
    • 농촌계획
    • /
    • 제29권3호
    • /
    • pp.25-37
    • /
    • 2023
  • According to the 「Rural Spatial Reconstruction and Regeneration Support Act」, enacted on March 29, 2024, all local governments are required to establish a 'Rural Spatial Reconstruction and Regeneration Plan' (hereinafter referred to as the 'Rural Spatial Plan'). In order for the 'Rural Spatial Plan' to be appropriately established, this study analyzed the supply and demand of spatial data from the perspective of user stakeholders and derived implications for improving rural spatial planning data utilization. In conclusion, three key recommendations come from this result. Firstly, it is necessary to establish an integrated DB for rural spatial planning data. This can solve the problem of low awareness of scattered data-providing websites, reduce the processing time of non-GIS data, and reduce the time required to acquire data by securing the availability of data search and download. In particular, research should be conducted on the establishment of a spatial analysis simulation system to support stakeholders' decision-making, considering that many stakeholders have difficulty in spatial analysis because spatial analysis techniques were not actively used in rural projects before the implementation of the rural agreement system in 2020. Secondly, research on how to improve data acquisition should be conducted in each data sector. The data sector group with the lowest ease of receiving are 'Local Community Domain', 'Changes in Domestic and International Conditions', and 'Provision and Utilization of Daily Life Services'. Lastly, in-depth research is needed on how to raise each rural spatial planning data supply stakeholder to the position of player. Stakeholders of 'University Institutions' and 'Public Enterprises and Research Institutes' should give those who participate in the formulation of rural spatial plans access to the raw data collected for public work. Stakeholders of 'Private company' need to come up with realistic measures to build a data pool centered on consultative bodies between existing private companies and then prepare a step-by-step strategy to fully open it by participating various stakeholders. In order to induce 'Village Residents and Associations' stakeholders to play a leading role as owners and producers of data, personnel should be trained to collect and record data related to the village. In addition, support measures should be prepared to continue these activities.

MobileNetV3 기반 요검사 서비스 어플리케이션 구현 (Implementation of Urinalysis Service Application based on MobileNetV3)

  • 박기조;최승환;김경석
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.41-46
    • /
    • 2023
  • 인체 소변은 혈액 내의 노폐물을 배출하는 과정으로 채취가 쉽고 다양한 물질들이 포함되어 있습니다. 요검사는 이를 통해 질병, 건강상태, 요로 감염 여부 등을 확인하는 용도로 사용됩니다. 요검사에는 물리적 성상 검사, 화학적 검사, 현미경 검사의 세 가지 방법이 있으며, 화학적 검사는 요검사지를 사용하여 쉽게 결과를 확인할 수 있다. 요검사지에는 다양한 항목들을 검사할 수 있으며, 이를 통해 다양한 질병들을 확인할 수 있다. 최근 스마트폰의 보급으로 스마트폰을 이용한 요검사지 판독 연구가 진행되고 있다. 스마트폰을 이용하여 요검사지의 색 변화를 감지하고 판독하는 방법이 있다. 이러한 방법은 RGB값과 색 차이 공식을 사용하여 판별한다. 그러나 다양한 환경 요인으로 인해 정확도가 떨어지는 문제가 있다. 본 논문은 이러한 문제를 해결하기 위해 딥러닝 모델을 적용한다. 특히, 경량화된 CNN(Convolutional Neural Networks) 모델을 사용하여 스마트폰 내에서 요검사지의 색 판별을 개선한다. CNN은 이미지 인식과 패턴 찾기에 유용한 모델로, 경량화된 버전도 사용 가능하다. 이를 통해 스마트폰에서 딥러닝 모델을 운영하고 정확한 요검사지 결과를 추출할 수 있다. 요검사지는 다양한 환경에서 촬영하여 딥러닝 모델 학습 이미지를 준비 하였으며 MobileNet V3을 사용하여 요검사 서비스 어플리케이션을 설계하였다.

중국 고승전의 체재 변화와 그 의미 (A Study on the Evolution of the Ten Subjects and Their Significance in the Biographies of Eminent Monks of China)

  • 정천구
    • 대순사상논총
    • /
    • 제43집
    • /
    • pp.179-209
    • /
    • 2022
  • 혜교(慧皎)는 중국에 불교가 전래되어 널리 퍼지고 자리를 잡는 과정에서 큰 기여를 한 고승들의 업적을 기리기 위해서 『고승전(高僧傳)』을 저술했다. 혜교는 열 개의 과목을 설정해 행적들을 세분했는데, 이른바 '십과(十科)' 체재다. 이 십과는 고승전이 불교사서로서 의의를 갖게 해주는 중요한 틀이다. 『고승전』을 이어 저술된 『속고승전(續高僧傳)』, 『송고승전(宋高僧傳)』, 『대명고승전(大明高僧傳)』 등이 십과 체재를 따른 데서 확인된다. 그러나 십과는 고승전 저자들의 인식과 의도에 따라 형태에서 변화를 겪었다. 도선은 『속고승전』에서 일부 과목들의 명칭을 바꾸고 새로운 과목을 추가했으며, 찬녕은 『송고승전』에서 『속고승전』의 십과를 그대로 이으면서 각 과목에 새로운 의미를 부여했다. 뒤늦게 『대명고승전』을 편찬한 여성은 세 과목만 남기고 일곱 과목을 없앴다. 십과의 체재는 형태뿐만 아니라 의미에서도 변화가 있었다. 혜교가 교화를 중시했다면, 도선은 '수행'과 '실천'을 강조했고 찬녕은 '지혜' 와 '깨달음'을 강조했다. 여성은 십과의 붕괴를 보여주면서 불교가 쇠퇴하고 있었던 상황을 담아냈다. 이렇게 각 고승전의 십과에 각기 다른 의미가 부여되었다는 것은 저자들이 불교사를 각기 다르게 인식했다는 뜻이기도 하다. 따라서 중국 불교사의 전개 과정이 일부 반영되었으리라고 생각된다. 물론 각 고승전의 내용을 다양한 측면에서 심도 있게 분석해 비교하는 작업이 뒤따라야 한다

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.

A Study on Deep Learning Model for Discrimination of Illegal Financial Advertisements on the Internet

  • Kil-Sang Yoo; Jin-Hee Jang;Seong-Ju Kim;Kwang-Yong Gim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.21-30
    • /
    • 2023
  • 인터넷 불법금융광고는 인터넷 카페, 블로그 등을 통해 통장매매, 신용카드·휴대폰결제현금화 및 개인신용정보매매 등 불법금융행위를 목적으로 한다. 금융감독당국의 노력에도 불구하고 불법금융행위는 줄어들지 않고 있다. 본 연구는 인터넷 불법금융광고 게시글에 파이썬 딥러닝 기반 텍스트 분류기법을 적용해 불법여부를 탐지하는 모델을 제안한다. 텍스트 분류기법으로 주로 사용되는 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit)을 활용한다. 그동안 수작업으로 심사한 불법확인 결과를 기초 데이터로 이용한다. 한국어 자연어처리와 딥러닝 모델의 하이퍼파라미터 조절을 통해 최적의 성능을 보이는 모델을 완성하였다. 본 연구는 그동안 이뤄지지 않았던 인터넷 불법금융광고 판별을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 딥러닝 모델에서 91.3~93.4% 수준의 정확도를 보임으로써 불법금융광고 탐지에 딥러닝 모델을 실제 적용하여 불법금융광고 근절에 기여할 수 있기를 기대해 본다.