• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.033초

작성자 분석 기반의 공격 메일 탐지를 위한 분류 모델 (A Classification Model for Attack Mail Detection based on the Authorship Analysis)

  • 홍성삼;신건윤;한명묵
    • 인터넷정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.35-46
    • /
    • 2017
  • 최근 사이버보안에서 악성코드를 이용한 공격은 메일에 악성코드를 첨부하여 이를 사용자가 실행하도록 유도하여 공격을 수행하는 형태가 늘어나고 있다. 특히 문서형태의 파일을 첨부하여 사용자가 쉽게 실행하게 되어 위험하다. 저자 분석은 NLP(Neutral Language Process) 및 텍스트 마이닝 분야에서 연구되어지고 있는 분야이며, 특정 언어로 이루어진 텍스트 문장, 글, 문서를 분석하여 작성한 저자를 분석하는 방법들은 연구하는 분야이다. 공격 메일의 경우 일정 공격자에 의해 작성되어지기 때문에 메일 내용 및 첨부된 문서 파일을 분석하여 해당 저자를 식별하면 정상메일과 더욱 구별된 특징들을 발견할 수 있으며, 탐지 정확도를 향상시킬 수 있다. 본 논문에서는 기존의 기계학습 기반의 스팸메일 탐지 모델에서 사용되는 특징들과 문서의 저자 분석에 사용되는 특징들로부터 공격메일을 분류 및 탐지를 할 수 있는 feature vector 및 이에 적합한 IADA2(Intelligent Attack mail Detection based on Authorship Analysis)탐지 모델을 제안하였다. 단순히 단어 기반의 특징들로 탐지하던 스팸메일 탐지 모델들을 개선하고, n-gram을 적용하여 단어의 시퀀스 특성을 반영한 특징을 추출하였다. 실험결과, 특징의 조합과 특징선택 기법, 적합한 모델들에 따라 성능이 개선됨을 검증할 수 있었으며, 제안하는 모델의 성능의 우수성과 개선 가능성을 확인할 수 있었다.

효율적인 병원보건관리를 위한 태아건강분류 모델 (Design of Fetal Health Classification Model for Hospital Operation Management)

  • 전제란
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.263-268
    • /
    • 2021
  • 본 연구에서는 병원에서 실질적인 태아분만 시스템에 관리를 위한 태아건강분류모델을 설계하는 것을 목적으로 한다. 출산 중 사망자 수는 2017년을 기준으로 295,000명인 산모 사망률과 유사하다. 이러한 사망의 94%는 환경에 의해 발생하므로 대부분 예방할 수 있다. 따라서 본 논문에서는 랜덤 포레스트(Random Forest)를 이용하여 Cardiotocograms(CTG) 검사에서 추출한 2개의 데이터(태아의 심박수, 태아의 움직임, 자궁 수축 등)로 태아의 건강을 예측하는 모델을 제안하였다. 본 연구에서 제안된 모델은 태아분만 보건운영 시스템을 안정적으로 관리하기 위해 태아분만에 대한 데이터의 분포가 불균형한 이상 데이터를 갖는 항목을 찾아 표준편차의 상한 및 하한의 임계값을 설정하여 이상값을 제거하여 정확도를 높혔다. 또한 태아의 건강상태를 나타내는 클래스의 비율이 불규칙함으로, 데이터 리샘플링을 이용하여 소수의 클래스를 복제하여 클래스의 균형을 맞추었다. 그 결과 정확도가 4~5% 향상되어 97.75%로 나타났다. 이에 예측 모델을 통해 발생 할 수 있는 태아의 사망과 병을 사전에 정확히 예측하여 우선적으로 관리함으로써 효율적인 태아 보건운영과 태아 사망 및 병 예방에 기여할 수 있을 것이라고 기대한다.

건강신념모델을 적용한 청소년 비행과 유해환경과의 관련성 연구 (A Study on the Relationship between Adolescent Misconducts and Harmful Environment Based on Health Belief Model)

  • 이명선
    • 보건교육건강증진학회지
    • /
    • 제18권3호
    • /
    • pp.37-58
    • /
    • 2001
  • This study placed its objectives in suggesting the basic data for setting up an approach to protect the educational environment, by analyzing the relevance between the misconducts of adolescence and the harmful environment around the school, as an object of study, middle school students and high school students all over the country. Thus, this study carried out the questionnaire survey, by the multi-stage of stratified sampling in 2,114 middle school and high school students from June 29, 2000 through July 29, 2000. And the results of analysis were as follows: 1. In case of the ratio of students using harmful environment, the electronic game room had the highest ratio (78.3%); next, the PC room (75.6%), the singing room (71.6%), and the cartoon room (34.3%). 2. In terms of the experiences of using the harmful environment according to the personal characteristics, high school students used it in a higher ratio, compared with middle school students (p〈0.001); the students, whose father graduated from a high school, comparatively used it much more(p〈0.05). Also, when a school is located near to amusement quarters or shopping centers, students used the harmful environment most highly (p〈0.001). And the differences were found to be statistically significant. 3. In case of the perceived susceptibility factors, the harmful environment was found to be used in lower ratio, by the students who answered “very so” to the question item, The more harmful environment facilities are positioned around school, the more student have the opportunities to use them. (p〈0.001). That is, the findings showed that the higher students' degree of perceived susceptibility factors was the less students used harmful environment facilities. The differences were statistically significant. In terms of the ratio of using harmful environment according to perceived seriousness factors, it was founded out that the students, who answered, “If I use any harmful environment facilities, it will be very harmful to myself.”. had the less opportunities of having used them, compared with the students who did not answer so (p〈0.001). This indicated that the higher the degrees perceived seriousness of students, the less they used harmful environment facilities. And the differences were statistically significant. In the side of the ratio of using harmful environment according to the perceived barriers, it was found out that there were any special large differences. That is, perceived barriers had nothing to do with students' using harmful environment. 4. As the result of having analyzed the factors influencing the behaviors of using harmful environment, the factor to explain the behaviors of using harmful environment was found to be the degree of perceived seriousness, among individual perceiving factors; next, the location of a school - one of personal characteristics, the degree of perceived susceptibility and ages, m sequence. 5. Among students' misconduct experiences, drinking was highest (21.6%), next, smoking (11.9%), drug abuse (4.3%), and sexual relations (1.6%), In sequence. Among other problematic behaviors, excessive waste was highest (14.6%); next, disobedience and lie (10.7%), night wandering (7.8%), and bad dressing and making-up (5.5%), in sequence. 6. In terms of the misconducts according to the behaviors of using harmful environment, compared with the students who did not commit any misconducts, harmful environment facilities were used more highly, by each group of students who experienced drinking (p〈0.00l), smoking (p〈0.001), sexual relations (p〈0.05), excessive waste (p〈0.001), disobedience & lie (p〈0.001), and bad dressing & making-up (p〈0.05). And the differences were statistically significant.

  • PDF

RELAP5/MOD1/NSC를 이용한 원자력 1호기 외부전원상실사고해석;II:설계기준사고 (Analysis of Loss of Offsite Power Transient Using RELAP5/MOD1/NSC; II: KNU1 Design-Base Simulation)

  • Kim, Hyo-Jung;Chung, Bub-Dong;Lee, Young-Jin;Kim, Jin-Soo
    • Nuclear Engineering and Technology
    • /
    • 제18권3호
    • /
    • pp.175-182
    • /
    • 1986
  • 원자력 1호기의 설계 기준 사고인 외부 전원 상실 사고를 열, 수력학적 최적 계산용 코드인 RELAP5/MOD1/NSC를 사용하여 모의하였다. 본 분석은 최적 계산모델로 수행되었으나, 사고 전개 및 가정등 보수성을 갖는 평가 방법에 의거하였다. 해석결과중 노심평균온도, 증기발생기 및 가압기 수위 등의 중요한 열·수력학적 변수를 원자력 1호기의 최종 안전성 분석보고서의 결과와 비교하였다. 본 해석결과에서 노심평균온도와 가압기 수위는 보다 낮게, 증기발생기 수위는 보다 높게 나타남으로써 더 향상된 안전한계치를 확인하였다. 이것은 본 해석에서 최적 열·수력 모델을 사용하였을 뿐만 아니라 초기치로써 최적 값을 택하였기 때문에 얻어지는 결과이며, 또한 이와 같은 유형의 산고 (2차 계통의 열제거 능력 상실 사고)에서 원자력 1호기의 안전성을 더욱더 입증시켜 주는 것이다.

  • PDF

분산환경에서 혼용 뷰 관리기법을 채택한 이질적인 멀티데이타베이스 상호운용 모델 설계 (A Design of Model for Interoperability in Heterogeneous Multi-Database Adopting Mixed View Management Mechanism on Distributed Environments)

  • 이승용;박재복;김명희;주수종
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.531-542
    • /
    • 2005
  • 본 논문에서는 이질 환경의 지역 데이터베이스 시스템(Local DataBase System: LDBS)을 분산 시스템 형태로 통합하고 전역 사용자에게 빠른 질의 처리를 제공하는 멀티 데이터베이스 관리 시스템(Multi-DataBase Management System: MDBMS)을 제안한다. 이를 위해 MDBMS의 구성 요소들의 기능을 정의하고 그들 간의 상호작용을 설계한다 또한, 구성요소 중 전역 뷰 관리자 관점에서 전역 질의에 대한 결과 정보가 전역 뷰 저장소에 모두 저장되어 있는 경우. 전혀 없는 경우, 그리고 일부 저장되어 있는 경우를 비교하여 객체간의 인터페이스 및 메소드 호출에 따른 시퀀스 다이아그램을 통하여 본 시스템의 기능을 정립한다. 마지막으로, 정립된 기능을 토대로 예제 질의를 이용한 각 기능들의 수행과정을 나타내어 구체적으로 설계된 모델을 제안한다.

CBD 기반 소프트웨어에 대한 유스케이스 기반 테스트모델 (A USE CASE based Test Model for CBD Based Software)

  • 유지호;이남용
    • 한국전자거래학회지
    • /
    • 제8권4호
    • /
    • pp.239-252
    • /
    • 2003
  • 품질 좋은 소프트웨어란 성능이 뛰어나고 가격 이 저렴한 소프트웨어를 일컫는 말이다. 또한, 시장 요구에 부응하는 서비스를 지원하면서도 오류가 적고 유지보수하기 쉬운 구조를 가져야 한다. 이 모든 것을 충족하는 소프트웨어를 개발하기 위한 방법으로 최근 CBD (Component Based Development)가 각광 받고 있다. CBD (Component Based Development) 확산과 더불어 컴포넌트 구성, 기능, 호환성, 신뢰성을 위한 컴포넌트 테스트를 수행하고 있으나 이것만으로는 CBD (Component Based Development) 기반 소프트웨어 품질을 보장할 수 엄다. 높은 신뢰성, 유지보수성, 재활용 성을 가지는 단위 컴포넌트라도 조립, 통합 후에는 의도한 요구사항을 만족시키지 못하고 문제를 일으킬 수도 있으므로 이에 대한 통합 테스트 기법이 필요하다. 본 논문은 UML (Unified Modeling Language)기반 소프트웨어 개발에 컴포넌트 통합 테스트를 위한 것이고, 테스트 기법은 UML (Unified Modeling Language)의 순차다이어그램과 협력다이어그램을 참조하여 컴포넌트 사이 인터페이스에 존재하는 결점을 추출하는 테스트기법이다.

  • PDF

치매 환자를 포함한 한국 노인 음성 데이터 딥러닝 기반 음성인식 (Deep learning-based speech recognition for Korean elderly speech data including dementia patients)

  • 문정현;강준서;김기웅;배종빈;이현준;임창원
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.33-48
    • /
    • 2023
  • 본 연구에서는 발화자가 동물이나 채소와 같은 일련의 단어를 무작위로 일 분 동안 말하는 한국어 음성 데이터에 대한 자동 음성 인식(ASR) 문제를 고려하였다. 발화자의 대부분은 60세 이상의 노인이며 치매 환자를 포함하고 있다. 우리의 목표는 이러한 데이터에 대한 딥러닝 기반 자동 음성 인식 모델을 비교하고 성능이 좋은 모델을 찾는 것이다. 자동 음성 인식은 컴퓨터가 사람이 말하는 말을 자동으로 인식하여 음성을 텍스트로 변환할 수 있는 기술이다. 최근 들어 자동 음성 인식 분야에서 성능이 좋은 딥러닝 모델들이 많이 개발되어 왔다. 이러한 딥러닝 모델을 학습시키기 위한 데이터는 대부분 대화나 문장 형식으로 이루어져 있다. 게다가, 발화자들 대부분은 어휘를 정확하게 발음할 수 있어야 한다. 반면에, 우리 데이터의 발화자 대부분은 60세 이상의 노인으로 발음이 부정확한 경우가 많다. 또한, 우리 데이터는 발화자가 1분 동안 문장이 아닌 일련의 단어를 무작위로 말하는 한국어 음성 데이터이다. 따라서 이러한 일반적인 훈련 데이터를 기반으로 한 사전 훈련 모델은 본 논문에서 고려하는 우리 데이터에 적합하지 않을 수 있으므로, 우리는 우리의 데이터를 사용하여 딥러닝 기반 자동 음성 인식 모델을 처음부터 훈련한다. 또한 데이터 크기가 작기 때문에 일부 데이터 증강 방법도 적용한다.

Target DNA 염기서열 내에 존재하는 비상동성 간격이 상동성재조합을 이용한 클로닝 빈도에 미치는 영향 (Effect of Non-homologous Spacing in Target DNA Sequence on the Frequency of Cloning Based Homologous Recombination)

  • 김재우;도은주;윤세련;정윤희;윤영호;임선희;선우양일;박인호
    • 미생물학회지
    • /
    • 제41권4호
    • /
    • pp.239-245
    • /
    • 2005
  • Transformation-associated recombination (TAR) 클로닝 법은 복잡한 게놈으로부터 염색체 내의 특정부위나 유전자를 선택적으로 분리할 수 있다. 이 방법은 목적 유전자에 근접한 작은 게놈DNA 염기서열 정보를 필요로 한다. 이 기술은 효모의 spheroplast transformation을 시키는 동안 목적으로 하는 유전자의 5' 또는 3' 서열을 포함하고 있는 TAR vector와 게놈DNA사이에서 일어나는 상동성재조합에 의해 이루어진다. 본 연구에서는 plasmid 모델시스템을 이용하여 target hooks 내에 존재하는 비상동성 염기서 열이 상동성재조합에 미치는 영향을 조사하였다. plasmid에 존재하는HIS3유전자와 변형시킨 his3-TRP1-his3 단편 사이의 상동성재조합의 효율은 $Ura^+$ 형질전환체의 형질분석에 의해 이루어졌다. $Ura^+$ 형질전환체의 수는 7종류의 서로 달리 변형된 his3-TRP1-his3 단편들을 사용하였을 매 거의 동일하게 나타났다. 그러나 $Trp^+His^+$ positive recombinants의 빈도는 변형된 his3-TRP1-his3 단편 내에 비상동성 영역에 부정확한 간격을 지닐 때 현저한 감소를 나타내었다. 이러한 결과로서, 부정확한 간격이 target hook과 substrate DNA 사이에 일어나는 상동성재조합을 방해하는 것으로 사료된다. 그러므로 이종간의 상동유전자를 클로닝 할 때에는 target hook내의 비상동성 염기서열이 존재한다면 이것이 정확한 간격을 지니는지 여부를 중요란 요인으로 고려해야 한다.

RELA5/MOD1/NSC를 이용한 원자력 1호기 외부전원상실사고해석 - I. 실제사고해석 (Analysis of Loss of Offsite Power Transient Using RELAP5/MODl/NSC; I: KNU1 Plant Transient Simulation)

  • Kim, Hho-Jung;Chung, Bub-Dong;Lee, Young-Jin;Kim, Jin-Soo
    • Nuclear Engineering and Technology
    • /
    • 제18권2호
    • /
    • pp.97-106
    • /
    • 1986
  • 1981년 6일 9일 원자력 1호기에서 발생한 77.5% 출력상태에서의 외부전원상실사고를 열, 수력학적최적계산용 코드인 RELAP5/MODl/NSC를 사용하여 모의하였으며 해석결과는 발전소 실측자료와 잘 일치하였다. 원자로 냉각재펌프의 트립에 따른 flow coastdown후에 hot-cold leg온도차에 의하여 자연순환 유동이 형성됨이 확인되었으며 실측자료와 잘 일치하여 이와 관련된 전산코드의 열수력학 적모델의 타당성을 입증할 수 있었다. 또한 위의 사고전개가 정상운전상태인 전출력(100%)에서 재발하였을 경우를 가정하여 해석하였다. 이러한 해석을 통하여 보조급수의 공급과 더불어 증기발생기 PORV의 적절한 작동으로 원자력 1호기 노심잔열을 제거하여 안전성에 문제점을 야기하지 않음을 입증하였다. 최적 계산방법에 의한 사고해석에서는 turbine stop valve 작동시간, 증기 발생기 PORV 설정치 등 non-safety 관련요소들의 특성에 대한 정화한 모의가 필수적이다.

  • PDF

시간 기반의 비정상 행위 침입탐지 모델 설계 (A Design of Time-based Anomaly Intrusion Detection Model)

  • 신미예;정윤수;이상호
    • 한국정보통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.1066-1072
    • /
    • 2011
  • 시스템 호출 순서에 대한 관계를 분석하는 방법은 정상적인 시스템 호출 순서를 일정한 크기로 시스템 호출 순서를 분할하여 진을 생성하여 탐지자로 사용한다. 시스템 호출의 매개변수를 고려하는 방법은 매개변수의 길이에 대한 평균과 표준편차를 이용하여 탐지자로 사용한다. 시스템 호출 순서만을 고려한 모델은 시스템 호출 순서는 정상이지만 포맷 스트링 공격과 같이 매개변수의 값만 변하는 공격을 탐지할 수 없으며, 시스템 호출 매개변수만을 고려한 모델은 매개변수 각각을 고려하므로 공격이 시작되지 않은 구간에서 획득한 정보에 의해 긍정적 결함률이 높게 나타나는 문제점이 있다. 이러한 문제점을 해결하기 위해 공격과 관련된 시스템 호출의 여러 속성들을 동시에 고려하는 접근 방법으로서 연속적인 시스템 호출 순서 및 매개변수를 그룹(Group)화하여 보다 효율적으로 학습 및 탐지하는 방법이 필요하다. 이 논문에서는 비정상적인 행위를 정상적인 행위로 판단하는 긍정적 결함률을 개선하기 위하여 시스템 호출 순서 및 매개변수에 시간 개념을 적용하여 시스템 호출 순서 및 매개변수의 비정상행위를 탐지한다. 실험 결과 제안 기법은 DARPA 데이터 셋을 사용한 실험에서 시스템 호출의 긍정적 결함률은 시간을 고려하지 않은 시스템 호출 순서 모델보다 시간을 고려한 시스템 호출 순서 모델의 긍정적 결함률이 13% 향상되었다.