• 제목/요약/키워드: Information Network

검색결과 31,326건 처리시간 0.058초

다양한 데이터 전처리 기법 기반 침입탐지 시스템의 이상탐지 정확도 비교 연구 (Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems Based on Various Data Preprocessing Techniques)

  • 박경선;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.449-456
    • /
    • 2021
  • 침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.

SNA를 이용한 AI 스피커 지속적 사용에 영향을 미치는 요인 분석 연구: 아마존 에코 리뷰 중심으로 (A Study on the Factors Affecting Continuous Use of AI Speaker Using SNA)

  • 김영범;차경진
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.95-118
    • /
    • 2021
  • 최근 AI 스피커 시장의 규모가 급속도 커지면서 AI 스피커의 다양한 활용 가능성이 크게 주목받고 있다. 소비자들이 다양한 채널을 통해 제품을 사용한 경험을 표현하고 공유하는 환경을 만들어 졌고, 그로 인하여 소비자가 제품을 이용한 경험에 대한 다양하고 솔직한 생각을 남긴 리뷰들의 양이 방대해졌는데, 이러한 리뷰데이터는 소비자의 생각을 분석하는 데에 매우 유용하다고 할 수 있다. 본 연구에서는 이 리뷰데이터를 활용하여 AI 스피커 지속적인 사용에 영향을 미치는 요인에 대하여 분석하고자 하였다. 무엇보다 선행연구를 통하여 도출된 AI 사용의도에 영향을 미치는 7가지 요인들이 실제로 소비자들이 남기는 리뷰에서도 나타나는 요인인지를 확인하고자 하였다. 이를 위해, Amazon.com의 아마존 에코 제품에 대한 고객 리뷰데이터를 기반으로 하여 텍스트마이닝과 사회관계망 분석을 활용하여 분석하였다. 리뷰데이터를 긍정리뷰와 부정리뷰로 분류하고 전처리하여 도출된 단어들 간 연결성을 중심으로 AI 스피커의 지속적인 사용에 영향을 미치는 요인을 분류하고자 연결 중심성 분석을 하였으며, 이를 통해 연결성의 위치가 비슷한 단어들 간 분류를 하기 위하여 CONCOR 분석을 하였다. 긍정 리뷰 연구 결과, 소비자들은 AI 스피커 지속적 사용에 영향을 미치는 요인으로 의인화와 친밀성을 가장 중요하게 보았다. 이 두 요인들은 다른 요인들과도 강한 연결 관계를 보여주었고, 선행연구에서 도출된 요인 외에 연결성도 중요한 요인임을 도출하였다. 또한 추가적으로 부정적인 리뷰 분석 결과, 인식오류와 호환성이 AI 스피커 사용에 있어서 소비자들에게 부정적인 영향을 주는 주요 요인들로 도출되었다. 이러한 연구 결과를 토대로 본 연구에서는 소비자들이 아마존 에코 제품을 지속적으로 사용하게 하는 구체적인 방법에 대하여 제시하고자 한다.

비소세포폐암 환자의 재발 예측을 위한 흉부 CT 영상 패치 기반 CNN 분류 및 시각화 (Chest CT Image Patch-Based CNN Classification and Visualization for Predicting Recurrence of Non-Small Cell Lung Cancer Patients)

  • 마세리;안가희;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권1호
    • /
    • pp.1-9
    • /
    • 2022
  • 비소세포폐암(NSCLC)은 전체 폐암 중 85%의 높은 비중을 차지하며 사망률(22.7%)이 다른 암에 비해 현저히 높은 암으로 비소세포폐암 환자의 수술 후 예후에 대한 예측은 매우 중요하다. 본 연구에서는 종양을 관심영역으로 갖는 비소세포폐암 환자의 수술 전 흉부 CT 영상 패치의 종류를 종양 관련 정보에 따라 총 다섯 가지로 다양화하고, 이를 입력데이터로 갖는 사전 학습 된 ResNet 과 EfficientNet CNN 네트워크를 사용하여 단일 모델과 간접 투표 방식을 이용한 앙상블 모델, 그리고 3 개의 입력 채널을 활용한 앙상블 모델에서의 실험 결과 및 성능을 오분류의 사례와 Grad-CAM 시각화를 통해 비교 분석한다. 실험 결과, 종양 주변부 패치를 학습한 ResNet152 단일 모델과 EfficientNet-b7 단일 모델은 각각 87.93%와 81.03%의 정확도를 보였다. 또한 ResNet152 에서 총 3 개의 입력 채널에 각각 영상 패치, 종양 주변부 패치, 형상 집중 종양 내부 패치를 넣어 앙상블 모델을 구성한 경우에는 정확도 87.93%를, EfficientNet-b7 에서 간접 투표 방식으로 영상 패치와 종양 주변부 패치 학습 모델을 앙상블 한 경우에는 정확도 84.48%를 도출하며 안정적인 성능을 보였다.

배움공동체에 대한 탐색적 연구 : covid19 언택트시대를 중심으로 (An Exploratory Study on the Learning Community: Focusing on the Covid19 Untact Era)

  • 정수정;임홍남;박홍재
    • 융합정보논문지
    • /
    • 제12권5호
    • /
    • pp.237-245
    • /
    • 2022
  • 본 연구는 언택트시대의 배움공동체에 대한 사회적 담론이 어떠한지 살펴보고, 팬데믹이라는 사회적 상황 속에서 아동을 위한 배움공동체가 나아가야할 방향에 대해 논의해 보고자한다. 이를 위해 2020년 1월 20일부터 2021년 1월 20일까지 1년 동안의 빅데이터를 '언택트+배움공동체'라는 키워드로 인터넷 포털사이트(구글, 다음, 네이버 등의 뉴스)에서 데이터를 수집 및 분석하였다. 분석결과, 단어빈도 및 네트워크분석에서 '마을교육공동체', '운영', '활동', '코로나19', '지원', '온라인' 등의 단어가 언택트시대의 배움공동체와 관련이 높은 것으로 도출되었다. 이는 배움공동체 내에서 마을의 교육공동체가 주축이 되어 코로나19라는 상황 속에서도 마을 활동가와 주민협의회 등이 뜻을 모아 코로나19로 멈춰진 아동의 일상을 회복하고 관계 회복을 위한 노력을 온라인 매체를 활용하여 지원 해줄 수 있다는 것을 보여준다. 결론적으로 단어빈도 분석을 통해 배움공동체와 관련된 핵심키워드를 파악하고 배움공동체에 대한 사회적 경향을 살펴보았다는데 의의가 있으며, 코로나19의 장기화로 아동의 공적 돌봄·교육의 틈새와 한계에 대한 대안으로 배움공동체의 도입 및 활성화를 위한 기초자료로써 시사점을 가진다

PageRank 알고리즘을 활용한 사이버표적 중요성 순위 선정 방안 연구 (A research on cyber target importance ranking using PageRank algorithm)

  • 김국진;오승환;이동환;오행록;이정식;신동규
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.115-127
    • /
    • 2021
  • 전 세계적으로 과학기술의 발달에 따라 육·해·공·우주에 이어 사이버공간이라는 영역 또한 전장 영역으로 인식되고 있다. 이에 따라 육·해·공·우주에서 이루어지는 물리적 작전뿐만 아니라 사이버공간에서 이루어지는 사이버 작전 수행을 위한 정의, 체계, 절차, 계획 등 다양한 요소를 설계·수립해야 한다. 본 연구에서는 사이버 작전의 표적처리(Targeting) 중 표적개발 및 우선순위 부여 단계에서 중간표적개발을 통해 선정한 사이버 표적 목록에 대한 우선순위를 부여할 때 고려할 수 사이버 표적의 중요성을 고려 요소로 선정하여 이에 대한 점수를 산출, 사이버 표적 우선순위 선정 점수의 일부로 활용하는 방안을 제시한다. 이에 따라, 사이버 표적 우선순위 부여 과정에서 사이버 표적 중요성 범주를 설정하고, 사이버 표적 중요성 개념 및 기준항목을 도출한다. 도출된 기준항목별 점수산정 및 종합을 위해 PageRank 알고리즘을 기반으로 Event Prioritization Framework 등의 매개변수를 종합한 TIR(Target Importance Rank) 알고리즘을 제안한다. 그리고 스턱스넷 사례 기반 네트워크 토폴로지 및 시나리오 데이터를 구성하여 제안된 알고리즘으로 사이버 표적 중요성 점수를 도출하고 사이버 표적의 우선순위를 선정하여 제안된 알고리즘을 검증한다.

블로그 마이닝을 활용한 행복주택의 인식 분석 (Analysis of Perception on Happy Housing Using Blog Mining Technique)

  • 황지현
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.211-223
    • /
    • 2022
  • 본 연구는 주거정책 분야에서 여론을 수렴하기 위해 블로그의 활용 가능성을 고찰하고자 한다. 이를 위해 '행복주택'을 키워드로 관련 게시글을 수집하고 주요 키워드를 추출하여 키워드 분석과 단어 군집 분석을 통해 대중들의 인식을 파악하였다. 행복주택에 대한 사회적 논의가 확산된 2013년 5월부터 2021년 8월까지 블로그 게시글 137,002개를 분석 자료로 활용하였으며, 주요 정책과 자료 수집량을 고려하여 수집 기간을 3단계로 나누어 도출된 단어를 분석한 결과는 다음과 같다. 키워드 분석에서 전반적으로 행복주택의 위치, 세대수, 단지 및 주택 규모, 입주 가능 조건 등과 관련된 단어의 중요도가 높았다. 1단계에서는 정부 정책 시행, 2단계에서는 행복주택 신청 절차, 3단계에서는 모집공고, 입주 자격, 임대조건에 중요도가 각각 높은 것으로 나타났다. 군집 분석에서는 모든 단계에서 사업 진행, 신청 절차, 사업지역이 주요 주제로 도출되었다. 특히, 1단계에서는 정책 시행 및 추진방안, 2단계는 입주 자격 및 금융 지원, 3단계에서는 정책 시행 및 입주 자격이 주요한 주제로 도출되었다. 이러한 결과는 블로그를 통해 정책 관련 정보 공유 및 사회적 이슈 반영, 정책 전달 여부 평가, 대중의 정책 참여도 유추가 가능하며, 블로그를 여론 수렴 방법으로 활용할 가능성을 제시한 데에 의의가 있다.

3차원 탄성파자료의 층서구분을 위한 패치기반 기계학습 방법의 개선 (Improvements in Patch-Based Machine Learning for Analyzing Three-Dimensional Seismic Sequence Data)

  • 이동욱;문혜진;김충호;문성훈;이수환;주형태
    • 지구물리와물리탐사
    • /
    • 제25권2호
    • /
    • pp.59-70
    • /
    • 2022
  • 최근의 연구들을 통해 기계학습은 탄성파 해석 분야에 그 적용 범위를 확장하고 있으며, 탄성파 해석에서 중요한 탄성파 층서 구분을 수행하는 합성곱 신경망들의 개발도 수행되었다. 하지만 지도 학습의 경우 대량의 학습 자료가 필요하며, 비용과 시간의 한계로 탄성파 층서구분의 지도학습은 학습 자료의 부족이 문제가 될 수 있다. 이번 연구에서는 자료 부족 문제를 보완하기위해 탄성파 단면에 패치 분할과 자료증강을 적용하였다. 또한 패치 분할로 손실될 수 있는 공간정보를 제공하기 위해 깊이를 고려할 수 있는 인공 채널을 생성하여 추가하였다. 실험을 위한 학습 모델로 U-Net을 사용하였으며, 층서 구분을 위한 학습 자료가 제공되는 F3 block 자료를 이용하여 학습과 예측 결과에 대한 평가를 수행하였다. 분석 결과 자료증강과 인공 채널의 추가로 패치 기반의 층서 구분 학습 모델을 개선할 수 있음을 확인하였다.

딥러닝 알고리즘을 이용한 인쇄된 별색 잉크의 색상 예측 연구 (A Study on A Deep Learning Algorithm to Predict Printed Spot Colors)

  • 전수현;박재상;태현철
    • 산업경영시스템학회지
    • /
    • 제45권2호
    • /
    • pp.48-55
    • /
    • 2022
  • The color image of the brand comes first and is an important visual element that leads consumers to the consumption of the product. To express more effectively what the brand wants to convey through design, the printing market is striving to print accurate colors that match the intention. In 'offset printing' mainly used in printing, colors are often printed in CMYK (Cyan, Magenta, Yellow, Key) colors. However, it is possible to print more accurate colors by making ink of the desired color instead of dotting CMYK colors. The resulting ink is called 'spot color' ink. Spot color ink is manufactured by repeating the process of mixing the existing inks. In this repetition of trial and error, the manufacturing cost of ink increases, resulting in economic loss, and environmental pollution is caused by wasted inks. In this study, a deep learning algorithm to predict printed spot colors was designed to solve this problem. The algorithm uses a single DNN (Deep Neural Network) model to predict printed spot colors based on the information of the paper and the proportions of inks to mix. More than 8,000 spot color ink data were used for learning, and all color was quantified by dividing the visible light wavelength range into 31 sections and the reflectance for each section. The proposed algorithm predicted more than 80% of spot color inks as very similar colors. The average value of the calculated difference between the actual color and the predicted color through 'Delta E' provided by CIE is 5.29. It is known that when Delta E is less than 10, it is difficult to distinguish the difference in printed color with the naked eye. The algorithm of this study has a more accurate prediction ability than previous studies, and it can be added flexibly even when new inks are added. This can be usefully used in real industrial sites, and it will reduce the attempts of the operator by checking the color of ink in a virtual environment. This will reduce the manufacturing cost of spot color inks and lead to improved working conditions for workers. In addition, it is expected to contribute to solving the environmental pollution problem by reducing unnecessarily wasted ink.

KoEPT 기반 한국어 수학 문장제 문제 데이터 분류 난도 분석 (Analyzing Korean Math Word Problem Data Classification Difficulty Level Using the KoEPT Model)

  • 임상규;기경서;김부근;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.315-324
    • /
    • 2022
  • 이 논문에서는 자연어로 구성된 수학 문장제 문제 자동 풀이하기 위한 Transformer 기반의 생성 모델인 KoEPT를 제안한다. 수학 문장제 문제는 일상 상황을 수학적 형식으로 표현한 자연어 문제이다. 문장제 문제 풀이 기술은 함축된 논리를 인공지능이 파악해야 한다는 요구사항을 지녀 최근 인공지능의 언어 이해 능력을 증진하기 위해 국내외에서 다양하게 연구되고 있다. 한국어의 경우 문제를 유형으로 분류하여 풀이하는 기법들이 주로 시도되었으나, 이러한 기법은 다양한 수식을 포괄하여 분류 난도가 높은 데이터셋에 적용하기 어렵다는 한계가 있다. 본 논문은 이에 대해 '식' 토큰과 포인터 네트워크를 사용하는 KoEPT 모델을 사용했다. 이 모델의 성능을 측정하기 위해 현존하는 한국어 수학 문장제 문제 데이터셋인 IL, CC, ALG514의 분류 난도를 측정한 후 5겹 교차 검증 기법을 사용하여 KoEPT의 성능을 평가하였다. 평가에 사용된 한국어 데이터셋들에 대하여, KoEPT는 CC에서는 기존 최고 성능과 대등한 99.1%, IL과 ALG514에서 각각 89.3%, 80.5%로 새로운 최고 성능을 얻었다. 뿐만 아니라 평가 결과 KoEPT는 분류 난도가 높은 데이터셋에 대해 상대적으로 개선된 성능을 보였다. KoEPT가 분류 난도의 영향을 덜 받으며 좋은 성능을 얻게 된 이유를 '식' 토큰과 포인터 네트워크 때문이라는 것을 ablation study를 통해서 밝혔다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.