• 제목/요약/키워드: Log data analysis

검색결과 975건 처리시간 0.033초

통합보안 관리를 위한 침입대응 시스템 설계 (Design of Intrusion Responsible System For Enterprise Security Management)

  • 이창우;손우용;송정길
    • 융합보안논문지
    • /
    • 제5권2호
    • /
    • pp.51-56
    • /
    • 2005
  • 인터넷의 사용자 증가와 네트워크 환경이 점점 복잡해지고 제공되는 서비스 및 사용자의 요구사항들이 다양해짐에 따라 안정적이고 효과적인 환경을 유지하기 위한 서비스 운용관리는 점점 어려워지고 있다. 또한 초창기 보안은 침입차단시스템에 국한되었지만, 최근에는 침입탐지시스템(IDS), 가상 사설망(VPN), 시스템 보안, 인증 등 관련 솔루션이 대거 등장함에 따라 통합관리가 중요시되어 지고 있다. 이런 문제를 해결하기 위해 제안한 본 로그 분석을 통한 침입 대응시스템은 로그 파일을 XML 형식으로 저장함으로써 XML의 장점인 로그 파일의 검색이 용이하고 빠르게 이루어 질 수 있으며, 데이터의 구조화에 따라 시스템의 로그 파일들을 통합 분석, 관리하는데 이점을 가질 수 있다. 또한, 본 논문에서 제안한 생성된 로그파일을 IP 주소에 의해 소트된 로그와 Port 번호에 의해 소트된 로그, 침입 유형에 의해 소트된 로그, 탐지 시간에 의해 소트된 로그 등 다양한 형태로 변환하기 때문에 다른 침입탐지시스템에서 생성된 로그 파일과 비교 분석이 가능하다.

  • PDF

Evaluation of wind loads and the potential of Turkey's south west region by using log-normal and gamma distributions

  • Ozkan, Ramazan;Sen, Faruk;Balli, Serkan
    • Wind and Structures
    • /
    • 제31권4호
    • /
    • pp.299-309
    • /
    • 2020
  • In this study, wind data such as speeds, loads and potential of Muğla which is located in the southwest of Turkey were statistically analyzed. The wind data which consists of hourly wind speed between 2010 and 2013 years, was measured at the 10-meters height in four different ground stations (Datça, Fethiye, Marmaris, Köyceğiz). These stations are operated by The Turkish State Meteorological Service (T.S.M.S). Furthermore, wind data was analyzed by using Log-Normal and Gamma distributions, since these distributions fit better than Weibull, Normal, Exponential and Logistic distributions. Root Mean Squared Error (RMSE) and the coefficients of the goodness of fit (R2) were also determined by using statistical analysis. According to the results, extreme wind speed in the research area was 33 m/s at the Datça station. The effective wind load at this speed is 0.68 kN/㎡. The highest mean power densities for Datça, Fethiye, Marmaris and Köyceğiz were found to be 46.2, 1.6, 6.5 and 2.2 W/㎡, respectively. Also, although Log-normal distribution exhibited a good performance i.e., lower AD (Anderson - Darling statistic (AD) values) values, Gamma distribution was found more suitable in the estimation of wind speed and power of the region.

로그 데이터를 이용한 기업 정보 시스템의 사용 패턴 분석 (Utilization Pattern Analysis of an Enterprise Information System using Event Log Data)

  • 한관희
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.723-732
    • /
    • 2022
  • 최근 들어 기업정보 시스템의 성공적인 활용은 기업의 효과적인 전략 수행과 기업 경영 목적 달성에 핵심적인 역할을 하고 있다. 기업정보 시스템의 도입 성공 여부를 결정하는 인자 중의 하나가 시스템 활용도로서, 정보시스템 활용도를 측정하는 효과적인 방안을 마련하는 것은 기업 경영에서 매우 중요하다. 본 연구에서는 프로세스 마이닝 기법을 이용한 로그 데이터 분석을 통해 정보 시스템 활용도를 평가한다. 즉, 기본적인 접속 로그 통계뿐만 아니라 정보시스템을 실제로 사용하는 순서를 패턴화하고 유사 사용 기능을 군집화하여, 정보시스템 설계시에 예상하였던 시스템 사용 순서/기능과 실제 현황을 비교함으로써 기존 정보시스템을 개선하거나 확장하는데 피드백을 제공하고자 한다.

Analysis of Online Behavior and Prediction of Learning Performance in Blended Learning Environments

  • JO, Il-Hyun;PARK, Yeonjeong;KIM, Jeonghyun;SONG, Jongwoo
    • Educational Technology International
    • /
    • 제15권2호
    • /
    • pp.71-88
    • /
    • 2014
  • A variety of studies to predict students' performance have been conducted since educational data such as web-log files traced from Learning Management System (LMS) are increasingly used to analyze students' learning behaviors. However, it is still challenging to predict students' learning achievement in blended learning environment where online and offline learning are combined. In higher education, diverse cases of blended learning can be formed from simple use of LMS for administrative purposes to full usages of functions in LMS for online distance learning class. As a result, a generalized model to predict students' academic success does not fulfill diverse cases of blended learning. This study compares two blended learning classes with each prediction model. The first blended class which involves online discussion-based learning revealed a linear regression model, which explained 70% of the variance in total score through six variables including total log-in time, log-in frequencies, log-in regularities, visits on boards, visits on repositories, and the number of postings. However, the second case, a lecture-based class providing regular basis online lecture notes in Moodle show weaker results from the same linear regression model mainly due to non-linearity of variables. To investigate the non-linear relations between online activities and total score, RF (Random Forest) was utilized. The results indicate that there are different set of important variables for the two distinctive types of blended learning cases. Results suggest that the prediction models and data-mining technique should be based on the considerations of diverse pedagogical characteristics of blended learning classes.

웹 로그 데이터를 이용한 온라인 소비자의 가격민감도 영향 요인에 관한 연구 (Determinants of Online Price Sensitivity Using Web Log Data)

  • 전종근;박철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권1호
    • /
    • pp.1-16
    • /
    • 2006
  • This paper empirically analyzed consumer price search behavior using Web log data of a Korean web site for price comparison. Consumer click-stream data of the site was used to test the effects of price level, product category, third party certification, reputation of retailers on click behavior. According to the descriptive statistics, 67.4% of shopbot users clicked the offer which was the lowest price returned in a search. We found that third party certification and reputation of retailers were significant determinants of clicking the lowest priced offer from legit analysis. We also applied Tobit regression analysis to estimate the price premium of the two determinants, but only reputation of retailers was found to have price premium of 4.9%.

  • PDF

이기종 네트워크 장치를 사용하는 시스템의 효율적인 관리를 위한 로그 수집 방법 (Log Collection Method for Efficient Management of Systems using Heterogeneous Network Devices)

  • 양재호;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.119-125
    • /
    • 2023
  • IT 인프라 운영이 고도화하면서 시스템을 관리하는 방식이 널리 보급되어 있으며, 최근에는 Syslog를 활용한 개선방법들이 연구되고 있다. 그러나 이러한 방법으로 수집한 로그 데이터를 활용하여 시스템 관제를 할 경우 다양한 형식으로 추출되는 로그를 전문 인력이 분석해야 하는 어려움이 있다. 본 논문은 엣지 컴퓨팅을 활용하여 Syslog 데이터를 분산 수집하고 중복 데이터를 전처리하여 중앙 데이터베이스에 적재하는 시스템을 구축 방법을 제시하고자 한다. 또한, 데이터사전을 구성하여 실시간으로 데이터를 분류하고 카운팅하는 기능을 제공하며, 데이터사전에 등록된 데이터에 대해서는 중앙 데이터베이스로의 전송을 제한하는 시스템을 구현한다. 이를 통해 데이터 사전의 정의어 패턴을 유지하며, 중복 데이터와 시간 중복을 제어하여 중앙 데이터베이스에 정제된 데이터를 적재함으로써 빅데이터 분석을 위한 기초 자료를 확보할 수 있다. 시뮬레이션결과 제안된 알고리즘과 프로시저를 구체적인 예시와 함께 설명하고, syslog 데이터를 활용하여 그 성능을 검증하였다. syslog 데이터는 실제 로그 데이터에서 추출한 예시를 포함하고 있으며 이를 통해 로그 데이터로부터 필요한 정보를 정확하게 추출하였고, 분류 및 적재 과정에서 정상적인 처리가 이루어지는지를 확인하였다. 이러한 시스템은 엣지 환경에서 로그 데이터를 효율적으로 수집하고 관리하기 위한 솔루션으로 활용하여 기술의 확산 측면에서도 효과를 기대할 수 있다.

Anomalous Pattern Analysis of Large-Scale Logs with Spark Cluster Environment

  • Sion Min;Youyang Kim;Byungchul Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.127-136
    • /
    • 2024
  • 본 연구는 Spark 클러스터 환경에서 대용량 로그를 분석하여 시스템 이상과의 연관성을 탐색한다. 로그를 활용한 이상 감지 연구는 증가하고 있으나, 클러스터의 다양한 컴포넌트의 로그를 충분히 활용하지 못하고 이상과 시스템의 연관성을 고려하지 않는다는 한계가 있다. 따라서 본 논문에서는 정상과 비정상 로그의 분포를 분석하고, 로그 템플릿의 출현 여부를 통해 이상 감지 가능성을 탐색한다. Hadoop과 Spark를 활용하여 정상과 비정상 로그 데이터를 생성하고, t-SNE와 K-means 클러스터링을 통해 비정상 상황에서의 로그 템플릿을 찾아 이상 현상을 파악한다. 결과적으로, 비정상 상황에서만 발생하는 고유한 로그 템플릿을 확인하며 이를 통해 이상 현상 감지의 가능성을 제시한다.

음파검층과 밀도검층 자료에서 산출된 이방성 변수를 이용한 지층 구분 (Formation Identification using Anisotropic Parameters from Sonic and Density Logs)

  • 장성형;김태연;황세호
    • 지질공학
    • /
    • 제27권3호
    • /
    • pp.323-330
    • /
    • 2017
  • 지하 지층의 확인은 지표면 지질조사, 시추코어 분석, 시추코어 관찰, 물리검층 자료 분석 등의 다양한 방법을 이용한다. 이 가운데 물리검층 자료는 원위치에서 연속적으로 물성을 제공하므로 시추코어 분석 자료와 더불어 지층의 확인에 활용되고 있다. 본 연구에서는 완전파형 음파검층과 밀도검층 자료에서 이방성 변수를 구하고 이를 이용하여 지층의 구분에 적용하고자 하였다. 톰슨 이방성 변수(${\varepsilon},\;{\delta},\;{\eta}$)는 바쿠스(Backus) 평균법을 P파와 S파 속도, 밀도검층 자료에 적용하여 계산하였다. 이와 같은 방법을 캐나다 블랙풋의 물리검층 자료에 적용한 결과, 12개 구간으로 지층을 구분 할 수 있 수 있었다. 즉, 탄성파 속도 이방성을 반영하는 톰슨 이방성 값의 변화에서 지층의 구분이 가능하였고 지층 구분에 많이 이용하는 자연감마선검층 자료가 없는 경우에도 톰슨 이방성 변수를 이용하여 지층 구분이 가능함을 알 수 있었다.

구매 vs. 사용 휴대폰 Log 분석을 통한 사용자 재분류 및 UI 최적화 (Buying vs. Using: User Segmentation & UI Optimization through Mobile Phone Log Analysis)

  • 전명훈;나대열;안정희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.460-464
    • /
    • 2008
  • 제품의 사용자 인터페이스를 개선하고 최적화하기 위해서는 실제 사용자들이 그 제품을 어떻게 사용하는지에 대한 정확한 이해가 선행되어야 한다. 지금까지 사용자의 행동을 이해하기 위한 방법으로 주로 사용되어 온 면접이나 질문지는 사용자의 기억에 의존해야만 한다는 단점이 잇으며, 사용자에게 특정한 과제를 부여하고 행태를 관찰하거나 실험을 진행하는 usability test, 사용자의 실제 환경이 아닌 주어진 환경에서 실험자의 의도에 따라 정해진 과제를 수행해야 한다는 제약이 있다. 본 연구에서는 이러한 단점들을 보완하고 실제 사용 환경에서 자연스러운 사용자 행태를 추출하기 위하여 사용자의 사용 로그를 저장하고 분석하는 방법을 활용하였다. 연구 대상 폰을 사용하고 있는 실사용자들을 마켓 세그멘테이션에 따라 선발한 후, 로깅 소프트웨어를 이용하여 약 2 주간 사용한 휴대폰 로그 데이터를 수집하였다. 또한, 로그 분석이라는 방법이 실제 관찰을 포함하지 않았다는 점을 보완하기 위하여 사용자들에게 같은 기간 동안 시간대별 일기 형식의 기록을 하도록 요청하였고, 추후 간단한 면접을 실시하였다. 수집된 데이터를 분석하여 주요 기능의 사용 빈도 및 사용 행태를 추출해내고 사용자의 세그멘테이션을 재분류할 수 있었다. 또한, 이를 바탕으로 새로운 형태의 사용자 인터페이스의 방향 또한 도출해 낼 수 있었다.

  • PDF

장내미생물 분석 플랫폼 구현을 위한 요구사항 분석 및 시스템 설계 (Requirements Analysis and System Design for the Implementation of the Gut Microbiome Analysis Platform)

  • 임복출;마상혁;마상배;최형민
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권6호
    • /
    • pp.487-496
    • /
    • 2021
  • The analysis method of the microbiome has been evolving for a very long time, and the industrial field has grown rapidly with the start of human genome analysis 20 years ago. As continuous research continues, related industries have grown together, and among them, Illumina of the US has been leading the popularization of DNA analysis by developing innovative equipment and analysis methods since its establishment in 1998. In this paper, 'AiB Index', 'AiB Chart' using statistical process control and log-scale technique to analyze the gut microbiome analysis methodology and implement an algorithm that can analyze minute changes in the minor strains that can be overlooked in the existing analysis methods. want to implement. From the data analysis point of view, we proposed a platform for analyzing gut microbes that can collect fecal data, match and process gut microbes, and store and visualize the results.