• Title/Summary/Keyword: 발생빈도 예측

Search Result 669, Processing Time 0.036 seconds

Frequency Estimation of Substring for Scientific Database (과학 데이타베이스에서 부분 문자열의 발생 빈도 예측)

  • 배진욱;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.536-538
    • /
    • 2003
  • 대량의 짧은 문자열들에 대해 부분 문자열의 발생 빈도를 예측하는 문제는 카운트 서픽스 트리를 미리 생성한 후 이를 이용함으로써 처리될 수 있다. 카운트 서픽스 트리는 모든 부분 문자열의 발생 빈도를 저장한 뒤 가지치기를 함으로써, 제한된 트리 크기와 발생 빈도 예측이라는 두 가지 목표를 처리한다. 하지만, 염기서열에서 처럼 저장된 문자열의 길이가 길어질 경우 카운트 서픽스 트리를 생성하기가 대단히 어려워진다는 문제점이 발생한다. 이 논문에서는 선삽입, 후가지치기 방식의 카운트 서픽스 트리 대신 처음부터 길이가 q 이하인 문자열들만을 삽입하는 큐그램 트리를 제안한다. 큐그램 트리는 제한된 트리 크기에 따라 저장할 부분 문자열의 크기를 미리 결정할 수 있으며, 데이타베이스에 저장된 문자열의 전체 길이가 N일 때 O(N) 시간에 생성 가능하다. 실험 결과 제한된 부분 문자열을 가지고 있음에도 불구하고 긴 부분 문자열의 발생 빈도를 매우 정확하게 예측할 수 있음을 보였다.

  • PDF

An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences (소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석)

  • Kim, Yong-Woo;Kang, Hang-Bong
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.5 no.9
    • /
    • pp.229-236
    • /
    • 2016
  • In the past, crime prediction methods utilized previous records to accurately predict crime occurrences. Yet these crime prediction models had difficulty in updating immense data. To enhance the crime prediction methods, some approaches used social network service (SNS) data in crime prediction studies, but the relationship between SNS data and crime records has not been studied thoroughly. Hence, in this paper, we analyze the relationship between SNS data and criminal occurrences in the perspective of crime prediction. Using Latent Dirichlet Allocation (LDA), we extract tweets that included any words regarding criminal occurrences and analyze the changes in tweet frequency according to the crime records. We then calculate the number of tweets including crime related words and investigate accordingly depending on crime occurrences. Our experimental results demonstrate that there is a difference in crime related tweet occurrences when criminal activity occurs. Moreover, our results show that SNS data analysis will be helpful in crime prediction model as there are certain patterns in tweet occurrences before and after the crime.

Analysis of relationship between frequency of crime occurrence and frequency of web search (범죄 발생 빈도수와 웹 검색 빈도수의 관계 분석 연구)

  • Park, Jung-Min;Park, Koo-Rack;Chung, Young-Suk
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.5
    • /
    • pp.15-20
    • /
    • 2018
  • In modern society, crime is one of the major social problems. Crime has a great impact not only on victims but also on those around them. It is important to predict crimes before they occur and to prevent crime. Various studies have been conducted to predict crime. One of the most important factors in predicting crime is frequency of crime occurrence. The frequency of crime is widely used as basic data for predicting crime. However, the frequency of crime occurrence is announced about 2 years after the statistical processing period. In this paper, we propose a frequency analysis of crime - related key words retrieved from the web as a way to indirectly grasp the frequency of crime occurrence. The relationship between the number of frequency of crime occurrence and frequency of actual crime occurrence was analyzed by correlation coefficient.

An Hourly Extreme Rainfall Outlook Using Climate Information (기상인자를 활용한 시단위 극치강우량 전망)

  • Kim, Yong-Tak;Hong, Min;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.14-14
    • /
    • 2018
  • 세계의 여러 국가에서 과거 발생했던 강수의 통계적 특성에서 벗어나는 극치사상이 빈번하게 관측되고 있다. 이와 같은 현상에 가장 큰 영향을 미치고 있는 요인중 하나는 지구온난화이며 실제 산업화 이후 온실가스의 증가와 더불어 극한 기상현상의 발생 빈도가 증가하였다. 현재 예상치 못한 수문사상의 발생으로 인해 수자원관리에 있어서 많은 어려움을 겪고 있으며, 특히 호우사상은 막대한 인명 및 사회적 피해를 야기하고 있다. 우리나라의 경우 계절적 특징으로 여름철에 강수가 집중되는 양상을 보이고 있으며 따라서 여름철 강수량을 예측하여 호우에 대한 대비책을 마련해야한다. 계절강수 예측은 수문, 산림, 식품, 등을 포함한 사회 경제적 파급 효과가 매우 크지만 아직 신뢰성 있는 예측은 어려운 상태이다. 또한, 발생 강도와 빈도가 큰 극한 강우는 주로 짧은 시간에 걸쳐 발생하기 때문에 예측하기가 어렵다. 최근 다양한 분야의 연구에서 AO, NAO, ENSO, PDO등과 같은 외부적 요인이 수문학적 빈도를 변화시킨다고 알려지고 있어 본 연구에서는 Bayesian 통계기법을 이용한 비정상성 빈도해석모형을 토대로 외부 기상인자에 의한 변동성을 고려할 수 있는 계절강수량 예측모형을 구축한 후 산정된 결과를 입력 자료로 하여 극치강수량을 추정할 수 있는 비정상성 Four - Parameter (4P)-Beta분포를 이용한 알고리즘을 개발하여 직접적으로 일단위 이하의 극치강수량을 상세화 시킬 수 있는 모형으로 확장하여 이를 통해 기상변동성을 다양한 시간규모에서 고려하기 위한 정보로 활용하고자 하였다.

  • PDF

Analysis of Inundation Area in Namgang According to Flood Return Period Using HEC-geoRAS (HEC-geoRAS를 이용한 빈도 별 홍수에 따른 남강 침수면적 분석)

  • Lee, Sun Mi;Kim, Jin Hyuck;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.239-239
    • /
    • 2022
  • 기후변화로 인한 홍수패턴 변화로 인해 침수피해 발생 빈도가 증가하고 있다. 특히 2020년에는 기록적인 장기간 폭우로 인해 댐 하류 지역의 수몰피해가 발생한 바 있다. 예상을 벗어난 이상 홍수 발생 시 댐 방류로 인한 하류 지역 피해예측 및 주민 안전을 위해 침수범위를 예측하고 대응하는 것이 필요하다. 남강댐은 인공방수로 운영을 통해 홍수량을 가화천과 분담하는 운영방식을 이용하고 있으나 댐 직하류에는 진주시가 위치하여 홍수방류에 따른 지역 침수구간을 예측하는 것이 중요하다. 따라서 본 연구에서는 재현기간 별 남강댐 홍수 방류량에 대해 남강댐하류~낙동강 합류부 구간의 홍수위 변화 분석 및 침수면적 계산을 수행했다. HEC-RAS를 이용한 남강 본류 수리해석을 위해 2013년 하천기본계획 단면을 이용하였으며, HEC-geoRAS를 이용한 침수면적 계산을 위해 2020년 수치지형도를 이용했다. HEC-RAS 모의를 위한 상류 경계조건은 남강댐 홍수 방류량을 적용하였으며, 하류 경계조건은 빈도 별 홍수위를 적용한 정상상태 모의를 수행했다. 빈도 별 남강댐 홍수 방류량은 남강댐 상류로 유입되는 빈도 별 홍수량에서 남강댐 저류 가능 홍수량을 제외한 유량을 방류하는 시나리오를 가정하여 결정했다. 50년, 80년, 100년, 200년 빈도 홍수량에 대한 홍수위 모의 결과, 우안 지역은 제방고를 초과하는 홍수위가 발생하지 않은 반면 좌안에서는 농경지를 중심으로 하천범람이 발생했다. 특히 80년 빈도 이상 홍수량에 대해 범람지점이 50년 빈도 홍수량에 비해 2배 이상 증가했다. 또한 침수면적을 계산한 결과, 만곡부와 지류 합류부 주변에서 주로 침수가 발생함을 확인할 수 있었다. 빈도 별 침수면적을 비교해보면 50년 빈도의 침수면적을 기준으로 80년, 100년, 200년 빈도에서 각각 9.4%, 18.7%, 53.1% 증가한 침수면적을 나타냈다.

  • PDF

A method for optimizing lifetime prediction of a storage device using the frequency of occurrence of defects in NAND flash memory (낸드 플래시 메모리의 불량 발생빈도를 이용한 저장장치의 수명 예측 최적화 방법)

  • Lee, Hyun-Seob
    • Journal of Internet of Things and Convergence
    • /
    • v.7 no.4
    • /
    • pp.9-14
    • /
    • 2021
  • In computing systems that require high reliability, the method of predicting the lifetime of a storage device is one of the important factors for system management because it can maximize usability as well as data protection. The life of a solid state drive (SSD) that has recently been used as a storage device in several storage systems is linked to the life of the NAND flash memory that constitutes it. Therefore, in a storage system configured using an SSD, a method of accurately and efficiently predicting the lifespan of a NAND flash memory is required. In this paper, a method for optimizing the lifetime prediction of a flash memory-based storage device using the frequency of NAND flash memory failure is proposed. For this, we design a cost matrix to collect the frequency of defects that occur when processing data in units of Drive Writes Per Day (DWPD). In addition, a method of predicting the remaining cost to the slope where the life-long finish occurs using the Gradient Descent method is proposed. Finally, we proved the excellence of the proposed idea when any defect occurs with simulation.

Drought Frequency Analysis using Monthly Rainfall for Low Flow Management (갈수관리 활용을 위한 월강수량 가뭄빈도분석)

  • Moon, Jang-Won;Kim, Jeong-Yup;Cho, Hyo-Seob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.415-415
    • /
    • 2018
  • 갈수관리를 효과적으로 수행하기 위해서는 하천유량을 예측할 수 있는 방안을 마련하는 것이 중요하다. 하천유량 예측을 위해서는 강수량에 대한 예측 값을 활용하는 방안이 가장 적합하다고 할 수 있으나 강수량 예측에 대한 불확실성은 하천유량 예측의 정확도 확보에 있어 한계로 작용하고 있다. 강수량 예측에 대한 불확실성 극복을 위해서는 다양한 강수 시나리오를 설정하여 활용하는 방안을 검토할 수 있으며, 유량 예측을 하고자 하는 유역에 대해 과거 발생했던 강수량이 반복된다는 가정 하에 유량 예측을 제한적으로 수행하고 있는 상황이다. 이와 함께 강수 시나리오의 다양성 확보 차원에서 하천유량을 예측하고자 하는 유역에 대해 가뭄빈도 강수량을 사전에 산정한 후 유량 예측 과정에 활용하는 방안도 고려해볼 수 있는 방안이다. 이에 본 연구에서는 2016년 수립된 수자원장기종합계획(국토교통부, 2016)에서 제시된 중 권역별 일 강수량 자료를 이용하여 중권역별로 월 강수량을 산정한 후 월별 가뭄빈도분석을 수행하였다. 1966~2015년까지의 기간에 대한 월 강수량 자료를 이용하여 월별로 가뭄빈도분석을 수행하였으며, 빈도분석 방법으로는 확률가중모멘트법을 이용하여 적정 분포형 결정 및 갈수빈도별 강수량을 산정하여 제시하였다. 이때 빈도 강수량의 재현기간은 총 7가지 빈도(2년, 5년, 10년, 20년, 50년, 80년, 100년)를 고려하였다. 산정된 빈도 강수량을 이용하여 월 유출모형에 적용함으로써 월 유출 전망 자료 생산이 가능하며, 금강수계의 용담댐유역에 시범 적용하여 그 결과를 검토하였다. 검토 결과, 중권역별로 산정된 월별 가뭄빈도 강수량을 활용한 하천유량 예측 방법은 갈수예보에 있어 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF

Load Shedding via Predicting the Frequency of Tuple for Efficient Analsis over Data Streams (효율적 데이터 스트림 분석을 위한 발생빈도 예측 기법을 이용한 과부하 처리)

  • Chang, Joong-Hyuk
    • The KIPS Transactions:PartD
    • /
    • v.13D no.6 s.109
    • /
    • pp.755-764
    • /
    • 2006
  • In recent, data streams are generated in various application fields such as a ubiquitous computing and a sensor network, and various algorithms are actively proposed for processing data streams efficiently. They mainly focus on the restriction of their memory usage and minimization of their processing time per data element. However, in the algorithms, if data elements of a data stream are generated in a rapid rate for a time unit, some of the data elements cannot be processed in real time. Therefore, an efficient load shedding technique is required to process data streams effcientlv. For this purpose, a load shedding technique over a data stream is proposed in this paper, which is based on the predicting technique of the frequency of data element considering its current frequency. In the proposed technique, considering the change of the data stream, its threshold for tuple alive is controlled adaptively. It can help to prevent unnecessary load shedding.

Prediction of water level in sewer pipes using machine learning (기계학습을 활용한 하수관로 수위 예측)

  • Heesung Lim;Hyunuk An;Hyojin Lee;Inhyeok Song
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.93-93
    • /
    • 2023
  • 최근 범지구적인 기후변화로 인해 도시유역의 홍수 발생 빈도가 빈번하게 발생하고 있다. 이로 인해 불투수성이 큰 도시지역의 침수 등의 자연재해 증가로 인명 및 재산피해가 발생하고 있다. 이에 따라 하수도의 제 기능을 수행하고 있다면 문제가 없지만 이상기후로 인한 기록적인 폭우에 의해 침수가 발생하고 있다. 홍수 및 집중호우와 같은 극치사상의 발생빈도가 증가됨에 따라 강우 사상의 변동에 따른 하수관로의 수위를 예측하고 침수에 대해 대처하기 위해 과거 수위에 따른 수위 예측은 중요할 것으로 판단된다. 본 연구에서는 수위 예측 연구에 많이 활용되고 있는 시계열 학습에 탁월한 LSTM 알고리즘을 활용한 하수관로 수위 예측을 진행하였다. 데이터의 학습과 검증을 수행하기 위해 실제 하수관로 수위 데이터를 수집하여 연구를 수행하였으며, 대상자료는 서울특별시 강동구에 위치한 하수관로 수위 자료를 활용하였다. 하수관로 수위 예측에는 딥러닝 알고리즘 RNN-LSTM 알고리즘을 활용하였으며, RNN-LSTM 알고리즘은 하천의 수위 예측에 우수한 성능을 보여준 바 있다. 1분 뒤 하수관로 수위 예측보다 5분, 10분 뒤 또는 1시간 3시간 등 다양한 분석을 실시하였다. 데이터 분석을 위해 하수관로 수위값 변동이 심한 1주일을 선정하여 분석을 실시하였다. 연구에는 Google에서 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하였으며, 하수관로 수위 고유번호 25-0001을 대상으로 예측을 하였다. 학습에는 2012년 ~ 2018년의 하수관로 수위 자료를 활용하였으며, 모형의 검증을 위해 결정계수(R square)를 이용하여 통계분석을 실시하였다.

  • PDF

Computer virus occurrence frequency Predictive modeling using Markov chains (마코프 체인을 이용한 컴퓨터 바이러스 발생 빈도수 예측 모델링)

  • Chung, Young-Suk;Park, Koo-Rack;Ahn, Woo-Young
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.01a
    • /
    • pp.119-121
    • /
    • 2013
  • 최초의 컴퓨터 바이러스인 브레인 바이러스가 만들어진 이후로, 현재까지 컴퓨터 바이러스로 인한 피해는 늘어나고 있다. 이에 따라 컴퓨터 바이러스를 막기 위한 여러 가지 노력이 현재도 진행 중에 있다. 컴퓨터 바이러스로 인한 피해 방지와 예방을 위한 대책을 수립하기 위해서는 컴퓨터 바이러스의 발생 빈도수를 예측 하는 것이 필요하다. 본 논문은 다양한 예측 연구에 활용되고 있는 마코프 체인을 적용하였다. 본 논문은 마코프 체인을 적용하여 컴퓨터 바이러스 빈도수를 예측하는 모델링을 제안한다.

  • PDF