• 제목/요약/키워드: 발생빈도 예측

검색결과 672건 처리시간 0.037초

과학 데이타베이스에서 부분 문자열의 발생 빈도 예측 (Frequency Estimation of Substring for Scientific Database)

  • 배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.536-538
    • /
    • 2003
  • 대량의 짧은 문자열들에 대해 부분 문자열의 발생 빈도를 예측하는 문제는 카운트 서픽스 트리를 미리 생성한 후 이를 이용함으로써 처리될 수 있다. 카운트 서픽스 트리는 모든 부분 문자열의 발생 빈도를 저장한 뒤 가지치기를 함으로써, 제한된 트리 크기와 발생 빈도 예측이라는 두 가지 목표를 처리한다. 하지만, 염기서열에서 처럼 저장된 문자열의 길이가 길어질 경우 카운트 서픽스 트리를 생성하기가 대단히 어려워진다는 문제점이 발생한다. 이 논문에서는 선삽입, 후가지치기 방식의 카운트 서픽스 트리 대신 처음부터 길이가 q 이하인 문자열들만을 삽입하는 큐그램 트리를 제안한다. 큐그램 트리는 제한된 트리 크기에 따라 저장할 부분 문자열의 크기를 미리 결정할 수 있으며, 데이타베이스에 저장된 문자열의 전체 길이가 N일 때 O(N) 시간에 생성 가능하다. 실험 결과 제한된 부분 문자열을 가지고 있음에도 불구하고 긴 부분 문자열의 발생 빈도를 매우 정확하게 예측할 수 있음을 보였다.

  • PDF

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

범죄 발생 빈도수와 웹 검색 빈도수의 관계 분석 연구 (Analysis of relationship between frequency of crime occurrence and frequency of web search)

  • 박정민;박구락;정영석
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.15-20
    • /
    • 2018
  • 현대사회에서 범죄는 큰 사회문제 중의 하나이다. 범죄는 피해자뿐만 아니라 피해자 주변인들에게도 큰 영향을 미친다. 범죄는 발생하기 전에 예측하여 범죄 발생을 막는 것이 중요하다. 범죄를 예측하기 위한 다양한 연구가 진행되었다. 범죄 예측에 중요한 요소 중에 하나가 범죄 발생 빈도수 이다. 범죄 발생 빈도수는 범죄를 예측하는 분야의 기본 데이터로 많이 사용되고 있다. 그러나 범죄 발생 빈도수는 통계처리기간을 거쳐 약 2년 뒤에 발표된다. 본 논문은 범죄 발생 빈도수를 간접적으로 파악할 수 있는 방법으로 웹에서 검색되는 범죄 관련 키워드의 빈도수 분석을 제안한다. 범죄 발생 빈도수의 키워드와 실제 범죄 발생빈도수의 관계를 상관 계수로 분석하여 관련이 있음을 확인하였다.

기상인자를 활용한 시단위 극치강우량 전망 (An Hourly Extreme Rainfall Outlook Using Climate Information)

  • 김용탁;홍민;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2018
  • 세계의 여러 국가에서 과거 발생했던 강수의 통계적 특성에서 벗어나는 극치사상이 빈번하게 관측되고 있다. 이와 같은 현상에 가장 큰 영향을 미치고 있는 요인중 하나는 지구온난화이며 실제 산업화 이후 온실가스의 증가와 더불어 극한 기상현상의 발생 빈도가 증가하였다. 현재 예상치 못한 수문사상의 발생으로 인해 수자원관리에 있어서 많은 어려움을 겪고 있으며, 특히 호우사상은 막대한 인명 및 사회적 피해를 야기하고 있다. 우리나라의 경우 계절적 특징으로 여름철에 강수가 집중되는 양상을 보이고 있으며 따라서 여름철 강수량을 예측하여 호우에 대한 대비책을 마련해야한다. 계절강수 예측은 수문, 산림, 식품, 등을 포함한 사회 경제적 파급 효과가 매우 크지만 아직 신뢰성 있는 예측은 어려운 상태이다. 또한, 발생 강도와 빈도가 큰 극한 강우는 주로 짧은 시간에 걸쳐 발생하기 때문에 예측하기가 어렵다. 최근 다양한 분야의 연구에서 AO, NAO, ENSO, PDO등과 같은 외부적 요인이 수문학적 빈도를 변화시킨다고 알려지고 있어 본 연구에서는 Bayesian 통계기법을 이용한 비정상성 빈도해석모형을 토대로 외부 기상인자에 의한 변동성을 고려할 수 있는 계절강수량 예측모형을 구축한 후 산정된 결과를 입력 자료로 하여 극치강수량을 추정할 수 있는 비정상성 Four - Parameter (4P)-Beta분포를 이용한 알고리즘을 개발하여 직접적으로 일단위 이하의 극치강수량을 상세화 시킬 수 있는 모형으로 확장하여 이를 통해 기상변동성을 다양한 시간규모에서 고려하기 위한 정보로 활용하고자 하였다.

  • PDF

HEC-geoRAS를 이용한 빈도 별 홍수에 따른 남강 침수면적 분석 (Analysis of Inundation Area in Namgang According to Flood Return Period Using HEC-geoRAS)

  • 이선미;김진혁;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.239-239
    • /
    • 2022
  • 기후변화로 인한 홍수패턴 변화로 인해 침수피해 발생 빈도가 증가하고 있다. 특히 2020년에는 기록적인 장기간 폭우로 인해 댐 하류 지역의 수몰피해가 발생한 바 있다. 예상을 벗어난 이상 홍수 발생 시 댐 방류로 인한 하류 지역 피해예측 및 주민 안전을 위해 침수범위를 예측하고 대응하는 것이 필요하다. 남강댐은 인공방수로 운영을 통해 홍수량을 가화천과 분담하는 운영방식을 이용하고 있으나 댐 직하류에는 진주시가 위치하여 홍수방류에 따른 지역 침수구간을 예측하는 것이 중요하다. 따라서 본 연구에서는 재현기간 별 남강댐 홍수 방류량에 대해 남강댐하류~낙동강 합류부 구간의 홍수위 변화 분석 및 침수면적 계산을 수행했다. HEC-RAS를 이용한 남강 본류 수리해석을 위해 2013년 하천기본계획 단면을 이용하였으며, HEC-geoRAS를 이용한 침수면적 계산을 위해 2020년 수치지형도를 이용했다. HEC-RAS 모의를 위한 상류 경계조건은 남강댐 홍수 방류량을 적용하였으며, 하류 경계조건은 빈도 별 홍수위를 적용한 정상상태 모의를 수행했다. 빈도 별 남강댐 홍수 방류량은 남강댐 상류로 유입되는 빈도 별 홍수량에서 남강댐 저류 가능 홍수량을 제외한 유량을 방류하는 시나리오를 가정하여 결정했다. 50년, 80년, 100년, 200년 빈도 홍수량에 대한 홍수위 모의 결과, 우안 지역은 제방고를 초과하는 홍수위가 발생하지 않은 반면 좌안에서는 농경지를 중심으로 하천범람이 발생했다. 특히 80년 빈도 이상 홍수량에 대해 범람지점이 50년 빈도 홍수량에 비해 2배 이상 증가했다. 또한 침수면적을 계산한 결과, 만곡부와 지류 합류부 주변에서 주로 침수가 발생함을 확인할 수 있었다. 빈도 별 침수면적을 비교해보면 50년 빈도의 침수면적을 기준으로 80년, 100년, 200년 빈도에서 각각 9.4%, 18.7%, 53.1% 증가한 침수면적을 나타냈다.

  • PDF

낸드 플래시 메모리의 불량 발생빈도를 이용한 저장장치의 수명 예측 최적화 방법 (A method for optimizing lifetime prediction of a storage device using the frequency of occurrence of defects in NAND flash memory)

  • 이현섭
    • 사물인터넷융복합논문지
    • /
    • 제7권4호
    • /
    • pp.9-14
    • /
    • 2021
  • 고신뢰성을 요구하는 컴퓨팅 시스템에서 저장장치의 수명예측방법은 데이터 보호뿐만 아니라 활용성을 극대화 할 수 있기 때문에 시스템 관리하기 위한 중요한 요소 중 한 가지이다. 최근 여러 저장시스템에서 저장장치로 사용되고 있는 SSD(Solid State Drive)의 수명은 이를 구성하고 있는 낸드 플래시 메모리의 수명이 실질적인 수명과 연결된다. 따라서 SSD를 이용하여 구성한 저장시스템에서는 낸드 플래시 메모리의 수명을 정확하고 효율적으로 예측하는 방법이 필요하다. 본 논문에서는 낸드 플래시 메모리 불량 발생빈도를 이용하여 플래시 메모리 기반 저장장치의 수명 예측을 최적화할수 있는 방법을 제안한다. 이를 위해 DWPD(Drive Writes Per Day) 단위로 데이터를 처리할 때 발생하는 불량 발생빈도를 수집하기 위한 비용 매트릭스(Cost Metrix)를 설계한다. 그리고 경사하강법(Gradient Descent)을 이용하여 수명의 마감이 발생하는 경사도까지 남은 비용을 예측하는 방법을 제안한다. 마지막으로 시뮬레이션을 통해 임의의 불량이 발생했을 때 제안하는 방법을 통한 수명예측의 우수성을 증명했다.

갈수관리 활용을 위한 월강수량 가뭄빈도분석 (Drought Frequency Analysis using Monthly Rainfall for Low Flow Management)

  • 문장원;김정엽;조효섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.415-415
    • /
    • 2018
  • 갈수관리를 효과적으로 수행하기 위해서는 하천유량을 예측할 수 있는 방안을 마련하는 것이 중요하다. 하천유량 예측을 위해서는 강수량에 대한 예측 값을 활용하는 방안이 가장 적합하다고 할 수 있으나 강수량 예측에 대한 불확실성은 하천유량 예측의 정확도 확보에 있어 한계로 작용하고 있다. 강수량 예측에 대한 불확실성 극복을 위해서는 다양한 강수 시나리오를 설정하여 활용하는 방안을 검토할 수 있으며, 유량 예측을 하고자 하는 유역에 대해 과거 발생했던 강수량이 반복된다는 가정 하에 유량 예측을 제한적으로 수행하고 있는 상황이다. 이와 함께 강수 시나리오의 다양성 확보 차원에서 하천유량을 예측하고자 하는 유역에 대해 가뭄빈도 강수량을 사전에 산정한 후 유량 예측 과정에 활용하는 방안도 고려해볼 수 있는 방안이다. 이에 본 연구에서는 2016년 수립된 수자원장기종합계획(국토교통부, 2016)에서 제시된 중 권역별 일 강수량 자료를 이용하여 중권역별로 월 강수량을 산정한 후 월별 가뭄빈도분석을 수행하였다. 1966~2015년까지의 기간에 대한 월 강수량 자료를 이용하여 월별로 가뭄빈도분석을 수행하였으며, 빈도분석 방법으로는 확률가중모멘트법을 이용하여 적정 분포형 결정 및 갈수빈도별 강수량을 산정하여 제시하였다. 이때 빈도 강수량의 재현기간은 총 7가지 빈도(2년, 5년, 10년, 20년, 50년, 80년, 100년)를 고려하였다. 산정된 빈도 강수량을 이용하여 월 유출모형에 적용함으로써 월 유출 전망 자료 생산이 가능하며, 금강수계의 용담댐유역에 시범 적용하여 그 결과를 검토하였다. 검토 결과, 중권역별로 산정된 월별 가뭄빈도 강수량을 활용한 하천유량 예측 방법은 갈수예보에 있어 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF

효율적 데이터 스트림 분석을 위한 발생빈도 예측 기법을 이용한 과부하 처리 (Load Shedding via Predicting the Frequency of Tuple for Efficient Analsis over Data Streams)

  • 장중혁
    • 정보처리학회논문지D
    • /
    • 제13D권6호
    • /
    • pp.755-764
    • /
    • 2006
  • 근래 들어 유비쿼터스 컴퓨팅 및 센서 네트워크 환경 등과 같은 다양한 응용 분야에서 데이터 스트림 형태의 정보를 발생시키고 있으며, 이들 정보를 효율적으로 처리하기 위한 다양한 방법들이 활발히 제안되어 왔다. 대부분의 이들 방법들은 주로 처리 과정에서의 공간 사용량 및 데이터당 처리 시간을 줄이는데 초점을 맞추고 있다. 하지만 이들 방법들에서 데이터 발생량이 급격히 증가되는 경우 일부 데이터는 실시간으로 처리되지 못하며 해당 방법의 성능 저하를 초래한다. 따라서, 데이터 스트림 처리의 효율성을 높이기 위해서는 효율적인 과부하 처리 기법을 필요로 한다. 이를 위해서 본 논문에서는 발생빈도 예측법을 이용한 과부하 처리 기법을 제안한다. 즉, 해당 기법에서는 처리 대상 데이터의 현재 시점까지의 발생빈도를 고려하여 해당 데이터의 향후 발생 상황을 예측하며, 이를 통해서 해당 데이터 스트림에서 과부하가 발생했을 때 효율적으로 대처할 수 있도록 지원한다. 또한, 제안되는 방법에서는 데이터 스트림의 변화를 고려하여 튜플 선별을 위한 임계값을 적응적으로 조절함으로써 불필요한 과부하 처리 수행을 최소화한다.

기계학습을 활용한 하수관로 수위 예측 (Prediction of water level in sewer pipes using machine learning)

  • 임희성;안현욱;이효진;송인혁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.93-93
    • /
    • 2023
  • 최근 범지구적인 기후변화로 인해 도시유역의 홍수 발생 빈도가 빈번하게 발생하고 있다. 이로 인해 불투수성이 큰 도시지역의 침수 등의 자연재해 증가로 인명 및 재산피해가 발생하고 있다. 이에 따라 하수도의 제 기능을 수행하고 있다면 문제가 없지만 이상기후로 인한 기록적인 폭우에 의해 침수가 발생하고 있다. 홍수 및 집중호우와 같은 극치사상의 발생빈도가 증가됨에 따라 강우 사상의 변동에 따른 하수관로의 수위를 예측하고 침수에 대해 대처하기 위해 과거 수위에 따른 수위 예측은 중요할 것으로 판단된다. 본 연구에서는 수위 예측 연구에 많이 활용되고 있는 시계열 학습에 탁월한 LSTM 알고리즘을 활용한 하수관로 수위 예측을 진행하였다. 데이터의 학습과 검증을 수행하기 위해 실제 하수관로 수위 데이터를 수집하여 연구를 수행하였으며, 대상자료는 서울특별시 강동구에 위치한 하수관로 수위 자료를 활용하였다. 하수관로 수위 예측에는 딥러닝 알고리즘 RNN-LSTM 알고리즘을 활용하였으며, RNN-LSTM 알고리즘은 하천의 수위 예측에 우수한 성능을 보여준 바 있다. 1분 뒤 하수관로 수위 예측보다 5분, 10분 뒤 또는 1시간 3시간 등 다양한 분석을 실시하였다. 데이터 분석을 위해 하수관로 수위값 변동이 심한 1주일을 선정하여 분석을 실시하였다. 연구에는 Google에서 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하였으며, 하수관로 수위 고유번호 25-0001을 대상으로 예측을 하였다. 학습에는 2012년 ~ 2018년의 하수관로 수위 자료를 활용하였으며, 모형의 검증을 위해 결정계수(R square)를 이용하여 통계분석을 실시하였다.

  • PDF

마코프 체인을 이용한 컴퓨터 바이러스 발생 빈도수 예측 모델링 (Computer virus occurrence frequency Predictive modeling using Markov chains)

  • 정영석;박구락;안우영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.119-121
    • /
    • 2013
  • 최초의 컴퓨터 바이러스인 브레인 바이러스가 만들어진 이후로, 현재까지 컴퓨터 바이러스로 인한 피해는 늘어나고 있다. 이에 따라 컴퓨터 바이러스를 막기 위한 여러 가지 노력이 현재도 진행 중에 있다. 컴퓨터 바이러스로 인한 피해 방지와 예방을 위한 대책을 수립하기 위해서는 컴퓨터 바이러스의 발생 빈도수를 예측 하는 것이 필요하다. 본 논문은 다양한 예측 연구에 활용되고 있는 마코프 체인을 적용하였다. 본 논문은 마코프 체인을 적용하여 컴퓨터 바이러스 빈도수를 예측하는 모델링을 제안한다.

  • PDF