• 제목/요약/키워드: temporal mining

검색결과 119건 처리시간 0.032초

천변저류지 조성에 따른 토평천 유역의 저류량 분석 (A Study on Storage Analysis of Topyeong Stream Watershed by Washland Construction)

  • 김재철;유재정;김상단
    • 한국습지학회지
    • /
    • 제10권2호
    • /
    • pp.39-51
    • /
    • 2008
  • 최근 하수처리, 홍수조절, 광산침출수, 농업유출수 등의 처리에 습지를 이용하려는 시도가 증가하고 있다. 하지만 장기모니터링의 어려움으로 인해 습지에 대한 장기간의 자료들이 부족하여 습지의 올바른 이용이 어려운 실정이다. 이에 본 연구에서는 장기간의 자료 생성을 목적으로 한 수문분석의 일환으로 장기유출 수문모형인 SWAT(Soil and Water Assessment Tool)모형을 이용하여 토평천 유역의 우포, 목포, 사지포, 쪽지벌에 대한 저류량을 모의하였다. 이를 바탕으로 토평천 유역에 천변저류지를 조성하는 가상 시나리오를 작성하여 조성된 천변저류지의 저류량 거동을 분석하였다. 천변저류지의 조성에 따른 우포늪의 저류량 변화를 분석한 결과 천변저류지 조성에 따라 우포늪도 일정 정도의 영향을 받을 수 있음이 파악되었다.

  • PDF

3차원 유전자 발현 데이터에서의 시간 관계 규칙을 이용한 유전자 상호작용 조절 네트워크 구축 (Constructing Gene Regulatory Networks using Temporal Relation Rules from 3-Dimensional Gene Expression Data)

  • ;박진형;이헌규;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.340-343
    • /
    • 2008
  • 유전자들은 복잡한 상호작용을 통해 세포의 기능이 조절된다. 상호작용하는 유전자 그룹들을 유전자 조절 네트워크라고 한다. 기존의 유전자 조절 네트워크는 2D microarray 데이터를 이용하여 시간의 흐름에 따른 유전자간의 상호작용을 알 수가 없었다. 이 논문에서는 시간의 변화에 따른 유전자들 간의 조절관계를 살펴 볼 수 있는 조절네트워크 모델링의 방법을 제시한다. 유전자의 발현양을 표시하기 위해 이진 이산화 방법을 사용하였고 3D microarray 데이터에서 유전자 발현 패턴을 찾기 위해 Cube mining 알고리즘을 적용하였고, 유전자간의 관계를 밝히기 위해 시간 관계 규칙탐사 기법을 사용하여 유전자들 간의 시간 관계를 포함한 유전자 조절네트워크를 구축하였다. 이 연구는 시간의 흐름에 따른 유전자간의 상호작용을 알 수 있으며, 모델링된 조절 네트워크를 이용하여 기능이 아직 발견되지 않은 유전자들의 기능을 예측 할 수 있다.

공간적 의사결정을 위한 공간 데이터 웨어하우스 설계 및 활용 (A Design and Practical Use of Spatial Data Warehouse for Spatiall Decision Making)

  • 박지만;황철수
    • Spatial Information Research
    • /
    • 제13권3호
    • /
    • pp.239-252
    • /
    • 2005
  • 본 연구는 대용량의 공간자료에서 의미 있는 지식을 탐색 및 발견하고, 인터넷 환경에서 공간적 의사결정과정을 지원하기 위한 방안을 설계하였다. 그리고 설계를 기반으로 실험적 원형 시스템(Pilot Tested System)을 구현하여 의사결정자와 분석가 사이에서 특정주제에 적합한 다차원적 분석을 위해 양방향 통신이 가능하도록 공간 데이터 웨어하우스의 눈송이 스키마모델(snowflake schema model)을 활용하였다. 눈송이 스키마는 공간자료와 연계할 경우 기존 스타 스키마모델(star schema model)보다 확장성과 유연성이 뛰어난 분석중심의 설계방안이다. 또한 눈송이 스키마모델의 평가를 위해 백화점 거래사례를 통해 실험적 시스템을 구현하여 평가하였다. 이 시스템의 목적은 목표마케팅 지역설정이며, 의사결정자와 분석가의 양방향통신이 가능한 인터넷상담시스템이다.

  • PDF

변경 집합을 이용한 XML 문서의 버전 관리를 위한 저장 기법 (Storage Policies for Versions Management of XML Documents using a Change Set)

  • 윤홍원
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1349-1356
    • /
    • 2004
  • 데이터 마이닝을 요구하는 전자상거래, 전자정부와 관련된 문서 처리 시스템 등에서 XML 문서의 버전 관리에 대한 관심이 높아지고 있다. 본 논문에서는 대량의 XML 문서를 장기적으로 유지하면서 XML 문서의 이력 정보를 효율적으로 관리하기 위하여, XML 버전을 생성하는 변경 집합을 정의하고 변경 집합을 이용한 XML 문서의 저장 방법을 제안한다. 변경 집합은 변경 연산집합과 시간지원 차원을 포함하고 있으며, 변경 연산 집합은 스키마 변경 연산과 데이터 변경 연산으로 구성된다. 변경 집합을 이용한 세가지 XML 문서의 저장 방법을 제안한다. 세가지 저장 방법은, (1) 변경 집합을 모두 저장하는 방법, (2)변경 집합과 버전을 주기적으로 저장 방법, 그리고 (3) 저장 적합 시점에 변경 집합 모음과 버전을 저장하는 방법이 있다. 또한, 기존의 저장 방법과 제안한 저장 방법들 사이에 성능을 비교한다. 성능 평가를 통하여 저장 적합 시점에 변경 집합모음과 버전을 저장하는 방법의 성능이 다른 저장 방법보다 우수함을 보인다.

Design of Query Processing System to Retrieve Information from Social Network using NLP

  • Virmani, Charu;Juneja, Dimple;Pillai, Anuradha
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권3호
    • /
    • pp.1168-1188
    • /
    • 2018
  • Social Network Aggregators are used to maintain and manage manifold accounts over multiple online social networks. Displaying the Activity feed for each social network on a common dashboard has been the status quo of social aggregators for long, however retrieving the desired data from various social networks is a major concern. A user inputs the query desiring the specific outcome from the social networks. Since the intention of the query is solely known by user, therefore the output of the query may not be as per user's expectation unless the system considers 'user-centric' factors. Moreover, the quality of solution depends on these user-centric factors, the user inclination and the nature of the network as well. Thus, there is a need for a system that understands the user's intent serving structured objects. Further, choosing the best execution and optimal ranking functions is also a high priority concern. The current work finds motivation from the above requirements and thus proposes the design of a query processing system to retrieve information from social network that extracts user's intent from various social networks. For further improvements in the research the machine learning techniques are incorporated such as Latent Dirichlet Algorithm (LDA) and Ranking Algorithm to improve the query results and fetch the information using data mining techniques.The proposed framework uniquely contributes a user-centric query retrieval model based on natural language and it is worth mentioning that the proposed framework is efficient when compared on temporal metrics. The proposed Query Processing System to Retrieve Information from Social Network (QPSSN) will increase the discoverability of the user, helps the businesses to collaboratively execute promotions, determine new networks and people. It is an innovative approach to investigate the new aspects of social network. The proposed model offers a significant breakthrough scoring up to precision and recall respectively.

실시간 추천을 위한 분할셋 기반 Up-to-Moment 선호모델 탐색 (Mining the Up-to-Moment Preference Model based on Partitioned Datasets for Real Time Recommendation)

  • 한정혜;변루나
    • 인터넷정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.105-115
    • /
    • 2007
  • 최근 들어 유비퀴터스 컴퓨팅에 대한 많은 연구들이 활발히 시작되고 있는데, 특히 모바일을 활용한 실시간 추천 모델에 대한 요구는 점차 커지고 있다. 본 연구에서는 기존 대용량 데이터베이스에서 실시간 추천을 위하여 Up-To-Moment 연관규칙 탐색 알고리즘이 있는데, 보다 더 정교하게 과거의 거래 세부정보까지 고려할 수 있도록 UP-To-Moment 데이터 셋의 과거 데이터 셋 부분을 (k-1)개로 분할-조합규칙을 적용하는 연관규칙 선호모델을 제안하였다. 제안된 모델은 전자상점 뿐만 아니라 유비퀴터스 컴퓨팅에 적용 가능한 레스토랑 음식 추천 데이터에 대하여, 전통적인 Up-To-Moment 연관규칙 탐색모델 $EM_{past'}$ 데이터 셋 크기값을 가중 조합한 $EM^w_{past'}$ 그리고 시간에 따른 지수평활법 분할-조합규칙을 적용한 $EM^{ES}_{past}$을 비교하여 보았다. 특히 $EM^{ES}_{past}$의 지수평활 상수 a 값의 변화에 따른 세 알고리즘의 연관규칙 계산에 대한 민감도도 비교함으로써, 실제 데이터 적용 시에 보수적 또는 진보적 실시간 추천의 선택이 가능하도록 하였다. 세 알고리즘의 비교 시뮬레이션 결과를 보면, 데이터 셋 크기 값을 가중 조합한 $EM^w_{past}$이 가장 효율이 떨어지는 것으로 나타났으며, 누적된 과거 데이터 셋의 크기가 클수록 $EM^{ES}_{past}$의 정확성이 높은 추천을 하는 것으로 나타났다.

  • PDF

Using Artificial Neural Networks for Forecasting Algae Counts in a Surface Water System

  • Coppola, Emery A. Jr.;Jacinto, Adorable B.;Atherholt, Tom;Poulton, Mary;Pasquarello, Linda;Szidarvoszky, Ferenc;Lohbauer, Scott
    • 생태와환경
    • /
    • 제46권1호
    • /
    • pp.1-9
    • /
    • 2013
  • Algal blooms in potable water supplies are becoming an increasingly prevalent and serious water quality problem around the world. In addition to precipitating taste and odor problems, blooms damage the environment, and some classes like cyanobacteria (blue-green algae) release toxins that can threaten human health, even causing death. There is a recognized need in the water industry for models that can accurately forecast in real-time algal bloom events for planning and mitigation purposes. In this study, using data for an interconnected system of rivers and reservoirs operated by a New Jersey water utility, various ANN models, including both discrete prediction and classification models, were developed and tested for forecasting counts of three different algal classes for one-week and two-weeks ahead periods. Predictor model inputs included physical, meteorological, chemical, and biological variables, and two different temporal schemes for processing inputs relative to the prediction event were used. Despite relatively limited historical data, the discrete prediction ANN models generally performed well during validation, achieving relatively high correlation coefficients, and often predicting the formation and dissipation of high algae count periods. The ANN classification models also performed well, with average classification percentages averaging 94 percent accuracy. Despite relatively limited data events, this study demonstrates that with adequate data collection, both in terms of the number of historical events and availability of important predictor variables, ANNs can provide accurate real-time forecasts of algal population counts, as well as foster increased understanding of important cause and effect relationships, which can be used to both improve monitoring programs and forecasting efforts.

유비쿼터스 홈 네트워크 시스템에서 은닉 마르코프 모델을 이용한 사용자 행동 상태 분석 및 예측 알고리즘 (Analysis and Prediction Algorithms on the State of User's Action Using the Hidden Markov Model in a Ubiquitous Home Network System)

  • 신동규;신동일;황구연;최진욱
    • 인터넷정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.9-17
    • /
    • 2011
  • 본 논문은 유비쿼터스 홈 네트워크 시스템에서 저장된 사용자 행동 프로파일 데이터에 은닉 마르코프 모델에 적용하여 사용자의 행동 상태를 예측하는 알고리즘을 제안한다. 은닉 마르코프 모델은, 순차 데이터를 갖는 패턴을 인식하기 위해서 데이터에 내포되어 있는 시간성을 적절히 표현하고, 그것으로부터 원하는 정보를 추론할 수 있는 대표적인 모델이다. 제안 알고리즘에서는 "행동 인지 시스템(Activity Recognition System)"에 의하여 저장된 행동 발생 횟수, 행동 지속시간, 행동이 발생된 위치 데이터를 학습 데이터로 이용하였다. 사용자의 행동에 가중치를 부여하여 사용자의 행동에 대한 흥미를 객관적으로 수식화 하는 방법을 제안하였으며 은닉 마르코프 모델을 이용하여 시간에 따른 가중치 변화를 구하여 사용자의 행동 상태 변화를 예측하였다. 제안 알고리즘은 현실적인 유비쿼터스 홈 네트워크 구축에 도움을 준다.

유사도와 유클리디안 계산패턴을 이용한 CBR 패턴연구 (A Study on the CBR Pattern using Similarity and the Euclidean Calculation Pattern)

  • 윤종찬;김학철;김종진;윤성대
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.875-885
    • /
    • 2010
  • 사례기반추론(CBR:Case-Based Reasoning)은 기존 데이터와 사례 데이터들의 관계성을 추론하는 기법으로 유사도(Similarity)와 유클리디안(Euclidean) 거리 계산 방법이 가장 많이 사용되고 있다. 그러나 이 방법들은 기존 데이터와 사례 데이터를 모두 비교하기 때문에 데이터 검색과 필터링에 많은 시간이 소요되는 단점이 있다. 따라서 이를 해결하기 위한 다양한 연구들이 진행되고 있다. 본 논문에서는 기존의 유사도와 유클리디안 계산과정에서 발견된 패턴을 활용한 SE(Speed Euclidean-distance) 계산방법을 제안한다. SE 계산방법은 새로운 사례입력에 발견된 패턴과 가중치를 적용하여 빠른 데이터 추출과 수행시간 단축으로 시간적 공간적 제약사항에 대한 연산 속도를 향상시키고 불필요한 연산 수행을 배제하는 것이다. 실험을 통해 유사도나 유클리디안 방법으로 데이터를 추출하는 기존의 방법보다 제안하는 방법이 다양한 컴퓨터 환경과 처리 속도에서 성능이 향상됨을 확인할 수 있었다.

Kriging Analysis for Spatio-temporal Variations of Ground Level Ozone Concentration

  • Gorai, Amit Kumar;Jain, Kumar Gourav;Shaw, Neha;Tuluri, Francis;Tchounwou, Paul B.
    • Asian Journal of Atmospheric Environment
    • /
    • 제9권4호
    • /
    • pp.247-258
    • /
    • 2015
  • Exposure of high concentration of ground-level ozone (GLO) can trigger a variety of health problems including chest pain, coughing, throat irritation, asthma, bronchitis and congestion. There are substantial human and animal toxicological data that support health effects associated with exposure to ozone and associations have been observed with a wide range of outcomes in epidemiological studies. The aim of the present study is to estimate the spatial distributions of GLO using geostatistical method (ordinary kriging) for assessing the exposure level of ozone in the eastern part of Texas, U.S.A. GLO data were obtained from 63 U.S. EPA's monitoring stations distributed in the region of study during the period January, 2012 to December, 2012. The descriptive statistics indicate that the spatial monthly mean of daily maximum 8 hour ozone concentrations ranged from 30.33 ppb (in January) to 48.05 (in June). The monthly mean of daily maximum 8 hour ozone concentrations was relatively low during the winter months (December, January, and February) and the higher values observed during the summer months (April, May, and June). The higher level of spatial variations observed in the months of July (Standard Deviation: 10.33) and August (Standard Deviation: 10.02). This indicates the existence of regional variations in climatic conditions in the study area. The range of the semivariogram models varied from 0.372 (in November) to 15.59 (in April). The value of the range represents the spatial patterns of ozone concentrations. Kriging maps revealed that the spatial patterns of ozone concentration were not uniform in each month. This may be due to uneven fluctuation in the local climatic conditions from one region to another. Thus, the formation and dispersion processes of ozone also change unevenly from one region to another. The ozone maps clearly indicate that the concentration values found maximum in the north-east region of the study area in most of the months. Part of the coastal area also showed maximum concentrations during the months of October, November, December, and January.