• Title/Summary/Keyword: 예측인자

Search Result 2,387, Processing Time 0.035 seconds

Prediction of transcription factor binding sites by extracting common sequences (공통서열 추출을 통한 전사인자 결합부위 예측)

  • 임명은;심정섭;정명근;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.820-822
    • /
    • 2003
  • 접미사 배열이나 접미사 트리는 대용량의 서열데이터를 효율적으로 검색, 저장할 수 있는 인덱스 자료구조로서 바이오인포매틱스와 같이 대용량 데이터의 처리. 분석이 필요한 분야에 이용될 수 있다. 최근 들어 접미사 배열에 대한 연구가 활발히 진행되어 접미사 배열의 효율적인 저장, 선형시간 생성 및 선형시간 탐색 알고리즘들이 개발되었다. 본 논문에서는 같은 전사인자가 결합할 것으로 예상되는 여러 개의 전사조절부위에 대한 DNA 서열들이 입력으로 주어졌을 때 전사인자가 결합하는 부위를 예측하는 방법을 제시한다. 이를 위해 최근에 제시된 선형시간 접미사 배열 생성 알고리즘을 이용하고 TRANSFAC과 EMBL 등의 DB를 이용하여 실험을 통해 본 논문에서 제시하는 방법의 정확도를 평가한다.

  • PDF

Uncertainty of the operational models in the Nakdong River mouth (낙동강 하구 환경변화 예측모형의 불확실성)

  • Cho, Hong Yeon;Lee, Gi Seop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.4-4
    • /
    • 2022
  • 낙동강 하구 환경/생태 복원을 위하여 "해수유입"으로 하구환경을 조성하는 사업이 추진되고 있으며, 해수 유입 규모와 빈도에 따른 생태환경변화를 예측하는 연구수요가 증가하고 있는 상황이다. 보다 구체적으로는 단기간의 해수유입에 의한 흐름 및 염분 확산범위 예측과 더불어 보다 장기간의 지형변화, 수질환경 변화, 생태환경 변화 등에 대한 예측이 필요한 상황이다. 그리고 그 예측의 대부분을 수치모델에 크게 의존하고 있는 상황이다. 그러나, 수치모형을 이용한 단기 예측은 가까운 미래에 대한 입력조건을 사용하여야 하기 때문에 입력조건에 대한 불확실성이 포함되고, 환경생태모형의 불확실성에 따른 예측 한계 등으로 인하여 오차가 누적되기 때문에 직접적인 활용에 크게 제한이 따를 수 있다. 또한 운영과정에서 어떤 분산, 편향 오차 등이 지속적으로 발생하는 경우, 모델 예측 결과에 대한 신뢰수준이 크게 감소하기 때문에 모델의 적절한 운영기법이 요구된다. 모델은 관심을 가지는 자연현상에 대한 근사(approximation)이고, 예상하지 못한 오차가 발생할 수 있기 때문에 관측 자료를 이용한 자료동화(data assimilation) 과정이 운영모델에서는 필수적인 부분이다. 이론적인 기반이 탄탄한 유체역학 기반 기상예측의 경우에도, 가용한 모든 지점의 관측 자료를 이용한 자료 동화과정을 통하여 모델 예측 결과를 개선하여 나가는 과정을 포함하여 운영하고 있다. 이 과정이 포함하는 중요한 개념은 수치모델이 가지고 있는 (예측 수준의) 한계를 인정하고, 수치모델에 전적으로 의존하는 것이 아니라 관측 자료를 이용하여 그 한계를 저감하여 나가는 과정이다. 모니터링은 모델의 한계를 알려주는 지표이다. 모델링과 모니터링의 불가피한 상호의존 관계를 의미하는 이 개념은 단기간의 흐름, 염분 확산 예측으로 한정되지 않고, 장기적인 변화가 예상되는 생태환경변화 모델에도 적용이 된다. 즉각적인 변화보다는 장기적인 관점에서 파악하여야 하는 생태학적인 변화는 보다 다양한 인자가 관여하기 때문에 어떤 측면에서는 모델보다는 적절한 빈도와 항목에 대한 관측계획 수립(monitoring design)이 더 중요하다고 할 수 있다. 이론적인 질량보존(mass conservation) 방정식을 기반으로 하는 모델은 다양한 현실적인 인자의 영향을 받기 때문에 모델의 한계를 인정하고, 모니터링 자료를 적극적으로 활용하여 불확실성을 저감하는 접근방식이 요구된다.

  • PDF

Spectral Weighted-Sum-of-Gray-Gases Modeling of Narrow Band for Prediction of Radiative Heat Transfer Induced from Liquid Engine Plume (액체 엔진 플룸 복사 열전달 예측을 위한 파장별 회체가스 중합법의 좁은밴드 적용)

  • Ko, Ju-Yong;kim, In-Sun
    • Aerospace Engineering and Technology
    • /
    • v.8 no.1
    • /
    • pp.17-25
    • /
    • 2009
  • The precise calculation of gas absorption coefficient in the radiative transfer equation is very important to the prediction of radiative heat transfer induced from liquid engine plume in view of base insulation design. For this purpose, the WNB model for gas absorption coefficient is described with the selection of important parameters and then the calculated results are compared with those of SNB model for validation. Total emissivity, narrow band averaged intensity and total intensity are calculated and compared to the results of SNB model. As results, the total emissivity and the total intensity are well matched within 3.1% and roughly 5 % error, respectively. Moreover, the gas modeling database is constructed with estimation of the combustion gas composition of $CO_2$ and $H_2O$ for liquid engine plume.

  • PDF

Modeling of plasma etch process using genetic algorithm and radial basis function network (유전자 알고리즘과 레이디얼 베이시스 함수망을 이용한 플라즈마 식각공정 모델링)

  • Park, Kyoung-Young;Kim, Byung-Whan
    • Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.159-162
    • /
    • 2004
  • 플라즈마 공정 모델 개발에 역전파 신경망이 가장 많이 응용되고 있으나, 관여하는 다수의 학습인자로 인해 그 최적화가 매우 어렵다. Radial basis function network (RBFN)은 관여하는 학습인자의 수가 적어 그 최적화가 상대적으로 용이하지만, 두인자의 다양한 조합에 의해 RBFN의 예측성능이 상당히 영향을 받을 수 있다. 본 연구에서는 학습인자 상호간의 작용을 유전자 알고리즘 (genetic algorithm-GA)을 이용하여 최적화하는 기법을 소개한다. 제안하는 알고리즘을 광도파로 제작을 위해 수행한 실리카 식각공정 데이터에 적용하여 평가하였다. 평가에 이용된 식각 응답은, 실리카 식각률, aluminum (Al) 식각률, Al 선택비, 그리고 실리카 프로파일 각도이다. 최적화한 모델은 종래의 모델과 비교하였으며, 그 향상도는 실리카 식각률, Al 식각률, Al 선택비, 그리고 실리카 프로파일 각도에 대해서 각 기 0.8%, 32.4%, 20.3%, 1.3% 등이었다. Al 식각률과 선택비에 대해서 예측성능은 상당이 향상되었다.

  • PDF

Alalysis of flood damage type by climate change using stepwise regression model (단계적 회귀모형을 이용한 기후변화에 따른 홍수피해 유형분석)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.394-394
    • /
    • 2018
  • 최근 기후변화로 인하여 강수량 및 집중호우 발생 횟수의 증가에 따라 홍수의 발생 빈도 및 강도가 증가한다. 기후변화에 따른 미래의 강수량 예측은 2013년에 발간된 IPCC(Intergovernmental Panel on Climate Change) 5차 평가보고서 (AR5)를 활용하여 분석하고 있다. 기후변화 시나리오에 따라 기온 상승률 및 강수량의 증가량, 극한 강우사상의 발생 빈도 및 발생정도가 다르게 결정되며, 극한 강우사상으로 유발되는 홍수의 피해 정도가 홍수피해 유형별로 다르게 나타난다. 본 연구에서는 기후변화에 따른 미래의 홍수 피해 정도를 예측하기 위하여 홍수에 영향을 미치는 인자 및 홍수를 감소시키는 인자들을 활용하여 단계적 회귀모형을 이용하여 인명피해, 피해면적, 피해액, 발생빈도 등 홍수피해 유형 별로 현재 및 미래의 홍수피해정도를 예측 및 분석하였다. 홍수에 영향을 미치는 인자로 연평균강수량, 일최대강수량, 1시간최대강수량, 10분최대강수량, 호우일수, 인구밀도, 자산밀도, 도로현황, 시가화율 등을 사용하였고, 홍수 피해를 감소시키는 치수대책으로는 하천개수율, 하수도보급률, 양수량, 유수지용량 등을 사용하였다.

  • PDF

Prediction of Regional Metastasis by the Expression of Lymphangiogenic Factors in Micropapillary Thyroid Carcinoma (미세갑상선유두상암종에서 림프관 생성인자 확인을 통한 림프절 전이의 예측)

  • Lee, Sung-Bu;Choi, Seung-Ho;Nam, Soon-Yuhl;Cho, Kyung-Ja;Kim, Sang-Yoon
    • Korean Journal of Head & Neck Oncology
    • /
    • v.27 no.1
    • /
    • pp.32-37
    • /
    • 2011
  • 서 론 : 미세갑상선유두상암종 환자에서 불필요한 예방적 중앙 림프절절제술을 피하기 위해서 림프절 전이를 수술 전에 예측하는 수단이 필요하다. 림프관 생성 및 성장의 조절에 VEGF-C/D, VEGFR-3 pathway, podoplain이 관여된다는 사실이 밝혀져 있다. 림프관 생성 및 성장과 관련된 인자인 VEGF-C/D, podoplanin에 대한 면역조직화학염색과 반정량적 분석을 통해 미세갑상선유두상암종에서 림프절전이와의 관련성을 확인하고자 하였다. 대상 및 방법 : 2006년 9월부터 2008년 6월까지 본원에서 미세갑상선유두상암종으로 진단받고 1인 술자에 의해 갑상선 전 절제술 및 예방적 중앙 림프절절제술을 받은 104명의 환자 중 중앙 림프절 전이가 있었던 환자와 없었던 환자를 각각 25명씩 무작위로 선별하여 종양부위에 면역화학염색을 실시하여 림프관생성인자의 발현 정도를 비교하였다. 결 과 : 대상군 50예 중 VEGF-C/D는 50예(100%) 모두 발현이 되었고 podoplanin은 33예(66%)에서 발현이 되었다. 그 중 VEGF-C는 10예(20%)에서 약한 양성, 37예(74%)에서 중등도 양성, 3예(6%)에서 강한 양성소견을 보였고 VEGF-D는 9예(18%)에서 약한 양성, 37예(74%)에서 중등도 양성, 4예(8%)에서 강한 양성소견을 보였다. 중앙 림프절 전이 음성 환자 군과 양성 환자 군으로 분류하였을 때 VEGF-C/D의 발현율의 차이는 p-value가 각각 0.48, 1.00으로 통계적으로 유의한 차이를 보이지 않았다. 50예 전체를 대상으로 하여 종양의 개수, 최대크기, 검출된 전체 림프절의 수, 양성 림프절의 수, 주변조직 침범여부에 따른 VEGF-C/D의 발현도 통계적으로 유의한 차이를 보이지 않았다. Podoplanin의 경우 염색 여부에 따라 양성군과 음성군으로 나누어 분석하였을 때 종양의 개수, 최대크기, 검출된 림프절의 수, 양성 림프절의 수, 주변조직 침범여부도 통계적으로 유의한 차이를 보이지 않았다. 결 론 : VEGF-C/D는 대상군 전체(100%)에서 발현이 되었고 podoplanin은 66%에서 발현이 되었다. 림프관 생성인자로 알려진 VEGF-C/D및 podoplanin이 미세갑상선유두상암종에서 많이 발현이 되는 것으로 보아 위 인자들이 림프절 전이를 일으키는 인자 중 하나로 생각된다. 하지만 미세갑상선유두상암종에서 중앙 림프절 전이를 예측할 수 있는 인자로 부적합 한 것으로 생각되며 향후 더 많은 증례를 통해 관련성 여부에 대한 연구가 필요하고 또 다른 인자의 관련성에 대해서 연구가 필요하겠다.

Development of statistical forecast model for PM10 concentration over Seoul (서울지역 PM10 농도 예측모형 개발)

  • Sohn, Keon Tae;Kim, Dahong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.2
    • /
    • pp.289-299
    • /
    • 2015
  • The objective of the present study is to develop statistical quantitative forecast model for PM10 concentration over Seoul. We used three types of data (weather observation data in Korea, the China's weather observation data collected by GTS, and air quality numerical model forecasts). To apply the daily forecast system, hourly data are converted to daily data and then lagging was performed. The potential predictors were selected based on correlation analysis and multicollinearity check. Model validation has been performed for checking model stability. We applied two models (multiple regression model and threshold regression model) separately. The two models were compared based on the scatter plot of forecasts and observations, time series plots, RMSE, skill scores. As a result, a threshold regression model performs better than multiple regression model in high PM10 concentration cases.

Long-term Forecast of Seasonal Precipitation in Korea using the Large-scale Predictors (광역규모 예측인자를 이용한 한반도 계절 강수량의 장기 예측)

  • Kim, Hwa-Su;Kwak, Chong-Heum;So, Seon-Sup;Suh, Myoung-Seok;Park, Chung-Kyu;Kim, Maeng-Ki
    • Journal of the Korean earth science society
    • /
    • v.23 no.7
    • /
    • pp.587-596
    • /
    • 2002
  • A super ensemble model was developed for the seasonal prediction of regional precipitation in Korea using the lag correlated large scale predictors, based on the empirical orthogonal function (EOF) analysis and multiple linear regression model. The predictability of this model was also evaluated by cross-validation. Correlation between the predicted and the observed value obtained from the super ensemble model showed 0.73 in spring, 0.61 in summer, 0.69 in autumn and 0.75 in winter. The predictability of categorical forecasting was also evaluated based on the three classes such as above normal, near normal and below normal that are clearly defined in terms of a priori specified by threshold values. Categorical forecasting by the super ensemble model has a hit rate with a range from 0.42 to 0.74 in seasonal precipitation.

A Study on the Improvement of Quantitative Precipitation Forecast using a Clustering Method (군집기법을 이용한 연강수량 예보개선에 관한 연구)

  • Kim, Gwang-Seob;Jo, So-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.94-97
    • /
    • 2009
  • 연 및 계절강수량의 정확한 예보는 수자원관리에 매우 중요하다. 예보 정확도를 높이기 위한 다양한 연구가 계속 진행되어 왔다. 그럼에도 불구하고 강수자료가 가지는 매우 큰 불확실성 때문에 예보의 정확도 향상은 계속되는 숙제로 우리에게 남아 있다. 이를 개선하기 위하여 본 연구에서는 군집화 기법을 이용한 연 및 계절 강수량 예측개선에 대한 연구 결과를 제시하였다. 이를 위하여 연강수량, 계절강수량 및 월강수량의 예측을 위하여 전구에서 일어나는 각종 기후 인자들과의 상관성 분석은 대단히 중요하다. 전 세계적으로 어느 특정 지역에서의 선행 기후인자 변화 양상이 우리나라의 강수량에 높은 상관성을 가지며 영향을 미친다면 예측을 위한 매우 유용한 정보라 하겠으나 국내 강수량과 기후 지수 사이의 선형 상관성은 매우 낮을 뿐만 아니라 지체상관성도 특정 지체에서 매우 큰 상관성을 보이는 인자를 찾기 어려움을 알 수 있다. 이를 극복하기 위하여 본 연구에서는 k-mean clustering을 이용하여 우리나라 주변의 기후조건을 분류하고 기후조건에 따른 강수량의 변화를 분석하였다. 남중국해역($105^{\circ}E\;^{\sim}\;135^{\circ}E$, $0^{\circ}N\;^{\sim}\;35^{\circ}N$), 우리나라 연안 해역 ($110^{\circ}E\;^{\sim}\;150^{\circ}E$, $20^{\circ}N\;^{\sim}\;40^{\circ}N$), 인도양 해역 ($75^{\circ}E\;^{\sim}\;105^{\circ}E$, $0^{\circ}N\;^{\sim}\;25^{\circ}N$) 및 아라비아 해역 ($45^{\circ}E\;^{\sim}\;75^{\circ}E$, $0^{\circ}N\;^{\sim}\;30^{\circ}N$ 평균 해수면 온도 변화에 따라 8개 군집으로 분류한 분석결과로 분석결과 2008년도는 그룹 5에 해당하며 그룹 5의 기후 상태는 근해와 남중국해역의 평균 해수면 온도가 평년보다 낮고 인도양 해역과 아라비아 해역의 평균 해수면 온도는 평년값과 비슷한 상태를 나타낸다. 그룹 5에 해당하는 기후조건에서 차년의 강수평균은 평년값 보다 적음을 보였다. 이러한 특성은 전체 유역에 걸쳐 동일하게 나타났다. 이에 대한 계절적 평균 분포는 군집 5에 대한 차년도 강수의 평균 계절분포는 전체적으로 평년값보다 낮게 나타났다. 이에 근거하여 올해 연 평균 강수량은 평년값보다 적을 것이며 전체 계절에 대하여도 평년값보다 적은 강수량이 올 것으로 판단된다. 이는 기상청의 2009년 봄철 기후전망과 유사한 예측 결과를 보여준다.

  • PDF

A Study on the Analysis of the Relationship between Sea Surface Temperature and Monthly Rainfall (해수면온도와 우리나라 월강우량과의 관계분석에 관한 연구)

  • Oh, Tae-Suk;Moon, Young-Il
    • Journal of Korea Water Resources Association
    • /
    • v.43 no.5
    • /
    • pp.471-482
    • /
    • 2010
  • Rainfall events in the hydrologic circulation are closely related with various meteorological factors. Therefore, in this research, correlation relationship was analyzed between sea surface temperature of typical meteorological factor and monthly rainfall on Korean peninsula. The cluster analysis was performed monthly average rainfall data, longitude and latitude observed by rainfall observatory in Korea. Results from cluster analysis using monthly rainfall data in South Korea were divided into 4 regions. The principal components of monthly rainfall data were extracted from rainfall stations separated cluster regions. A correlation analysis was performed with extracted principal components and sea surface temperatures. At the results of correlation analysis, positive correlation coefficients were larger than negative correlation coefficients. In addition, The 3 month of principal components on monthly rainfall predicted by locally weighted polynomial regression using observed data of sea surface temperature where biggest correlation coefficients have. The result of forecasting through the locally weighted polynomial regression was revealed differences in accuracy. But, this methods in the research can be analyzed for forecasting about monthly rainfall data. Therefore, continuous research need through hydrological meteorological factors like a sea surface temperature about forecasting of the rainfall events.