• Title/Summary/Keyword: 이상수

Search Result 51,954, Processing Time 0.079 seconds

Trend analysis of extream precipitation in Korea using Quantile Regression (Quantile Regression을 활용한 우리나라 극치강수량 경향성 분석)

  • So, Byung-Jin;Kwon, Hyun-Han;Park, Rae-Gun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.369-370
    • /
    • 2012
  • 일반적으로 회귀분석의 최적화는 평균적인 개념을 확장하여 사용되어지고 있다. 평균은 관찰값들에 관한 모든 정보와 관련된 통계량으로써 많은 연구에 이용되어지고 있다. 정규분포를 이루는 모집단의 경우 평균을 사용한 추정이 바람직하지만, 이상치로 인한 분포의 꼬리가 두꺼워지는 경우 중위수(median)를 사용하는 것이 바람직하다고 알려져 있다. 강수량의 분포형태는 꼬리(tail)가 두꺼운 왜곡된 형태를 갖고 있으므로 robust 통계량인 Quantile을 이용한 강수량의 분석 및 평가를 실시하였다. 본 연구에서는 Quantile에 따른 회귀선의 변화를 이용하여 강수량의 경향성을 평가하고, 극치강수량의 변화를 보여줄 수 있는 Quantle값을 추출해 보고자 한다. 또한 bootstrap 방법을 이용하여 Quantile에 따른 회귀계수의 신뢰구간을 분석하여 회귀인자의 신뢰성을 평가하였다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 이상값의 영향을 저감시키는 평균과 달리 이상값의 영향을 효과적으로 분리 및 재현시킬 수 있어 극치값에 따른 변화를 효과적으로 평가할 수 있으며, robust 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있다.

  • PDF

Detecting and classification ADRs using Named Entity Recognition on social media (개체명 인식을 이용한 소셜 미디어에서의 약물 부작용 표현 추출 및 분류)

  • Jeong, Hyeon-jeong;Kim, Hyon Hee
    • Annual Conference of KIPS
    • /
    • 2021.05a
    • /
    • pp.443-446
    • /
    • 2021
  • 의약품에 대한 안전성 정보 수집과 관리는 온라인, 오프라인을 통해 약물 이상 사례를 보고받는 형태로 진행되고 있다. 하지만 소비자들의 자발적인 참여로 이루어지므로 실제 발생하는 약물 부작용보다 데이터가 현저히 적다는 단점이 존재한다. 본 논문에서는 약물 이상 데이터 희소성 문제를 해결 할 수 있도록 소셜 미디어에서 약물 부작용 표현을 찾을 수 있도록 하였다. 소셜 미디어의 경우에는 표준 약물 부작용 용어를 사용하기보다는 일반인들이 자연어로 표현한 경우가 많으므로 개체명 인식 기법을 이용해 부작용을 추출할 수 있는 모델을 개발하였다. 또한 추출된 부작용 표현을 표준용어로 분류할 수 있는 모델을 제시하였다. 실험 결과 제안한 두 가지 모델은 0.9 이상의 정확도를 얻을 수 있었으며, 일반 사용자들이 자연어로 표현한 약물 부작용 표현을 효과적으로 찾아내고 표준 부작용 용어로 매핑할 수 있음을 보여준다.

Vibration Diagnosis of Rotating Machinery Using Fuzzy Inference (퍼지추론을 이용한 회전기계의 정밀진단법)

  • 전순기;양보석
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 1995.10a
    • /
    • pp.284-288
    • /
    • 1995
  • 최근 애매성이 수반되는 정보를 Zadeh는 멤버쉽함수(membership function)를 이용하여 새로운 정보처리 방식으로서 퍼지이론을 제안하였고, 그후 의료계에서도 퍼지이론을 도입한 진단법들이 제안되었다. 회전기계의 이상진단법으로는 주파수득점법(Point counting method), 퍼지역연산법(Inverse method of fuzzy theory)등이 보고되고 있으며, 저자들도 퍼지이론을 이용하여 구름베어링의 결함진단, 회전기계의 간이 이상진단법등을 보고하였다. 이들은 주로 진동주파수의 스펙트럼 데이터 만을 이용하고 있고, 다른 많은 데이터를 복합적으로 이용할 수 없다. 이 때문에 주로 소규모 문제의 간이진단에서는 효과적이나 진단대상이 복잡하고 대규모로 되면 보다 정확한 원인 추정이 곤란하게 된다. 또한 수치데이터만을 취급할 수 있으므로 진동전문가가 진단에 이용하는 각종의 수치화 될 수 없는 데이터(언어적인 정보)가 취급될 수 없다. 따라서 이들의 진단법은 개략적인 진단은 가능하나 상세한 원인까지는 진단할 수 없는 단점이 있다. 회전기계의 이상판단시 참고가 되는 각종 정보로는 주로 진동진폭의 크기, 진폭과 위상의 변화, 진폭의 변화, 진동파형, 진동벡터의 시간변화 등이 있고, 이들은 수치적으로 표현할 수 있는 계량데이터와 판단의 경계가 불명확한 언어정보(범위데이터)로 나눌 수 있다. 후자는 애매성(fuzziness)을 많이 포함하고 있으며, 엄밀히 측정되는 수치데이터에서도 퍼지성을 가지고 있다. 이러한 언어적인 정보의 애매성을 퍼지추론에서는 [수치적 진리치](numeric truth)와 [언어적 진리치](linguistic truth)의 개념으로 표현하게 되었다. 수치적 진리치는 확실함의 척도를 [0,1] 사이의 수치를 이용하여 표현하고 있으며, 이 수치는 소견의 확실도로서 가능성을 표현한 것이다. 예를 들면, 진동진폭 스펙트럼상에 2X 성분이 상당히 크게 나타나 정렬불량의 가능성이 0.7 정도라고 판정하는 것 등은 이러한 수치적진리치를 이용하는 방법이다. 그러나 상기의 수치적 표현만으로는 확실도를 한개의 수치로서 대표하게 하는 것은 진단의 정밀도에 문제가 있을 것으로 생각된다. 따라서 언어적진리치가 도입되어 [상당히 확실], [확실], [약간 확실] 등의 언어적인 표현을 이용하여 애매성을 표현하게 되었다. 본 논문에서는 간이진단 결과로부터 추출된 애매한 진단결과중에서 가장 가능성이 높은 이상원인을 복수로 선정하고, 여러 종류의 수치화할 수 없는 언어적(linguistic)인 정보ㄷㄹ을 if-then 형식의 퍼지추론으로 종합하는 회전기계의 이상진단을 위한 정밀진단 알고리즘을 제안하고 그 유용성을 검토한다.

  • PDF

Development of quality control techniques for global climate observations (글로벌 기후 관측자료 품질관리 기법 개발)

  • Lee, Jae-Seung;Kim, Seon-Ho;Bae, Deg-Hyo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.104-104
    • /
    • 2019
  • 기후 관측자료의 경우 관측, 가공, 전송 중에 오류가 발생할 수 있으며, 특히 글로벌 기후자료는 다양한 조건을 가지고 있는 자료를 수집하였기 때문에 일반적으로 해당 국가 관측자료보다 품질이 낮다. 본 연구에서는 글로벌 기후 관측자료의 품질을 개선할 수 있는 품질관리 기법을 개발하고 국내 지역에 적용해보고자 한다. 연구대상지역으로 국내 대표도시 7 곳을 선정하였으며, 글로벌 기후자료는 NCDC (National Climatic Data Center)의 일 단위 GSOD (Global Surface Summary of the Day) 자료를 수집하였다. 품질관리는 강수와 기온에 대해서 실시하였으며 과정은 크게 이상치 검사, 이상치 및 결측치 보정, 연, 월 단위 기후 자료 산정으로 구분된다. 이상치 검사는 중복성 검사, 내적일치성 검사, 기후범위 검사, 공간동질성 검사를 기반으로 구성되어 있다. 이상치 및 결측치 보정은 인접 관측소의 자료를 보간하여 수행하였으며, 보간기법은 4 방향 역거리 가중법을 활용하였다. 연, 월 단위 자료 산정은 자료의 결측률을 고려하여 일 단위 자료를 연, 월 단위 자료로 변환하는 과정이다. 이상치 검사 결과 대부분의 이상치는 기후범위와 공간동질성 검사에서 발견되는 것으로 나타났으며, 중복성 및 내적일치성 검사는 이상치 검출 효과가 적은 것으로 나타났다. 결측치 및 이상치 보간 결과 추정된 자료와 관측값 간의 상관관계가 있는 것으로 나타나 활용성이 있었다. 본 연구는 글로벌 자료의 품질관리 기법을 제시하였다는 점에서 활용성이 있으며, 향후 품질관리 기법의 검증에 관한 연구를 수행할 필요가 있다.

  • PDF

A Mechanism for the Expression of Polymorphic Object Type (다형적 객체 타입 기술을 위한 메커니즘)

  • 이민규;한동수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.436-438
    • /
    • 1999
  • 객체지향 프로그래밍에서 다형성이란 객체가 하나 이상의 객체 타입을 가질 수 있다는 것을 말한다. 이처럼 객체가 하나 이상의 타입을 가지게 되면 다양한 문맥에서 객체를 사용할 수 있게 되어 재사용성을 달성 할 수 있게 된다. 그러나 이러한 객체의 다형성은 정적인 타입 검사를 어렵게 하여 실행시 타입 오류를 유발할 가능성을 높이는 원인으로 작용한다. 본 논문에서는 객체 타입을 기술하기 위한 문맥에서 당일 타입만을 기술했던 것이 제약에서 벗어나 여러 타입의 조합으로 다형적 타입을 기술할 수 있게 함으로써 문맥에 맞는 객체 타입을 기술할 수 있도록 하는 메커니즘을 제안한다. 그리고 이 메커니즘이 어떻게 사용될 수 있는가에 대한 예제들도 함께 소개한다.

  • PDF

Development of data processing component module for the flood management in an agricultural watershed (농촌유역 홍수관리를 위한 자료처리 요소모듈 개발)

  • Lee, Do Gil;Kang, Moon Seong;Park, Jihoon;Ryu, Jeong Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.289-289
    • /
    • 2016
  • 신뢰성 높은 홍수관리는 경향성 분석, 이상치 판정 등의 전처리를 수행한 입력 자료를 구축하는 것을 필요로 한다. 경향성 분석은 방법에 따라 경향성의 유무가 다르게 나타나기 때문에 하나의 방법으로만 판단하기 어려우며, 이상치 분석은 지역 특성에 따라 기준이 변동하므로 일정한 기준을 적용하기가 어려워 주로 수동으로 이루어지며 이 작업을 완료하는 데에는 많은 시간이 소요된다. 입력 자료 전처리에 수반되는 비용과 시간을 절감하기 위해 이러한 문제점의 개선이 필요한 실정이다. 따라서 본 연구의 목적은 농촌유역 홍수관리를 위한 자료처리 요소 모듈을 개발하는 데 있다. 홍수관리를 위한 자료처리 요소 모듈은 크게 기상자료의 경향성을 분석하는 모듈과 수위자료의 이상치를 탐지하고 판정하는 모듈로 구성하였다. 경향성 분석 모듈은 모수적 방법인 t-test와 비모수적 방법인 Hotelling-Pabst test 및 Mann-Kendall test를 분석 방법으로 제공하여 하나의 입력 자료로 세 가지 방법으로 분석한 결과를 비교할 수 있도록 개발하였다. 이상치 탐지 모듈은 IQR (interquartile range) 규칙과 규칙기반의 방법을 이용한 이상치 탐지를 제공할 수 있도록 개발하였다. 개발된 모듈은 한강 유역의 용당저수지에 적용하여 검정을 실시하였다. 본 연구에서 개발된 농촌유역 홍수관리를 위한 자료처리 요소 모듈은 추후 홍수관리 및 그에 관한 연구를 하는데 있어 활용될 수 있을 것으로 기대된다.

  • PDF

Outlier Impact on the Power of Significance Test for Cronbach Alpha Reliability Coefficient

  • Yonghwan Um
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.5
    • /
    • pp.179-187
    • /
    • 2023
  • In this paper, we studied the impact of outliers on the power of the significance tests for Cronbach alpha reliability coefficient. Four variables were varied: sample size, the number of items, the number of outliers and population Cronbach Alpha levels. We simulated data using multivariate normal distribution and used outliers sampled from uniform distribution. To test the significance of Cronbach Alpha Reliability, parametric approach(F statistic) and permutation method were used. Consequently, we observed that the powers of permutation test are equal to or greater than those of F test under all conditions, and also both F test and permutation test lose the power as the number of outliers increases, and that these effects of outliers on the power are enhanced for increasing population alpha levels.

A Study on the Outliers Detection in the Number of Railway Passengers for the Gyeongbu Line From Seoul to Major Cities Using a Time Series Outlier Detection Technique (시계열 이상치 탐지 기법을 활용한 경부선 주요도시 철도 승객수의 이상치 탐색 연구)

  • LEE, Jiseon;YOON, Yoonjin
    • Journal of Korean Society of Transportation
    • /
    • v.35 no.6
    • /
    • pp.469-480
    • /
    • 2017
  • On April 1, 2004, KTX (Korea Train eXpress), the first HSR (High-Speed Rail) in Korea, was introduced to Gyeongbu Line. The introduction of the KTX service led to a change in the number of passengers for Gyeongbu Line. Previous studies have analyzed the pre and post-event changes of the intervening events by either simple statistics or intervention ARIMA analysis. However, the intervention ARIMA model has a limitation that several assumptions such as the occurrence time and the type of intervention events are necessary. To this end, this study analyzed the effects of intervention event on the number of passengers using the Gyeongbu line based on a time series outlier detection technique which can overcome limitations in the previous studies. The time series outlier detection technique can analyze the time, effect type and size of an intervention event without the assumption of the time and effect type of the intervention event. The data were collected from the Korea Transport Database (KTDB) for twelve years from 2003 to 2014 (144 months). The analysis results showed that the size of the influence type in the same intervention events was different across the major city routes, and the intervention event which could not be found by previous study methods was also found.

Outlier Detection in Time Series Monitoring Datasets using Rule Based and Correlation Analysis Method (규칙기반 및 상관분석 방법을 이용한 시계열 계측 데이터의 이상치 판정)

  • Jeon, Jesung;Koo, Jakap;Park, Changmok
    • Journal of the Korean GEO-environmental Society
    • /
    • v.16 no.5
    • /
    • pp.43-53
    • /
    • 2015
  • In this study, detection methods of outlier in various monitoring data that fit into big data category were developed and outlier detections were conducted for both artificial data and real field monitoring data. Rule-based methods applied rate of change and probability of error for monitoring data are effective to detect a large-scale short faults and constant faults having no change within a certain period. There are however, problems with misjudgement that consider the normal data with a large scale variation as outlier caused by using independent single dataset. Rule-based methods for noise faults detection have a limit to application of real monitoring data due to the problem with a choice of proper window size of data and finding of threshold for outlier judgment. A correlation analysis among different two datasets were very effective to detect localized outlier and abnormal variation for short and long-term monitoring dataset if reasonable range of training data could be selected.

축산과학원 - 양계 연구 동향

  • Korea Poultry Association
    • KOREAN POULTRY JOURNAL
    • /
    • v.40 no.11
    • /
    • pp.168-170
    • /
    • 2008
  • 농촌진흥청 축산과학원(원장 이상진)은 농장에서 계란을 출하할 때 집하장까지 운송에 소요되는 시간과 온도에 따른 품질을 조사한 결과, 운송시간이 짧고, 운송온도가 낮을수록 계란의 신선도가 높은 것으로 나타났다고 밝혔다. 계란은 작은 중량임에도 불구하고 병아리를 탄생시킬 수 있는 완전영양소를 갖고있기 때문에 요즘과 같이 온도가 높아지는 시기에는 달걀 내부의 호흡작용과 수분증발에 의해 계란의 품질이 현저히 나빠질 수 있다. 시험에 의하면 계란은 운송거리가 5km이내일 때에는 상온 운송차량과 $4^{\circ}C$ 냉장차량에서 계란의 신선도(Haugh unit)에는 차이가 없었으나, 운송거리가 100km이상에서는 냉장운송을 하지 않으면 신선도가 4배 이상 현저하게 낮아졌다. 또한, 난각의 총 미생물 수에서도 운송거리가 5km이내에서는 운송차량의 온도에 따른 차이가 없었으나, 100km이상 운송 시에는 냉장을 하지 않은 계란이 냉장계란에 비하여 2배 정도 높아지는 것으로 나타났다. 농촌진흥청 축산과학원 유영모 박사는 "계란이 농장에서 판매장까지 복잡한 경로를거쳐 유통되는 경우가 많은데, 요즘과 같은 고온기에는 계란의 신선도를 유지하는 냉장유통이 필요하며, 특히 여름철 장거리 운송 시에는 냉장차량을 이용하는 것이 계란의 신선도를 유지하는데 중요하다"고 말했다.

  • PDF