• 제목/요약/키워드: 데이터 불확실성 분석

검색결과 281건 처리시간 0.034초

Interval Type-2 TSK 퍼지 추론 시스템의 설계 (Design of Interval Type-2 TSK Fuzzy Inference System)

  • 지광희;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1849-1850
    • /
    • 2008
  • Type-2 퍼지 집합은 Type-1 퍼지 집합의 확장으로 Type-1 퍼지 집합으로는 다루기 힘든 언어적인 불확실성을 다루기 위해 고안되었다. 대표적인 퍼지 논리 시스템(Fuzzy Logic System; FLS)으론 Mamdani FLS 모델과 TSK FLS모델이 있다. 본 논문에서는 Interval Type-2 TSK FLS를 구성한다. FLS 구성을 위한 전반부는 가우시안 형태의 Type-2 멤버쉽 함수를 사용하며, 전.후반부 파라미터들은 오류역전파 알고리즘을 통한 학습으로 결정한다. 본 논문에서는 Type-1 TSK FLS와 Interval Type-2 TSK FLS를 설계하고 가스로 공정 데이터에 적용하여 성능을 비교 분석한다. 또한 노이즈를 추가한 데이터들을 통하여 노이즈에 대한 성능도 비교 분석한다.

  • PDF

Type-2와 Type-1 TSK FLS의 비교 연구 (Comparative Study on Type-2 and Type-1 TSK FLS.)

  • 지광희;오성권
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.321-324
    • /
    • 2008
  • Type-2 퍼지 집합은 Type-1 퍼지 집합에서는 다루기 어려운 언어적인 불확실성을 더욱 효과적으로 다룰 수 있다. TSK 퍼지 로직 시스템(TSK Fuzzy Logic Systems; TSK FLS)은 Mamdani 모델과 함께 가장 널리 사용되는 FLS이다. 본 연구의 Interval Type-2 TSK FLS 모델은 전반부에서 Type-2 퍼지 집합을 이용하고 후반부는 계수가 상수인 1차식을 사용한다. 전반부의 파라미터는 오류역전파 방법(Back-propagation)을 통한 학습으로 결정되고, 후반부 파라미터(계수)들은 Least squre method(LSM)를 사용하여 결정된 값을 사용하여 모델을 구축한다. 본 논문에서는 Type-1 TSK FLS과 Type-2 TSK FLS의 성능을 가스로 공정 데이터를 적용하여 비교 분석한다. 또한 랜덤 화이트 가우시안 노이즈를 추가한 테스트 데이터를 사용하여 노이즈에 대한 성능을 분석한다.

  • PDF

태양광발전설비 원격 관제를 위한 빅데이터 분석 및 처리 (Big Data Analysis and Processing for Remote Control of PV Facilities)

  • 권준아;김영근;이종찬;김원중
    • 한국전자통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.837-844
    • /
    • 2018
  • 신재생에너지의 발전량 변동에 따라 기존 발전기의 발전량을 증가시키거나 감소시켜야 하는데, 발전량 증 감발에 빠르게 반응을 하는 발전기들은 상대적으로 발전비용이 크므로 태양광발전의 예측 정확도에 따라서 기동발전계획의 비용 효율성이 영향을 받게 된다. 이에 본 논문에서는 태양광 발전량 예측의 불확실성을 최소화하기 위하여 빅데이터 분석 및 처리를 적용한 태양광발전설비 원격관제 시스템을 제안하였다.

모바일 라이프 특이성 추론을 위한 베이지안 확률 모델의 자동 학습 (Automatic Learning of Bayesian Probabilistic Model for Mobile Life Landmark Reasoning)

  • 황금성;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.362-366
    • /
    • 2007
  • 다양한 기능과 센서를 탑재한 최신 모바일 디바이스는 사용자의 위치, 전화기록, SMS, 사진, 동영상 등 사용자에 관한 다양한 정보를 지속적으로 수집할 수 있기 때문에 개인의 생활을 이해하고 다양한 서비스를 제공할 수 있는 가능성을 가지고 있다. 하지만, 모바일 장치의 성능 제약 및 환경 불확실성으로 인해 아직까지 많은 연구 과제들이 남아 있다. 본 논문에서는 이러한 모바일 환경의 문제를 극복하기 위해 베이지안 네트워크를 이용한 라이프 로그 분석 모델 및 자동 학습 방법을 제안한다. 제안하는 베이지안 네트워크 모델은 모듈화 되어서 계산량은 감소되었으며, 자동 학습 방법을 통해 지속적인 업데이트가 가능하다. 이는 제안하는 방법이 복잡한 확률 모델을 자동으로 분할하는 방법과 분할된 상태에서의 유기적인 추론 방법을 포함하고 있기에 가능하다. 실험에서는 실제 모바일 장치에서 수집된 로그 데이터를 이용하여 제안하는 방법에 의한 실험 결과를 분석하고 분할을 통한 효율성 향상을 논의 한다.

  • PDF

베이지안 네트워크를 이용한 대사증후군의 예측 모델링 (Prognostic Modeling of Metabolic Syndrome Using Bayesian Networks)

  • 박한샘;조성배;이홍규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.292-294
    • /
    • 2005
  • 대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말한다. 미국에서는 $25\%$ 이상의 성인이 대사성 증후군인 것으로 알려져 있으며, 경제 여건의 향상 및 식생활 습관의 변화와 함께 최근 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되고 있는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학 분야에서 지식 발견, 데이터 마이닝을 위한 도구로 유용하게 사용되고 있다. 본 논문에 서 는 대사증후군을 예측하는 문제를 다루며, 베이지안 네트워크와 의학 지식을 이용한 대사증후군의 예측 모델을 제안한다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행하였으며, 실험 결과 다층 신경망, k-최근접 이웃 등의 분류기 보다 높은 $81.5\%$의 예측율을 보였다.

  • PDF

온톨로지와 군집분석을 이용한 지하공간 정보모델 개발 (Development of Subsurface Spatial Information Model with Cluster Analysis and Ontology Model)

  • 이상훈
    • 한국지리정보학회지
    • /
    • 제13권4호
    • /
    • pp.170-180
    • /
    • 2010
  • 지하공간 개발의 증가에 따라 지층단면도 등 다양한 형태로 제공되는 지하공간 정보모델의 신뢰성이 요구되고 있다. 그러나 지반은 근본적으로 불확실하며, 이를 표현하는 정보모델도 자료부족, 해석표준 부재 등의 비통계적 요인과 외부환경 변수라는 통계적 요인으로 불확실성을 가진다. 따라서, 현재의 모델 생성은 고도로 훈련된 전문가에 의해 이뤄지고 있다. 본 연구는 지반공학 전문가의 경험과 지식에서 시맨틱을 추출하고, 이를 온톨로지 모델과 정보량으로 정량화하였다. 정량화한 온톨로지 모델은 군집분석의 클러스터간 거리계산에 적용하여 시맨틱을 고려한 군집분석 방법론을 제안하였다. 본 제안 방법을 실험지역에 적용한 결과 기존 K-Means 방법에 비해 전문가의 해석과 유사한 결과를 도출하였으며, 수작업으로는 어려운 대용량 데이터를 손쉽게 처리하고 3차원 GIS로 가시화가 가능하였다. 본 연구를 통해 지반공학 전문가의 도움 없이도, 그 경험을 고려하면서 대량의 지반정보 데이터를 효과적으로 처리하여 신뢰성 있는 지하공간 정보모델을 생성할 수 있을 것이다.

종이 헬리콥터 낙하해석모델의 통계적 교정 및 검증 (Statistical Calibration and Validation of Mathematical Model to Predict Motion of Paper Helicopter)

  • 김길영;유성범;김동영;김동성;최주호
    • 대한기계학회논문집A
    • /
    • 제39권8호
    • /
    • pp.751-758
    • /
    • 2015
  • 수학적 해석모델은 물리적 현상을 파악하고 실험비용을 절감하는데 활발하게 사용되지만 편의를 위한 단순화 또는 파라미터가 가지고 있는 불확실성에 의해 해석모델에 의한 예측결과는 실제현상과 차이가 발생한다. 본 연구에서는 이러한 문제에 대해 통계적 기법을 이용하여 해석모델의 불확실성을 반영한 교정 및 검증 방법을 종이 헬리콥터를 통해 제시한다. 먼저, 같은 제원의 세 가지 종이 헬리콥터로 실시한 실험 데이터를 각 그룹으로 형성하여 두 가지 낙하해석모델에서 미지의 입력 파라미터인 항력계수를 교정하는데 사용했다. 그리고 확률분포로 예측된 낙하시간을 실험 데이터 분포와 비교하여 해석 모델을 검증하였다. 이 때, Markov Chain Monte Carlo 기법을 활용하여 항력계수의 불확실성을 정량화하였다. 또한 종이 헬리콥터의 그룹별 데이터에 대해 분산분석(Analysis of Variance)를 이용하여 제작오차와 실험오차의 관계를 비교하였고, 각 그룹이 모두 동일한 대상으로 간주해도 됨을 증명하였다.

비정형, 정형 데이터의 이미지 학습을 활용한 시장예측 (MPIL: Market prediction through image learning of unstructured and structured data)

  • 이윤선;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.16-21
    • /
    • 2021
  • 금융 시계열 분석은 현대 사회의 경제적, 사회적으로 매우 중요한 역할을 하며 세계 발전에 영향을 미치는 중요한 과제지만 많은 잡음(noise)과 불확실성 등의 어려움으로 인해 금융 시계열 분석 예측은 어려운 연구 주제이다. 본 논문에서는 비정형 데이터와 정형 데이터를 함께 이미지로 변환하여 시장을 예측 하는 방법(MPIL)을 제안한다. 시장 예측을 위해 n일 기간의 비정형 데이터인 SNS, 뉴스 데이터를 감정분석하고 정형 데이터인 시장 데이터를 GADF 알고리즘으로 이미지 변환하고 이미지 학습을 통해 n+1일의 가격을 예측하는 초단기 시장을 예측한다. MPIL은 평균 정확도 56%로 기존 시장예측에 사용되던 감정분석을 활용하여 LSTM으로 시장을 예측하는 모델 평균 정확도 50%보다 높은 정확도를 보였다.

태양광 전원과 Li 배터리를 포함하는 마이크로 그리드의 운영특성 해석 (Analysis of Micro-grid Operations Including PV Source and Li Battery)

  • 김덕영
    • 한국산학기술학회논문지
    • /
    • 제15권7호
    • /
    • pp.4692-4697
    • /
    • 2014
  • 태양광 전원은 태양광 패널이 설치된 지역의 위치와 날씨 그리고 기후 등에 매우 큰 영향을 받으며, 전원으로서의 사용시간의 제한과 출력의 불확실성이라는 특성을 갖는다. 이러한 태양광 전원의 불확실성을 가능한 줄이기 위해, 태양광 전원의 출력에 대한 오랜 기간 동안의 데이터를 분석하여 출력의 평균값을 산출해 내었다. 태양광 전원의 출력의 평균값은 태양광 전원에 직접 연결되어 그리드에 안정적인 전력을 공급하기 위한 Li 에너지 저장장치의 적정 용량산정과 운용방식에 꼭 필요한 데이터이며, 이로부터 Li 배터리의 충방전모드에 의해 그리드에 일정한 출력의 전력을 공급하는 것이 가능하도록 하였다. 태양광 전원과 Li 배터리를 포함하는 시스템이 악조건의 그리드 운전상태에서의 동작특성을 관찰하기 위해 Li 배터리의 충전율이 100%에서 10%로 단시간에 감소될 정도의 과부하 상태에 대해 태양광 전원과 Li 배터리의 운용특성을 분석하고 Li 배터리 셀 단위의 출력 및 온도특성을 해석하였다.

딥 러닝에서 Labeling 부담을 줄이기 위한 연구분석 (An Analysis of the methods to alleviate the cost of data labeling in Deep learning)

  • 한석민
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.545-550
    • /
    • 2022
  • 딥러닝은 많은 데이터를 필요로 한다는 것은 이미 널리 알려져있다. 이를 통해, 딥러닝에 쓰이는 신경망의 수없이 많은 parameter들을 학습시킨다. 학습과정에는 데이터뿐 아니라, 각 데이터별로 전문가가 입력한 label이 필요한 경우가 대부분인데, 이 label을 얻는 과정은 시간과 자원 소비가 심하다. 이 문제를 완화하기 위해, few-shot learning, self-supervised learning, weak-supervised learning등이 연구되어오고 있다. 본 논문에서는, label을 상대적으로 적은 노력으로 수행하기 위한 연구들의 동향을 살펴보고, 앞으로의 개선 방향을 제시하도록 한다.