• 제목/요약/키워드: 편향 기반 예측

검색결과 29건 처리시간 0.029초

지하수위 예측을 위한 경사하강법과 화음탐색법의 결합을 이용한 다층퍼셉트론 성능향상 (Improvement of multi layer perceptron performance using combination of gradient descent and harmony search for prediction of groundwater level)

  • 이원진;이의훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.186-186
    • /
    • 2022
  • 강수 및 침투 등으로 발생하는 지하수위의 변동을 예측하는 것은 지하수 자원의 활용 및 관리에 필수적이다. 지하수위의 변동은 지하수 자원의 활용 및 관리뿐만이 아닌 홍수 발생과 지반의 응력상태 등에 직접적인 영향을 미치기 때문에 정확한 예측이 필요하다. 본 연구는 인공신경망 중 다층퍼셉트론(Multi Layer Perceptron, MLP)을 이용한 지하수위 예측성능 향상을 위해 MLP의 구조 중 Optimizer를 개량하였다. MLP는 입력자료와 출력자료간 최적의 상관관계(가중치 및 편향)를 찾는 Optimizer와 출력되는 값을 결정하는 활성화 함수의 연산을 반복하여 학습한다. 특히 Optimizer는 신경망의 출력값과 관측값의 오차가 최소가 되는 상관관계를 찾는 연산자로써 MLP의 학습 및 예측성능에 직접적인 영향을 미친다. 기존의 Optimizer는 경사하강법(Gradient Descent, GD)을 기반으로 하는 Optimizer를 사용했다. 하지만 기존의 Optimizer는 미분을 이용하여 상관관계를 찾기 때문에 지역탐색 위주로 진행되며 기존에 생성된 상관관계를 저장하는 구조가 없어 지역 최적해로 수렴할 가능성이 있다는 단점이 있다. 본 연구에서는 기존 Optimizer의 단점을 개선하기 위해 지역탐색과 전역탐색을 동시에 고려할 수 있으며 기존의 해를 저장하는 구조가 있는 메타휴리스틱 최적화 알고리즘을 이용하였다. 메타휴리스틱 최적화 알고리즘 중 구조가 간단한 화음탐색법(Harmony Search, HS)과 GD의 결합모형(HS-GD)을 MLP의 Optimizer로 사용하여 기존 Optimizer의 단점을 개선하였다. HS-GD를 이용한 MLP의 성능검토를 위해 이천시 지하수위 예측을 실시하였으며 예측 결과를 기존의 Optimizer를 이용한 MLP 및 HS를 이용한 MLP의 예측결과와 비교하였다.

  • PDF

탐색 패턴 확장에 의한 적응형 계층 육각 탐색의 성능 개선 (Performance Improvement of Adaptive Hierarchical Hexagon Search by Extending the Search Patterns)

  • 곽노윤
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.305-315
    • /
    • 2008
  • 기제안된 적응형 계층 육각 탐색은 적응형 육각 탐색에 기반한 고속의 계층형 블록 정합 알고리즘의 일종이다. 적응형 계층 육각 탐색은 고속 움직임 탐색이 가능한 적응형 육각 탐색의 장점을 유지하면서도 시공간 움직임 활동도가 높은 비디오 시퀀스에서 흔히 발생되는 국부 최소 문제를 적응적으로 경감시킬 수 있는 것이 특징이다. 본 논문은 적응형 계층 육각 탐색의 예측 화질을 개선하기 위해 이 탐색의 수평 편향 패턴과 수직 편향 패턴을 효과적으로 확장하는 방법을 제안함에 그 목적이 있다. 본 논문에서는 서로 다른 움직임 특성을 갖는 복수의 동영상 시퀀스들에 대한 컴퓨터 시뮬레이션 결과를 토대로 예측 화질과 연산 시간 측면에서 제안된 방법의 성능을 분석 평가하였다. 시뮬레이션 결과는 제안된 방법이 작은 움직임 탐색과 큰 움직임 탐색에 모두 적합함을 보여주었다. 제안된 방법은 육각 탐색 패턴의 확장 과정에서 추가적인 연산량 증가를 초래했지만 이 연산량의 증가에 상응하는 예측 화질 개선을 기할 수 있었다.

  • PDF

현장 조사 자료를 이용한 GIS 기반 주제도 작성을 위한 단변량 크리깅 기법의 비교 (Comparison of Univariate Kriging Algorithms for GIS-based Thematic Mapping with Ground Survey Data)

  • 박노욱
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.321-338
    • /
    • 2009
  • 이 연구의 목적은 비대칭 분포를 가지는 현장 조사 자료로부터 GIS 기반 주제도를 생성하기 위한 공간 내삽 방법으로 단변량 크리깅 기법을 비교하는데 있다. 기존 정규 크리깅과 비선형 자료 변환에 기반을 둔 로그 정규 크리깅, 다중 가우시안 크리깅과 지시자 크리깅을 지화학 원소 비소와 납에 대해 사례 연구를 통해 비교하였다. 예측 능력의 비교 분석을 위해 leave-one-out 기반 교차 검증을 통한 오차 분석을 수행하였으며, 샘플링 밀도의 차이에 따른 오차의 변화 양상도 분석하였다. 비교 분석 결과, 지시자 크리깅이 전반적으로 가장 높은 예측 능력을 나타내었으며, 작은 값과 높은 값의 예측 능력도 우수한 것으로 나타났다. 정규 크리깅에 비해 비선형 자료 변환 기반 크리깅 기법들이 우수한 예측 능력을 나타내었지만, 기존에 많이 적용된 로그 정규 크리깅은 샘플링 밀도와 상관없이 편향 정도가 가장 크게 나타내었다. 이 연구를 통해 얻어지는 정량적 검증 결과는 비대칭 분포를 가지는 현장 조사 자료의 내삽을 위한 크기깅 기법의 선정에 유용하게 이용될 수 있을 것으로 기대된다.

쏘일네일링의 인발저항에 대한 LRFD 저항편향계수 산정 (Estimation of LRFD Resistance Bias Factors for Pullout Resistance of Soil-Nailing)

  • 손병두;임희대;박준모
    • 한국지반공학회논문집
    • /
    • 제31권10호
    • /
    • pp.5-16
    • /
    • 2015
  • 본 연구에서는 국가건설기준이 한계상태설계법으로 전환됨에 따라 현재 연구기반이 미약한 쏘일네일링의 LRFD 설계법 개발의 일환으로 인발저항에 대한 저항편향계수를 분석하였다. 쏘일네일링의 설계 및 시공 기술수준 등 지역적 특성을 반영하기 위하여 국내 비탈면과 굴착공사에서 수행된 인발시험 자료를 수집하고, 지반특성, 쏘일네일의 제원, 인발시험 결과 등으로 구성된 데이터베이스를 구축하였다. 쏘일네일링의 인발저항에 대한 저항계수를 보정하기 위하여 국내에서 가장 많이 이용되며 비교적 자료수가 충분한 중력식과 가압식 그라우팅공법의 인발저항에 대한 저항편향계수를 산정하였다. 저항편향계수는 1.144~1.325으로 실제 극한인발저항력을 비교적 보수적으로 예측하고 있으며 미국의 연구사례(NCHRP Report)보다 안전측으로 설계가 이루어지고 있으나, 인발저항력에 대한 불확실성은 $COV_R$=0.27~0.43으로 비교적 큰 것으로 나타났다. 또한 가압식 그라우팅공법은 중력식 그라우팅공법에 비해 내재된 안전여유가 많으며, 실제 발휘되는 극한인발저항력의 불확실성이 낮은 것으로 분석되었다.

DNA 길이와 혼합 종 개수 예측을 위한 합성곱 신경망 (Convolution Neural Network for Prediction of DNA Length and Number of Species)

  • 승희;김예원;이효민
    • Korean Chemical Engineering Research
    • /
    • 제62권3호
    • /
    • pp.274-280
    • /
    • 2024
  • 기계학습법의 신경망 기술을 이용한 자료분석은 질병 유전자 탐색 및 진단, 신약 개발, 약인성 간 손상 예측 등과 같은 다양한 분야에서 활용되고 있다. 질병 특징 발견을 위한 자료분석은 DNA 정보를 기반으로 이루어질 수 있다. 본 연구에서는 DNA의 분자 정보 중 DNA의 길이와 용액 내 DNA의 길이별 종 개수를 예측하는 신경망을 개발하였다. 겔 전기영동을 통한 기존 방법론의 시간 소요 한계점을 해결하고자, 미세유체역학적 농축 장치의 동역학 자료를 분석 대상으로 하여 실험 분석 과정 중의 시간 소요 문제점을 해결하였다. 동역학 자료를 공간시간 지도로 재구성하여 학습 및 예측에 필요한 계산용량을 낮추었으며, 공간시간 지도에 대한 분석 정확도를 높이기 위해 합성곱 신경망을 활용하였다. 그 결과, 단일 변수 회귀로써의 단일 DNA 길이 예측과 복합 변수 회귀로써의 다종 DNA 길이의 동시 예측 및 이진 분류로써의 DNA 혼합 종 개수 예측을 성공적으로 수행하였다. 추가적으로, 예측 과정 중 발생할 수 있는 예측 편향을 학습 자료 구성 방식을 통한 해결책을 제시하였다. 본 연구를 활용한다면, 광학 측정 자료를 이용하는 액체생검 기반의 세포유리 DNA 분석 및 암 진단 등의 의학 자료 분석을 효과적으로 수행할 수 있을 것이다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

부가 정보를 활용한 비전 트랜스포머 기반의 추천시스템 (A Vision Transformer Based Recommender System Using Side Information)

  • 권유진;최민석;조윤호
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.119-137
    • /
    • 2022
  • 최근 추천 시스템 연구에서는 사용자와 아이템 간 상호 작용을 보다 잘 표현하고자 다양한 딥 러닝 모델을 적용하고 있다. ONCF(Outer product-based Neural Collaborative Filtering)는 사용자와 아이템의 행렬을 외적하고 합성곱 신경망을 거치는 구조로 2차원 상호작용 맵을 제작해 사용자와 아이템 간의 상호 작용을 더욱 잘 포착하고자 한 대표적인 딥러닝 기반 추천시스템이다. 하지만 합성곱 신경망을 이용하는 ONCF는 학습 데이터에 나타나지 않은 분포를 갖는 데이터의 경우 예측성능이 떨어지는 귀납적 편향을 가지는 한계가 있다. 본 연구에서는 먼저 NCF구조에 Transformer에 기반한 ViT(Vision Transformer)를 도입한 방법론을 제안한다. ViT는 NLP분야에서 주로 사용되던 트랜스포머를 이미지 분류에 적용하여 좋은 성과를 거둔 방법으로 귀납적 편향이 합성곱 신경망보다 약해 처음 보는 분포에도 robust한 특징이 있다. 다음으로, ONCF는 사용자와 아이템에 대한 단일 잠재 벡터를 사용하였지만 본 연구에서는 모델이 더욱 다채로운 표현을 학습하고 앙상블 효과도 얻기 위해 잠재 벡터를 여러 개 사용하여 채널을 구성한다. 마지막으로 ONCF와 달리 부가 정보(side information)를 추천에 반영할 수 있는 아키텍처를 제시한다. 단순한 입력 결합 방식을 활용하여 신경망에 부가 정보를 반영하는 기존 연구와 달리 본 연구에서는 독립적인 보조 분류기(auxiliary classifier)를 도입하여 추천 시스템에 부가정보를 보다 효율적으로 반영할 수 있도록 하였다. 결론적으로 본 논문에서는 ViT 의 적용, 임베딩 벡터의 채널화, 부가정보 분류기의 도입을 적용한 새로운 딥러닝 모델을 제안하였으며 실험 결과 ONCF보다 높은 성능을 보였다.

사회적 거리분석: 선거자료와 결혼선호도자료에서 나타난 지역주의를 중심으로 (Analysis of Social Distance using Election and Marriage Preference Data)

  • 이명진
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 춘계학술대회
    • /
    • pp.37-57
    • /
    • 2001
  • 본 연구는 최근의 사회조사와 선거자료를 이용하여 한국사회의 지역주의의 특징을 살펴보고자 한다. 첫째, 최근의 선거결과에 보이는 지역주의적 투표는 지역간 사회적 거리를 잘 보여주고 있다. 둘째, 이러한 사회적 거리는 '편견과 차별'의 형태로 다양한 일상생활에서 존재하고 있다. 많은 사람들은 이러한 편견을 믿고 있으며, 편견에 의한 지역적 차별을 경험하고 있다. 특히 이러한 경험은 특정지역(호남)과 관련되어 있다. 셋째, 이러한 정치적 측면(지역주의적 투표)과 사회적 측면(지역간 편견)을 선거제도와 연결하여 살펴봄으로써, 앞으로 한국사회의정치제도의 변화에 대한 전망을 할 수 있다. 한국 정치에서 나타나는 지도자나 이데올로기의 편향은 많은 사람들로 하여금 투표나 선거에서 출신지를 중요한 요소로 삼게 하였다. 이러한 요소는 쉽게 사라지지는 않을 것이며, 앞으로 선거제도의 변화에 중요한 역할을 할 것이다. 이러한 예측은 세 가지 중요한 요소에 근거하고 있다. 첫째, 유권자들의 지역주의에 대한 믿음과 예측은 쉽게 사라지지 않을 것이다. 둘째, 정치지도자들은 지역주의를 선거와 관련한 자신의 이익을 위해서 최대한 이용할 것이다. 셋째, 지역주의에 근거한 유권자들의 성향은 최근 선거와 투표에서 더욱 강화되고 있다. 정치엘리트들이 지역적인 기반을 중심으로 결합하려는 경향이 강해지고 있다. 이러한 경향은 이들 정치엘리트 사이의 내각중심제에 대한 선호도와 지역당의 출현 가능성을 증가시킬 것이다.

사회적 거리분석: 선거자료와 결혼선호도자료에서 나타난 지역주의를 중심으로 (Analysis of Social Distance using Election and Marriage Preference Data)

  • 이명진
    • 한국조사연구학회지:조사연구
    • /
    • 제2권1호
    • /
    • pp.37-57
    • /
    • 2001
  • 본 연구는 최근의 사회조사와 선거자료를 이용하여 한국사회의 지역주의의 특징을 살펴보고자 한다. 첫째, 최근의 선거결과에 보이는 지역주의적 투표는 지역간 사회적 거리를 잘 보여주고 있다. 둘째. 이러한 사회적 거리는 ‘편견과 차별’의 형태로 다양한 일상생활에서 존재하고 있다. 많은 사람들은 이러한 편견을 믿고 있으며, 편견에 의한 지역적 차별을 경험하고 있다. 특히 이러한 경험은 특정지역(호남)과 관련되어 있다. 셋째, 이러한 정치적 측면(지역주의적 투표)과 사회적 측면(지역간 편견)을 선거제도와 연결하여 살펴봄으로써, 앞으로 한국사회의 정치제도의 변화에 대한 전망을 할 수 있다. 연구의 잠재적인 가정은 선거에 있어서 지역적인 투표가 무조건 ‘나쁜’것만은 아니라는 것이다. 한국 정치에서 나타나는 지도자나 이데올로기의 편향은 많은 사람들로 하여금 투표나 선거에서 출신지를 중요한 요소로 삼게 하였다. 이러한 요소는 쉽게 사라지지는 않을 것이며. 앞으로 선거제도의 변화에 중요한 역할을 할 것이다. 이러한 예측은 세 가지 중요한 요소에 근거하고 있다. 첫째, 유권자들의 지역주의에 대한 믿음과 예측은 쉽게 사라지지 않을 것이다. 둘째. 정치지도자들은 지역주의를 선거와 관련한 자신의 이익을 위해서 최대한 이용할 것이다. 셋째, 지역주의에 근거한 유권자들의 성향은 최근 선거와 투표에서 더욱 강화되고 있다. 정치엘리트들이 지역적인 기반을 중심으로 결합하려는 경향이 강해지고 있다. 이러한 경향은 이들 정치엘리트 사이의 내각중심제에 대한 선호도와 지역당의 출현 가능성을 증가시킬 것이다.

  • PDF

SMOTE와 Light GBM 기반의 불균형 데이터 개선 기법 (Imbalanced Data Improvement Techniques Based on SMOTE and Light GBM)

  • 한영진;조인휘
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권12호
    • /
    • pp.445-452
    • /
    • 2022
  • 디지털 세상에서 불균형 데이터에 대한 클래스 분포는 중요한 부분이며 사이버 보안에 큰 의미를 차지한다. 불균형 데이터의 비정상적인 활동을 찾고 문제를 해결해야 한다. 모든 트랜잭션의 패턴을 추적할 수 있는 시스템이 필요하지만, 일반적으로 패턴이 비정상인 불균형 데이터로 기계학습을 하면 소수 계층에 대한 성능은 무시되고 저하되며 예측 모델은 부정확하게 편향될 수 있다. 본 논문에서는 불균형 데이터 세트를 해결하기 위한 접근 방식으로 Synthetic Minority Oversampling Technique(SMOTE)와 Light GBM 알고리즘을 이용하여 추정치를 결합하여 대상 변수를 예측하고 정확도를 향상시켰다. 실험 결과는 Logistic Regression, Decision Tree, KNN, Random Forest, XGBoost 알고리즘과 비교하였다. 정확도, 재현율에서는 성능이 모두 비슷했으나 정밀도에서는 2개의 알고리즘 Random Forest 80.76%, Light GBM 97.16% 성능이 나왔고, F1-score에서는 Random Forest 84.67%, Light GBM 91.96% 성능이 나왔다. 이 실험 결과로 Light GBM은 성능이 5개의 알고리즘과 비교하여 편차없이 비슷하거나 최대 16% 향상됨을 접근 방식으로 확인할 수 있었다.