• 제목/요약/키워드: Data fitting algorithm

검색결과 199건 처리시간 0.029초

SVM 기반 Bagging과 OoD 탐색을 활용한 제조공정의 불균형 Dataset에 대한 예측모델의 성능향상 (Boosting the Performance of the Predictive Model on the Imbalanced Dataset Using SVM Based Bagging and Out-of-Distribution Detection)

  • 김종훈;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.455-464
    • /
    • 2022
  • 제조업의 공정에서 생성되는 데이터셋은 크게 두 가지 특징을 가진다. 타겟 클래스의 심각한 불균형과 지속적인 Out-of-Distribution(OoD) 샘플의 발생이다. 클래스 불균형은 SMOTE 및 다양한 샘플링 전략을 통해서 대응할 수 있다. 그러나, OoD 탐색은 현재까지 인공신경망 영역에서만 다뤄져 왔다. OoD 탐색의 적용이 가능한 인공신경망은 제조공정 데이터셋에 대해서 만족스러운 성능을 발현하지 못한다. 원인은 제조공정의 데이터셋이 인공신경망에서 일반적으로 다루는 이미지, 텍스트 데이터셋과 비교해서 크기가 매우 작고, 노이즈가 심하다는 것이다. 또한 인공신경망의 과적합(overfitting) 문제도 제조업 데이터셋에서 인공신경망의 성능을 저하하는 원인으로 지적된다. 이에 현재까지 시도된 바 없는 SVM 알고리즘과 OoD 탐색의 접목을 시도하였다. 또한 예측모델의 정밀도 향상을 위해 배깅(Bagging) 알고리즘을 모델링에 반영하였다.

LiDAR 데이터를 이용한 옥트리 분할 기반의 지붕요소 자동추출 (Automatic Extraction of Roof Components from LiDAR Data Based on Octree Segmentation)

  • 송낙현;조홍범;조우석;신성웅
    • 한국측량학회지
    • /
    • 제25권4호
    • /
    • pp.327-336
    • /
    • 2007
  • 건물의 3차원 모델링은 3차원 공간정보를 구축하는데 있어서 매우 중요한 요소이다. 기존의 3차원 건물 모델링은 대부분 입체 항공사진을 이용하여 도화사에 의해 수동으로 진행되어 많은 시간과 비용이 소요된다. 또한 연구논문이나 실험적으로 시도되고 있는 일부 자동화 방법은 건물을 정확하고 세밀하게 묘사하는데 한계가 있다. 건물의 3차원 모델링을 자동화하기 위해서는 건물 외곽선과 지붕 모양을 정확하게 추정할 수 있는 알고리즘이 필수적이다. 최근 다양한 분야에서 활용되고 있는 항공라이다(LiDAR) 데이터는 지형지물에 대한 3차원 정보를 제공하지만, 이를 이용하여 건물 외곽선을 정확하게 추정하기에는 기술적으로 어려움이 있다. 따라서 기존에 구축된 수치지도의 건물 외곽선을 이용한다면, 항공라이다 데이터를 이용하여 3차원 평면을 최소단위로 하는 건물지붕의 구성요소들을 조합하여 자동으로 건물지붕의 3차원 모델링이 가능하다. 본 논문은 기 구축된 수치지도의 건물 외곽선과 옥트리(octree) 분할을 기반으로 항공라이다 데이터를 이용하여 건물지붕의 구성요소를 자동으로 추출하는 방법을 제안하였다. 건물지붕에 대한 항공라이다 데이터를 3차원 공간상에서 재귀적으로 분할하여 패치(patch)를 구성하고, 동일한 속성을 갖는 패치들을 병합하여 지붕의 구성요소를 추출한다. 항공라이다 데이터를 이용하여 제안된 방법으로 실험한 결과, 평면, 게이블, 다면, 곡면 등 다양한 형태의 지붕에 대한 구성요소들을 자동으로 추출 할 수 있었다.

부산시 하천퇴적물의 유기 오염도 평가 (Evaluation of Organic Sediments Qualities for the Urban Streams in the Busan City)

  • 이준기;김석구;송재홍;이태윤
    • 대한환경공학회지
    • /
    • 제31권11호
    • /
    • pp.975-982
    • /
    • 2009
  • 본 연구는 부산시에 위치한 하천들에 대한 기본적인 퇴적물 데이터와 현재의 오염상태에 대한 정보를 제공하기 위한 목적으로 수행되었다. 먼저 부산시 하천중 14곳을 선정하고 대상하천의 퇴적물을 채집하였다. 그리고 퇴적물특성을 알아보기 위해 퇴적물의 화학적산소요구량, 강열감량, 유기탄소, 원소분석을 실시하였고 그 결과 퇴적물의 화학적산소요구량, 강열감량, 유기탄소, 총질소 함량이 각각 1.20~75.07 mg/L, 0.19~11.54 %, 0.23~34.21%, 0.76~3.46%로 나타났다. 퇴적물의 분석 데이터를 각각 USEPA 퇴적물 환경기준과 캐나다 온타리오 퇴적물 환경기준과 비교해 본 결과, COD, 강열감량, 총유기탄소 값으로 평가했을 경우 보수천과 구덕천이 다른 하천에 비해 상대적으로 심하게 오염된 것으로 평가되었지만 총질소 값으로 비교해 본 결과 결과적으로 모든 하천이 심한 오염상태인 것으로 평가 되었다. 최종적으로 퇴적물COD와 수분함량, 회분함량, 강열감량, 유기탄소량, 총질소, 총인과의 상관관계를 알아보기 위해 Linear 모델에 최소자승법을 적용해 fitting 하였고 그 결과 모든항목에서 퇴적물COD와 높은 상관관계 (r=0.9664~0.8501)를 띔을 알 수 있었다.

이종의 공간 데이터 셋의 면 객체 자동 매칭 방법 (Automated Areal Feature Matching in Different Spatial Data-sets)

  • 김지영;이재빈
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.89-98
    • /
    • 2016
  • 본 연구에서는 축척과 갱신 주기가 상이한 이종의 공간 데이터 셋을 융합하기 위하여 사용자의 개입을 최소화하면서 다대다 관계에도 적용이 가능한 기하학적 방법론 기반의 면 객체 자동 매칭 방법을 제안하였다. 이를 위하여 첫째, 포함함수가 0.4 이상인 객체(노드)는 인접행렬에서 에지로 연결되었고, 이들 인접행렬의 곱을 반복적으로 수행하여 다대다 관계를 포함하는 후보 매칭 쌍을 선정하였다. 다대다 관계인 면 객체들은 알고리즘으로 생성된 convex hull로 단일 면 객체로 변환하였다. 기하학적 매칭을 위하여, 매칭 기준을 설정하고, 이들을 유사도 함수를 이용하여 유사도를 계산하였다. 다음으로 변환된 유사도와 CRITIC 방법으로 도출된 가중치를 선형 조합하여 형상 유사도를 계산하였다. 마지막으로 훈련자료에서 모든 가중치에 대한 정확도와 재현율을 나타낸 PR 곡선의 교차점인 EER로 임계값을 선정하고, 이 임계값을 기준으로 매칭 유무를 판별하였다. 제안된 방법을 수치지도와 도로명 주소기본도에 적용한 결과, 일부 다대다 관계에서 잘못 매칭되는 경우를 시각적으로 확인할 수 있었으나, 통계적 평가에서 정확도, 재현율, F-measure가 각각 0.951, 0.906, 0.928로 높게 나타났다. 이는 제안된 방법으로 이종의 공간 데이터 셋을 자동으로 매칭하는데 그 정확도가 높음을 의미한다. 그러나 일부 오류가 발생한 다대다 관계인 후보 매칭 쌍을 정확하게 정량화하기 위해서 포함함수나 매칭 기준에 대한 연구가 진행되어야 할 것이다.

Metabolic Changes in Patients with Parkinson's Disease after Stereotactic Neurosurgery by Follow-up 1H MR Spectroscopy

  • Choe, Bo-Young;Baik, Hyun-Man;Chun, Shin-Soo;Son, Byung-Chul;Kim, Moon-Chan;Kim, Bum-Soo;Lee, Hyoung-Koo;Suh, Tae-Suk
    • 한국자기공명학회논문지
    • /
    • 제5권2호
    • /
    • pp.99-109
    • /
    • 2001
  • Authors investigated neuronal changes of local cellular metabolism in the cerebral lesions of Parkinsonian symptomatic side between before and after stereotactic neurosurgery by follow-up 1H magnetic resonance spectroscopy (MRS). Patients with Parkinson's disease (PD) (n = 15) and age-matched normal controls (n = 15) underwen MRS examinations using a stimulated echo acquisition mode (STEAM) pulse sequence that provided 2${\times}$2${\times}$2 ㎤ (8ml) volume of interest in the regions of substantia nigra, thalamus, and lentiform nucleus. Spectral parameters were 20 ms TE, 2000 ms TR, 128 averages,2500 Hz spectral width, and 2048 data points. Raw data were processed by the SAGE data analysis package (GE Medical Systems). Peak areas of N-acetylaspartate (NAA), creatine (Cr), choline-containing compounds (Cho), inositols (Ins), and the sum (Glx) of glutamate and GABA were calculated by means of fitting the spectrum to a summation of Lorentzian curves using Marquardt algorithm. After blindly processed, we evaluated neuronal alterations of observable metabolite ratios between before and after stereotactic neurosurgery using Pearson product-moment analysis (SPSS, Ver. 6.0). A significant reduction of NAA/Cho ratio was observed in the cerebral lesion in substantia nigra of PD patient related to the symptomatic side after neurosurgery (P : 0.03). In thalamus, NAA/Cho ratio was also significantly decreased in the cerebral lesion including the electrode-surgical region (P : 0.03). A significant reduction of NAA/Cho ratio in lentiform nucleus was not oberved, but tended toward significant reduction after neurosurgery (P = 0.08). In particular, remarkable lactate signal was noted from the surgical thalamic lesions of 6 among 8 patients and internal segments of globus pallidus of 6 among 7 patients, respectively. Significant metabolic alterations of NAA/Cho ratio might reflect functional changes of neuropathological processes in the lesion of substantia nigra, thalamus, and lentiform nucleus, and could be a valuable finding fur evaluation of Parkinson's disease after neurosurgery. Increase of lactate signals, being remarkable in surgical lesions, could be consistent with a common consequence of neurosurgical necrosis. Thus, IH MRS could be a useful modality to evaluate the diagnostic and prognostic implications fur Parkinsons disease after functional neurosurgery.

  • PDF

비선형 감마 커브 구현을 위한 작은 크기와 4bit(LSB) 오차를 가진 10비트 감마 라인 시스템의 설계 (Design of 10bit gamma line system with small size of gate count and 4bit error(LSB) to implement non-linear gamma curve)

  • 장원우;김현식;이성목;김인규;강봉순
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.353-356
    • /
    • 2005
  • 이 논문에서, 제시된 감마$({\gamma})$ 라인 시스템은 해당 공식에 의해 만들어진 비선형 감마 곡선과 하드웨어로 구현된 결과 사이의 오차를 최소화하기 위해 만들어졌다. 제시된 알고리즘과 시스템은 특정 감마값이 2.2, 즉 {0,1}$^{2.2}$에 의해 생성되는 공식과 입, 출력 데이터 크기가 10bit를 기반으로 한다. 오차를 최소화하기 위해, 시스템은 데이터 점들 사이를 지나 적합한 다항식을 만드는 수치해석 방법, 최소 자승 다항식을 사용하였다. 제한된 감마 라인은, 정밀도를 높이기 위해, 서로 각각의 중첩된 범위를 가지는 2차 다항식 9개로 구성되어 있다. $MATLAB^{TM}$ 7.0으로 검증된 알고리즘을 바탕으로, 제한된 시스템은 Verilog-HDL으로 구현되었다. 시스템은 2클럭 지연을 가지며 1 클럭마다 결과가 생성된다. 오차 범위(LSB)는 -4에서 +3이다. 표준편차는 1.287956238을 가진다. 시스템의 전체 게이트 값은 2,083이며, 최대 타이밍은 15.56[ns] 이다.

  • PDF

SWAT 모형의 매개변수와 유역의 지형학적 특성 관계 (The Relationship between Parameters of the SWAT Model and the Geomorphological Characteristics of a Watershed)

  • 이웅희;이지행;박지훈;최흥식
    • Ecology and Resilient Infrastructure
    • /
    • 제3권1호
    • /
    • pp.35-45
    • /
    • 2016
  • 섬강 시험유역의 지형학적 특성 매개변수와 SWAT-CUP의 SUFI-2 알고리즘을 이용한 SWAT 모형 매개변수와의 상관관계와 이들의 관계식을 개발하였다. 개발한 상관 관계식을 이용하여 속사천 유역의 SWAT 모형의 매개변수를 추정하였다. 아울러, 속사천 유역의 2000 - 2007년의 강우-유출 자료를 대상으로 SWAT-CUP의 SUFI-2 알고리즘을 이용하여 SWAT 모형의 매개변수를 추정하였다. 개발한 식에 의해 산정한 각 매개변수의 적용성을 검토하기 위해 2000 - 2007년의 속사천 시험유역 자료를 이용하여 SWAT 모형의 유출모의를 실시하였다. 실측자료와 지형학적 특성 매개변수의 상관관계 분석으로 산정된 매개변수를 이용하여 속사천에 적용한 유출 모의결과와의 RMSE (root mean square error)는 $1.09m^3/s$이고, SWAT-CUP의 SUFI-2 최적 매개변수를 적용한 유출 모의결과와의 RMSE는 $0.93m^3/s$으로 나타났다. 따라서 지형학적 특성 매개변수를 이용한 SWAT 모형의 매개변수 추정이 적용성이 있다고 판단된다.

작물분류에서 기계학습 및 딥러닝 알고리즘의 분류 성능 평가: 하이퍼파라미터와 훈련자료 크기의 영향 분석 (Performance Evaluation of Machine Learning and Deep Learning Algorithms in Crop Classification: Impact of Hyper-parameters and Training Sample Size)

  • 김예슬;곽근호;이경도;나상일;박찬원;박노욱
    • 대한원격탐사학회지
    • /
    • 제34권5호
    • /
    • pp.811-827
    • /
    • 2018
  • 본 연구의 목적은 다중시기 원격탐사 자료를 이용한 작물분류에서 기계학습 알고리즘과 딥러닝 알고리즘의 비교에 있다. 이를 위해 전라남도 해남군과 미국 Illinois 주의 작물 재배지를 대상으로 기계학습 알고리즘과 딥러닝 알고리즘에 대해 (1) 하이퍼파라미터와 (2) 훈련자료의 크기에 따른 영향을 비교 분석하였다. 비교 실험에는 기계학습 알고리즘으로 support vector machine(SVM)을 적용하고 딥러닝 알고리즘으로 convolutional neural network(CNN)를 적용하였다. 특히 CNN에서 2차원의 공간정보를 고려하는 2D-CNN과 시간차원을 확장한 구조의 3D-CNN을 적용하였다. 비교 실험 결과, 다양한 하이퍼파라미터를 고려해야 하는 CNN의 경우 SVM과 다르게 두 지역에서 정의된 하이퍼파라미터 값이 유사한 것으로 나타났다. 이러한 결과를 바탕으로 모델 최적화에 많은 시간이 소요되지만 최적화된 CNN 모델을 다른 지역으로 확장할 수 있는 전이학습의 적용 가능성이 높을 것으로 판단된다. 다음 훈련자료 크기에 따른 비교 실험 결과, SVM 보다 CNN에서 훈련자료 크기의 영향이 큰 것으로 나타났는데 특히 다양한 공간특성을 갖는 Illinois 주에서 이러한 경향이 두드러지게 나타났다. 또한 Illinois 주에서 3D-CNN의 분류 성능이 저하되는 것으로 나타났는데, 이는 모델 복잡도가 증가하면서 과적합의 영향이 발생한 것으로 판단된다. 즉 모델의 훈련 정확도는 높지만 다양한 공간특성이나 입력 자료의 잡음 효과 등으로 오히려 분류 성능이 저하된 것으로 나타났다. 이러한 결과는 대상 지역의 공간특성을 고려해 적절한 분류 알고리즘을 선택해야 하는 것을 의미한다. 또한 CNN에서 특히, 3D-CNN에서 일정 수준의 분류 성능을 담보하기 위해 다량의 훈련자료 수집이 필요하다는 것을 의미한다.

신경회로망을 이용한 유출수문곡선 모의에 관한 연구 (A Study on the Simulation of Runoff Hydograph by Using Artificial Neural Network)

  • 안경수;김주환
    • 한국수자원학회논문집
    • /
    • 제31권1호
    • /
    • pp.13-25
    • /
    • 1998
  • 신경회로망은 어떤 사상에 대한 인과관계를 연상기억능력을 통하여 인식할 수 있는 기능을 가지고 있을 뿐 아니라 비선형현상에 대한 적응능력이 뛰어나 수문계의 강우-유출 현상에 대한 적용가능성은 많으나 이를 수문학적으로 검증하는데는 아직 검토단계라 할 수 있으며 적용에 따른 방법론에 대한 연구가 필요하다 할 수있다. 본 연구에서는 하천유역에서 호우의 발생에 따른 하천의 홍수유출수문곡선을 모의하기 위한 블랙박스모형으로서 신경회로망이론의 적용에 따른 문제를 수문학적으로 규명하고자 하였다. 이를 위한 방법으로서 홍수발생의 직접적인 원인인 강우패턴을 신경회로망의 입력패턴으로하고 이에 따른 출력패턴을 유출수문곡선이라는 가정하에 신경회로망모형을 구성하고 평창강유역에서 발생된 과거 홍수기록자료를 이용하여 그 결과를 제시하였다. 본 연구결과에 의하면 신경회로망의 학습이 수행되는 동안 어떠한 형태로든 수문학적 개념을 토대로 구성된 모형의 구조에 잘 적응되고 있음을 알수 있었다. 이 결과를 토대로 지금까지 복잡한 과정을 거쳐야하는 강우-유출 모형화 과정에서 발생되는 문제점들을 효율적으로 해결할 수 있는 접근방법으로서 활용될수 있을 것으로 기대된다.

  • PDF

필리핀 지오이드모델의 개발방안 연구 (A Study on Geoid Model Development Method in Philipphines)

  • 이석배
    • 한국측량학회지
    • /
    • 제27권6호
    • /
    • pp.699-710
    • /
    • 2009
  • 한 국가에서 지오이드모델은 그 나라의 일관된 표고기준면을 제공함으로써 정확한 정표고를 결정할 수 있게 하며, 국가기준점의 평면위치 결정시 지오이드고를 고려한 측지망 조정계산을 실시함으로써 좌표결정의 정확도를 높일 수 있다. 본 연구는 말레이시아나 인도네시아와 비슷한 조건의 동남아시아 국가인 필리핀이 자국의 지오이드모델을 어떻게 개발하는 것이 최선인지 그 방법론을 연구한 연구이다. 따라서 본 연구에서는 전반적인 지오이드 결정이론을 살펴보고, 아시아 국가들에서의 지오이드 개발사례를 통하여 필리핀 일원에 가장 적합한 지오이드 모델 개발방안을 제시하고자 하였으며, 필리핀 일원에서 최신의 지구중력장 모델인 EGM2008을 해석하여 지오이드고와 중력이상을 계산하였다. 연구결과 항공중력방법에 기반한 중력 지오이드모델을 개발하고, 200점 내외의 GPS/leveling데이터에 의한 기하학적 지오이드고를 합성하여 하이브리드 지오이드 모델을 개발하는 것이 가장 합리적인 방법으로 연구되었다. 또한 스토크스적분의 수행은 4밴드 구면 FFT방법이, 중력지오이드모델 개발에는 EGM2008과 SRTM에 의한 remove and restore 기법이, 하이브리드 지오이드모델의 개발에는 Least square collocation 알고리즘이 제안되었다.