• 제목/요약/키워드: 일반화된 모델

검색결과 616건 처리시간 0.031초

데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로) (Improvement of generalization of linear model through data augmentation based on Central Limit Theorem)

  • 황두환
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.19-31
    • /
    • 2022
  • 기계학습 모델 구축 간 트레이닝 데이터를 활용하며, 훈련 간 사용되지 않은 테스트 데이터를 활용하여 모델의 정확도와 일반화 성능을 판단한다. 일반화 성능이 낮은 모델의 경우 새롭게 받아들이게 되는 데이터에 대한 예측 정확도가 현저히 감소하게 되며 이러한 현상을 두고 모델이 과적합 되었다고 한다. 본 연구는 중심극한정리를 기반으로 데이터를 생성 및 기존의 훈련용 데이터와 결합하여 새로운 훈련용 데이터를 구성하고 데이터의 정규성을 증가시킴과 동시에 이를 활용하여 모델의 일반화 성능을 증가시키는 방법에 대한 것이다. 이를 위해 중심극한정리의 성질을 활용해 데이터의 각 특성별로 표본평균 및 표준편차를 활용하여 데이터를 생성하였고, 새로운 훈련용 데이터의 정규성 증가 정도를 파악하기 위하여 Kolmogorov-Smirnov 정규성 검정을 진행한 결과, 새로운 훈련용 데이터가 기존의 데이터에 비해 정규성이 증가하였음을 확인할 수 있었다. 일반화 성능은 훈련용 데이터와 테스트용 데이터에 대한 예측 정확도의 차이를 통해 측정하였다. 새롭게 생성된 데이터를 K-Nearest Neighbors(KNN), Logistic Regression, Linear Discriminant Analysis(LDA)에 적용하여 훈련시키고 일반화 성능 증가정도를 파악한 결과, 비모수(non-parametric) 기법인 KNN과 모델 구성 간 정규성을 가정으로 갖는 LDA의 경우에 대하여 일반화 성능이 향상되었음을 확인할 수 있었다.

KRM 대기확산모델의 수행능력 (Performance of KRM Dispersion Modelling System)

  • 김용준
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 1999년도 추계학술대회 논문집
    • /
    • pp.163-167
    • /
    • 1999
  • 컴퓨터가 일반화됨에 따라 대기질 관리 및 연구 분야에서 수치모델 이용이 보편화되고 있다. 현재 사용되는 대기오염 수치모델의 종류는 매우 다양하며, 구동에 필요한 전산시스템의 규모도 다양하다. 연구용 및 대형 모델들은 활용 분야가 넓고 신뢰도가 높은 반면 대형 전산시스템과 고도의 전문 인력을 요구한다. 그러나, 국내 대부분의 대기질 관련 기관의 사용 가능한 전산시스템과 담당 인력을 고려할 때 대형 모델의 사용이 일반화되기에는 한계가 있다.(중략)

  • PDF

균열암반에서의 양수시험자료 해석과 일반화 방사상 유동모델의 적용성 연구

  • 성현정;김용제;우남칠;이철우;김구영
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2003년도 추계학술발표회
    • /
    • pp.493-496
    • /
    • 2003
  • 이 연구는 우리나라 균열암반 대수층의 수리적 특성을 해석ㆍ평가하기 위하여 양수시험 해석해(Theis, 1935; Cooper-Jacob, 1946; Papadopulos-Cooper, 1967; Hantush, 1962a,b; Moench, 1985; Hantush-Jacob, 1955) 및 일반화 방사상 유동 모델을 이용하여 균열암반 대수층(화강암, 화산암, 변성암, 백악기퇴적암, 제3기 퇴적암에 굴착된 100개 조사공)에서 수행되어진 양수시험으로부터 얻은 122개의 양수시험자료(수위강하 자료)를 분석하였다. AQTESOLV 전산프로그램을 이용한 양수시험자료 분석에 의하면, 122개 자료중 86개(71%)의 자료들이 이 연구에 사용된 해석해와 일치하며, 양수시험자료 해석해 중에 누수(leaky) 및 경계조건(boundary condition)을 고려한 해석해들이 53개(43%)로 가장 많이 나타났다. 그러므로, 양수시험자료의 해석은 균열암반 대수층의 수리지질학적 특성에 적합한 개념모델의 설정이 중요하다. 일반화 방사상 유동(GRF)모델을 적용해보면, 122개의 자료중 77개(63%)의 자료들이 Barker(1988)의 표준곡선에 의한 차원(1.1차원-2.9차원)을 보여준다. 이중 44.2%에 해당하는 39개 자료가 1.1차원과 1.9차원 사이의 분할 유동차원을 보여주는 반면에 26개(6.5%)만이 Theis 이론에 맞는 2차원의 방사상 흐름을 보여주며, 38개(49.3%)는 2.1차원에서 2.9차원에 속한다. 따라서 우리나라 균열암반 대수층에서 지하수 유동은 대부분 분할차원의 유동을 보여주는 것으로 평가된다.

  • PDF

유비쿼터스 환경에서 다양한 개인화 서비스에 적용하기 위한 사용자 모델링의 일반화 방법론 (A Generalization Approach to User Modeling for Adapting Various Personalized Services in Ubiquitous Computing Environment)

  • 이주연;이성진;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.366-371
    • /
    • 2006
  • 최근 연구가 활발히 진행되고 있는 ‘유비쿼터스’라는 새로운 패러다임은 기존보다 더욱 많은 컴퓨팅 자원을 이용하여 사용자의 편의를 지원하는 것을 그 목표로 하고 있다. 유비쿼터스 컴퓨팅 환경에서 사용자를 지원하기 위한 대표적인 예로 개인화 서비스를 들 수 있으며, 개인화 서비스는 사용자에 대한 모델링이 필수 요소가 된다. 개개인의 행동 패턴 혹은 선호도 정보로 구성된 사용자 모델은 다양한 개인화 서비스의 원활한 지원을 위해 지금까지 유용하게 사용되고 있지만, 기존의 사용자 모델은 각 서비스가 개발될 때, 그 서비스에 적합한 형태로 매번 설계되어야 하는 문제점을 지닌다. 본 논문에서는 이러한 문제점을 해결하고자, 사용자 모델을 구성하는 정보들을 분석하여, 모델 설계에 필요한 일반화된 입력 패턴들을 도출하고, 도출된 패턴들을 바탕으로 더욱 쉽고 빠르게 사용자 모델을 생성할 수 있는 방법을 제안한다.

  • PDF

현장암반 모델을 적용한 터널의 역해석 (Application of Back Analysis for Tunnel Design by Modified In Situ Rock Model)

  • 김학문;이봉열;황의석;김태훈
    • 한국터널지하공간학회 논문집
    • /
    • 제2권3호
    • /
    • pp.25-36
    • /
    • 2000
  • 본 연구에서는 합리적이고 공학적인 터널 해석 방법을 제시하기 위해, 시공 중 막장에서 관찰된 신뢰성 높은 암석 및 암반 평점분류 방식과 실내시험을 근거로 하는 일반화된 Hoek-Brown의 현장 암반 모델을 현재 시공이 완료된 지하철 터널 공사 현장의 계측자료와 비교 분석하였다. 그 결과로서 실무적인 측면에서의 터널해석을 위한 일반화된 Hoek-Brown 현장 암반모델의 국내 적용성을 제시하고 적용으로 인한 지반 입력물성치에 대한 타당성을 Trueman과 Trunk의 경험적인 추정식으로 검증하고자 한다. 그러나 불량한 암반의 RMR 값은 정확도가 떨어지기 때문에 일반화된 Hoek-Brown의 현장 암반모델의 적용성에 문제가 있으나, 시공 중 계측자료로 보완함으로서 위험도가 높은 불량암반의 적용성을 평가하였다. 본 연구를 통해서 암석의 경험적인 파괴규준인 일반화된 Hoek-Brown 현장 암반모델을 적용하여 변형과 강도에 과한 암반 입력물성치를 결정하는 과정에서 GSI하한치 = RMR-5를 사용함으로서 현장에서 안정해석의 정확도를 높일 수 있음을 알 수 있다. 단, 여기서는 편마암의 mi=33, 풍화암의 최저치 ${\sigma}ci=100t/m^2$ 이고 GSI는 RMR Chart의 해당연도와 상관없이 동일하다는 조건에서 이루어졌다.

  • PDF

2차원 중합전 일반화된-막 구조보정 (2D Prestack Generalized-screen Migration)

  • 송호철;설순지;변중무
    • 지구물리와물리탐사
    • /
    • 제13권4호
    • /
    • pp.315-322
    • /
    • 2010
  • 위상막 구조보정과 split-step Fourier 구조보정은 주파수-파수, 주파수-공간 영역에서 단방향 파동방정식을 이용하여 빠른 계산 속도로 수평적 속도변화를 고려할 수 있는 구조보정이다. 일반화된-막(generalized-screen) 구조보정은 주파수-파수영역에서 수직전파를 가정하는 위의 두 구조보정과는 달리 수직전파를 가정하지 않고, 지수함수의 무한급수 전개를 이용한다. 또한 수직느리기항의 테일러 급수전개를 일반화하여 고차항을 추가함으로써 급격한 속도변화를 갖는 지하구조에서 넓은 각으로 전파하는 파동장에 대한 정확도를 향상시켰다. 이 논문은 다양한 경사와 급격한 속도변화를 포함하는 복잡한 지하구조를 효율적으로 보다 정확하게 영상화하기 위하여 2차원 일반화된-막 구조보정에 대하여 연구하였다. 일정한 미소변량(constant perturbation)을 갖는 매질과 SEG/EAGE 암염돔을 모사한 모델에 대하여 일반화된-막 전파자와 위상막 전파자의 전파된 파동장을 비교한 결과, 일반화된-막 전파자가 파동장의 넓은각 전파에 대해 위상막 전파자보다 높은 정확도를 보였다. 또한 일반화된-막 전파자의 차수를 증가시킬수록 넓은 각으로 전파하는 파동장의 정확도가 향상되었다. 큰 수평적 속도변화와 급경사를 갖는 모델과 SEG/EAGE 암염돔 합성 탄성파탐사 자료에 대하여 일반화된-막 구조보정과 위상막 구조보정을 적용한 결과, 일반화된-막 구조보정이 속도변화가 크고 급격한 경사를 갖는 반사면을 보다 정확한 위치에 뚜렷하게 영상화하였다.

색상 정보를 포함하여 2차원 대상물 인식에 보다 적합한 일반화된 허프변환에 관한 연구 (A Study on Improving Generalized Rough Transform with Chromatic Informations, Suited for 2D Object Recognition)

  • 백기현;이행세
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1984-1987
    • /
    • 2003
  • 본 논문에서는 모델에 기반한 2차원 영상인식 알고리즘 중에 하나인 일반화된 허프변환(Generalized Hough Transform)에 대하여 색상정보까지 포함할 수 있도록 기존의 알고리즘을 확장하는 방법을 제시하였고, 이에 의한 실험결과를 간단히 고찰하였다. 기존의 일반화된 허프변환은 대상물의 윤곽선 정보에 기반을 두었기 때문에, 윤곽선 정보가 일치하면 대상물의 색상이나 명암분포가 달라도 동일한 대상물로 인식할 가능성이 있다. 따라서, 일반화된 허프변환을 확장하여 대상물의 모델링과 인식과정에 색상정보(chromatic information)를 포함한다면 2D 영상인식시 컬러정보를 활용할 수 있는 장점이 있다. 여기에서는 실제로 모델링 과정과 인식과정에서 색상정보를 반영하기 위한 간략한 방법과, 이에 따른 실험결과를 제시하였다. 간단한 2D 위치변환이 존재하는 실험에서 윤곽선의 모양이 거의 일치하더라도 색상이 다른 대상물이 존재할 경우에 이를 올바로 구분할 수 있었다.

  • PDF

하이브리드모델을 이용한 장단비가 다른 코팅된 단섬유를 갖는 복합재의 등가열전도계수 예측 (Prediction of Effective Thermal Conductivity of Composites with Coated Short Fibers of Different Aspect Ratios Using Hybrid Model)

  • 이재곤;김진곤
    • 한국산학기술학회논문지
    • /
    • 제14권6호
    • /
    • pp.2618-2623
    • /
    • 2013
  • 일정하지 않은 장단비의 코팅된 충전재가 한 방향으로 정렬된 복합재의 등가열전도계수를 쉽게 예측할 수 있는 하이브리드모델을 제시한다. 코팅된 충전재의 등가열전도계수를 일반화된 자기일치모델로 계산하고, 원래 복합재를 모재와 이 값을 갖는 단섬유로 단순화한 후 수정된 에쉘비 모델을 적용한다. 일정한 장단비의 코팅된 단섬유가 한 방향으로 정렬된 복합재에 대해 일반화된 자기일치모델과 수정된 에쉘비모델의 예측결과를 하이브리드모델과 비교한다. 마지막으로 장단비 2와 10인 코팅된 단섬유가 한 방향으로 배치된 복합재의 등가열전도계수를 하이브리드모델로 쉽게 계산할 수 있음을 보여준다.

자연 프루닝과 베이시안 선택에 의한 신경회로망 일반화 성능 향상 (Improving Generalization Performance of Neural Networks using Natural Pruning and Bayesian Selection)

  • 이현진;박혜영;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.326-338
    • /
    • 2003
  • 신경회로망 설계 및 모델선택의 목표는 최적의 구조를 가지는 일반화 성능이 우수한 네트워크를 구성하는 것이다. 하지만 학습데이타에는 노이즈(noise)가 존재하고, 그 수도 충분하지 않기 때문에 최종적으로 표현하고자 하는 진확률 분포와 학습 데이타에 의해 표현되는 경험확률분포(empirical probability density) 사이에는 차이가 발생한다. 이러한 차이 때문에 신경회로망을 학습데이타에 대하여 과다하게 적합(fitting)시키면, 학습데이타만의 확률분포를 잘 추정하도록 매개변수들이 조정되어 버리고, 진확률 분포로부터 멀어지게 된다. 이러한 현상을 과다학습이라고 하며, 과다학습된 신경회로망은 학습데이타에 대한 근사는 우수하지만, 새로운 데이타에 대한 예측은 떨어지게 된다. 또한 신경회로망의 복잡도가 증가 할수록 더 많은 매개변수들이 노이즈에 쉽게 적합되어 과다학습 현상은 더욱 심화된다. 본 논문에서는 통계적인 관점을 바탕으로 신경회로망의 일반화 성능을 향상시키는 신경회로 망의 설계 및 모델 선택의 통합적인 프로세스를 제안하고자 한다. 먼저 학습의 과정에서 적응적 정규화가 있는 자연기울기 학습을 통해 수렴속도의 향상과 동시에 과다학습을 방지하여 진확률 분포에 가까운 신경회로망을 얻는다. 이렇게 얻어진 신경회로망에 자연 프루닝(natural pruning) 방법을 적용하여 서로 다른 크기의 후보 신경회로망 모델을 얻는다. 이러한 학습과 복잡도 최적화의 통합 프로세스를 통하여 얻은 후보 모델들 중에서 최적의 모델을 베이시안 정보기준에 의해 선택함으로써 일반화 성능이 우수한 최적의 모델을 구성하는 방법을 제안한다. 또한 벤치마크 문제를 이용한 컴퓨터 시뮬레이션을 통하여, 제안하는 학습 및 모델 선택의 통합프로세스의 일반화 성능과 구조 최적화 성능의 우수성을 검증한다.

ODBMS기반의 XML 문서저장관리시스템 (A ODBMS-based XML Document Repository System)

  • 왕지현;김현기;정의석;임수종;임명은
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.34-36
    • /
    • 2001
  • 컴퓨터 산업이 발전하고 정보량이 늘어남에 따라 XML이 다양한 분야에 사용되고 있다. 본 논문은 여러분야에 활용되고 있는 XML문서들을 효율적으로 저장하고 관리할 수 있을 뿐만 아니라 다 사용자 환경에서 문서의 전체나 일부를 공유할 수 있는 기능을 제공하는 XML 문서저장관리시스템을 소개한다. 다양한 DTD를 수용하기 위해 객체 지향적인 일반화 데이터 모델을 제안하며 , 시스템을 구성하고 있는 각 구성요소 모듈을 설명한다. 일반화 데이터 모델은 DTD 의존적인 모델에 비해 연산량이 적을 뿐더러 여러 DTD를 하나의 스키마로 수용할 수 있다.

  • PDF