• 제목/요약/키워드: 함수데이터분석

검색결과 911건 처리시간 0.033초

딥러닝을 위한 경사하강법 비교 (Comparison of Gradient Descent for Deep Learning)

  • 강민제
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.189-194
    • /
    • 2020
  • 본 논문에서는 신경망을 학습하는 데 가장 많이 사용되고 있는 경사하강법에 대해 분석하였다. 학습이란 손실함수가 최소값이 되도록 매개변수를 갱신하는 것이다. 손실함수는 실제값과 예측값의 차이를 수치화 해주는 함수이다. 경사하강법은 오차가 최소화되도록 매개변수를 갱신하는데 손실함수의 기울기를 사용하는 것으로 현재 최고의 딥러닝 학습알고리즘을 제공하는 라이브러리에서 사용되고 있다. 그러나 이 알고리즘들은 블랙박스형태로 제공되고 있어서 다양한 경사하강법들의 장단점을 파악하는 것이 쉽지 않다. 경사하강법에서 현재 대표적으로 사용되고 있는 확률적 경사하강법(Stochastic Gradient Descent method), 모멘텀법(Momentum method), AdaGrad법 그리고 Adadelta법의 특성에 대하여 분석하였다. 실험 데이터는 신경망을 검증하는 데 널리 사용되는 MNIST 데이터 셋을 사용하였다. 은닉층은 2개의 층으로 첫 번째 층은 500개 그리고 두 번째 층은 300개의 뉴런으로 구성하였다. 출력 층의 활성화함수는 소프트 맥스함수이고 나머지 입력 층과 은닉 층의 활성화함수는 ReLu함수를 사용하였다. 그리고 손실함수는 교차 엔트로피 오차를 사용하였다.

HOG 특징을 이용한 다항식 방사형 기저함수 신경회로망 기반 숫자 인식 방법의 설계 (Design of Digits Recognition Method Based on pRBFNNs Using HOG Features)

  • 김봉연;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1365-1366
    • /
    • 2015
  • 본 논문에서는 HOG 특징을 이용한 다항식 방사형 기저함수 신경회로망 기반 숫자 인식 시스템의 설계를 제안한다. 제안한 숫자 인식 시스템은 HOG 특징을 이용하여 숫자를 입력 데이터로 사용하기 위해 특징을 계산한다. 다항식 방사형 기저 함수 신경회로망은 고차원 데이터의 입-출력 형태를 갖는 클래스를 분류하는데 용이하며, 활성함수의 중심점 및 분포상수는 Fuzzy C-Means(FCM) 알고리즘에 의해 초기 값을 설정한다. 또한 제안한 분류기의 최적화를 위해 Particle Swarm Optimization(PSO)를 사용하여 최적화된 분류기의 성능을 비교한다. 숫자 인식을 위하여 공인 데이터베이스인 MNIST handwritten digit database를 사용하여 분류기의 성능을 평가하고 분석한다.

  • PDF

의료 영상 바이오마커 추출을 위한 딥러닝 손실함수 성능 비교 (Comparison of Deep Learning Loss Function Performance for Medical Video Biomarker Extraction)

  • 서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.72-74
    • /
    • 2021
  • 다양한 분야에서 현재 활용되고 있는 딥러닝 과정은 데이터 준비, 데이터 전처리, 모델 생성, 모델 학습, 모델 평가로 구성 된다. 이중 모델 학습 과정에서 손실함수는 모델이 학습하면서 출력한 값을 실제 값과 비교하여 그 차이를 출력하게 되고, 출력된 손실값을 기반으로 모델은 역전파 알고리즘을 통해 손실값이 감소하는 방향으로 가중치를 수정해가며 학습을 진행한다. 본 논문에서는 바이오마커 추출을 위한 딥러닝 모델에서 사용될 신경망 출력 값의 손실도를 측정하여 출력해주는 다양한 손실함수를 분석하고 실험을 통해 최적의 손실함수를 찾아내고자 한다.

  • PDF

25 kHz 대역에서 PN 신호열을 이용한 거제 천해역 수중음향통신 채널 특성 분석 (Shallow Water Acoustic Communication Channel Characteristic Analysis Using PN Sequence with 25 kHz Carrier at the Shore of Geojea Island)

  • 김승근;김시문;임용곤
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.381-389
    • /
    • 2007
  • 본 논문에서는 천해역에서 PN 신호열의 자기상관특성을 이용하여 수중 초음파통신 채널 특성을 측정하는 방법과 수신 신호 샘플 데이터로부터 수중통신 채널 특성 분석 결과에 대하여 기술한다. 수중음향통신 채널의 특성을 측정하기 위하여 두개의 PN 신호를 I-채널 및 Q-채널 데이터로 사용하여 QPSK 심볼을 생성하고, 5 kHz 심볼율과 25 kHz 반송파를 갖는 신호로 변조하여 전송한다. 수신부는 송신기에서 675 m와 1492 m 떨어진 위치에서 수신 신호를 샘플링하여 저장한다. 저장된 샘플 데이터를 이용하여 산란 함수, 상관 시간, 지연전력 프로파일, spaced-tone 자기상관함수, 지연 확산 및 상관 대역폭을 각각의 음파 전파 거리에 대하여 분석한다. 또한, 분석한 채널 특성을 토대로 수중 전송 시스템 설계 및 구현을 위한 설계 지침을 제안한다.

Haplotype 블록 분할을 위한 LD 기반 알고리즘 (LD-based Algorithm for Haplotype Block Partitioning)

  • 나경락;김상준;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.331-333
    • /
    • 2004
  • 본 연구는 Haplotype 데이터에서 나타나는 별개의 Haplotype의 수를 최소화하는 블록으로 분할하는 방법을 제안한다. Multi-population case인 Haplotype 데이터를 분석하기 위해 패턴의 개수를 최소한으로 줄이는 볼록 분할 방법은 전산학적인 최적해의 의미를 가지게 되며, 이와 더불어 생물학적인 의미를 가지는 블록 경계를 찾기 위해 |D'| 을 계산하고 LD를 분석하였다 분석된 LD는 블록 분할 알고리즘에서 블록 결정 함수로 사용하였으며, 이에 대한 검정은 X$^2$-test를 통해 이루어졌다. 많은 Sample로 구성된 Haplotype 데이터로부터 평균 패턴의 개수를 최소화하고 긴 블록 길이를 가지는 블록 분할의 결과를 얻었다.

  • PDF

이동전화망에서 호 도착 시간과 채널 보류 시간의 통계적 분석 (Statistical Analysis of Call Interarrival Time and Channel Holding Time in Cellular Telephony Network)

  • 엄태랑;장주욱;이경근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.478-480
    • /
    • 2003
  • 일반적으로 음성전화망에서 수학적 모델을 사용하여 트래픽 분석을 수행하는 경우 호 도착 시간과 채널 보류 시간은 지수 분포라고 가정한다. 본 논문에서는 이동전화망을 구성하고 있는 교환기에서 추출한 과금 데이터를 이용하여 호 발생으로 인해 집계되는 호량애 관한 호 도착 시간과 채널 보류 시간이 나타내는 분포를 알아본다. 또한 분석된 확률 분포를 통계적 검정 방법을 이용하여 경험분포함수에 대한 기대 분포함수의 적합성을 판별한다.

  • PDF

원전 디지털 I&C 계통 고장예측을 위한 신뢰도 함수 추정 인공지능 모델 비교연구 (Comparative Study of AI Models for Reliability Function Estimation in NPP Digital I&C System Failure Prediction)

  • 이대영;이정훈;양승혁
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.1-10
    • /
    • 2023
  • 원전 계측제어계통은 정상운전 시 자가 진단기능의 유지보수를 위해 일정 주기로 건전성을 확인하고 있으며, 계획예방정비 기간 동안 기능 및 성능점검을 실시하여 필요한 경우 유지보수를 하고 있다. 하지만 원전의 정보를 계측하고 제어하는 계측제어계통에서도 선제적으로 고장을 진단하고 대처하여 사고전파를 방지할 수 있는 기술개발이 필요하다. 이에 본 논문에서는 계측제어 장비의 환경조건과 자가 진단 데이터를 활용한 신뢰도 함수 추정 방안을 연구하였으며, 고장데이터의 획득을 위해 계측제어 장비의 부품에 대한 Feature 별 확률분포를 가정하여 가상 고장데이터를 생산하였다. 이러한 고장데이터를 바탕으로 생존분석에서 활용되는 대표적인 인공지능 모델(DeepSurve, DeepHit)을 이용하여 신뢰도 함수를 추정하였고, 그와 동시에 전통적인 준모수적 방법론인 Cox 회귀모델을 통해 신뢰도 함수를 추정하여 환경조건과 진단 데이터를 바탕으로 한 잔여 수명 계산을 통해 적용 가능성을 확인하였다.

머신러닝 기반 유클리드 거리를 이용한 붓꽃 품종 분류 재구성 (A Reconstruction of Classification for Iris Species Using Euclidean Distance Based on a Machine Learning)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.225-230
    • /
    • 2020
  • 기계학습은 데이터를 기반으로 한 컴퓨터를 학습시켜 컴퓨터 스스로 데이터의 경향성을 파악하게 하여 새로운 입력 데이터의 출력을 예측하도록 하는 알고리즘이다. 기계학습은 크게 지도학습, 비지도학습, 강화학습으로 나눌 수 있다. 지도학습은 데이터에 대한 레이블이 주어진 상태로 기계를 학습시키는 방법이다. 즉, 데이터 및 레이블의 쌍을 통해 해당 시스템의 함수를 추론하는 방법으로 새로운 입력 데이터에 대해서 추론한 함수를 이용하여 결과를 예측한다. 그리고 예측하는 결과 값이 연속 값이면 회귀분석, 예측하는 결과 값이 이산 값이면 분류로 사용된다. 새로운 붓꽃 데이터 Sepal length(5.01)과 Sepal width(3.43)을 이용하여 기초 데이터와 유클리드 거리를 분석하였다. 분석결과, 테이블 3의 8번(5, 3.4, setosa), 27번(5, 3.4, setosa), 41번(5, 3.5, setosa), 44번(5, 3.5, setosa) 그리고 40번(5.1, 3.4, setosa)의 데이터 순으로 유사도가 높은 붓꽃으로 분류되었다. 따라서 이론적 실무적 시사점을 제시하였다.

실제 작품의 분석을 통한 점묘화의 색상병치 (The Color Juxtaposition of Pointillism Based on Real-Works Analysis)

  • 서상현;윤경현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제16권2호
    • /
    • pp.19-28
    • /
    • 2010
  • 본 논문에서는 점묘주의에서 화가들이 사용했던 색상이론을 기반으로 색상병치의 특징 및 패턴을 분석하고 얻어진 분석 데이터를 회화적 렌더링에 적용해 점묘화를 생성하는 알고리즘을 제안한다. 점묘화의 병치를 분석하기 위해서, 실제 작품에 나타나는 스트로크의 색상을 추출하고 그 색상의 분포도를 잘 알려진 확률분포함수와 적합도 검정을 통해 최적의 분포도 함수를 얻는다. 이러한 분포도 함수를 이용해 색상 병치를 함으로써 2D 입력영상을 점묘화풍의 영상으로 효과적으로 변환할 수 있었다. 우리의 연구는 실제 작품을 통해 얻어진 데이터를 사용함으로써 보다 신뢰성이 있으며 합리적이라고 할 수 있다.

다변량 확률분포함수의 추정을 위한 MKDE-ebd 개발 (Development of MKDE-ebd for Estimation of Multivariate Probabilistic Distribution Functions)

  • 강영진;노유정;임오강
    • 한국전산구조공학회논문집
    • /
    • 제32권1호
    • /
    • pp.55-63
    • /
    • 2019
  • 공학문제에서 많은 확률 변수들은 상관성을 가지고 있고, 입력변수의 상관성은 기계시스템의 통계적 성능 분석 결과에 큰 영향을 미친다. 하지만, 상관 변수들은 결합분포함수를 모델링하기 어렵다는 이유로 종종 독립변수로 취급되거나 특정한 모수적 모델로 표현되는 경우가 많으며, 특히 데이터가 적은 경우 결합분포함수를 정확히 모델링하는데 더 큰 어려움이 있다. 본 연구에서 개발된 경계데이터를 이용한 다변량 커널밀도추정은 비선형성을 갖는 다양한 형태의 다변량 확률 분포 추정을 위해 개발되었다. 다변량 커널밀도추정은 주어진 데이터와 균등분포함수의 파라미터의 신뢰구간으로부터 생성된 경계데이터를 결합하여 데이터의 질과 수에 덜 민감하다. 따라서 제안된 방법은 보수적인 통계모델링과 신뢰성 해석 결과를 도출할 수 있으며, 통계시뮬레이션과 공학예제를 통해 그 성능을 검증하였다.