• 제목/요약/키워드: 랜덤 변수

검색결과 261건 처리시간 0.026초

유사가능도 기반의 네트워크 추정 모형에 대한 GPU 병렬화 BCDR 알고리즘 (BCDR algorithm for network estimation based on pseudo-likelihood with parallelization using GPU)

  • 김병수;유동현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.381-394
    • /
    • 2016
  • 그래피컬 모형은 변수들 사이의 조건부 종속성을 노드와 연결선을 통하여 그래프로 나타낸다. 변수들 사이의 복잡한 연관성을 표현하기 위하여 그래피컬 모형은 물리학, 경제학, 생물학을 포함하여 다양한 분야에 적용되고 있다. 조건부 종속성은 공분산 행렬의 역행렬의 비대각 성분이 0인 것과 대응하는 두 변수의 조건부 독립이 동치임에 기반하여 공분산 행렬의 역행렬로부터 추정될 수 있다. 본 논문은 공분산 행렬의 역행렬을 희박하게 추정하는 유사가능도 기반의 CONCORD (convex correlation selection method) 방법에 대하여 기존의 BCD (block coordinate descent) 알고리즘을 랜덤 치환을 활용한 갱신 규칙과 그래픽 처리 장치 (graphics processing unit)의 병렬 연산을 활용하여 고차원 자료에 대하여 보다 효율적인 BCDR (block coordinate descent with random permutation) 알고리즘을 제안하였다. 두 종류의 네트워크 구조를 고려한 모의실험에서 제안하는 알고리즘의 효율성을 수렴까지의 계산 시간을 비교하여 확인하였다.

합리적 생각의 물리적 모델링과 주가 흐름 패턴 분석 (Physical Modelling for Consistent Reasonable Thought and Stock-Price Flow Patterns)

  • 박상업
    • 새물리
    • /
    • 제68권12호
    • /
    • pp.1364-1373
    • /
    • 2018
  • 사람의 생각을 사람들이 인지할 수 있게 표현한 인문학적 기호를 물리학적 기호로 체계적으로 변환한다. 기호를 체계적으로 사용하는 언어의 개념 구조를 수학적 형식으로 정리하고, 합리적인 개인의 선택을 함수로 표현하는 효용을 도입하였다. 일관성을 도입하여 효용을 보편화하고, 언어의 개념구조와 호환되게 함수를 구성하였고, 확률 형태로 변형하였다. 확률에 대한 랜덤변수를 도입하고, 물리적 위치 변수와 랜덤변수를 연결하여 물리학적 기호를 도입하였다. 기호변화의 패턴을 유도하고 물리적 기호의 변화모델을 구성하였다. 모델은 점프형, 표류형과 확산형 변화 패턴을 예측하고, 주가흐름의 패턴에서 약 2분, 약 3.5분과 약 6분 정도에 나타나는 것을 보였다. 또한 인문학적인 도상기호, 상징기호와 지표기호가 모델에서 예측되는 것을 보였다.

Random Forest를 활용한 산사태 피해 영향인자 평가: 충주시 산사태를 중심으로 (Evaluation of the Importance of Variables When Using a Random Forest Technique to Assess Landslide Damage: Focusing on Chungju Landslides)

  • 이재호;정유진;최정해
    • 지질공학
    • /
    • 제34권1호
    • /
    • pp.51-65
    • /
    • 2024
  • 산사태는 전 세계적으로 매년 큰 재산 피해를 야기하는 자연 재해로 알려져 있다. 국내에서도 기후 변화의 영향으로 산사태 피해가 증가하는 경향을 보이고 있으며, 이로 인한 피해를 줄이기 위해서는 산사태를 증가시키는 인자들을 파악하는 것이 중요하다. 따라서 본 연구는 충청북도 충주시에서 발생한 산사태 피해에 영향을 미치는 변수들의 중요도를 평가하기 위해 랜덤포레스트 모델을 활용하여 14개의 인자들 사이의 중요도를 분석하였다. 연구 결과, 모델의 성능은 AUC가 0.87로 높은 정확도를 보이며, 변수 중요도는 경사 방향, 경사, 계곡까지의 직선 거리, 고도 순으로 정해졌으며, 이는 경사방향과 경사 등의 지형인자가 암종과 유효토심과 같은 지질과 토양인자보다 산사태 피해에 더 큰 영향을 미친다는 것을 시사한다. 이 연구 결과는 산사태 피해 예측지도의 제작 및 산사태 피해 감소에 초점을 맞춘 연구에 기초 자료로서 활용될 수 있을 것으로 기대된다.

비선형 회귀를 이용한 학습도우미 애플리케이션 (Learning Assistant Application Using Non-Linear Regression)

  • 장은영;김강우;김민식;류다은;박승묵;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.235-237
    • /
    • 2021
  • 코로나 19로 대학교 강의들이 비대면 방식으로 전환되고 있는데, 기존의 교수학습 지원센터는 웹 환경만을 제공한다. 따라서 본 논문에서는 모바일 애플리케이션을 통해 수강생들이 교수학습 지원센터에 쉽게 접근할 수 있도록 도와주는 시스템을 개발하였다. 애플리케이션에서 학생들의 강의 시간 및 시험, 과제 등의 일정을 관리해주고, 푸시 알림을 제공해주는 학습 도우미의 역할을 수행한다. 뿐만 아니라 직관적인 인터페이스, 다크 모드, scroll-to-top 버튼 등을 고려한 디자인으로 사용자의 편리함을 도모한다. 학습 도우미 애플리케이션의 가장 핵심기능 중 하나는 머신러닝 기법 중 비선형 회귀(Non-Linear Regression)을 이용해 성적 데이터를 분석해주는 차별화된 기능이다. 이를 위해 최종적인 성적을 종속변수, 일정 기간까지의 성적을 독립변수로 설정하여 기존의 성적 데이터를 바탕으로 종속변수인 최종성적을 랜덤 포레스트 비선형 회귀분석으로 예측하는 알고리즘을 제시하고자 한다.

  • PDF

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.35-47
    • /
    • 2020
  • 박스 오피스 예측은 영화 이해관계자들에게 중요하다. 따라서 정확한 박스 오피스 예측과 이에 영향을 미치는 주요 변수를 선별하는 것이 필요하다. 본 논문은 영화의 박스 오피스 예측 정확도 향상을 위해 다변량 시계열 데이터 분류와 주요 변수 선택 방법을 제안한다. 연구 방법으로 한국 영화 일별 데이터를 KOBIS와 NAVER에서 수집하였고, 랜덤 포레스트(Random Forest) 방법으로 주요 변수를 선별하였으며, 딥러닝(Deep Learning)으로 다변량 시계열을 예측하였다. 한국의 스크린 쿼터제(Screen Quota) 기준, 딥러닝을 이용하여 영화 개봉 73일째 흥행 예측 정확도를 주요 변수와 전체 변수로 비교하고 통계적으로 유의한지 검정하였다. 딥러닝 모델은 다층 퍼셉트론(Multi-Layer Perceptron), 완전 합성곱 신경망(Fully Convolutional Neural Networks), 잔차 네트워크(Residual Network)로 실험하였다. 결과적으로 주요 변수를 잔차 네트워크에 사용했을 때 예측 정확도가 약 93%로 가장 높았다.

정수장 전염소 공정제어를 위한 침전지 잔류염소농도 예측 머신러닝 모형 (Machine learning model for residual chlorine prediction in sediment basin to control pre-chlorination in water treatment plant)

  • 김주환;이경혁;김수전;김경훈
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1283-1293
    • /
    • 2022
  • 본 연구는 정수장의 수처리 공정에서 계측되고 있는 수량 및 수질데이터의 활용과 수처리 공정제어의 지능화를 위한 것으로 정수장에서 전염소 공정이 수반되는 처리공정에서 침전지 유출수 잔류염소농도 안정화를 위하여 이를 추정할 수 있는 모형을 구축하고자 하였다. 정수장 침전지 유출수의 잔류염소농도를 예측하기 위하여 중회귀모형과 인공지능 알고리즘 중 다층퍼셉트론 신경망, 랜덤포레스트 및 장단기기억(Long Short Term Memory; LSTM) 모형을 활용하였고 그 결과를 비교, 평가하였다. 모형의 입력변수로는 전염소 공정이 도입된 정수장에서의 잔류염소농도, 수온, 탁도, pH, 전기전도도, 유량, 알칼리도 등이 사용되었고 전염소에 따른 침전지의 안정적 운영을 위해 요구되는 침전지 잔류염소농도를 출력변수로 구성하였다. 적용 결과에서는 랜덤포레스트 모형이 가장 양호한 결과를 보여 주었으며 다음으로 LSTM, 다층퍼셈트론 신경망 순으로 나타났다. 수학적 모형인 중회귀모형은 적합도 측면에서 가장 낮은 결과를 보여 주었는데, 이는 수량과 수질데이터의 수치적인 규모나 차원의 차이뿐만 아니라 계절별 수질특성에 따라 염소소비 특성이 매우 다양하게 반응하기 때문으로 판단된다. 따라서 정수장 수처리 공정에서 인공지능 알고리즘의 적용을 위해서는 랜덤포레스트와 같이 의사결정 트리구조의 도입과 적용이 타당한 것으로 나타났다. 본 연구에서 분석된 결과를 근거로 전염소 공정이 도입된 정수장 수처리 공정에서 염소주입량을 실시간으로 예측 가능하게 함으로써 침전지 유출수에서 잔류염소농도를 일정하게 유지하는데 기여할 수 있을 것으로 기대된다.

노이즈 매개변수 예측 기반 고속 노이즈 제거 방식 (Fast Blind Image Denoising Algorithm Based on Estimating Noise Parameters)

  • 응웬 뚜안안;김범수;홍민철
    • 전기전자학회논문지
    • /
    • 제18권4호
    • /
    • pp.523-531
    • /
    • 2014
  • 본 논문에서는 노이즈에 대한 사전 정보 없이 단일 왜곡 영상으로부터 노이즈 매개 변수를 예측하고, 예측된 매개변수를 이용한 고속 노이즈 검출 및 제거하는 기법에 대해 제안한다. 왜곡 영상의 국부 통계를 이용하여 예측된 노이즈 매개 변수는 노이즈 검출기를 위한 사전 제약 조건으로 활용되며, 상기 제약 조건은 1차 마르코프 랜덤 장과 결합하여 노이즈 검출기를 구성하게 된다. 더불어 노이즈 검출 과정에서 설정된 제약 조건 및 매개 변수를 기반으로 복원 영상의 완화도를 제어하기 위한 가변 필터 차수의 가중치 기반 적응 노이즈 제거 필터를 제안한다. 실험 결과를 통해 제안 방식의 우수성을 검증할 수 있었다.

PGA 투어의 골프 스코어 예측 및 분석 (Prediction of golf scores on the PGA tour using statistical models)

  • 임정은;임영인;송종우
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.41-55
    • /
    • 2017
  • 최근 골프는 많은 사람들의 취미 생활로서 자리를 잡아가고 있으며 골프와 관련된 연구도 다양하게 이루어지고 있다. 본 연구에서는 데이터 마이닝 기법을 사용하여 PGA 투어에 참여하는 선수들의 평균스코어를 예측하고 스코어에 유의한 영향을 미치는 변수들을 제시하고자 한다. 그리고 추가적으로 4개의 PGA 투어 플레이오프에 대해 상위 10명, 상위 25명의 선수들을 예측하는 것을 목표로 한다. 우리는 다양한 선형/비선형 회귀분석 방법을 이용하여 평균스코어를 예측하는데, 선형회귀분석 방법으로는 단계적 선택법, 모든 가능한 회귀모형, 라소(LASSO), 능형회귀, 주성분회귀분석을 사용하였으며 비선형회귀분석 방법으로는 트리(CART), 배깅, 그래디언트 부스팅, 신경망 모형, 랜덤 포레스트, 최근접이웃방법(KNN)을 사용하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면 페어웨이의 단단함와 그린의 풀의 높이, 평균최대풍속이 높을수록 선수들의 평균스코어는 높아지며 반대로 한 번에 퍼팅을 성공시키는 횟수와 그린적중률 실패 후 버디나 이글로 점수를 만드는 scrambling 변수들, 그리고 공을 멀리 보낼 수 있는 능력을 나타내는 longest drive는 그 값이 높아짐에 따라 선수들의 평균스코어가 낮아지는 경향이 있음을 알 수 있었다. 11가지 모형 모두 테스트 데이터인 2015년 경기 결과를 예측하는데 낮은 오류율을 보였으나 배깅과 랜덤 포레스트의 예측률이 가장 좋았으며 두 모형 모두 상위 10명과 상위 25명의 랭킹을 예측할 때 상당히 높은 적중률을 보였다.

랜덤포레스트와 Sentinel-2를 이용한 식생 분류의 입력특성 최적화 (Optimization of Input Features for Vegetation Classification Based on Random Forest and Sentinel-2 Image)

  • 이승민;정종철
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.52-67
    • /
    • 2020
  • 최근 북극은 매년 영구 동토층이 녹아 눈으로 덮인 땅이 드러나고 있어 해당 지역 관리를 위한 공간정보가 필요하다. 한국의 국토지리정보원(NGII)은 극지방의 공간정보를 구축하여 극지공간정보 서비스를 제공하고 있으나, 식생 정보는 제공되지 않고 있으므로 식생 공간정보 구축을 위한 추가적인 연구가 필요하다. 본 연구에서는 북극 스발바르제도의 뉘올레순 지역에 대한 식생 분류를 수행하기 위해 다중 시기의 Sentinel-2 영상을 사용하였다. 전처리 단계에서는 다중 시기 Sentinel-2 영상으로부터 10개 밴드와 6가지 정규 지수식을 생성하였다. 영상 분류는 8개 속성에 대한 토지피복분류를 통해 전체 식생 영역을 추출하는 과정과 전체 식생 영역 내에서 다시 세분류를 수행하는 과정으로 이루어졌다. 영상 분류 알고리즘은 OOB(Out-Of-Bag)를 통해 정확도 평가 및 변수 중요도를 산정할 수 있는 랜덤포레스트를 사용하였다. 전체 정확도는 다시기 영상이 사용되었을 경우와 식생 지수가 추가되었을 경우의 이점을 확인하기 위해 사용된 영상 수에 따라 각각 정확도를 산정하였다. 단일시기의 Sentinel-2 영상은 전체 정확도가 77%였으나, 7개의 다중 시기 Sentinel-2 영상을 기반으로 학습하였을 때, 81%로 향상되었다. 또한, 식생 지수가 추가로 사용된 학습에서 전체 정확도가 약 83%로 향상되었다. 식생 분류 시 변수 중요도는 적색, 녹색, 단파적외선-1 밴드가 가장 높은 변수로 선정되었다. 본 연구는 극지방의 식생에 대한 분류를 수행할 시 입력특성을 최적화하는 기초 연구로 활용될 수 있을 것으로 판단된다.

패턴인식법에 의한 압축기의 이상진단에 관한 연구

  • 김태구;김광일
    • 한국산업안전학회:학술대회논문집
    • /
    • 한국안전학회 2001년도 공동학술대회
    • /
    • pp.25-30
    • /
    • 2001
  • 엔진이나 콤프레셔 등과 같은 기기 진동의 동특성은 불규칙적으로 변동하는 성분을 갖는 랜덤 프로세스로 그것을 수학적으로 명확히 기술하는 것은 어렵다/sup 1)/. 하지만 통계학적인 입장에서 시계열 데이터를 보면 시계열 데이터가 확률변수로서 각각의 모집단에 속한다. 따라서 이 점에 주목하여 시계열의 확률적인 특징을 추출하는 것으로, 각각의 시계열 데이터를 확률공간으로 구별하는 것이 가능하다면 시계열 데이터에 의해 표현되어진 상태의 식별가능하다는 이론이 성립된다/sup 2)/.(중략)

  • PDF