• 제목/요약/키워드: 베이지안 분류

검색결과 200건 처리시간 0.03초

지표변화와 지리공간정보의 연관성 분석을 통한 공주지역 지표환경 변화 분석 (Change Detection of land-surface Environment in Gongju Areas Using Spatial Relationships between Land-surface Change and Geo-spatial Information)

  • 장동호
    • 대한지리학회지
    • /
    • 제40권3호
    • /
    • pp.296-309
    • /
    • 2005
  • 본 연구는 공주지역의 지표변화를 분석하기 위해 우도비 기반의 베이지안 예측모델을 이용하여 지리공간 정보와 지표변화와의 연관성 및 미래의 지표변화를 탐지하였다. 지표변화 지역은 위성사진을 토지피복분류 한 후 선분류 후비교법을 이용하여 변화지역을 추출하였다. 지표변화와 관련이 있는 지리공간 정보는 GIS 환경에서 구축하였으며, 우도비를 이용하여 지표변화 예측도를 작성하였다. 분석결과, 도시지역 및 농업지역 지표변화에 가장 큰 영향을 미치는 주제도는 고도, 하계망, 인구밀도, 도로, 인구이동, 총사업체수, 지가 등이다. 또한 산림지역 지표변화에 영향을 미치는 주제도는 고도, 경사도, 인구밀도, 인구이동, 지가 등이다. 지표변화 분석결과, 도시지역은 금강을 중심으로 구도심과 신도심지역의 도시 확산이 이루어지고, 인터체인지 및 국도를 따라 시가화 지역이 확산 될 것으로 예측되었다. 농업지역은 금강의 소지류 및 인접지역과 연결되는 국도주변 지역이 변화가 일어날 확률이 높다. 산림지역은 대부분 남동쪽에 위치하고 있는데, 그 원인은 밤나무 재배단지가 본 지역에 넓게 나타나면서 산림훼손이 일어날 확률이 높은 것으로 예측되었다. 예측비율 곡선을 이용하여 검증한 결과, 지표변화가 일어날 확률이 가장 높은 상위 $10\%$지역에서 도시지역은 $80\%$, 농업지역은 $55\%$, 산림지역은 $40\%$정도의 예측능력을 보였다. 따라서, 본 통합 모델은 산림지역 예측에는 부적합한 것으로 볼 수 있어서, 향후 새로운 주제도 선정 및 예측모델 등이 필요하다. 결론적으로 본 방법은 향후 토지피복 변화 연구를 위한 효과적인 방법 중의 하나로 적용될 수 있을 것으로 기대된다.

직관 실험 및 코퍼스를 바탕으로 한 의미 중의성 해소 계산 모형 연구 (A Study on the Computational Model of Word Sense Disambiguation, based on Corpora and Experiments on Native Speaker's Intuition)

  • 김동성;최재웅
    • 인지과학
    • /
    • 제17권4호
    • /
    • pp.303-321
    • /
    • 2006
  • 본 논문은 의미 중의성 해소에 대한 화자의 직관의 계산 모형에 대한 연구로 Harris (1964)의 '분포가설'에 근거하여 핵심어와 공기하는 어휘들에 대한 분포적 정규성을 포착하는 언어 직관의 계산 모형을 제안한다. 이를 위해 분포적 정규성에 대한 화자의 처리 계산 모형을 파악하기 위하여 심리언어학적 실험을 실시하고 그 결과를 분석한다. 계산 모형으로는 논리 모형, 확률 모형, 그리고 확률 추론 모형의 세가지 모형이 설정되었다. 실험은 두 가지로 구성되었다. 첫 번째는 100만 어절 코퍼스에서 추출된 문장을 화자 직관으로 의미를 식별하는 실험이었다. 이 실험에서는 응답간 일치도가 98%로 나왔다. 두 번째 실험은, 제한된 환경에서 실험자의 반응을 관찰하기 위한 것으로, 분열문이라는 환경을 통해 핵심어와 공기어사이의 의미 관계를 살펴보았다. 또한 100만 어절 코퍼스에서 관찰된 수치와 실험에서 관찰된 관찰치사이의 상관성을 피어슨의 상관계수로 측정하였다. 그러한 측정 결과 실제 코퍼스에서 관찰되는 현상은 논리모형과 상관성이 있었고, 제한된 환경에서 실시한 결과는 확률 모형과 상관성이 있었다. 이 실험결과는 논리 모형이 우선적으로 의미 분류에 관여하나, 만약 논리 모형이 적용되지 않을 경우 확률 모형이 관여함을 보여 준다. 아울러 의미 결정 모형의 관점에서는 논리 모형이 정확하게 직관모형을 예측할 수 있었고, 확률추론 모형도 직관모형을 근사치에 가깝게 예측할 수 있었다.

  • PDF

고속도로 네트워크에서 동적기종점수요 추정기법 비교연구 (Comparison of Dynamic Origin Destination Demand Estimation Models in Highway Network)

  • 이승재;조범철;김종형
    • 대한교통학회지
    • /
    • 제18권5호
    • /
    • pp.83-97
    • /
    • 2000
  • 직접적인 신호제어 및 정보제공을 이용한 교통혼잡의 완화는 링크수준(Link-level)의 자료와 통행수준(Trip-level)의 자료를 동시에 이용하는 것이 효율적이나, 통행수준의 자료인 교통수요의 기점과 종점, 그리고 출발시간 등이 검지체계를 통해서 직접적으로 얻을 수 없어 이를 간접적으로 추정하는 것이 필요하다. 따라서, 본 연구의 목적은 기존의 기종점 추정 모형과는 달리, 교통류 시뮬레이션 모형이나 기종점 수요에 대한 시계열자료 등의 사전정보 없이도 링크교통량만을 가지고도 해당 네트워크에 가능한 모든 O-D조합에 대한 분할비를 동시에 시간 효율적으로 추정 가능한 모형을 개발, 비교하는 것이다 이 모형에는 비통행배정기반 모형에 적합한 칼만필터를 베이지안 갱신법에 기초하여 개발하고 최소자승법과 이를 토대로한 정규화 최소자승법도 함께 제시하였다. 본 연구에서 개발한 3가지의 모형을 가상의 고속도로 네트워크에 적용한 결과, 갑작스러운 수요 변화를 가지는 교통수요 패턴과 첨두를 3개 가지는 하루 24시간 교통수요 패턴에도 적응성 있는 결과를 보였다. 따라서, 본 모형은 연속류에서 수요관리 및 제어, 여행시간 예측과 동적통행배정, 차종분류 등의 기초적인 자료획득을 위해 사용될 수 있을 것으로 판단된다.

  • PDF

트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 (Geographical Name Denoising by Machine Learning of Event Detection Based on Twitter)

  • 우승민;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.447-454
    • /
    • 2015
  • 본 논문에서는 트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 방식을 제안한다. 최근 스마트폰 이용자의 증가로 소셜 네트워크 서비스(SNS) 이용자가 증가하고 있는 추세이다. 그중 트위터는 140자 이내의 단문서비스와 팔로우 기능으로 정보의 빠른 전달력과 확산성을 가지고 있다. 이러한 특성과 모바일에 최적화된 트위터의 특성상 정보 전달 속도가 매우 빠르기 때문에 재난 상황이나 이벤트 전달의 매개체 역할을 하고 있다. 이와 관련된 연구로는 트위터 사용자 개개인을 이벤트 탐지의 센서로 사용하여 현실에서 발생하는 이벤트를 탐지하였는데 이벤트가 특정 장소에서 발생한다는 특성을 이용해서 지명 키워드를 사용하였다. 그러나 지명과 동형이의어 관계에 관한 노이즈제거에 대한 부분이 누락되어있어서 이벤트 탐지의 정확도를 낮추는 요인이 된다. 이에 본 논문에서는 제거와 예측 두 가지 방식으로 노이즈제거 기법을 적용하였다. 먼저 노이즈 관련 데이터베이스 구축을 이용하여 제거 필터링을 진행한 후에 나이브 베이지안 분류를 이용해서 지명 유무를 결정하였다. 실험 데이터를 이용해서 기계학습을 위한 확률값을 구했으며, 지명마다 본 논문에서 제시하는 예측기법을 검증했을 때 89.6%의 신뢰도로 노이즈제거 기법의 필요성을 보였다.

행동 패턴 모델을 이용한 게임 봇 검출 방법 (Behavior Pattern Modeling based Game Bot detection)

  • 박상현;정혜욱;윤태복;이지형
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.422-427
    • /
    • 2010
  • 2004년 이후 정보기술의 성장과 더불어 게임 서비스에 대한 피해 사례가 해 마다 빠르게 증가하고 있는 실정이다. 특히 게임 봇(자동사냥 프로그램)에 대한 피해규모가 가장 크게 조사되고 있으며 이를 방지하기 위한 연구도 활발히 진행되고 있다. 게임 봇은 사용자가 입력하는 키보드나 마우스의 움직임을 대신해 자동으로 게임을 수행하는 프로그램으로 어떠한 사용자의 조작 없이도 게임 속에서의 이득 활동을 무한정 행할 수 있다. 이와 같은 행동은 일반적인 사용자에게 상대적인 불쾌감을 줄 뿐만 아니라 게임의 수명을 단축시키는 등 게임 회사 및 사용자에게 큰 피해를 발생시키고 있어 이를 방지하기 위한 방법이 주목 되고 있다. 기존의 게임 봇 검출 연구들은 단순이 사용자 개인 PC에 설치되어 동작중인 프로그램을 감시하기 때문에 게임 봇 사용자의 조작에 의해 쉽게 피해갈수 있는 단점을 가지고 있다. 따라서 본 논문에서는 게임 서버측면에서 사람과 게임 봇의 행동을 비교하여 게임 봇 사용자들이 조작이나 회피가 힘든 게임 봇 검출 방법을 제안한다. 제안 방법으로는 게임 봇과 사람의 행동 패턴 차이 모델을 정의하고 나이브 베이지안 분류기를 사용하여 게임 봇을 검출한다.

피라미드 구조와 베이지안 접근법을 이용한 Markove Random Field의 효율적 모델링 (Efficient Methodology in Markov Random Field Modeling : Multiresolution Structure and Bayesian Approach in Parameter Estimation)

  • 정명희;홍의석
    • 대한원격탐사학회지
    • /
    • 제15권2호
    • /
    • pp.147-158
    • /
    • 1999
  • 지표면에 대한 다양한 정보를 제공해 주는 원격탐사기법은 수 십년 동안 우리의 환경을 관찰하고 이해하는데 중요한 역할을 해왔다. 이러한 원격탐사 자료를 이용하는데 다양한 디지털 영상처리기법이 도입되어 자료에서 관찰되는 여러 가지 특성을 모형화하고 처리하는데 매우 유용하게 활용되어져 왔다. 화소들 간의 공간적 관계를 고려하는 Markov Random Field (MRF) 모형은 텍스처 모델링이나 영상분할 및 분류와 같은 여러 분야에서 많이 이용되는 모형으로 이것에 기초한 다양한 알고리즘이 발표되었다. 보통 원격탐사 자료는 그 크기가 매우 크고 시간적 간격을 두고 변화를 관측해 가는 경우에는 분석해야할 자료의 양이 매우 방대하다. 이러한 자료를 처리하는데 걸리는 시간은 처리해야할 자료의 양과는 비선형적 관계에 있다. 본 논문에서는 MRF를 이용하여 원격탐사 자료를 처리할 때 걸리는 시간을 단축하기 위한 방법론이 연구되었다. 이를 위해 논리적 구조로 영상을 피라미드형태로 감소하는 크기로 분석하는 multiresolution 구조가 고려되었는데 이는 연상의 거시적 특징과 미세한 특징을 효율적으로 분석할 수 있는 방법을 제공해 준다. 영상의 크기가 커질수록 파라미터 추정 또한 복잡하고 많은 시간을 요하게 된다. 본 논문에서는 이를 위해 Bayesian 방법을 이용하여 원격탐사 영상과 같은 크기가 큰 영상의 MRF 모형의 파라미터를 효율적으로 추정할 수 있는 방법에 제안되어 있다.

남극 극 전선 탐지를 위한 접근법과 변동성에 대한 연구 (An Approach for the Antarctic Polar Front Detection and an Analysis for itsVariability)

  • 박진구;김현철;황지현;배덕원;조영헌
    • 대한원격탐사학회지
    • /
    • 제34권6_2호
    • /
    • pp.1179-1192
    • /
    • 2018
  • 이 연구는 남빙양(Southern Ocean)에서 나타나는 주된 전선(Front)들 중에 남극 극 전선(Antarctic Polar Front; PF)을 탐지하기 위하여 위성 기반 해수면 온도(sea surface temperature)와 해수면 고도(sea surface height) 자료를 복합적으로 사용하였다. 정확한 PF 탐지를 위하여 일별 SST와 SSH 자료를 각각 기반으로 하여 베이지안 결정 이론(Bayesian decision theory)을 적용하였으며, 이를 근거로 전선/비전선의 신호를 격자 별로 분류하였다. 이후, 시공간적인 합성을 통하여 일차적인 노이즈(noise) 제거 및 지리학적 연결성을 보완하였다. 그러나 이들 과정을 수행하고도 여전히 잔존하는 일부 노이즈를 제거하기 위하여 해빙 및 연안 마스킹(masking)을 수행하였다. 또한 모폴로지 연산(morphology operation)을 통하여 지류 성분을 최대한으로 배제하고 주된 전선 성분만을 추출하였다. 최종적으로 선택된 전선 격자 들에서 PF의 특징을 나타낼 수 있도록 가장 최남단의 전선만을 선택하여 평활 스플라인(smoothing spline) 최적화 방식을 통해 선 형태의 월별 PF를 산출하였다. 산출된 PF는 기존의 연구에서 제시한 PF의 위치와 상당히 유사한 것으로 나타났으며, 특히 바닥 지형에 따라 상당 부분 결정되는 PF의 변화를 잘 모사하는 것으로 보인다. 로스해 주변(${\sim}180^{\circ}W$)과 호주 이남의 해역($120^{\circ}E-140^{\circ}E$)은 PF의 위치에 대한 계절적 변동이 높게 나타나며, 그러한 변동이 기존에 제시된 결과와 상당히 유사한 경향을 지닌다. 그러므로 이 연구에서 산출된 PF의 위치에 대한 탐지 결과가 향후 장기적 관점에서 수행될 연구에 사용될 수 있는 가치를 지닐 것으로 기대한다.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

머신 러닝 기법을 이용한 PIC 범퍼 빔 설계 방법 (The PIC Bumper Beam Design Method with Machine Learning Technique)

  • 함석우;지승민;전성식
    • Composites Research
    • /
    • 제35권5호
    • /
    • pp.317-321
    • /
    • 2022
  • 본 연구에서는 머신 러닝을 통해 하중 유형에 따른 구간을 나누어 각 하중 유형에 강한 적층 각도 순서가 배치되는 PIC 설계 방법이 범퍼 빔에 적용되었다. 머신 러닝을 적용하기 위한 학습 데이터의 입력 값과 라벨은 각각 전체 요소 중 일부인 참조 요소의 좌표와 하중 유형으로 정의되었다. 좌표 값을 나타내는 방법인 2D 표현 방법과 3D 표현 방법을 비교하기 위하여 각각의 방법으로 학습 데이터 생성 및 머신 러닝 모델이 학습되었다. 2D 표현 방법은 유한요소 모델을 각 면으로 나누고 그에 따른 학습 데이터 생성 및 머신 러닝 모델을 학습시키는 방법이며, 3D 표현 방법은 유한요소 모델 전체에서 학습 데이터를 생성하여 하나의 머신 러닝 모델을 학습시키는 방법이다. 머신 러닝 모델의 성능에 영향을 미치는 하이퍼파라미터는 베이지안 알고리즘을 통해 최적 값으로 튜닝되었으며, 튜닝 된 모델 중 k-NN 분류 방법이 가장 높은 예측률과 AUC-ROC로 나타났다. 그리고 2D 표현 방법과 3D 표현 방법 중 3D 표현 방법이 더 높은 성능을 보였다. 튜닝 된 머신 러닝 모델을 통해 예측된 하중 유형 데이터가 유한요소 모델에 매핑되었으며, 유한요소 해석을 통해 비교 검증되었다. 3D 표현 방법의 머신 러닝 모델로 설계된 PIC 방법이 강도 측면에서 더 우수함이 검증되었다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.