• 제목/요약/키워드: statistics based method

검색결과 2,157건 처리시간 0.025초

적외선 영상에서 변위추정 및 SURF 특징을 이용한 표적 탐지 분류 기법 (The Target Detection and Classification Method Using SURF Feature Points and Image Displacement in Infrared Images)

  • 김재협;최봉준;천승우;이종민;문영식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.43-52
    • /
    • 2014
  • 본 논문에서는 적외선 영상에서 영상 변위를 이용하여 기동 표적 영역을 탐지하고, SURF(Speeded Up Robust Features) 특징점에 대한 BAS(Beam Angle Statistics)를 이용하여 분류하는 시스템에 대하여 설명한다. 영상 기반 기술 분야에서 대표적인 대응점 정합 알고리즘인 SURF 기법은 SIFT(Scale Invariant Feature Transform) 기법에 비해 정합 속도가 매우 빠르고 비슷한 정합 성능을 보이기 때문에 널리 사용되고 있다. SURF를 이용한 대부분의 객체 인식의 경우 특징점 추출과 정합의 과정을 수행하지만, 제안하는 기법은 표적의 기동 특성을 반영하여 영상의 변위 추정을 통하여 표적의 영역을 탐지하고 SURF 특징점 들의 기하구조를 판단함으로써 표적 분류를 수행한다. 제안하는 기법은 무인 표적 탐지/인지 시스템의 초기모델 구축을 위하여 연구가 진행되었으며, 모의 표적을 이용한 가상 영상과 적외선 실 영상을 이용하여 실험한 결과 약 73~85%의 분류 성능을 확인하였다.

의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상 (Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity)

  • 윤희근;최수정;박성배
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.653-661
    • /
    • 2016
  • 기존의 패턴기반 트리플 생성 시스템은 distant supervision의 가정으로 인해 오류 패턴을 생성하여 트리플 생성 시스템의 성능을 저하시키는 문제점이 있다. 이 문제점을 해결하기 위해 본 논문에서는 패턴과 프로퍼티 사이의 의미 유사도 기반의 패턴 신뢰도를 측정하여 오류 패턴을 제거하는 방법을 제안한다. 의미 유사도 측정은 비지도 학습 방법인 워드임베딩과 워드넷 기반의 어휘 의미 유사도 측정 방법을 결합하여 사용한다. 또한 한국어 패턴과 영어 프로퍼티 사이의 언어 및 어휘 불일치 문제를 해결하기 위해 정준 상관 분석과 사전 기반의 번역을 사용한다. 실험 결과에 따르면 제안한 의미 유사도 기반의 패턴 신뢰도 측정 방법이 기존의 방법보다 10% 높은 정확률의 트리플 집합을 생성하여, 트리플 생성 성능 향상을 증명하였다.

시공간 상관성을 고려한 일기산출기 모형을 이용한 4대강 유역별 미래 일기 변수 산출 (Future Weather Generation with Spatio-Temporal Correlation for the Four Major River Basins in South Korea)

  • 이동환;이재용;오희석;이영조
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.351-362
    • /
    • 2012
  • 일기 산출기 모형은 가상의 일기 자료를 생성하는 통계 모형이다. 본 연구는 시공간 상관성이 고려된 다중지점에서의 일기산출 모형을 제안하고, 온실가스 배출 미래 시나리오에 따라 강수량과 평균 기온 일기산출이 가능한 알고리즘을 개발하였다. 제안된 알고리즘은 다단계 일반화 선형모형 하에서 필요한 모수들을 추정하고, 적합된 모형 하에서 일기변수들을 랜덤하게 산출하는 절차이다. 과거 30년간 관측된 우리나라 4대강 유역의 일 강수량 자료와 평균 기온 자료를 가지고 모형을 적합하고, 미래 일별 일기자료 산출에 적용하였다.

언어모델 전이학습 기반 해외 직접 구매 상품군 분류 (A Method of Classification of Overseas Direct Purchase Product Groups Based on Transfer Learning)

  • 오교중;최호진;차원석;김일구;우찬균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.571-575
    • /
    • 2022
  • 본 논문에서는 통계청에서 매월 작성되는 온라인쇼핑동향조사를 위해, 언어모델 전이학습 기반 분류모델 학습 방법론을 이용하여, 관세청 제공 전자상거래 수입 목록통관 자료를 처리하기 위해서 해외 직접 구매 상품군 분류 모델을 구축한다. 최근에 텍스트 분류 태스크에서 많이 이용되는 BERT 기반의 언어모델을 이용하며 기존의 색인어 정보 분석 과정이나 사례사전 구축 등의 중간 단계 없이 해외 직접 판매 및 구매 상품군을 94%라는 높은 예측 정확도로 분류가 가능해짐을 알 수 있다.

  • PDF

이미지 지역 통계를 이용한 모바일 기기로 촬영한 문서에서의 그림자 제거 (Shadow Removal from Scanned Documents taken by Mobile Phones based on Image Local Statistics)

  • 나예지;박상일
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권3호
    • /
    • pp.43-48
    • /
    • 2018
  • 본 연구는 핸드폰과 같은 모바일 기기로 촬영한 문서 이미지에서 조명 조건들로 인해 발생한 부드러운 그림자를 제거하는 방법을 제안한다. 본 방법은 기존의 피라미드 기반 방법이나, 경계법 방법에 비해 더 좋은 결과를 만들어 낸다. 방법의 기본아이디어는 촬영된 문서 이미지로부터 이미지 지역 통계를 활용하여 글자나 그림 등의 흥미로운 내용이 있는 부분을 분리하고, 이 분리된 부분에 대해 적응적인 밝기 및 대조 조정과 레벨 변환을 수행하여 이미지를 더욱 선명하게 하는 것이다. 또한 내용이 없는 부분에 대해서는 부드러운 채움을 위해 이미지 변형량 기반의 빈 곳 메우기 방법을 이용한다.

공간자료 주성분분석 (Principal component regression for spatial data)

  • 임예지
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.311-321
    • /
    • 2017
  • 주성분 분석은 통계학 뿐만 아니라 기상학에서 널리 사용되는 방법론이며, 고차원 자료에 대한 차원축소 역할 뿐만아니라 기상자료에서의 의미있는 패턴을 찾아내기 위해 사용되는 방법론이다. 또한 주성분분석에 기반을 둔 주성분 회귀분석 방법론은 기후예측이 가능하므로 미래 시점의 기후값 예측에 사용될 수 있다. 본 논문에서는 Wang과 Huang (2016) 논문에서 제안한 제한된 공간 주성분 분석을 기반으로 한 주성분 회귀분석 방법론을 개발하였다. 이를 시뮬레이션을 통하여 확인하였고, 실제 자료인 동아시아 지역 온도예측에 적용하여 기존의 주성분 회귀분석 예측 값에 비해 예측력이 높아짐을 확인하였다.

주성분의 자기일치성에 기초한 다변량 대표관찰치의 기하적 표현 (A Method of Expressing Multivariate Representative Observations Based on the Self-Consistency of Principal Components)

  • 김기영;박용주
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.129-135
    • /
    • 2005
  • 일변량 자료의 경우 대표관찰치는 사분위수 등에 기초하여 자료의 분포와 변이를 함축적으로 표현하기 위한 목적으로 사용되는 소수 개의 관찰치이다. Jones와 Rice(1992)는 다변량 자료에 대한 대표관찰치를 선택하기 위해 주성분분석에 근거한 방법을 제시한 바 있다. 이 연구에서는 주성분의 자기일치성을 이용하여 대표관찰치를 선택하고, 이를 표현하는 방안을 고찰한다. 기존의 방법에 의한 대표관찰치가 자료의 표본변이에 민감한 한편, 여기에서 제안되는 방법의 결과는 자기일치성을 가진다.

국내 배달음식 이용건수 분석 및 예측 (A Study on the Number of Domestic Food Delivery Services)

  • 권재영;김시내;박은지;송종우
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.977-990
    • /
    • 2015
  • 우리나라는 세계적으로 배달음식 문화가 가장 많이 발달한 나라 중에 하나로 최근에는 일인가구의 증가와 배달앱 시장의 발달과 함께 그 성장 속도 또한 눈부시게 증가하고 있다. 따라서 배달음식 이용에 큰 영향을 미칠 것으로 예상되는 날씨와 날짜별 변수를 고려하여 시간대별 배달음식 이용건수를 예측함으로써 소비자와 생산자 모두에게 이익을 주는 예측모형을 찾고자 한다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 2014년도 배달음식 통화건수를 예측하는데 있다. 예측에 사용되는 회귀 모형은 선형회귀모형, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 기계, 신경망, 로지스틱 회귀모형으로 총 6가지이다. 고려되는 배달음식 업종은 총 4가지(족발/보쌈정식, 중국음식, 치킨, 피자)로 크게 두 가지 방법을 이용하여 각 업종별 배달음식 이용건수를 예측하였다. 첫 번째 방법은 총 이용건수와 각 업종별 배달음식 이용비율을 곱하여 각 업종별 배달음식 이용건수를 예측하는 것이고, 두 번째 방법은 각 업종별 모형을 세워 각 업종별 배달음식 이용건수를 예측하는 방법이다. 최종적으로 선택된 모형은 방법 1에서는 신경망 모형과 선형회귀모형이며, 방법 2에서는 신경망 모형이었다. 방법 2보다는 방법 1로 구한 결과가 더 예측력이 좋은 것으로 나타났다.

그리드 기반 표본의 무게중심을 이용한 케이-평균군집화 (K-means clustering using a center of gravity for grid-based sample)

  • 이선명;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.121-128
    • /
    • 2010
  • 케이-평균 군집분석은 데이터들을 k개의 군집으로 임의로 분할을 하여 군집의 평균을 대푯값으로 분할해 나가는 방법으로 데이터들을 유사성을 바탕으로 재배치를 하는 방법이다. 이러한 케이-평균 군집분석은 시장조사, 패턴분석 및 인식, 그리고 이미지 처리 분야 등에서 폭넓게 응용되고 있다. 그러나 대용량의 데이터베이스를 분석대상으로 하므로 그 만큼 데이터 처리 시간이 많이 소요되는 것이 문제 중의 하나이다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 데이터 마이닝 방법이 사용되어지고 있는데 처리 속도 문제는 더욱 중요하게 생각하고 있다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 분할 군집법에서 가장 일반적으로 사용되고 있는 케이-평균 알고리즘에 대해 그리드를 기반으로 한 무게중심 알고리즘을 제안하고자 한다.

Identifying differentially expressed genes using the Polya urn scheme

  • Saraiva, Erlandson Ferreira;Suzuki, Adriano Kamimura;Milan, Luis Aparecido
    • Communications for Statistical Applications and Methods
    • /
    • 제24권6호
    • /
    • pp.627-640
    • /
    • 2017
  • A common interest in gene expression data analysis is to identify genes that present significant changes in expression levels among biological experimental conditions. In this paper, we develop a Bayesian approach to make a gene-by-gene comparison in the case with a control and more than one treatment experimental condition. The proposed approach is within a Bayesian framework with a Dirichlet process prior. The comparison procedure is based on a model selection procedure developed using the discreteness of the Dirichlet process and its representation via Polya urn scheme. The posterior probabilities for models considered are calculated using a Gibbs sampling algorithm. A numerical simulation study is conducted to understand and compare the performance of the proposed method in relation to usual methods based on analysis of variance (ANOVA) followed by a Tukey test. The comparison among methods is made in terms of a true positive rate and false discovery rate. We find that proposed method outperforms the other methods based on ANOVA followed by a Tukey test. We also apply the methodologies to a publicly available data set on Plasmodium falciparum protein.