• 제목/요약/키워드: nearest-neighbor analysis

검색결과 254건 처리시간 0.023초

Density Functional Analysis of the Spin Exchange Interactions in VOSb2O4

  • Koo, Hyun-Joo
    • Bulletin of the Korean Chemical Society
    • /
    • 제33권7호
    • /
    • pp.2338-2340
    • /
    • 2012
  • The spin exchange parameters of $VOSb_2O_4$ were evaluated by performing energy-mapping analysis based on density functional calculations. The spin exchange interaction between the nearest-neighbor $V^{4+}$ ions is strongly antiferromagnetic while other interactions are negligible. Thus, the magnetic structure of $VOSb_2O_4$ is best described by a spin-1/2 Heisenberg antiferromagnetic chain with no spin frustration.

우리나라 산악기상관측망의 공간분포 특성 (The spatial distribution characteristics of Automatic Weather Stations in the mountainous area over South Korea)

  • 윤석희;장근창;원명수
    • 한국농림기상학회지
    • /
    • 제20권1호
    • /
    • pp.117-126
    • /
    • 2018
  • 본 연구는 품질평가 등급이 우수한 4개 기관에서 운영하고 있는 990개의 AWS 중에서 고도가 200m 이상인 산악지역에 분포하고 있는 산악기상관측소의 공간분포 특성과 연도별 공간변화를 분석하였다. 공간분포특성 분석을 위해 2012년부터 2016년까지 203개의 산악기상관측망을 대상으로 유클리디안 거리 분석, 최근 린지수 분석, 커널밀도 분석 방법으로 공간분석을 수행하였다. 평균거리 분석 결과, 2012년(3개 기관)은 29.0km, 2012년(4개 기관) 26.6km, 2013년 21.9km, 2014년 16.9km, 2015년 14.3km, 2016년은 12.6km로 2012년부터 2016년까지 16.4km가 감소하는 효과를 보였다. 최근린지수는 0.666632~0.811237였으며, 군집화 범위인 Z-score 검정 결과는 -4.372239~-5.145115, 통계적으로는 P-value(P<0.01)로 매우 유의하면서 산악기상관측망이 군집화 형태로 분포하는 것으로 나타났다. 커널밀도 분석 결과, 2012년은 129,719ha/1개소, 2013년 90,917ha/1개소, 2014년 71,342ha/1개소, 2015년 58,875ha/1개소로, 2016년은 50,914ha/1개소로 2012년부터 2016년까지 169,399ha/1개소가 감소하면서 산악기상관측망 공간분포 밀도가 높아진 결과를 보였다. 따라서 백두대간 일부 지역과 경북 내륙, 경남북서부 지역을 대상으로 최적의 입지에 산악기상관측망을 확충하는 것이 필요하다고 사료된다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.

빅 데이터를 이용한 범죄패턴 분석 알고리즘의 구현 (Implementation of Crime Pattern Analysis Algorithm using Big Data)

  • 차경현;김경호;황유민;이동창;김상지;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.57-62
    • /
    • 2014
  • 본 논문에서는 빅 데이터를 이용하여 범죄 발생 패턴을 분석하는 알고리즘을 제안하고 구현했다. 제안된 알고리즘은 대검찰청에서 수집하여 공개한 범죄관련 빅 데이터를 사용하며, 표준편차 타원체 및 공간밀도 분석과 같은 공간통계분석을 통해 서울시의 2011-2013년 범죄발생 패턴을 분석했다. 범죄 발생 빈도수를 이용하여 범죄발생지역, 시간, 요일, 장소의 위험지수를 구했고, 범죄 패턴 분석 알고리즘을 통해 범죄 발생 확률을 구했다. 이를 통해 공간통계분석을 했다. 제안된 알고리즘의 구현 결과, 서울시의 각 구별로 범죄발생 패턴이 다르다는 것을 파악할 수 있었고, 다양한 범죄발생 패턴을 분석하고 범죄발생확률을 위험지수를 통해 수치화하여 위험도를 정량적으로 산출할 수 있었다.

K 최대근접이웃 방법을 이용한 통행시간 예측에 대한 연구 (A Study of Travel Time Prediction using K-Nearest Neighborhood Method)

  • 임성한;이향미;박성룡;허태영
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.835-845
    • /
    • 2013
  • 통행시간은 교통정보 중에서 가장 대표적이고 이용자 선호도가 높은 정보이다. 본 연구에서는 일반국도를 대상으로 실시간 시스템에 적용 가능한 통행시간 예측 방법을 개발하고자 하였다. 통행시간 예측방법으로 비모수적 접근 방법인 K 최대근접이웃 방법을 적용하였다. K 최대근접이웃 방법은 데이터에 대한 특별한 가정이 필요 없고, 모수 추정 과정이 필요 없어 실시간 교통관리시스템에 적합하다. K 최대근접이웃 방법의 우수성을 평가하기 위해 교통 분야에서 많이 적용되고 있는 이력자료 평균방법과 칼만 필터방법을 선정하여 평균절대백분율오차와 변동계수를 통해 평가하였다. 평가 결과 K 최대근접이웃 방법이 이력자료 평균방법과 칼만 필터방법에 비해 우수한 것으로 분석되었다. 통행시간 정보 제공 시 본 연구에서 개발된 방법을 통해 도출된 통행시간과 구간검지기로부터 관측된 통행시간을 탄력적으로 적용함으로써 통행시간 정보의 신뢰도를 향상시킬 수 있을 것으로 기대된다.

근접 이웃 선정 협력적 필터링 추천시스템에서 이웃 선정 방법에 관한 연구 (A study on neighbor selection methods in k-NN collaborative filtering recommender system)

  • 이석준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.809-818
    • /
    • 2009
  • 협력적 필터링 기법은 전자상거래에서 거래되는 아이템에 대하여 고객들이 평가한 선호 정보를 이용하여 특정 상품에 대한 선호도 예측 대상 고객의 선호도를 예측하는 기법이다. 협력적 필터링 기법을 통한 예측 정확도를 향상시키기 위해서는 예측에 이용할 수 있는 고객들의 선호 정보를 충분히 확보하여야 한다. 그러나 과도한 이웃 고객의 선호 정보는 오히려 예측 정확도에 부정적 영향을 미치며 또한 과소 정보 역시 예측 정확도 감소에 영향을 미칠 수 있다. 본 연구에서는 협력적 필터링 알고리즘 적용에 있어 k명의 근접 이웃을 결정하는 이웃 선정방법을 개선하였으며 개별 고객의 선호도 평가 정보를 이용하여 적정 이웃 수를 결정할 수 있는 방법을 제시한다. 본 연구의 결과는 근접 이웃 수 결정을 위한 기존 방법인 탐색적 방법을 개선함과 동시에 선호도 예측 정확도를 향상시키는데 유용한 방법을 제공할 수 있다.

  • PDF

다중 안테나를 갖는 공간 다중화 시스템을 위한 maximum likelihood 검출기의 성능 분석 (Performance analysis of maximum likelihood detection for the spatial multiplexing system with multiple antennas)

  • 신명철;송영석;권동승;서정태;이충용
    • 대한전자공학회논문지TC
    • /
    • 제42권12호
    • /
    • pp.103-110
    • /
    • 2005
  • 본 논문에서는 다중안테나를 갖는 공간 다중화 시스템에서 주어진 채널에 대한 maximum likelihood 검출기의 성능을 수식적으로 유도하였다. 벡터 심볼 오차율을 구하기 위해 nearest neighbor의 방향을 나타내는 에러벡터를 정의하였다. 전송 벡터 심볼이 랜덤한 채널에 의해 변환 될 경우 확정적으로 4개의 nearest neighbor를 가짐을 정의된 에러벡터의 특성을 이용해 입증하였다 변형된 구 검출기로부터 획득 가능한 에러벡터와 최소거리 정보를 바탕으로 주어진 랜덤 채널 하에서 벡터 심볼 오차율을 수식적으로 도출하였다. 유도된 벡터 심볼 오차식을 검증하기 위해, 랜덤 채널을 unitary 채널, dense 채널, sparse 채널로 분류한 후 각 채널 상황에서 유도된 결과 식을 모의 실험 결과와 비교하였다. 모의실험 결과로부터 유도된 벡터 심볼 오차식이 다양한 랜덤 MIMO 채널에서 ML 검출기의 성능을 잘 근사하고 있음을 입증하였다.

GIS 기반의 상권분석 모형 연구 - Huff 확률모형을 중심으로 - (A Study on the Trade Area Analysis Model based on GIS - A Case of Huff probability model -)

  • 손영기;안상현;신영철
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.164-171
    • /
    • 2007
  • 본 연구는 GIS공간분석기법과 Huff의 확률모형을 이용하여 근린생활권중심의 상권분석을 수행하였다. 연구에 사용된 기본도는 청주시 복대동을 대상으로 하여 업종, 세대수 등을 현장 조사하여 구축하였으며, 기 구축된 LMIS에 있는 연속지적도를 활용하였다. 분석에서는 커널밀도함수(Kernel Density Function)와 최근린지수(Nearest Neighbor Index)를 활용하여 근린생활권내 점포분포 중심권역을 설정하였다. 상권분석을 수행하기 위하여 설정된 중심권역에 따라 중심지(점)와 규모를 산출한 후 상권분석의 모형인 Huff 확률모형에 적용하여 중심권역별 상권을 추출하였으며, 추출된 상권을 지도로 도식하였다. 따라서 본 연구에서는 GIS 공간분석기법 중 커널밀도함수와 최근린지수를 통해 Huff 확률모형에 적용할 수 있는 방법을 제시하였다. 이러한 방법들을 이용함으로써 보다 정확하게 상권분석을 할 수 있으며, 향후 창업하고자 하는 소상공인들에 도움이 될 수 있으리라 사료된다.

  • PDF

토너먼트 기반의 빅데이터 분석 알고리즘 (An Algorithms for Tournament-based Big Data Analysis)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.545-553
    • /
    • 2015
  • 모든 데이터는 그 자체로 가치를 가지고 있지만, 실세계에서 수집되는 데이터들은 무작위적이며 비구조화되어 있다. 따라서 이러한 데이터를 효율적으로 활용하기 위해서 데이터에서 유용한 정보를 추출하기 위한 데이터 변환과 분석 알고리즘들을 사용하게 된다. 이러한 목적으로 사용되는 것이 데이터 마이닝이다. 오늘날에는 데이터를 분석하기 위한 다양한 데이터 마이닝 기법뿐만 아니라, 대용량 데이터를 효율적으로 처리하기 위한 연산 요건과 빠른 분석 시간을 필요로 하고 있다. 대용량 데이터를 저장하기 위하여 하둡이 많이 사용되며, 이 하둡의 데이터를 분석하기 위하여 맵리듀스 프레임워크를 사용한다. 본 논문에서는 단일 머신에서 동작하는 알고리즘을 맵리듀스 프레임워크로 개발할 때 적용의 효율성을 높이기 위한 토너먼트 기반 적용 방안을 제안하였다. 본 방법은 다양한 알고리즘에 적용할 수 있으며, 널리 사용되는 데이터 마이닝 알고리즘인 k-means, k-근접 이웃 분류에 적용하여 그 유용성을 보였다.