• 제목/요약/키워드: 유클리드 놈

검색결과 5건 처리시간 0.017초

놈(Norm)에 따른 k-최근접 이웃 학습의 성능 변화 (k-Nearest Neighbor Learning with Varying Norms)

  • 김두혁;김찬주;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.371-375
    • /
    • 2008
  • 예제 기반 학습(instance-based learning) 방법 중 하나인 k-최근접 이웃(k-nearest reighbor, k-NN) 학습은 간단하고 예측 정확도가 비교적 높아 분류 및 회귀 문제 해결을 위한 기반 방법론으로 널리 적용되고 있다. k-NN 학습을 위한 알고리즘은 기본적으로 유클리드 거리 혹은 2-놈(norm)에 기반하여 학습예제들 사이의 거리를 계산한다. 본 논문에서는 유클리드 거리를 일반화한 개념인 p-놈의 사용이 k-NN 학습의 성능에 어떠한 영향을 미치는지 연구하였다. 구체적으로 합성데이터와 다수의 기계학습 벤치마크 문제 및 실제 데이터에 다양한 p-놈을 적용하여 그 일반화 성능을 경험적으로 조사하였다. 실험 결과, 데이터에 잡음이 많이 존재하거나 문제가 어려운 경우에 p의 값을 작게 하는 것이 성능을 향상시킬 수 있었다.

  • PDF

차원 축소를 위한 유클리드 거리의 근사 방안 (On Approximating the Euclidean Distance for Dimensionality Reduction)

  • 정승도;김상욱;김기동;최병욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.67-69
    • /
    • 2005
  • 고차원 공간상의 벡터들 간의 유클리드 거리를 빠르게 계산하는 것은 멀티미디어 정보 검색을 위하여 매우 중요하다. 본 논문에서는 고차원 공간상의 두 벡터들 간의 유클리드 거리를 효과적으로 근사하는 방법을 제안한다. 이러한 근사를 위하여 두 벡터들의 놈(norm)을 사용하는 방법이 기존에 제안된 바 있다. 그러나 기존의 방법은 두 벡터간의 각도 성분을 무시하므로 근사 오차가 매우 커지는 문제점을 가진다. 본 연구에서 제안하는 방법은 기준 벡터라 부르는 별도의 벡터를 이용하여 추정된 두 벡터간의 각도 성분을 유클리드 거리 근사에 사용한다. 이 결과, 각도 성분을 무시하는 기존의 방법과 비교하여 근사 오차를 크게 줄일 수 있다. 또한, 제안된 방법에 의한 근사 값은 유클리드 거리 보다 항상 작다는 것을 이론적으로 증명하였다. 이는 제안된 방법으로 멀티미디어 정보 검색을 수행할 때 착오 기각이 발생하지 않음을 의미하는 것이다. 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.

  • PDF

고차원 공간에서 유클리드 거리의 효과적인 근사 방안 (An Effective Method for Approximating the Euclidean Distance in High-Dimensional Space)

  • 정승도;김상욱;김기동;최병욱
    • 전자공학회논문지CI
    • /
    • 제42권5호
    • /
    • pp.69-78
    • /
    • 2005
  • 고차원 공간상의 벡터들 간의 유클리드 거리를 빠르게 계산하는 것은 멀티미디어 정보 검색을 위하여 매우 중요하다. 본 논문에서는 고차원 공간상의 두 벡터들 간의 유클리드 거리를 효과적으로 근사하는 방법을 제안한다. 이러한 근사를 위하여 두 벡터들의 놈(norm)을 사용하는 방법이 기존에 제안된 바 있다. 그러나 기존의 방법은 두 벡터간의 각도 성분을 무시하므로 근사 오차가 매우 커지는 문제점을 가진다. 본 연구에서 제안하는 방법은 기준 벡터라 부르는 별도의 벡터를 이용하여 추정된 두 벡터간의 각도 성분을 그들을 위한 유클리드 거리 근사에 사용한다. 이 결과, 각도 성분을 무시하는 기존의 방법과 비교하여 근사 오차를 크게 줄일 수 있다. 또한, 제안된 방법에 의한 근사 값은 유클리드 거리 보다 항상 작다는 것을 이론적으로 증명하였다. 이는 제안된 방법을 이용하여 멀티미디어 정보 검색을 수행할 때 착오 기각이 발생하지 않음을 의미하는 것이다. 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.

네트워크이론과 경제구조 그리고 경제충격에 관한 실증연구: 기술경제적 함의 (An Empirical Study on the Network Theory, Economic Structure and Economic Shocks: The Implications on Technology Economics)

  • 조상섭;강신원
    • 기술혁신학회지
    • /
    • 제16권4호
    • /
    • pp.937-953
    • /
    • 2013
  • 경제변동의 원인과 발생과정 그리고 발전방향에 대한 이론적 논의가 활발하게 전개되고 있다. 본 연구는 경제변동에 대한 설명이론으로 네트워크 이론[Acemoglu, et al. 2012, 2010]을 적용하여 우리나라 경제변동성에 대한 실증적 연구를 수행하였다. 2000년도, 2005년도와 2010년도 3개년도 산업연관표를 적용하여 실시한 실증분석결과를 보면, 다음과 같이 분석결과를 요약할 수 있다. 먼저 우리나라 경제구조는 2000년도에 비하여 2005년도 그리고 2010년도가 1차 상호연결성과 2차 상호연결성의 파레토분포 인자가 지속적으로 높아지고 있다. 이러한 분석결과로부터 우리나라 네트워크 경제구조는 과거에 부문사이에 높은 연결성을 갖는 경제구조에서 그 연결성이 낮아지고 있는 경제구조로 변화하고 있음을 알 수 있다. 둘째, 유클리드 놈으로 측정된 우리나라 산업부문사이에 평균 영향력 벡터는 2000년도에 비하여 2005년도 그리고 2010년도에 더욱 낮아졌다. 이 분석결과는 핵심적 산업부문의 영향력이 낮아지고 있음을 보여주며, 산업부문사이에 투입과 산출의 상호연결성이 약화되고 있음을 보여 준다. 이 분석결과는 한 부문의 경제적 충격이 느리게 진행되는 특징이 존재하지만, 전체 경제에 그 부문충격이 2000년대 초기에 비하여 상대적으로 완화되었음을 보여준다. 이러한 연구결과를 바탕으로 몇 가지 산업 및 기술정책적 시사점을 제시하였다.

  • PDF

고차원 공간에서 효과적인 차원 축소 기법 (An Effective Method for Dimensionality Reduction in High-Dimensional Space)

  • 정승도;김상욱;최병욱
    • 전자공학회논문지CI
    • /
    • 제43권4호
    • /
    • pp.88-102
    • /
    • 2006
  • 멀티미디어 정보 검색에서 멀티미디어 데이터는 고차원 공간상의 벡터로 표현된다. 이러한 특정 벡터를 효율적으로 검색하기 위하여 다양한 색인 기법이 제안되어 왔다. 그러나 특정 벡터의 차원이 증가하면서 색인 기법의 효율성이 급격히 떨어지는 차원의 저주 문제가 발생한다. 차원의 저주 문제를 해결하기 위하여 색인하기 이전에 원 특정 벡터를 저차원 공간상의 벡터로 사상하는 차원 축소 기법이 제안된 바 있다. 본 연구에서는 벡터의 놈과 각도 성분을 이용하여 유클리드 거리를 근사하는 함수를 기반으로 하는 새로운 차원 축소 기법을 제안한다. 먼저, 유클리드 거리 근사를 위하여 추정된 각도의 오차의 발생 원인을 분석하고 이 오차를 줄이기 위한 기본 방향을 제시한다. 또한, 고차원 특정 벡터를 다수의 특징 서브 벡터들의 집합으로 분리하고 각 특징 서브 벡터로부터 놈과 각도 성분을 근사하여 차원을 축소하는 새로운 기법을 제안한다. 각도 성분을 정확하게 근사하기 위해서는 올바른 기준 벡터의 설정이 필수적이다. 본 연구에서는 최적 기준 벡터의 조건을 제시하고, Levenberg-Marquardt 알고리즘을 이용하여 기준 벡터를 선정하는 방법을 제안한다. 또한, 축소된 저차원 공간상의 벡터틀을 위한 새로운 거리 함수를 정의하고, 이 거리 함수가 유클리드 거리 함수의 하한 함수가 됨을 이론적으로 증명한다. 이는 제안된 기법이 착오 기각의 발생을 허용하지 않으면서 효과적으로 차원을 줄일 수 있음을 의미하는 것이다. 끝으로, 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.