On Approximating the Euclidean Distance for Dimensionality Reduction (차원 축소를 위한 유클리드 거리의 근사 방안)

  • Jeon Seungdo;Kim Sang-Wook;Kim KiDong;Choi Byung-Uk
    • Proceedings of the Korean Information Science Society Conference
    • 2005.11b
    • pp.67-69
    • 2005
  • 고차원 공간상의 벡터들 간의 유클리드 거리를 빠르게 계산하는 것은 멀티미디어 정보 검색을 위하여 매우 중요하다. 본 논문에서는 고차원 공간상의 두 벡터들 간의 유클리드 거리를 효과적으로 근사하는 방법을 제안한다. 이러한 근사를 위하여 두 벡터들의 놈(norm)을 사용하는 방법이 기존에 제안된 바 있다. 그러나 기존의 방법은 두 벡터간의 각도 성분을 무시하므로 근사 오차가 매우 커지는 문제점을 가진다. 본 연구에서 제안하는 방법은 기준 벡터라 부르는 별도의 벡터를 이용하여 추정된 두 벡터간의 각도 성분을 유클리드 거리 근사에 사용한다. 이 결과, 각도 성분을 무시하는 기존의 방법과 비교하여 근사 오차를 크게 줄일 수 있다. 또한, 제안된 방법에 의한 근사 값은 유클리드 거리 보다 항상 작다는 것을 이론적으로 증명하였다. 이는 제안된 방법으로 멀티미디어 정보 검색을 수행할 때 착오 기각이 발생하지 않음을 의미하는 것이다. 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.

Network Distance Estimation Scheme with Virtual Topology and Local Adjustment Term (가상 토폴로지와 지역 조정 항을 이용한 네트워크 거리 추정)

  • Lee, Sang-Hwan
    • 한국IT서비스학회:학술대회논문집
    • 2006.05a
    • pp.241-248
    • 2006
  • 네트워크 거리 (Network distance : 일반적으로 ping이나 traceroute 등으로 측정 가능한 round trip time 등 네트워크 상에서 패킷 전송 시간) 추정 기법은 인터넷상의 많은 응용프로그램들에서 유용하게 사용된다. 예를 들면 다수의 서버를 인터넷상에 설치하고자 하는 경우 사용자들 간의 네트워크 거리를 알고 있다면 서버와 사용자간의 왕복 전송 시간 (Round Trip Time)등을 최소화할 수 있도록 서버를 분산하여 설치하는 구성을 도출해 낼 수 있을 것이다. Peer to Peer 응용 프로그램들에서도 이 네트워크 거리 정보는 매우 유용하다. 기존에 존재하는 추정 기법들은 대부분 유클리드 공간 좌표 기반 기법들로서 유클리드 좌표 상의 거리가 실제 네트워크 거리와 유사하도록 유클리드 공간 좌표를 지정한다. 그러나 이런 방법들의 문제점은 인터넷 상의 네트워크 거리가 삼각 부등식을 만족하지 않는 경우가 존재하는 등 유클리드 공간의 기본적인 가정을 만족하지 못한다는데 있다. 이런 문제점 때문에 새로운 모델이 필요하고, 이 논문에서는 가상 토폴로지(Virtual Topology) 모델과 지역 조정 항 (Local Adjustment Term) 모델을 제시하고, 기본적인 성능 분석을 시도하였다.

A Study on Integrating Similarities (유사도 통합에 관한 연구)

  • Kim, Sunkyung;Park, Ji Su;Shon, Jin Gon
    • Annual Conference of KIPS
    • 2020.11a
    • pp.53-56
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

Adaptive Euclidean Distance Measure Method for Numeric Data Distribution (수치 데이터 분포에 적응적 유클리드 거리 측정 기법)

  • Choi, You-Hwan;Joo, Bum-Joon;Jung, Sung-Won
    • Proceedings of the Korean Information Science Society Conference
    • 2011.06c
    • pp.67-69
    • 2011
  • 데이터의 군집 분석에서 두 개의 서로 다른 데이터에 대한 유사도(거리)를 어떻게 정의하는가는 매우 중요한 문제이다. 수치속성에 대한 거리 측정 방법에는 다양한 기법이 존재하지만 각 속성의 크기와 범위가 서로 크게 다를 경우 이들을 동일한 인자로 여기고 거리 측정을 하게 되면 논리적인 오류를 범할 수 있다. 기존의 군집 분석 연구에서 사용된 거리 측정 기법은 데이터의 정규화 과정을 통해 이 문제를 해결하려고 노력하지만 일반적인 정규화는 이상치의 존재나 데이터의 편중된 분포 등의 이유로 속성별 거리가 왜곡될 수 있다. 본 논문은 이러한 문제점을 해결하기 위해 정규화된 데이터에서 각 속성의 비중을 고려한 적응적 유클리드 거리 측정 기법(AEDM: Adaptive Euclidean Distance Measure)을 제안한다. AEDM은 유클리드 거리를 기반으로 정규화 된 데이터의 형태에 따라 가중치를 부여하여 데이터의 분포에 관계없이 각 속성간의 거리를 충분히 반영하기 때문에 더욱 정확한 군집 분석을 가능하게 한다.

An Effective Method for Approximating the Euclidean Distance in High-Dimensional Space (고차원 공간에서 유클리드 거리의 효과적인 근사 방안)

  • Jeong, Seung-Do;Kim, Sang-Wook;Kim, Ki-Dong;Choi, Byung-Uk
    • Journal of the Institute of Electronics Engineers of Korea CI
    • v.42 no.5
    • pp.69-78
    • 2005
  • It is crucial to compute the Euclidean distance between two vectors efficiently in high dimensional space for multimedia information retrieval. In this paper, we propose an effective method for approximating the Euclidean distance between two high-dimensional vectors. For this approximation, a previous method, which simply employs norms of two vectors, has been proposed. This method, however, ignores the angle between two vectors in approximation, and thus suffers from large approximation errors. Our method introduces an additional vector called a reference vector for estimating the angle between the two vectors, and approximates the Euclidean distance accurately by using the estimated angle. This makes the approximation errors reduced significantly compared with the previous method. Also, we formally prove that the value approximated by our method is always smaller than the actual Euclidean distance. This implies that our method does not incur any false dismissal in multimedia information retrieval. Finally, we verify the superiority of the proposed method via performance evaluation with extensive experiments.

Novel Detection Schemes Based on the Unified Receiver Architecture for SWIPT (동시 무선 정보 및 전력 전송을 위한 통합된 수신기 구조 기반의 새로운 검출 기법)

  • Kang, Jinho;Kim, Young-bin;Shin, Dae Kyu;Choi, Wan
    • The Journal of Korean Institute of Communications and Information Sciences
    • v.42 no.1
    • pp.268-278
    • 2017
  • In this paper, we propose two novel detection schemes with low-complexity based on the unified receiver architecture which minimizes a fundamental tradeoff at rate-energy region in SWIPT system. The proposed detection schemes are twofold: The two-stage detection scheme and Euclidean distance combination detection scheme. The two-stage detection scheme detects amplitude information of symbols from rectified signals for energy harvesting. In the sequel, it detects symbols based on phase information of baseband signals for information decoding. The Euclidean distance combination detection scheme detects symbols using linear positive-weighted sum of two metrics: Euclidean distance based on baseband signals for information decoding and Euclidean distance based on rectified signals for energy harvesting. For numerical results, we confirm that the proposed detection scheme can achieve better performance than the conventional scheme in terms of symbol error rate, symbol success rate-energy region and achievable rate-energy region.

Performance of a 3-Dimensional Signal Transmission System (3차원 신호 전송시스템의 성능)

  • Kwon, Hyeock Chan;Kang, Seog Geun
    • Journal of the Korea Institute of Information and Communication Engineering
    • v.20 no.11
    • pp.2021-2026
    • 2016
  • In this paper, a system model for transmission of 3-dimensional (3-D) signals is presented and its performance is analyzed. Unlike 2-D signals, no quadrature form expression for the 3-D signals is available. Exploiting a set of orthogonal basis functions, the 3-D signals are transmitted. As a result of computer simulation using very higher-level signal constellations, the 3-D transmission system has significantly improved error performance as compared with the 2-D system. It is considered that the principal reason for such performance improvement is much increased minimum Euclidean distance (MED) of the 3-D lattice constellations compared with the corresponding 2-D ones. When the MEDs of 2-D and 3-D lattice constellation are compared to confirm the analysis, the MED of 3-D 1024-ary constellation is around 2.6 times larger than that of the quadrature amplitude modulation (QAM). Expanding the constellation size to 4096, the MED of 3-D lattice constellation is increased by 3.2 times of the QAM.

On the plane geometry using taxicab distance function (택시거리함수를 이용한 평면기하에 관한 연구)

  • Kwak, Kyung-Min;Baik, Seung-Min;Choi, Woo-Seok;Choi, Jun-Bum;Ko, Il-Seog;Kim, Byung-Hak
    • Communications of Mathematical Education
    • v.24 no.3
    • pp.659-689
    • 2010
  • Taxicab distance function is a practical distance notion which gives us information of real world pathway distance that really taxi can go through. As one of the non-Euclidean geometry, this study of an ideal city with all roads running horizontal or vertical, was introduced by the Russian Mathematician H. Minkowski and synthetically reported by the E. F. Kraus in 1986. After that, there were many reports and papers on this topic and still being researched. At this point of view, our research about taxicab geometry provides its differences from Euclidean plane geometry, and considers about several theorems on plane geometry using the taxicab distance function.

Segmentation of Continuous Speech based on PCA of Feature Vectors (주요고유성분분석을 이용한 연속음성의 세그멘테이션)

  • 신옥근
    • The Journal of the Acoustical Society of Korea
    • v.19 no.2
    • pp.40-45
    • 2000
  • In speech corpus generation and speech recognition, it is sometimes needed to segment the input speech data without any prior knowledge. A method to accomplish this kind of segmentation, often called as blind segmentation, or acoustic segmentation, is to find boundaries which minimize the Euclidean distances among the feature vectors of each segments. However, the use of this metric alone is prone to errors because of the fluctuations or variations of the feature vectors within a segment. In this paper, we introduce the principal component analysis method to take the trend of feature vectors into consideration, so that the proposed distance measure be the distance between feature vectors and their projected points on the principal components. The proposed distance measure is applied in the LBDP(level building dynamic programming) algorithm for an experimentation of continuous speech segmentation. The result was rather promising, resulting in 3-6% reduction in deletion rate compared to the pure Euclidean measure.

Communication Equalizer Algorithms with Decision Feedback based on Error Probability (오류 확률에 근거한 결정 궤환 방식의 통신 등화 알고리듬)

  • Kim, Nam-Yong;Hwang, Young-Soo
    • Journal of the Korea Academia-Industrial cooperation Society
    • v.12 no.5
    • pp.2390-2395
    • 2011
  • For intersymbol interference (ISI) compensation from communication channels with multi-path fading and impulsive noise, a decision feedback equalizer algorithm that minimizes Euclidean distance of error probability is proposed. The Euclidean distance of error probability is defined as the quadratic distance between the probability error signal and Dirac-delta function. By minimizing the distance with respect to equalizer weight based on decision feedback structures, the proposed decision feedback algorithm has shown to have significant effect of residual ISI cancellation on severe multipath channels as well as robustness against impulsive noise.