• 제목/요약/키워드: High-dimensional data

검색결과 1,543건 처리시간 0.031초

t-SNE에 대한 요약 (A review on the t-distributed stochastic neighbors embedding)

  • 김기풍;김충락
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.167-173
    • /
    • 2023
  • 본 논문에서는 고차원의 자료를 저차원으로 변환시켜 시각화하는 다양한 방법들을 소개하였다. 차원 축소는 크게 선형 방법과 비선형 방법으로 나눌 수 있는데 선형 방법으로 주성분 분석, 다차원 척도 등을 간략하게 소개하였고 비선형 방법으로 커널 주성분 분석, 자기조직도, 국소 선형 사상, Isomap, 국소 다차원 척도 등을 간략하게 소개하였으며, 가장 최근에 제안되었으며 매우 널리 사용되고 있지만 통계학 분야에는 비교적 생소한 t-SNE에 대하여 자세히 소개하였다. t-SNE를 이용한 간단한 예제를 제시하고 t-SNE의 장단점을 지적한 최근 연구 논문을 소개하고 제시된 향후 연구 과제들을 살펴보았다.

EBT 영상에서 임계치 설정법에 의한 심장의 3차원 표현 (3-Dimensional Representation of Heart by Thresholding in EBT Images)

  • 원철호;구성모;김명남;조진호
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1997년도 추계학술대회
    • /
    • pp.533-536
    • /
    • 1997
  • In this paper, we visualized 3-dimensional volume of heart using volume method by thresholding in EBT slices data. Volume rendering is the method that acquire the color by casting a pixel ray to volume data. The gray level of heart region is so high that we decide heart region by thresholding method. When a pixel ray is cast to volume data, the region that is higher than threshold value becomes heart region. We effectively rendered the heart volume and showed the 3-dimensional heart volume.

  • PDF

신발 접착제 도포 시스템을 위한 CAD 기반 로봇 오프라인 프로그래밍 (CAD Based Robot Off-line Programming for Shoe Adhesive Application System)

  • 윤중선;차동혁;김진영
    • 제어로봇시스템학회논문지
    • /
    • 제10권7호
    • /
    • pp.643-648
    • /
    • 2004
  • Most of shoes manufacturing processes are not yet automated, which puts restrictions on the increase of productivity. Among them, adhesive application processes particularly are holding the most workers and working hours. In addition, its working conditions are very poor due to the toxicity of adhesive agents. In case of automating adhesive application processes by using robots, the robot teaching by playback is difficult to produce high productivity because the kinds of shoes to be taught mount up to several thousands. Therefore, it is essential to generate the robot working paths automatically according to the kind, the size, and the right and left of shoes, and also to teach them to the robot automatically. This study deals with automated adhesive spraying to shoe outsoles and uppers by using a robot, and develops the program to generate three-dimensional robot working paths off-line based on CAD data. First, the three-dimensional data of an outsole outline or an upper profiling line are extracted from the two-dimensional CAD drawing file or the three-dimensional scanner. Next, based on the extracted data and the nozzle conditions for adhesive spraying, a robot working path is generated automatically. This research work is the core in automating adhesive spraying processes, and will do much for increasing productivity of shoes manufacturing.

고차원 자료의 비지도 부분공간 이상치 탐지기법에 대한 요약 연구 (A survey on unsupervised subspace outlier detection methods for high dimensional data)

  • 안재형;권성훈
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.507-521
    • /
    • 2021
  • 고차원 자료에서 이상치를 탐지하기 위해서는 변수를 선별해야 할 필요성이 있다. 이상치 탐지에 적합한 정보가 종종 일부 변수에만 포함되어 있기 때문이다. 많은 수의 부적합한 변수가 자료에 포함될 경우 모든 관측치의 거리가 비슷해지는 집중효과가 발생하고 이로 인해 모든 관측치의 이상정도가 비슷해지는 문제가 발생하게 된다. 부분공간 이상치 탐지기법은 전체 변수 중 이상치 탐지에 적합한 변수들의 집합을 선별하여 관측치의 이상정도를 측정함으로써 이러한 문제를 극복한다. 본 논문은 대표적인 부분공간 이상치 탐지기법을 부분공간 선정 방식에 따라 세가지 유형으로 분류하고 각 유형에 속한 방법론을 부분공간 선정 기준과 이상 정도 측정 방식에 따라 요약한다. 더하여, 부분공간 이상치 탐지기법들을 적용할 수 있는 컴퓨팅 프로그램을 소개하고 집중효과에 대한 간단한 가상 실험과 자료 분석 결과를 제시한다.

스테레오 카메라를 이용한 실내환경의 3차원 복원에 관한 연구 (A Study of the 3D-Reconstruction of indoor using Stereo Camera System)

  • 이동헌;엄대연;강훈
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.42-47
    • /
    • 2005
  • 본 논문은 스테레오 카메라론 사용하여 실내 환경의 3차원 복원하는 방법에 대하여 말하고 있다. 일반적으로 3차원 데이터를 추출하는 방법에는 3가지가 있는데, 초음파 센서를 사용하는 방법, 레이저 센서를 사용하는 방법, 그리고 스테레오 카메라론 사용하는 방법을 들 수 있다. 이중 스테레오 카메라는 적당한 가격으로 높은 성능을 낼 수 있는 방법이다. 본 논문에서는 스테레오 카메라론 사용하여 3차원 데이터를 추출하는 방법으로 Window Correlation Matching Method를 사용하였다. 스테레오 카메라를 사용하여 3차원 데이터를 우울할 때 가장 큰 문제인 정확하지 않은 데이터들에 대한 처리를 하기 위하여 Histogram Weighted Hough Transform이라는 방법을 제시하였다. 이렇게 하여 각 Step에 추출된 데이터에서 오차를 많이 줄일 수 있었기 때문에 복원이 더욱 잘 되도록 만들 수 있었으며, 3차원 복원에 DirectX를 사용하여 보다 현실감이 있도록 하였다. 본 논문은 기존에는 3차원 복원다는 3차원 데이터추출에 집중되었던 스테레오 카메라를 3차원 복원에 사용할 수 있다는 것을 보여주었으며, 오차를 줄이기 위해 새로운 알고리즘을 적용하려고 노력하였다.

소비자의 다차원가격 평가노력에 대한 제품관여도와 브랜드선호도의 영향 (Effect of Product Involvement and Brand Preference on Consumers' Evaluation Effort for Multi-Dimensional Prices)

  • 김재영
    • 유통과학연구
    • /
    • 제13권4호
    • /
    • pp.55-64
    • /
    • 2015
  • Purpose - Multi-dimensional prices comprise multiple components such as monthly payments and a number of payments rather than a single lump-sum amount. According to previous studies, an increase in the number of price dimensions leads to a massive amount of cognitive stress resulting in incorrect calculation, and deterioration in the consistency of the price judgment. However, an increase only in the level of complexity of calculating multi-dimensional prices does not always result in a corresponding decrease in the accuracy of price evaluation. Since diverse variables could affect consumers' purchase-decision-making process, the results of price evaluation would be different. In this study, an empirical analysis was performed to determine how the accuracy of price evaluation varies depending on the extent of the complexity of price dimensions using product involvement and brand preference as moderating variables. Research design, data, and methodology - A survey was conducted on 260 students, and 252 effective responses were used for analysis. The data was analyzed using t-test, one-way ANOVA, and two-way ANOVA. In this study, six hypotheses were developed to examine the effect of product involvement and brand preference on consumers' evaluation effort of multi-dimensional prices. Results - As the number of price dimensions increased, accuracy of price evaluation appeared to be low in high involvement, as expected. However, it showed no differences in price evaluation effort when the level of complexity of calculating multi-dimensional prices is low. When a small number of price dimensions are presented in both cases of high and low involvement, accuracy of price evaluation is much higher in a weak brand preference. On the contrary, a strong brand preference enhances an accuracy of price evaluation only in case of low involvement when the number of price dimensions is increased. An interaction effect of product involvement and brand preference on consumers' evaluation of multi-dimensional prices did not exist irrespective of the level of complexity of calculating prices being high or low. Conclusions - When the number of price dimensions is small, consumers' effort for price evaluation shows almost no difference without the moderating effect of involvement, and a weak brand preference leads to a higher accuracy of price evaluation in an effort to make the best selection. No interaction effect of product involvement and brand preference was found except for a main effect of brand preference. When a price is composed of multiple dimensions rendering it more difficult to calculate the final price, the effort for price evaluation was expected to decrease only slightly in case of combination of high involvement and strong brand preference. This is because people have a higher purchase intentions and trust for that particular brand. However, the accuracy of price evaluation was much lower in cases of high involvement, and there was no interaction effect between product involvement and brand preference except for a main effect of involvement and brand preference, respectively.

지리정보시스템을 위한 고속 측지계 변환 모델 연구 (A Study on Fast Datum Transformation model for GIS)

  • 서용철
    • 한국지리정보학회지
    • /
    • 제7권3호
    • /
    • pp.48-56
    • /
    • 2004
  • 본 연구에서는 실시간 측지계 변환 기법을 사용하는 지리정보시스템에 사용될 고속 변환 모델 개발을 수행하였다. 한 측지계에 준거하여 구축된 지리정보데이터를 다른 측지계에 준거하여 표시하는 경우 원 구축데이터의 좌표를 변환시키지 않고, 화면 표시나 출력 직전에 변환하여 표시하는 방법이 사용된다. 본 연구에서는 이러한 실시간 측지계 변환 작업의 속도를 향상시키고 높은 변환 정확도를 유지하기 위한 방법으로, 지역 분할 변환 매개변수 계산에 의한 2차원 동각상사변환 모델의 적용 방안을 검토하였다. 연구 결과 일정한 범위 안에서는 비교적 많은 계산 시간을 필요로 하는 3차원 측지계 변환과 2차원 등각상사변환이 거의 동일한 변환 정확도를 나타내었으며, 영역분할에 의한 2차원 상사 변환 모델을 적용할 경우 높은 정확도를 유지하고 향상된 변환 속도를 나타내는 실시간 측지계 변환이 가능하다는 결과를 얻게 되었다.

  • PDF

데이터 재사용에 의한 고속 프랙탈 영상압축을 위한 시스토릭 어레이의 설계 ((Design of Systolic Away for High-Speed Fractal Image Compression by Data Reusing))

  • 우종호;이희진;이수진;성길영
    • 전자공학회논문지SC
    • /
    • 제39권3호
    • /
    • pp.220-227
    • /
    • 2002
  • 프랙탈 영상압축의 고속처리를 위한 일차원 VLSI 어레이를 설계하였다. 기존의 제안된 일차원 VLSI 어레이에서 중첩되는 이웃의 정의역블럭의 데이터들을 재사용하므로서 전체 연산에 필요한 데이터의 총입력 횟수를 감소시키고, 이로 인한 전체 처리시간을 줄였다. 어레이로 입력되는 데이터의존관계를 고려하여, 입력순서가 적절히 조정되었으며, 이에 따라 처리요소들을 설계하였다. 몇몇 처리요소에는 데이터의 저장 및 경로설정을 위한 레지스터와 멀티플렉서들이 추가되었다. 따라서 영상의 크기가 N이고 블럭의 크기가 B인 경우, 이 설계는 적은 하드웨어를 추가하여 기존의 어레이보다 처리속도가 (N-4B)/4(N-B)배 향상되었다.

그리드 분할에 의한 다차원 데이터 디클러스터링 성능 분석 (Performance Analysis on Declustering High-Dimensional Data by GRID Partitioning)

  • 김학철;김태완;이기준
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1011-1020
    • /
    • 2004
  • 대규모의 데이터를 다루는 여러 시스템에서 데이터를 다수의 병렬 디스크에 분산시켜 저장한 후 질의 처리시 동시에 여러 개의 디스크를 접근함으로써 입출력 성능의 향상을 위한 많은 노력들이 행해져 왔다. 대부분 이전 연구들은 데이터 공간을 이루는 각 차원이 겹치지 않는 여러개의 구간으로 나누어져 전체 데이터 공간이 그리드 형태로 분할되어 있다는 가정하에 각 차원의 구간 번호로 결정되는 그리드 셀에 대해서 효과적으로 디스크 번호를 할당하는 알고리즘 개발에 집중되었다. 하지만, 그들은 데이터 공간을 그리드 형태로 분할하는 방법이 전체 디클러스터링 알고리즘 성능에 미치는 영향을 간과하였다. 본 논문에서 우리는 효과적인 그리드 분할을 통하여 매핑 함수를 이용하는 디클러스터링 알고리즘의 성능을 향상 시켰다. 이를 위하여 영역 질의 크기가 주어졌을 때 겹치는 그리드 셀의 수를 예측하는 모델을 제시하였으며 이를 이용하여 가능한 그리드 분할 방법들 중에서 질의 크기를 감소시키는 분할 방법을 선택하였다. 일반적으로, 다차원 데이터에 대해서는 이진 분할을 하지만 본 논문에서는 더 작은 수의 차원을 선택해서 여러 번 분할함으로써 질의를 만족하는 그리드 셀의 수를 감소시켰다. 다양한 실험 결과에 의하면 본 논문에서 제시한 예측 모델은 질의 크기와 차원에 관계없이 0.5% 이내의 에러율을 보이는 것으로 나타났다. 또한 효과적인 그리드 분할을 통하여 다차원 데이터에 대해서 가장 성능이 좋은 것으로 소개되고 있는 Kronecker sequence 매핑 함수를 이용하는 디클러스터링 알고리즘의 성능을 최대 23배까지 향상시킬 수 있음을 알 수 있었다.

원/달러 환율 투자 손실률에 대한 극단분위수 추정 (Extreme Quantile Estimation of Losses in KRW/USD Exchange Rate)

  • 윤석훈
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.803-812
    • /
    • 2009
  • 금융자료에 극단값이론을 적용하는 것은 위험관리에서 중요한 최신 통계기법 중의 하나라고 할 수 있다. 극단값분석에서 전통적으로 사용해 오던 연간 최대값방법은 시계열자료의 연간 최대값들에 대하여 일반화 극단값분포를 적합시키는 것이고, 최근 대안으로 널리 사용되고 있는 분계점 방법은 시계열자료 중 충분히 큰 하나의 분계점을 넘어서는 초과값들에 대하여 일반화파레토분포를 적합시키는 것이다. 그러나, 보다 실질적인 방법은 분계점을 넘어서는 초과값들을 하나의 점과정으로 해석하는 것인데, 즉 초과값들의 초과시점과 초과여분을 점근적으로 비동질 포아송과정을 갖는 하나의 2차원 점과정으로 간주하는 것이다. 본 논문에서는 이러한 2차원 비동질 포아송과정 모형을 1982.1.4부터 2008.12.31까지 수집된 원/달러 환율 시계열자료로부터 계산된 일별 환율투자손실률, 즉 일별 로그 손실률에 적용한다. 여기서 주된 관심은 10년 혹은 50년에 한번 정도 발생하는 대형 손실률 수준과 같은 극단분위수를 어떻게 추정하느냐 하는 것이다.