• 제목/요약/키워드: High dimensionality

검색결과 177건 처리시간 0.025초

시간적 근접성 향상을 통한 효율적인 SVM 기반 음성/음악 분류기의 구현 방법 (Efficient Implementation of SVM-Based Speech/Music Classifier by Utilizing Temporal Locality)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.149-156
    • /
    • 2012
  • 서포트벡터머신 (support vector machine)을 이용한 음성/음악 분류기는 높은 분류 정확도로 주목받고 있으나 많은 계산 량과 저장 공간을 요구하므로 특히 임베디드 시스템과 같이 자원이 제한 적인 경우에는 효율적인 구현이 필수적이다. 특히, 서포트벡터 (support vector)의 차원과 개수에 의해 결정되는 서포트벡터의 저장 공간의 크기는 일반적으로 임베디드 프로세서의 캐시 (cache)의 크기보다 훨씬 크므로 캐시에 존재하지 않는 서포트벡터를 메인 메모리로부터 읽어야 하는 경우가 많다. 메모리에서 데이터를 가져오는 데는 캐시나 레지스터와 비교했을 때 상대적으로 긴 시간과 많은 에너지가 소비되어 분류기의 실행시간과 에너지 소비를 증가시키는 요인이 된다. 본 논문에서는 분류기의 데이터 접근 양식을 보다 시간적 근접성을 가지게 변환하여 일단 프로세서 칩으로 불려진 데이터를 최대한 활용함으로써 메모리의 접근 횟수를 줄여 전체적인 서포트벡터의 실행시간의 단축시키는 기법을 제안한다. 실험을 통해 메모리로의 접근 회수의 감소와 이에 따른 실행시간 그리고 에너지 소비의 감소를 확인하였다.

히스토그램 시퀀스 구성을 위한 공간 지역성 보존 척도 (Spatial Locality Preservation Metric for Constructing Histogram Sequences)

  • 이정곤;김범수;문양세;최미정
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.79-91
    • /
    • 2013
  • 본 논문은 히스토그램 시퀀스(histogram sequence)에 저차원 변환을 적용할 때, 어떤 공간 채움 곡선(space filling curve: SFC)의 성능이 가장 좋은지를 판단하는 체계적인 평가방법을 제안한다. 히스토그램 시퀀스는 이미지를 주어진 SFC에 따라 시계열 형태로 표현한 것을 말한다. 히스토그램 시퀀스는 매우 고차원이므로 저장 및 검색이 매우 어렵다. 효율적인 저장 및 검색을 위해서 시계열 저차원 변환의 하한을 사용할 수 있는데, 이 하한의 성능은 SFC의 종류에 따라 큰 영향을 받게 된다. 본 논문에서는 히스토그램 시퀀스를 저차원 변환할 때 어떤 SFC의 성능이 좋은지를 평가하기 위해, "히스토그램 시퀀스에서 엔트리들이 인접하면 이미지에서도 해당 셀들이 인접해야 한다"는 공간지역성(spatial locality)의 개념을 제안한다. 다음으로, 공간 지역성을 정량적으로 평가할 수 있는 공간 지역성 보존 척도(spatial locality preservation metric)를 제안하고, 이를 계산하기 위한 정형적인 방법을 제시한다. 본 논문에서는 공간 지역성 보존 척도 측면에서 총 다섯 가지의 SFC를 평가하고, 이 평가 결과가 실제 이미지 매칭의 저차원 변환 성능 평가와 유사함을 확인한다. 또한, 저차원 변환 기반의 k-NN(k-nearest neighbors) 검색을 실험하여, 공간 지역성 보존 척도가 가장 낮은 힐버트-오더가 k-NN 검색에서도 가장 좋은 성능을 보임을 통해, 제안한 공간 지역성 보존 척도의 유용성을 입증한다.

라만 스펙트럼 고속 검색 알고리즘 (The Fast Search Algorithm for Raman Spectrum)

  • 고대영;백성준;박준규;서유경;서성일
    • 한국산학기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.3378-3384
    • /
    • 2015
  • 최근에 라만스펙트럼에 대한 고속 검색 방법은 많은 관심을 받아왔다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 코드워드의 MPS(Mean Pyramids Search)와 PDS(Partial Distortion Search)을 사용하는 알고리즘이 현재 이미지 코딩 분야에서 고속 검색 알고리즘으로 널리 사용되고 있다. 하지만 이 방법은 1차원 데이터의 경우에는 적합하지 않다. 본 논문에서 우리는 라만 스펙트럼 데이터에 적합한 3가지 새로운 방법의 고속 검색 알고리즘을 제안한다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 1DMPS+PDS와 비교하여 1DMPS Sort+PDS는 42.8%, 1DMPS Sort+PDS는 48.6%, 1DMPS Sort with Sorted Variance+PDS는 55.2%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.

뇌성마비 아동을 대상으로 한 감각프로파일(Sensory Profile)의 구성타당도 연구 (Construct Validation of the Sensory Profile for Children with Congenital Cerebral Palsy)

  • 유두한;홍덕기;황선정
    • 재활복지
    • /
    • 제18권4호
    • /
    • pp.315-330
    • /
    • 2014
  • 본 연구는 뇌성마비 아동을 대상으로 감각프로파일(Sensory Profile)의 구성타당도를 검증하는데 목적이 있다. 만 3~10세 뇌성마비 아동 87명의 감각처리기능을 평가하기 위해 보호자를 대상으로 동의 후에 평가용지와 평가지침서를 우편 또는 방문을 통해 작성하도록 하여 자료를 수집하였다. 수집된 자료는 타당도를 검증하기 위해 Winstep 3.81을 통해 라쉬분석을 실시하여 항목과 대상자의 적합성, 항목의 난이도, 평정척도의 적합성, 대상자와 항목의 분리신뢰도를 분석하였다. 연구결과, 87명의 뇌성마비 아동 중에 4명의 아동이 부적합 대상자로 나타났다. 부적합한 대상자를 제외한 83명의 대상자로 항목의 적합도를 분석한 결과, 15개 항목이 부적합 판정을 받았다. 항목의 난이도에 대한 분석결과에서는 뇌성마비 아동의 감각처리능력에 비해 낮은 난이도의 평가항목들로 구성되어 있어 높은 평가항목이 필요한 것으로 나타났다. 감각프로파일의 평정척도 분석결과에서는 5점 척도보다는 3점 척도가 더 적합한 것으로 나타났다. 또한 3점 척도의 항목과 대상자에 대한 분리신뢰도는 0.90 이상 값으로 우수한 수준으로 분석되었다. 본 연구 결과를 토대로 난이도가 높은 새로운 평가항목의 개발과 3점 척도의 점수체계 변환으로 타당도가 검증된 감각프로파일의 임상적 적용이 필요할 것으로 생각된다.

필기체 숫자 데이터 차원 감소를 위한 선분 특징 분석 알고리즘 (Line-Segment Feature Analysis Algorithm for Handwritten-Digits Data Reduction)

  • 김창민;이우범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.125-132
    • /
    • 2021
  • 인공신경망의 계층의 깊이가 깊어지고 입력으로 사용되는 데이터 차원이 증가됨에 신경망의 학습 및 인식에 있어서 많은 연산을 고속으로 요구하는 고연산의 문제가 발생한다. 따라서 본 논문에서는 신경망 입력 데이터의 차원을 감소시키기 위한 데이터 차원 감소 방법을 제안한다. 제안하는 선분 특징 분석(Line-segment Feature Analysis; LFA) 알고리즘은 한 영상 내에 존재하는 객체의 선분(Line-segment) 특징을 분석하기 위하여 메디안 필터(median filter)를 사용한 기울기 기반의 윤곽선 검출 알고리즘을 적용한다. 추출된 윤곽 영상은 [0, 1, 2, 4, 8, 16, 32, 64, 128]의 계수 값으로 구성된 3×3 또는 5×5 크기의 검출 필터를 이용하여 8가지 선분의 종류에 상응하는 고유값을 계산한다. 각각의 검출필터로 계산된 고유값으로부터 동일한 반응값을 누적하여 두 개의 1차원의 256 크기의 데이터를 생성하고 두 가지 데이터 요소를 합산하여 LFA256 데이터를, 두 데이터를 합병하여 512 크기의 LAF512 데이터를 생성한다. 제안한 LFA 알고리즘의 성능평가는 필기체 숫자 인식을 위한 데이터 차원 감소를 목적으로 PCA 기법과 AlexNet 모델을 이용하여 비교 실험한 결과 LFA256과 LFA512가 각각 98.7%와 99%의 인식 성능을 보였다.

정서 처리의 인지 평가모델을 기반으로 한 정서 억제의 차원성과 심리 사회적 적응 (Dimensionality of emotion suppression and psychosocial adaptation: Based on the cognitive process model of emotion processing)

  • 우성범
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제27권4호
    • /
    • pp.475-503
    • /
    • 2021
  • 본 연구는 정서 표현의 억제 구인을 Kennedy-Moore & Watson의 정서 처리의 인지 평가모델에 따라 구체적으로 구분하여 정서 억제의 구성개념을 명료화하고 정서 억제의 다차원적 이해를 돕고자 하였다. 또한 정서 억제와 관련한 구성개념과 성차와 관련한 선행연구들의 이슈들을 종합하여 정서 억제를 성별 비교를 통해 살펴보고자 하였다. 이를 위하여 성인 남녀 657명을 대상으로 정서에 대한 태도, 감정표현 불능증, 정서 조절 곤란 척도와 우울, 분노, 일상적 스트레스 척도를 실시하였다. 정서 억제 요인과 관련한 척도들을 대상으로 탐색적 요인분석을 실시한 결과 KMW모델의 각 단계에 해당하는 정서 억제 요인들이 나타나 '정서적 정보에 대한 주의 어려움', '정서의 이해와 해석 어려움', '정서 통제 신념', '정서 표현 취약성 신념'으로 명명하였다. 다음으로 요인분석에서 나타난 각 정서 억제 요인을 기준으로 군집분석을 실시하여 연구참가자들을 분류하였다. 그 결과 4가지 군집이 추출되어 '정서 통제 신념 군집', '정서 표현 군집', '정서주의 실패 군집', '전반적 억제 군집'으로 명명하였다. 각 군집을 대상으로 우울, 분노, 일상적 스트레스의 평균차이를 검증한 결과, 모든 종속변수에서 유의한 차이가 나타났다. 또한 성별에 따른 정서억제 군집들의 빈도가 차이가 있는지 알아본 결과 남성에서는 전반적 억제 군집의 빈도가 높게 나타났으며, 여성에서는 정서표현 군집의 비율이 높게 나타났다. 마지막으로 정서 억제에 대한 네가지 군집이 심리 사회적 적응에 미치는 영향에서의 성차가 존재하는지 분석하였고, 본 연구 결과를 바탕으로 시사점을 논의하였다.

무선단말기 RF-fingerprinting 특징의 비지도 클러스터링을 위한 차원축소 알고리즘 연구 (Study on Dimension Reduction algorithm for unsupervised clustering of the DMR's RF-fingerprinting features)

  • 정영규;신학철;나선필
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.83-89
    • /
    • 2023
  • RF-fingerprint를 이용한 클러스터링 기술은 전송 파형에 포함된 송수신기의 특성(signature)을 추출하고 이들에게 임의의 레이블을 자동으로 할당함으로써, 추후 지도 학습기반에 무선단말기 분류기의 개발을 용이하게 해준다. 동종 무선 단말기 분류를 위한 RF-fingerprint 특징 추출 알고리즘의 출력은 512개 또는 1024개 이상의 고차원 특징이다. 이러한 고차원의 특징을 분류기에는 효과적일 수 있으나 클러스터링 알고리즘의 입력으로는 부적절하다. 이에 본 논문은 다차원의 RF-fingerprinting 특징을 무선단말기의 fingerprinting 특징을 유지하면서 차원을 효과적으로 줄일 수 있는 차원 축소 알고리즘을 제안하고, 축소된 차원을 효과적으로 클러스터링할 수 있는 클러스터링 알고리즘을 제안한다. 제안된 RF-fingerprinting 클러스터링 알고리즘은 다차원 RF-fingerprinting 특징을 KL Divergence 기반에 t-SNE를 이용하여 차원을 축소하고 DPC(Density Peaks Clustering)를 이용하여 클러스터링 수행한다. 무선단말기 클러스터링 알고리즘의 성능 분석은 모토롤라XiR 10대와 윈어텍 N-Series 10대에서 수집한 3000개의 데이터셋을 이용한다. RF-fingerprintining기반 클러스터링 알고리즘의 성능 분석 결과 20개의 클러스터가 형성되었고, Homogeneity, Completeness, V-measure 모두 99.4%의 성능을 보였다.

첨단산업의 환경동태성이 공급체인의 결속에 미치는 영향: 유연성과 의존성의 역할 (The Effects of Environmental Dynamism on Supply Chain Commitment in the High-tech Industry: The Roles of Flexibility and Dependence)

  • 김상덕;지성구
    • 마케팅과학연구
    • /
    • 제17권2호
    • /
    • pp.31-54
    • /
    • 2007
  • 첨단산업의 기업들은 환경의 변화에 효과적으로 대응하는 것을 기업 성패에 중요한 요인으로 여기고 있다. 하지만 첨단산업의 환경 동태성이 공급체인 구성원 간 관계 결속에 미치는 영향에 관한 연구가 부족하여, 환경 변화에 효과적인 대응을 어렵게 하고 있다. 본 연구는 첨단산업에서 환경 동태성이 공급체인의 결속에 영향을 미치는 메커니즘에 대해 규명하고 있다. 좀 더 구체적으로 말하면, 첫째, 첨단산업의 고객, 경쟁, 기술 동태성이 공급체인의 결속에 어떠한 영향을 미치는지, 둘째, 공급체인의 유연성과 의존성이 이러한 영향에 어떠한 조절효과를 가지는 지 실증하고 있다. 구조방정식 모형에 의한 가설검정 결과 첨단산업의 고객 동태성은 공급체인의 결속을 약화시켰지만 경쟁 동태성은 강화시키는 역할을 하였다. 한편 유연성과 의존성은 고객과 경쟁 동태성에 유의적인 조절 효과를 가졌다.

  • PDF

기업부도예측을 위한 인공신경망 모형에서의 사례선택기법에 의한 데이터 마이닝 (Data Mining using Instance Selection in Artificial Neural Networks for Bankruptcy Prediction)

  • Kim, Kyoung-jae
    • 지능정보연구
    • /
    • 제10권1호
    • /
    • pp.109-123
    • /
    • 2004
  • 기업부도예측은 재무와 경영의사결정문제에서의 주된 인공신경망 응용분야라 할 수 있다. 일반적으로 인공신경망은 이 분야에서 매우 좋은 성과를 보이는 것으로 알려져 있지만 종종 잡음이 심한 데이터에 대해서는 일관성 있고 예측가능한 성과를 보이지 못하는 경우가 있다. 특히 학습용 자료가 매우 많아서 학습시간과 자료수집비용이 과대한 경우에는 적절한 자료의 축소가 되지 않고는 인공신경망을 학습시키는 것이 불가능한 경우도 있다. 사례선택기법은 자료의 차원을 축약시켜 주며 직접적으로 자료를 축소시켜 주는 방법이다. 사례기반 학습기법에서는 이미 몇 연구가 사례선택기법의 필요성을 주장한 바 있으나 인공신경망 모형에서 사례선택기법의 필요성을 주장한 연구는 거의 없다. 본 연구에서는 기업부도예측을 위한 인공신경망 모형에서 유전자 알고리즘을 이용한 사례선택기법을 제안한다. 본 연구에서 유전자 알고리즘은 다층 인공신경망에서의 계층별 연결강도를 최적화하고, 동시에 학습에 적합한 사례를 선택한다. 유전자 알고리즘에 의해 결정된 계층별 연결강도는 역전파오류 학습기법에서 종종 발생하는 국부 최적해에 수렴하는 현상을 최소화해 줄 것으로 기대되고, 선택된 학습용 사례는 학습시간의 단축과 예측성과를 향상시켜 줄 것으로 기대된다. 본 연구에서는 제안한 모형과 주요 데이터 마이닝 기법들의 성과를 비교 연구한다. 실험결과, 제안된 방법이 인공신경망에서의 사례선택기법으로 유용한 것으로 나타났다.

  • PDF

화자식별을 위한 강인한 주성분 분석 가우시안 혼합 모델 (RPCA-GMM for Speaker Identification)

  • 이윤정;서창우;강상기;이기용
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.519-527
    • /
    • 2003
  • 음성신호는 주변 잡음과 화자의 발성 패턴 변화, 음성 검출 오류에서 생기는 이상치(outlier)에 많은 영향을 받고 있다. 이러한 음성 신호를 이용하여 화자인식에 이용할 경우 인식률이 저하된다. 본 논문에서는 화자식별 (speaker identification)에서 학습 특징 벡터의 이상치와 고차원 문제를 해결하기 위하여 M-추정을 이용한 강인한 주성분 분석 가우시안 혼합모델 (Robust Principal Component Analysis-Gaussian Mixture Model)방법을 제안하였다. 제안된 방법은 먼저, 특징 벡터에 이상치가 존재할 경우 M-추정에 의하여 강인한 공분산 행렬을 재추정하여 얻어진 고유벡터로부터 변환 행렬을 구하여 감소된 차원을 갖는 새로운 특징벡터를 구한다. 여기에서 얻은 선형변환된 특징벡터로부터 화자의 가우시안 혼합 모델을 구한다. 제안된 방법의 성능을 검증하기 위하여 화자식별 실험을 하였다. 실험은 전형적인 가우시안 혼합 모델 방법과 주성분 분석법, 제안된 방법을 비교 분석하였다. 이상치가 2%씩 증가할 때마다 가우시안 혼합모델 방법과 주성분 분석법은 각각 0.65%, 0.55%씩 화자식별 성능이 저하되었지만, 제안된 방법은 0.03%정도 감소하였으므로 이상치에 더욱 강인함을 알 수 있다.