• 제목/요약/키워드: dimension reduction method

검색결과 251건 처리시간 0.025초

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

벽지 선택을 위한 감성 차원 축소에 관한 연구 (A study on reduction of sensibility dimension for selection of wallpaper)

  • 천영민;김순영;김성환;정성석
    • 감성과학
    • /
    • 제8권4호
    • /
    • pp.333-344
    • /
    • 2005
  • 벽지에 대한 감성형용사를 수집하였다. 수집한 형용사를 이용하여 소비자들을 위한 벽지 추천 모형을 개발하고자 한다. 설문조사, 현장조사, 인터넷 조사 등 다양한 방법을 통해 형용사를 수집하였고, 수집된 형용사들의 대표 형용사를 찾기 위해 여러 가지 통계분석 방법을 활용하였다. 유사성 행렬을 이용한 다차원 척도 분석방법을 통해 차원의 축명을 결정하고자 시도하였으며 배리맥스 회전 방법을 이용한 요인분석 방법을 통해 3개 또는 4개 정도의 축소된 요인을 찾고자 시도하였다 분석결과에 의하면 요인의 수를 3개로 했을 경우에는 약 $82\%$의 설명력에 대중적인, 중후한, 그리고 여성스러운 등의 형용사로 축소할 수 있었으며, 요인의 수를 4개로 했을 경우에는 약$93\%$의 설명력에 품위 있는, 무난한, 아름다운, 그리고 정감있는 등의 형용사로 축소할 수 있는 것으로 나타났다. 이 결과를 바탕으로 하여 추후에 소비자들을 위한 벽지추천 모형을 개발하는 데 활용할 수 있을 것으로 기대된다.

  • PDF

희소 투영행렬 획득을 위한 RSR 개선 방법론 (An Improved RSR Method to Obtain the Sparse Projection Matrix)

  • 안정호
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.605-613
    • /
    • 2015
  • 본 논문은 패턴인식에서 자주 사용되는 투영행렬을 희소화하는 문제를 다룬다. 최근 임베디드 시스템이 널리 사용됨에 따라 탑재되는 프로그램의 용량이 제한받는 경우가 빈번히 발생한다. 개발된 프로그램은 상수 데이터를 포함하는 경우가 많다. 예를 들어, 얼굴인식과 같은 패턴인식 프로그램의 경우 고차원 벡터를 저차원 벡터로 차원을 축소하는 투영행렬을 사용하는 경우가 많다. 인식성능 향상을 위해 영상으로부터 매우 높은 차원의 고차원 특징벡터를 추출하는 경우 투영행렬의 사이즈는 매우 크다. 최근 라소 회귀분석 방법을 이용한 RSR(rotated sparse regression) 방법론[1]이 제안되었다. 이 방법론은 여러 실험을 통해 희소행렬을 구하는 가장 우수한 알고리즘 중 하나로 평가받고 있다. 우리는 본 논문에서 RSR을 개선할 수 있는 세 가지 방법론을 제안한다. 즉, 학습데이터에서 이상치를 제거하여 일반화 성능을 높이는 방법, 학습데이터를 랜덤 샘플링하여 희소율을 높이는 방법, RSR의 목적함수에 엘라스틱 넷 회귀분석의 패널티 항을 사용한 E-RSR(elastic net-RSR) 방법을 제안한다. 우리는 실험을 통해 제안한 방법론이 인식률을 희생하지 않으며 희소율을 크게 증가시킴으로써 기존 RSR 방법론을 개선할 수 있음을 보였다.

풍절소음 저감을 위한 웨더스트립 돌출부 형상연구 (Aerodynamic acoustics of automotive weather strip protuberance)

  • 김태호;이규호;전승경;최진국;김준형
    • 대한기계학회:학술대회논문집
    • /
    • 대한기계학회 2007년도 춘계학술대회B
    • /
    • pp.2546-2551
    • /
    • 2007
  • Weather Strip(W/S) is a rubber part to proof water, sound and dust for opening and shutting devices including vehicle doors. And it requires high dimension precision and durability to proof water, noise, vibration and etc. But ironically it itself makes some wind noise because of some protuberance with glasses. The air flow analysis of door part of vehicle makes it possible to calculate and find out the cause of wind noise. In previous analysis, we focus on the numerical air flow analysis of the automobile side part. We do 2D-C.F.D first and 3D second. Through simulations, we can calculate the amount of sound pressure level at the glass run and find out the effects of glass run to make wind noise. Finally we can improve shape of glass run to reduce wind noise although it is small amounts of sound pressure reduction compared with total vehicle noise level.

  • PDF

로지스틱모형에서 그래픽을 이용한 회귀와 모형평가 (Graphical regression and model assessment in logistic model)

  • 강명욱;김부용;홍주희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.21-32
    • /
    • 2010
  • 그래픽적 회귀는 모형에 대한 가정을 하지 않고 회귀정보를 모두 포함하는 충분요약그림을 찾아내는 분석 방법으로 모든 회귀정보를 저차원의 그림으로 표현할 수 있게 하는 데에 그 목적이 있다. 잔차산점도를 이용한 모형의 평가는 적용 범위가 선형회귀모형에 국한되는 문제점이 있기 때문에 일반화선형모형에서는 그 대안으로 주변모형 산점도를 이용하여 모형의 적절성을 평가한다. 본 논문에서는 일반화선형모형 중에서 이진반응변수를 갖는 로지스틱모형에서의 그래픽적 회귀 방법과 주변모형 산점도를 이용한 모형평가 방법을 알아본다.

차량 쏠림 개선을 위한 전륜 현가시스템의 기하공차 최적화 (Optimization of Geometric Dimension & Tolerance Parameters of Front Suspension System for Vehicle Pulls Improvement)

  • 김용석;장동영
    • 대한기계학회논문집A
    • /
    • 제33권9호
    • /
    • pp.903-912
    • /
    • 2009
  • This study is focused on simulation-based dimensional tolerance optimization process (DTOP) to minimize vehicle pulls by reduction of dimensional variation in front suspension system. In previous studies, the effect of tires and wheel alignment sensitivity have mainly been investigated to eliminate vehicle pulls in nominal design condition without allocating optimal tolerance level for selected components, among various factors regarding vehicle pulls such as vehicle design parameters, vehicle weight balance, tires, and environmental factors. Unfortunately, there are wide variations in the real vehicle, and these have impacted actual vehicle pulls, especially wheel alignment effects from suspension geometry variation has not been considered in the previous studies. In the tolerance design of suspension, tolerance variables with the uncertainty such as parts dimensional variation, assembly process, datum position and direction, and assembly tool tolerance has a great influence on the variation of the suspension dimensional performances. This study introduces total vehicle pull prediction model in considering major key factors for vehicle pull sensitivity. The Monte Carlo-based tolerance analysis model using Taguchi robust method is developed to optimize dimensional tolerance parameters, satisfying on the target variation level.

Nonlinear dynamic analysis of laterally loaded pile

  • Mehndiratta, S.;Sawant, V.A.;Samadhiya, N.K.
    • Structural Engineering and Mechanics
    • /
    • 제49권4호
    • /
    • pp.479-489
    • /
    • 2014
  • In the present study a parametric analysis is conducted to study the effect of pile dimension and soil properties on the nonlinear dynamic response of pile subjected to lateral sinusoidal load at the pile head. The study is conducted on soil-pile model of different pile diameter, pile length and soil modulus, and results are compared to get the effect. The soil-pile system is modelled using Finite element method. The programming is done in MATLAB. Time history analysis of model is done for varying non-dimensional frequency of load and the results are compared to get the non-dimensional frequency at which pile head displacement is maximum in each case. Maximum possible bending moment and soil-pile interacting forces for the dynamic excitation of the pile is also compared. When results are compared with the linear response, it is observed that non-dimensional frequency is reduced in nonlinear response on account of reduction in the soil stiffness due to yielding. Nonlinear response curve shows high amplitude as compared to linear response curve.

시점별 형상의 지역적 선형 사상을 통한 3차원 물체의 특성 분석 (An Analysis of 3-D Object Characteristics Using Locally Linear Embedding)

  • 이수찬;윤일동
    • 방송공학회논문지
    • /
    • 제14권1호
    • /
    • pp.81-84
    • /
    • 2009
  • 본 논문은 시점에 따른 형상의 변화를 이용하여 물체의 특성을 나타내는 기법을 제안한다. 구체적으로, 3차원 물체의 여러 시점별 형상을 추출한 후, 이를 지역적 선형 사상을 통해 차원 축소하여 저차원 분포를 생성하고, 이를 이용하여 물체의 특성을 나타낸다. 또한, 생성된 점집합들에 반복적 최근접점 기법 및 푸리에 변환을 적용하여 유사한 모델을 검색하는 기법과 그 결과를 제시한다. 제안하는 기법은 다양한 시점에서의 형상 자체만이 아니라 시점에 따른 형상의 변화도 물체의 특성을 표현한다는 것을 보여주며, 검색 등 물체 특성을 표현하는데 적용될 것으로 기대된다.

우리나라 피할 수 있는 사망의 기대수명에 미치는 영향 (The Impact of Avoidable Mortality on Life Expectancy at Birth in Korea, 1990-2009)

  • 김영배
    • 보건의료산업학회지
    • /
    • 제5권3호
    • /
    • pp.123-132
    • /
    • 2011
  • To evaluate the impact of avoidable mortality on the changes in life expectancy at birth in Korea. Standard life table techniques and the Arriaga method were used to calculate and to decompose life expectancy changes by age, effects and groups of causes of avoidable mortality among two periods(1990-2000 and 2000-2009). A list of causes of avoidable mortality reached by consensus and previously published in Spain was used. Mortality in young adults produced a reduction in life expectancy at birth during the 1990-2000, but there was an important increase in life expectancy at birth during the 2000-2009; in both cases, this was the result of factors amenable to health policy interventions. The highest improvement in life expectancy at birth was due to non-avoidable causes, but avoidable mortality through health service interventions showed improvements in life expectancy at birth in those elderly people than 1 year and in those younger. Making a distinction between several groups of causes of avoidable mortality and using decomposition by causes, ages and effects allowed us to better explain the impact of avoidable mortality on the life expectancy at birth of the whole population and gave a new dimension to this indicator that could be very useful in public health.

담수답의 특성을 고려한 중금속 오염 농경지의 토양개량공법 효과 검토 (An Investigation on the Effect of Stabilization Methods for Rice Paddies contaminated by Heavy Metal considering Characteristics of submerged Paddy)

  • 유찬;윤성욱;이정훈;최승진;이성민
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2009년도 세계 도시지반공학 심포지엄
    • /
    • pp.1455-1471
    • /
    • 2009
  • In order to investigate on the effect of stabilization methods for rice paddies contaminated by heavy metals, a series of lab-scale model test was carried out by applying the characteristics of submerged Paddy soil. To perform the lab-scale model test, columns were made by acrylic with the dimension of diameter=10cm, thickness=0.5cm and were filled with soils which was contaminated were mixed with stabilization agents(lime stone 5% and steel refining slag 5% respectively). To manipulate the reduction condition, soils in the columns were submerged with distilled water. And then soil water and subsurface water in each column were sampled in the regular term and analysed the various physical and chemical properties.

  • PDF