• 제목/요약/키워드: 판별모델

검색결과 623건 처리시간 0.029초

운전행동 결정요인의 구성과 위험운전행동과의 관계 (The Structure of Driving Behavior Determinants and Its Relationship between Reckless Driving Behavior)

  • 오주석 ;이순철
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제17권2호
    • /
    • pp.175-197
    • /
    • 2011
  • 본 연구는 운전행동 결정요인 구성요인의 내용을 확장시켜 위험운전행동 및 운전 경험과의 관련성을 살펴보기 위한 목적으로 시행되었다. 기존의 운전행동 결정요인 관련 연구에서는 다뤄지지 않았으나, 다른 연구자들이 위험행동과 관련성을 가지고 있다고 주장한 분노, 내향성 및 A형 성격유형 등의 인적요인을 기존 모델에 더 추가하여 운전행동 결정요인을 재구성하고, 재구성된 요인들과 위험운전행동, 운전자의 개인특성 및 실제 운전경험 간의 관계를 살펴보았다. 270명의 운전자로부터 얻은 자료를 분석한 결과, 운전행동 결정요인은 문제회피, 이익/자극 추구, 대인불안, 대인분노 및 공격성의 5개 요인으로 재구성 되었으며, 위험운전행동 부문 역시 과속운전, 대처미숙, 난폭운전, 음주운전 및 주의산만의 5개 요인으로 구분되었다. 전반적으로 운전행동 결정요인 수준에서 부정적 성향이 강할수록 운전자들의 위험운전행동 수준이 높았으며, 실제 운전경험에 있어서도 과속적발 경험이나 음주운전 시도경험, 교통사고 경험이 많은 것으로 나타났다. 이 같은 높은 관련성을 볼 때, 향후 운전행동 결정요인의 측정을 통해 개인의 위험운전행동 유발 가능성을 미리 예측하고 위험 운전자들을 사전에 판별하여 교육서비스를 제공할 수 있을 것으로 기대한다.

  • PDF

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

오미자(Schisandra chinensis)의 국내 산지별 화학적마커 선정을 위한 LC/MS 기반의 대사체학 접근법 (LC/MS-based metabolomics approach for selection of chemical markers by domestic production region of Schisandra chinensis)

  • 김인선;오선민;송하은;김두영;윤다혜;이대영;류형원
    • Journal of Applied Biological Chemistry
    • /
    • 제66권
    • /
    • pp.467-476
    • /
    • 2023
  • 오미자(Schisandra chinensis)는 오미자과에 속하는 낙엽활엽덩굴식물로 한국, 일본, 중국, 대만 등 동아시아에 널리 분포한다. 오미자에 함유된 주요 성분에는 리그난 화합물뿐만 아니라 트리테르페노이드 화합물도 포함되어 있는 것으로 보고되었다. 한국 산지별 오미자의 특성을 구별하기 위해 대사산물 프로파일링과 다변량 통계 분석 기법인 PCA을 수행하여 판별식을 설정하였고, 그 결과 triterpenoids 16종, lignan 9종, flavonoid, phenylpropanoid, fatty acid 각 1종을 동정하였다. 또한 다변량 통계분석을 통해 OPLS-DA의 s-plot 모델을 적용하여 단양, 문경, 거창, 평창의 4개 그룹을 구분하는 것을 확인하였고, lanostane, cycloartane, 그리고 schiartane triterpenoid, dibenzocyclooctadiene lignan 이 각각 화학적마커로 동정하였다.

디지털 유지관리를 위한 데이터 기반 교량 신축이음 유간 평가 (Evaluation of Data-based Expansion Joint-gap for Digital Maintenance )

  • 박종호;신유성
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권2호
    • /
    • pp.1-8
    • /
    • 2024
  • 신축이음 장치는 교량 상부구조의 신축량을 수용할 목적으로 설치되며 공용중 충분한 유간을 확보하여야 한다. 안전점검 및 정밀안전진단 수행 시 유간부족 및 유간과다에 대한 손상을 명시하고 있으나, 유간에 따른 교량의 이상 거동을 판별하기 위한 기준이 미흡하다. 본 연구에서는 동일 신축이음부의 유간 데이터를 지속적으로 추적하여 데이터 기반의 유지관리 방안을 제시하였다. 689개소의 신축이음 장치에서 계절별 영향을 고려하여 총 2,756개의 유간 데이터를 수집하였다. 동일 위치에서 4개 이상의 데이터를 통해 신축거동을 분석할 수 있는 유간 변화 평가 방안을 마련하였으며, 신축거동에 영향을 미치는 인자를 분류하고 딥러닝과 설명 가능한 AI를 통해 각 인자의 영향도를 분석하였다. 유간 평가 그래프를 통해 교량 상부구조의 이상 거동을 협착 및 기능 고장으로 분류하였다. 이론적 거동을 보이고 있다하더라도 협착 가능성이 나타날 수 있는 사례 및 하절기 협착 가능성이 매우 높게 나타난 사례가 도출되었다. 협착 가능성은 낮으나 교량 상부구조에 기능상 문제점이 발생했을 가능성이 높은 사례와 시공오류에 따라 신축이음 장치가 재시공된 사례도 도출되었다. 딥러닝 및 설명 가능한 AI를 통한 영향인자 분석은 기존의 신축유간 계산식 및 교량 설계에 따른 결과로 설명 가능하여 신뢰 가능한 수준으로 판단되어 추후 모델의 개선을 통해 유지관리를 위한 가이드를 제시할 수 있을 것이라 판단된다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

스마트워크 환경에서 지속사용의도에 대하여 IT기업과 비IT기업 간의 차이분석에 관한 연구 -한국 중소기업을 중심으로 (A Study on the Analysis of Difference between IT and Non-IT Companies on the Smart Work Environment Continuous Use Intention - Focusing on Korean Small and Medium Enterprises)

  • 정수용;신용태
    • 디지털융복합연구
    • /
    • 제16권3호
    • /
    • pp.249-259
    • /
    • 2018
  • 본 연구는 중소기업에 근무하고 있는 직원들을 대상으로 현재 스마트워크가 지속사용의도에 미치는 영향에 대해 알아보고, 최종적으로 스마트워크 환경이 IT기업과 비IT기업 간의 차이를 알아보고자 하였다. 본 연구를 위해서 중소기업에 근무하고 있는 직원들로부터 설문자료를 수집하였다. 수집한 설문자료를 통해 실증분석을 하였으며, 신뢰도분석, 타당성분석, 판별타당성분석, 구조방정식 모델의 적합도 검정을 통해 최종적으로 연구모형을 검증하고 최종적으로 IT기업과 비IT기업의 차이분석을 실시하였다. 연구분석 결과는 직무특성의 직무효율성, 직무자율성 요인은 매개변수인 지각된 유용성과 직무만족에 긍정적인 영향을 미치는 것으로 나타났으며, 직무형태의 시간유연성은 매개변수인 지각된 유용성과 직무만족에 영향을 미치지 못하는 것으로 나타났고, 공간유연성은 직무만족에만 영향을 미치는 것으로 나타났다. 매개변수인 지각된 유용성은 직무만족, 지속사용의도에 긍정적인 영향을 미쳤고, 최종적으로 직무만족은 지속사용의도에 긍정적인 영향을 미쳤다. 그리고 IT기업과 비IT기업 간의 차이도 있는 것으로 나타났다. 본 연구 결과를 통해 스마트워크 환경을 통해 근무자, 조직에게 긍정적인 영향을 유도시킬 수 있으며, 근무자들에게 기존보다 기업의 특성에 맞게 더 나은 업무환경을 제공할 수 있다고 사료된다.

사용자의 혁신성 및 지식수준이 가상비서 기반 음성쇼핑의 이용에 미치는 영향 (Influence of User Innovativeness and Knowledge Base on Acceptance of Voice Shopping)

  • 조웅;안수호;정두희
    • 벤처창업연구
    • /
    • 제15권2호
    • /
    • pp.153-169
    • /
    • 2020
  • 가상비서에 기반해 구매활동을 하는 새로운 방식의 음성쇼핑(Voice shopping)이 주목받고 있다. 전 세계적으로 음성쇼핑 시장이 성장을 하고 있고, 우리나라도 음성쇼핑의 본격적 상용화를 눈앞에 두고 있다. 음성쇼핑 관련 서비스의 발전을 위해서는 서비스의 질, 새로운 방식에 맞는 효율적 프로세스, 고객관계 구축 방법 등 새로운 쇼핑방식과 관련한 세부적 이슈에 대해 구체적으로 고찰하는 작업이 필요하다. 그러한 시도의 일환으로서, 이 연구는 음성쇼핑에 대해 소비자들이 갖는 인식 및 태도에 영향을 미치는 요인을 판별하고자 한다. 이 연구에서는 171명의 온라인쇼핑 이용객의 설문조사 응답데이터를 기반으로 분석을 실시했다. 인지된 유용성, 사용 용이성 등 기술수용모델(Technology Acceptance Model)의 전형적 요인 외에 인지된 유희성이라는 요인을 추가하여 음성쇼핑에 대한 이용의도에 미치는 영향을 분석했다. 특별히 이 연구에서는 사용자의 속성이 미치는 영향에 집중하고자 한다. 음성쇼핑의 확산을 위해서는 유효한 타깃 고객을 설정하는 게 필요하며, 사용자에 대한 이해가 선행되어야 원활한 고객관계 구축이 가능해지기 때문이다. 따라서 이 연구에서는 사용자 혁신성 및 지식수준 등 사용자의 속성에 따라 음성쇼핑 이용의도와 관련한 요인이 어떻게 영향을 받는지 분석하고자 한다. 분석결과, 사용자 혁신성은 인지된 유용성과 사용 용이성, 인지된 유희성 모두에게 긍정적 영양을 줬다. 사용자 지식기반은 인지된 유용성과 사용 용이성, 인지된 유희성 모두에게 유의하지 않았으나, 이 변수들의 외생변수 역할을 하는 사용자 혁신성에 긍정적 영향을 주는 것으로 나타났다. 한편 확장된 기술수용모델 변수 중에서는 인지된 유용성과 인지된 유희성이 음성쇼핑의 이용의도에 긍정적 영향을 주고, 사용 용이성은 음성쇼핑 이용의도에는 유의한 영향이 없으나 인지된 유용성과 유희성을 모두 높이는 것으로 나타났다. 이 연구는 음성쇼핑 플랫폼 및 연관 서비스 개발시중점을 두어야 할 지향점 및 고객관계 설정 방향에 대한 시사점을 제시하는 데 의의가 있다.

89톤급 선미식 안강망어선의 선형치수에 관한 연구 (A Study on the Hull-dimension of 89 ton class Stow-net Vessel with Stern-fishing)

  • 박제웅;이현상
    • 수산해양기술연구
    • /
    • 제33권3호
    • /
    • pp.159-165
    • /
    • 1997
  • 근해안강망업업에서 경제성이 있고 안전성이 향상된 어선의개발에 중요한 기본자료가 될 최적한어선의 규모 및 기본치수를 선정하게되는 본 연구는 그 내용을 최적규모에 영향을 주는 어업 및 어선의 기본성능분석과 최적규모 결정을 위한 시스템의 개발로 크게 구분할 수 있다. 최적규모에 여향을 주는 어업 및 어선의 기본성능분석에서는 근해안강망어업의 어업자원 평가, 어업실태조사 등을 하고, 기본성능의 분석은 대표적인 톤급에서 빈번히 살생되는 안전성, 조업성등과 어선의 기분수치와의 인과관계를 ISM기법으로 분석하여 최적규모 결정모델에 이용하였다. 한편 최적규모결정을 위한 시스템을 경제성 평가 및 최적화 모델 구성, 어선의 초기설계조직의 구성, 및 시스템분석 S/W개발로 구분하여 연구를 수행하였으며, 최종적으로 규모 및 기분치수를 찾았다. 근해안강망어업의 개발대상어선의 대표적인 톤급으로 냉동설비를 성치한현축식 89톤급 및 선미식 89톤급으로 구분하여, 즉 어선(I)군과 어선(II)군으로 분류아여 항해속력 9~11노트에서 최적규모 및 기본치수를 구하였다. 즉 어선(I)군과 어선(II)군에 대한 경제성 분석을 통하여 얻어진 결과에 의햐면 어선(I)군에서는 향해 속력 10노트에 현측식 89톤 근해안강망어선(냉동설비 설치)이 경제적인 것으로 평가된다. 특히 어선(II)군의 향해속력 10노트인 {어선(II-2)군}대상어선은 분석된 모든 어선중에서 가장 경제성이 좋고 안전성을 만족하고 있는 것으로 최정적인 결론을 얻게 되었따. 이와 같은 연구로부터 다음과 같은 결론을 도출하였다. 즉 우리나라 안강망어업에 적합하게 이용될 수 있다고 사료되는 89톤급 선미식 안강망어선의 기본치수는 배의 길이(Lpp):27.0~28.0m, 배의 폭(B):6.6~6.8m, 배의 깊이(D):2.75-2.85m,방형 계수$C_b$:03685-0.698, 항해 속력(Vs):10노트인 것으로 분석된다. 감소되지 않았다' '통증을 호소했을 때 빨리 혹은 시기적절하게 대처해주지 않았다', '환자가 통증을 호소할 때, 무관심하며 형식적으로 대했다', '약물 투여방법, 작용시간, 부작용 등 통증 관리에 대한 정보제공이 없었다' 이었으며, 만족하는 이유는 '통증조절 후 통증이 감소했다', '통증을 호소할 때 의료진이 관심을 가져주었다', '의사나 간호사가 신속하게 통증조절을 해주었다' '의사를 신뢰하기 때문' 이었다. 4) 암성통증관리의 만족 또는 불만족에 영향을 미치는 요인 : 만족 집단과 불만족 집단의 통증정도 및 일상생활에 지장을 미치는 정도에 있어서 두 그룹간 통계적으로 유의한 차이가 없었다. 통증관리에 대한 환자의 염려 항목 중 '훌륭한 환자는 통증을 호소하지 않는 자이다'에 있어서 만족 집단의 평균점수가 불만족 집단의 평균점수보다 통계적으로 매우 유의하게 높았다. 결론 : 선행연구들에 비해 암환자의 통증관리에 대한 만족도는 증가하였으나 아직도 30%정도의 대상자는 만족하지 못하는 것으로 나타났다. 암환자의 통증 관리에 대한 만족도 향상을 위해 통증관련 약물, 통증 완화를 위한 간호중재방법 및 환자들의 통증과 관련된 잘못된 지식을 개선하는 내용이 포함된 환자교육이 절실히 요구된다. 지구조 판별도에서 지판이 침강 섭입하는 지판 경계부(destructive plate margin) 중 화산호의 조구적 영역에 도시된다. 본역의 화산암을 생성시킨 마그마는 $Al_2O_3$와 CaO 함량의 관계도, mode에서 나타나는 사장석 반정, 분화가 진행될수록 부의 Eu 이상이 증가하는 것 등에서 사장석의 분별이 우세한 분별결정작용을 거쳤음을 알 수 있다. 안산암질암을 관입한 중상 암맥에서 측정한 암석 년령은 $97.0{\pm}6.8~94.5{\pm}6.6$, 데사이트질암은 $68.9{\pm}4.8,\61.5{\pm}4.9~60.7{\pm}4.

  • PDF

한국 동해 남부해역 대륙붕에 서식하는 대형저서동물군집 공간분포를 결정하는 환경요인 (Environmentally Associated Spatial Distribution of a Macrozoobenthic Community in the Continental Shelf off the Southern Area of the East Sea, Korea)

  • 이정호;이정석;박영규;강성길;최태섭;김병모;류종성
    • 한국해양학회지:바다
    • /
    • 제19권1호
    • /
    • pp.66-75
    • /
    • 2014
  • 본 연구는 동해 남부 이산화탄소 해저지중저장 후보지 주변 수심 100-500 m 해역에서 저서생태계의 공간분포와 이를 결정하는 환경요인을 이해하기 위해 수행되었다. 2012년 8월-9월 총 16개 정점에서 대형저서동물군집과 환경요인을 조사하였다. 총 158종의 저서동물이 채집되었으며, 평균 서식밀도는 $843indiv/m^2$, 평균 생물량(습중량)은 $26.2g\;WW/m^2$로 나타났으며, 생물다양성이 높은 지역에서 주로 서식밀도가 높았다. 측정된 33개 환경변수를 대상으로 주성분분석을 실시한 결과 조사해역의 저서환경은 크게 퇴적물환경, 저층해수환경, 수심에 의해 지배된다. 저서동물의 분포는 세 가지 주성분과 밀접한 관련을 보였는데, 특히 사질함량이 많은 정점일수록 출현종수가 많아지고 생물량은 적어지는 경향이 관찰되었다. 조개 2종을 포함한 우점종 6종은 ${\Omega}$ aragonite, ${\Omega}$ calcite 농도가 높은 곳을 선호하였는데, 이 종들은 이산화탄소 유입으로 인해 해양산성화가 진행되면 가장 먼저 피해를 입을 수 있는 생물로 판단된다. 저서동물 상위 1% 우점종의 종조성을 바탕으로 집괴분석한 결과 지리적으로 뚜렷하게 구분되는 4개의 정점군이 분류되었다. 각 정점군은 고유의 저층해수 및 퇴적물 환경을 보이고 있으며, 대표적인 특성종으로는 A) Ampelisca miharaensis, (B) Edwardsioides japonica, (C) Maldane cristata, (D) Spiophanes kroeyeri을 들 수 있다. 측정이 용이한 5개의 환경요인(수심, 사질함량, 수온, 염분, pH)을 이용하여 4개의 정점군을 정확도 100%로 예측할 수 있는 판별함수모델을 제시하였다. 조사지역의 저서동물군집은 환경요인과 밀접한 관계를 보이고 있으며, 이는 환경변수에 기반하여 저서동물 분포를 예측할 수 있는 통계적모델 개발 가능성을 시사한다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.