• 제목/요약/키워드: 서포트 벡터 머신

검색결과 269건 처리시간 0.024초

머신 러닝을 활용한 회사 SNS 메시지에 내포된 심리적 거리 추출 연구 (A Study on the Extraction of Psychological Distance Embedded in Company's SNS Messages Using Machine Learning)

  • 이성원;김진혁
    • 경영정보학연구
    • /
    • 제21권1호
    • /
    • pp.23-38
    • /
    • 2019
  • 소셜 네트워크 서비스(이하 SNS)는 회사의 마케팅 채널로 적극 활용되고 있으며, 회사들의 고객층에 적합한 내용과 어조를 활용하여 주기적으로 SNS 메시지를 작성하는 등 활발한 마케팅을 펼치고 있다. 본 논문에서는 이제까지 간과되었던 SNS 메시지에 내포된 심리적 거리에 초점을 맞춰 전통적인 코더를 활용한 내용 분석(content analysis)과 자연어 처리 기법 및 머신 러닝 방법을 혼합하여 심리적 거리를 측정하는 분석 방법을 연구하였다. SNS 메시지의 심리적 거리 분석을 위해 코더들을 활용하여 내용분석을 수행하였으며, 이와 같은 방법으로 레이블링된 데이터를 자연어 처리 방법을 이용하여 워드 임베딩을 수행함으로써 머신 러닝 수행을 위한 입력 데이터를 마련하였다. 머신 러닝 분석법 중 Support Vector Machine(SVM)을 이용하여 SNS 메시지와 심리적 거리 간의 관계를 학습시켰으며, 마지막으로 테스트 데이터를 이용하여 심리적 거리를 예측함으로써 머신 러닝 분석의 성과를 검증하였다. 심리적 거리측정 방법론 수행 결과, 코더들의 내용분석 결과가 특정 값으로 편향되어 SVM 예측의 민감도와 정밀도가 낮은 결과가 도출되었다. 심리적 거리 응답 비율을 보정하고 코더들의 1차 내용분석 결과 중 답변이 일치한 데이터로 한정지어 머신 러닝을 실행한 결과 심리적 거리 예측의 정확도, 민감도, 특이도, 정밀도 모두 향상되어 심리적 거리가 70% 이상 예측되는 성과를 보였다. 본 연구는 SNS 메시지의 심리적 거리를 측정하는 방법을 제시함으로써 독자와의 심리적 거리를 제어 가능한 전략 요소로 활용 가능하게 할 것이라 기대된다.

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

중고령 노인의 개인적 가치에 따른 라이프스타일 분류: 머신러닝을 활용한 상대적 중요도 분석 (Identifying Personal Values Influencing the Lifestyle of Older Adults: Insights From Relative Importance Analysis Using Machine Learning)

  • 임승주;박지혁
    • 재활치료과학
    • /
    • 제13권2호
    • /
    • pp.69-84
    • /
    • 2024
  • 목적 : 노인의 건강한 삶의 방식으로서 라이프스타일에 대한 연구가 증가하고 있다. 라이프스타일이 개개인의 가치와 삶의 태도를 반영하는 개념임에도 불구하고, 아직까지 개인의 어떠한 가치가 라이프스타일을 건강하게 유도하는지 파악한 연구는 부족한 실정이다. 이에 본 연구는 노인의 라이프스타일 유형을 두 가지로 분류하고, 머신러닝을 활용하여 어떠한 개인적 가치가 건강한 라이프스타일에 우선적으로 작용하는지 파악하고자 한다. 연구방법 : 본 연구는 지역사회에 거주하는 55세 이상 중고령 노인 300명을 대상으로 횡단 연구를 수행하였다. 라이프스타일은 Yonsei Lifestyle Profile-Active, Balanced, Connected, Diverse (YLP-ABCD) 응답을 사용하여 잠재프로파일 분석을 통해 유형화하였다. 라이프스타일 유형을 예측하는 개인적 가치는 YLP-V (Values) 응답을 수집하여, 예측성능이 가장 높은 머신러닝 알고리즘을 선정한 후 상대적 중요도를 파악하였다. 결과 : 잠재프로파일 분석 결과, 라이프스타일은 건강한 라이프스타일 실천형(48.87%), 비실천형(51.13%)으로 분류되었다. 실천형에 속한 중고령 노인은 비실천형에 비해 사회관계가 활발한 특성을 나타내었다. 본 연구에 포함된 머신러닝 알고리즘 중 가장 우수한 성능을 보인 모델은 서포트 벡터 머신으로, 정확도 96%, Receiver Operating Characteristic (ROC) 영역 95%로 나타났다. 본 알고리즘을 바탕으로 개인적 가치의 상대적 중요도를 분석한 결과, 건강한 식단, 건강 매체, 여가활동, 건강 제품 및 머신러닝에 주의를 기울일수록, 해당 가치에 따라 중고령 노인은 건강한 라이프스타일을 실천하는 그룹에 속할 가능성이 큰 것으로 나타났다. 결론 : 본 연구는 중고령 노인의 사회적 관계망을 포함한 건강한 라이프스타일을 유도하기 위해, 건강 식단, 매체, 여가, 제품 및 습관에 대한 가치 향상을 중점적으로 다루는 종합적인 프로그램 및 서비스의 필요성을 시사한다.

하이퍼그래프 모델 기반의 장면 이미지 분류 기법 (Hypergraph model based Scene Image Classification Method)

  • 최선욱;이종호
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.166-172
    • /
    • 2014
  • 이미지를 각각의 카테고리로 분류하는 일은 컴퓨터 비전 분야의 중요한 문제 중 하나이다. 그러나 이미지에 존재하는 가변성, 모호성, 스케일 문제 등으로 인해 매우 도전적인 문제라고 할 수 있다. 본 논문에서는 장면 이미지를 구성하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려 가능한 하이퍼그래프 기반의 모델링 기법을 제시하고 이를 장면 이미지 분류에 적용한다. 각 장면 카테고리에 준최적화된 하이퍼그래프를 생성하기 위해 확률 부분공간 기법에 기반을 둔 탐색기법을 제안하고, 이들 부분 공간 내에 속한 시멘틱 속성들의 발현량을 축약하기 위한 우도비 기반의 선형 변환 기법을 제안한다. 제안한 기법의 우수성을 검증하기 위한 실험을 통하여 제시한 기법을 통해 생성된 특징 벡터의 분별력이 기존의 기법들에서 사용된 특징 벡터들의 분별력보다 우수함을 보인다. 또한 제안한 기법을 장면 분류 데이터에 적용한 결과 기존의 기법들과 비교하여 경쟁력 있는 분류 성능을 보인다. 제안 한 기법은 이미지 분류에서 일반적으로 사용 되는 기법인 BoW+SPM 모델과 비교하여 3~4%이상의 성능 향상을 보였다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구: 재무적 데이터를 중심으로 (Study on Predicting the Designation of Administrative Issue in the KOSDAQ Market Based on Machine Learning Based on Financial Data)

  • 윤양현;김태경;김수영
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.229-249
    • /
    • 2022
  • 본 연구는 다양한 머신러닝 기법을 통해 코스닥(KOSDAQ) 시장 내 관리종목 지정을 예측할 수 있는 모델에 대해 연구하였다. 증권시장 내 기업이 관리종목으로 지정이 되면 시장에서는 이를 부정적인 정보로 인식하여 해당 기업과 투자자에게 손실을 가져오게 된다. 본 연구를 통해 기업의 재무적 데이터를 바탕으로 조기에 관리종목 지정을 예측하고, 투자자들의 포트폴리오 리스크 관리에 도움을 주기 위한 머신러닝 접근이 타당한지 살펴본다. 본 연구를 위해 활용한 독립변수는 수익성, 안정성, 활동성, 성장성을 나타내는 21개의 재무비율을 활용하였으며, K-IFRS가 적용된 2011년부터 2020년까지 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 추출하였다. 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, LightGBM을 활용하여 관리종목 지정 예측 연구를 수행하였다. 연구결과는 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 의사결정나무 기반 학습 모형의 변수 중요도의 상위 3개 변수를 확인한 결과 각 모형에서 공통적으로 나온 재무변수는 ROE(당기순이익), 자본금회전율(Capital stock turnover ratio)로 해당 재무변수가 관리종목 지정에 있어 상대적으로 중요한 변수임을 확인하였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높은 것을 확인하였다. 기존 선행연구가 K-IFRS에 대한 고려를 하지 않았고, 다소 제한된 머신러닝에 의존하였다. 따라서 본 연구의 필요성과 함께 현실적 요구를 충족시키는 결과를 제시하였음을 알 수 있으며, 시장참여자들에게 있어 관리종목 지정에 대한 사전 예측을 확인할 수 있도록 기여했다고 볼 수 있다.

마이크로어레이 자료에서 서포트벡터머신과 데이터 뎁스를 이용한 분류방법의 비교연구 (A comparison study of classification method based of SVM and data depth in microarray data)

  • 황진수;김지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.311-319
    • /
    • 2009
  • 군집과 분류분석에서 L1 데이터 뎁스를 이용한 DDclust와 DDclass라고 불리는 로버스트한 방법이 Jornsten (2004)에 의하여 제안되었다. SVM-기반방법이 많이 사용되나 이상치가 있는 경우에는 약간의 문제가 있다. 유전자 자료에서는 유전자 수가 많기 때문에 적절한 유전자 선택과정이 필요하다. 따라서 적절한 유전자 또는 유전자 군집을 선택하여 분류에 이용하면 분류의 성능을 향상시킬 수 있다. 이러한 관점에서 뎁스 기반 분류방법과 SVM-기반 분류방법을 비교 연구하여 그 성능을 비교 하였다.

  • PDF

Support Vector Machine을 이용한 교육시설 초기 공사비 예측에 관한 연구 (A Study on Predicting Construction Cost of School Building Projects Based on Support Vector Machine Technique at the Early Project Stage)

  • 신재민;박현영;신윤석;김광희
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2012년도 추계 학술논문 발표대회
    • /
    • pp.153-154
    • /
    • 2012
  • The accuracy of cost estimation at an early stage in school building project is one of the critical factors for successful completion. So many method and techniques have developed that can estimate construction cost using limited information available in the early stage. Among the techniques, Support Vector Machine(SVM) has received attention in various field due to its excellent capacity for self-learning and generalization performance. Therefore, the purpose of this study is to verify the applicability of cost prediction model based on SVM in school building project at the early stage. Data used in this study are 139 school building cost constructed from 2004 to 2007 in Gyeonggi-Do. And prediction error rate of 7.48% in support vector machine is obtained. So the results showed applicability of using SVM model for predicting construction cost of school building projects.

  • PDF

한국어 트위터의 감정 분류를 위한 기계학습의 실증적 비교 (An Empirical Comparison of Machine Learning Models for Classifying Emotions in Korean Twitter)

  • 임좌상;김진만
    • 한국멀티미디어학회논문지
    • /
    • 제17권2호
    • /
    • pp.232-239
    • /
    • 2014
  • 온라인에서의 글쓰기가 늘어나면서, 기계학습을 통해 이를 분류하는 연구가 늘고 있다. 그럼에도 불구하고 한국어로 작성된 마이크로블로그를 대상으로 한 연구는 많지 않다. 또한 통계적으로 기계학습을 평가한 연구를 찾아보기 힘들다. 본 논문에서는 트위터를 대상으로, 표본을 추출하고, 형태소와 음절을 자질로 사용하여 기계학습에 따라 감정을 분류하였다. 그 결과 약 76%정도 트위터에 포함된 감정이 분류되었다. Support Vector Machine이 Na$\ddot{i}$ve Bayes보다 정확했고, 선형모델도 비구조적인 텍스트 처리에 비선형모델에 상응하는 정확성을 보였다. 또한 형태소가 음절 자질에 비해 높은 정확성을 보이지 않았다.

특징 강화 기법과 학습 데이터 길이 조절에 의한 Supervector Linear Kernel SVM 화자식별 개선 (Improvement in Supervector Linear Kernel SVM for Speaker Identification Using Feature Enhancement and Training Length Adjustment)

  • 소병민;김경화;김민석;양일호;김명재;유하진
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.330-336
    • /
    • 2011
  • 본 논문에서는 supervector linear kernel SVM을 사용한 화자식별 시스템의 성능을 개선하는 방법을 제안하였다. 제안한 방법은 긴 학습 데이터를 여러 개의 짧은 학습 데이터로 분할하는 것을 기본 아이디어로 하고 있다. 제안한 방법의 성능을 평가하기 위해 서로 다른 4가지 데이터베이스에 PCA, GKPCA, KMDA를 사용하여 특징 강화를 하고 실험한 뒤 결과를 분석하였다. 실험 결과 제안한 방법이 supervector linear kernel SVM을 사용한 화자 식별 성능을 향상 시키는 것을 확인하였다.

데이터 마이닝 기법 및 경험적 모드 분해법을 이용한 회전체 이상 진단 알고리즘 개발에 관한 연구 (A Study on Fault Diagnosis Algorithm for Rotary Machine using Data Mining Method and Empirical Mode Decomposition)

  • 윤상환;박병희;이창우
    • 한국기계가공학회지
    • /
    • 제15권4호
    • /
    • pp.23-29
    • /
    • 2016
  • Rotary machine is major equipment in industry. The rotary machine is applied for a machine tool, ship, vehicle, power plant, and so on. But a spindle fault increase product's expense and decrease quality of a workpiece in machine tool. A turbine in power plant is directly connected to human safety. National crisis could be happened by stopping of rotary machine in nuclear plant. Therefore, it is very important to know rotary machine condition in industry field. This study mentioned fault diagnosis algorithm with statistical parameter and empirical mode decomposition. Vibration locations can be found by analyze kurtosis of data from triaxial axis. Support vector of data determine threshold using hyperplane with fault location. Empirical mode decomposition is used to find fault caused by intrinsic mode. This paper suggested algorithm to find direction and causes from generated fault.