• 제목/요약/키워드: 서포트벡터 군집분석

검색결과 9건 처리시간 0.031초

서포트벡터 군집분석을 이용한 대구·경북지역 대학의 분류 (Classification of universities in Daegu·Gyungpook by support vector cluster analysis)

  • 박혜정;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.783-791
    • /
    • 2013
  • 본 논문에서는 대구 경북지역의 24개 4년제 대학교의 대학공시센터에 공시한 대학지표 자료를 사용하였다. 이들 대학지표들 중 재학생 충원률과 건강보험 취업률에 대한 지표를 이용하여 유사 특징을 가지고 있는 대학들을 그룹화 (분류)하여 그룹의 특징을 분석하는데 목적이 있다. SPSS의 계층적 군집분석과 서포트벡터 군집분석을 분석방법으로 활용하여 실험한 결과에서 공통으로 도출할 수 있는 정보를 구하였다.

서포트 벡터 머신을 이용한 완도 인근해역 추천항로 개선안에 관한 연구 (A Study on the Improvement of Recommended Route in the Vicinity of Wando Island using Support Vector Machine)

  • 유상록;정초영
    • 한국항해항만학회지
    • /
    • 제41권6호
    • /
    • pp.445-450
    • /
    • 2017
  • 항로 설정은 통항 선박들의 안전을 위해 교통 흐름을 반영할 필요가 있으며, 선박들이 항로를 잘 준수하는지 지속적인 경과 분석이 필요하다. 본 연구에서는 완도항 인근해역 추천항로의 문제점을 도출하고 이에 대한 개선안을 제시하였다. 효율적인 항로 중앙선을 설정하기 위해 선박 항적을 기반으로 서포트 벡터 머신을 이용하였다. 추천항로 중앙선을 기준으로 우측으로 항해해야 하므로 통항 선박들의 항적이 2개의 군집으로 분할된다. 서포트 벡터 머신은 패턴 인식 등 많은 분야에서 이용되고 있으며, 특히 이진 분류 기능이 뛰어나다. 연구 결과 장죽수도 방향의 2.4 NM 추천항로 구간에서 동진하는 상선은 약 79.5%가 추천항로를 준수하지 않는 것으로 나타나 선박 충돌 사고 위험이 상존하는 것을 확인하였다. 추천항로를 현 위치에서 북쪽으로 약 300 m 재설정할 경우, 동진하는 상선은 항로를 역주행할 비율이 79.5%에서 30.9%로 낮아지는 것으로 나타났다. 본 연구에서 적용한 서포트 벡터 머신은 선박 항적을 두 군집으로 분류가 가능하므로 항로 중앙선을 효과적으로 설정하는데 응용할 수 있을 것으로 기대된다.

설문 응답에 대한 신뢰도를 반영한 K-척도에 관한 연구 (Study on the K-scale reflecting the confidence of survey responses)

  • 박혜정;피수영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.41-51
    • /
    • 2013
  • 정보화시대에 인터넷 중독의 심각성은 정보화 사회의 큰 이슈로 부각되고 있다. 인터넷사용이 급증함에 따라 정보화의 역기능도 증가하고 있어 인터넷 중독은 사회적문제로 대두되고 있다. 초고속 무선인터넷 서비스 보급 및 넷북, 스마트 폰 등의 인터넷 접속기기가 더욱 다양화됨에 따라 인터넷 중독 자가진단 검사 척도인 K-척도의 진단기준도 시대변화에 따라 변화가 요구되었으며 2012년 3월에 K-척도의 진단기준이 변경되었다. 본 논문에서는 2012년 변경된 K-척도의 기준으로 경북지역 대학생들의 인터넷 중독 실태와 K-척도 특징들을 살펴보고자 한다. K-척도에서 중독 진단을 위한 조사방식은 응답자가 직접 자신의 중독증상을 주관적 판단에 의해 응답하는 설문방식이므로 응답자의 고의적인 사실 숨김으로 인해 응답오차가 발생할 수 있다. 본 논문에서는 응답오차를 줄이기 위해 변경된 K-척도에 응답자에게 설문 응답에 대한 신뢰할 수 있는 신뢰도 값을 추가적으로 입력하여 분석의 신뢰도를 높이고자 한다.

기계 학습을 이용한 악성 댓글 판별 시스템 (Discrimination System for Abusive Comments using Machine Learning)

  • 신효정;최소운;이경호;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.178-180
    • /
    • 2015
  • 본 논문에서는 기계 학습(Machine Learning)을 이용하여 댓글의 악성 여부를 분류하는 시스템에 대해 설명한다. 댓글은 문장의 길이가 짧고 맞춤법이 잘 되어있지 않는 특성을 가지고 있다. 따라서 댓글 분석을 위해 형태소 분석 결과와 문자단위 Bi-gram, Tri-gram을 자질로 이용한다. 전처리 된 댓글에서 각 자질 추출 방법에 따라 자질을 추출한다. 추출된 자질을 이용하여 기계학습 알고리즘의 모델을 학습하고 댓글의 악성 여부 분류에 활용한다. 본 논문에서는 댓글의 악성 여부 판별을 위한 자질 추출방법을 제안하고 실험을 통해 이에 대한 효용성을 검증하였다.

  • PDF

마이크로어레이 자료에서 서포트벡터머신과 데이터 뎁스를 이용한 분류방법의 비교연구 (A comparison study of classification method based of SVM and data depth in microarray data)

  • 황진수;김지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.311-319
    • /
    • 2009
  • 군집과 분류분석에서 L1 데이터 뎁스를 이용한 DDclust와 DDclass라고 불리는 로버스트한 방법이 Jornsten (2004)에 의하여 제안되었다. SVM-기반방법이 많이 사용되나 이상치가 있는 경우에는 약간의 문제가 있다. 유전자 자료에서는 유전자 수가 많기 때문에 적절한 유전자 선택과정이 필요하다. 따라서 적절한 유전자 또는 유전자 군집을 선택하여 분류에 이용하면 분류의 성능을 향상시킬 수 있다. 이러한 관점에서 뎁스 기반 분류방법과 SVM-기반 분류방법을 비교 연구하여 그 성능을 비교 하였다.

  • PDF

슈퍼 픽셀기반 무인항공 영상 영역분할 및 분류 (Super-Pixel-Based Segmentation and Classification for UAV Image)

  • 김인규;황승준;나종필;박승제;백중환
    • 한국항행학회논문지
    • /
    • 제18권2호
    • /
    • pp.151-157
    • /
    • 2014
  • 최근 무인항공기는 군사용뿐만 아니라 민간용으로도 많이 사용되고 있다. 무인항공기는 미리 입력된 좌표에 따라 GPS 정보를 이용하여 자동비행한다. 그러나 재밍이나 외부 교란에 의해 GPS 신호를 수신할 수 없으면 자동비행이 불가능 해진다. 이러한 문제를 해결하기 위한 한 방법으로, 본 연구에서는 무인기에 탑재된 카메라로부터 촬영된 영상으로부터 실시간으로 특정 영역을 검출하고 인식하는 알고리즘을 제안한다. 실시간 분류와 기계 학습에 사용할 특징을 추출하기 위한 전처리 과정으로 군집화 알고리즘인 그래프 기반 분할 알고리즘을 사용하여 슈퍼 픽셀화 하였다. 다양한 컬러모델 및 혼합 컬러 모델을 비교 분석하여 가장 이상적인 혼합 모델을 선정하고, 분류 알고리즘으로는 적은 트레이닝 데이터로도 뛰어난 분류 성능을 낼 수 있는 서포트 벡터 머신을 사용하였다. 무인항공 영상으로부터 18개의 컬러와 텍스처 특징 벡터를 추출하고 학습 및 예측과정을 통해 하천, 비닐하우스, 논 등 3 종류의 영역을 실시간으로 분류하였다.

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

기계학습 기반 유전자 발현 데이터를 이용한 치주질환 예측 (Prediction for Periodontal Disease using Gene Expression Profile Data based on Machine Learning)

  • 이제근
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.903-909
    • /
    • 2019
  • 치주질환은 상당수의 성인들이 가지고 있는 질환이지만 아직 분자적인 수준에서의 발생 기작과 치료 방법에 대해서는 많은 것이 밝혀져 있지 않다. 본 연구에서는 치주질환 조직과 정상 조직에서 얻어진 유전자 발현 데이터를 이용하여 치주질환 조직과 정상 조직 사이에 분자적 차이가 있는지를 확인한다. 특히 기계학습 알고리즘을 이용하여 유전자 발현양 기반 치주질환 조직과 정상 조직의 분류가 가능한지를 확인하고, 각 조직에서 발현양 차이가 나는 유전자들이 주로 어떤 기능을 하는 것인지 살펴본다. t-SNE를 이용한 분석 결과 정상 조직과 치주질환 조직 샘플이 명확히 구분되어 군집화 될 수 있음이 확인되었다. 또한, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신을 이용한 분류 알고리즘을 적용한 결과 불균형 데이터임에도 높은 정확도와 민감도, 특이도를 보였으며, 염증 반응 및 면역 반응 관련 유전자들이 주로 두 집단 간에 차이를 보임이 확인되었다.

통계적 형상분석을 이용한 엑셀 방사형 차트의 분류와 판별 (Classification and discrimination of excel radial charts using the statistical shape analysis)

  • 이승언;김준홍;최연석;최용석
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.73-86
    • /
    • 2024
  • 평가지표와 같은 수치형 자료의 경우 수치 형태보다 엑셀(Excel)의 방사형 차트 형태로 나타내 시각적으로 표현하면 정보 전달에 더욱 효과적일 것이다. 그러나 개체가 많은 경우 시각적으로 판별하거나 분류하는 것이 쉽지 않다. 이럴 경우 각 개체에 대해 방사형 차트를 이용하여 형상화 시킨 후, 형상의 정보를 대표할 수 있는 형상점을 찾고 형상좌표로 변환해 형상분석을 적용하여 분류 및 판별하는 방법을 알아보고자 한다. 형상분석을 이용하기 위해 주로 분석자의 주관으로 형상점을 얻고 임의의 좌표공간을 생성시켜 좌표를 얻곤 했다. 방사형 차트는 해당 개체의 특징을 나타내는 변수의 개수만큼 형상점이 생기게 되고 이를 선으로 이은 것은 하나의 형상으로 여겨진다. 따라서 중심을 원점으로 두고 2차원 공간으로 정의를 내린 후, X축과 각 특징을 나타내는 축이 이루는 각에 대해 삼각함수를 적용해 형상좌표를 추출해낸다. 변수의 개수가 많아 형상의 모양이 복잡해질 경우 방사형 차트를 이용해 시각화하더라도 쉽게 파악하기 어렵다. 독립성을 보장할 수 없는 변수들에 대해 주성분 분석(PCA)을 실시하여 시각적으로 효과적인 형상을 만든다. PCA를 실시하기 전과 후의 형상에 대해 전통적 판별분석, 서포트벡터머신(support vector machine; SVM), 인공신경망(artificial neural network; ANN)의 기법을 적용시켜 분류표와 분류율을 확인한다. 또한 GPA (generalized procrustes analysis) 적합좌표, 북스테인좌표 2가지 좌표에 대한 판별의 차이를 비교한다. 북스테인좌표의 경우 기저 형상점을 중심으로 형상의 위치와 회전, 척도를 변환한 좌표로써, 분류율에 대해 GPA 형상좌표보다 더 높은 결과를 보이고 있다. 북스테인좌표의 경우 여러 군집 간의 형상을 비교하는데 유용하게 활용된다.