• 제목/요약/키워드: 알고리즘 분류체계

검색결과 126건 처리시간 0.032초

데이타마이닝 기법을 이용한 문서 자동 분류 모델 (An Automatic Text Classification Model using Association Rules)

  • 김영인;이진용;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.101-108
    • /
    • 2000
  • 기업에서 보유한 전문 지식 정보가 급속도로 증가함에 따라 대량의 문서에 저장된 지식 정보를 효과적으로 탐색하여 기업 경영에 활용하기 위한 지식경영시스템 도입이 확산되고 있다. 이러한 지식경영시스템에서 핵심적인 구성 요소는 전문 분야의 지식 정보를 체계적으로 분류하고 효율적으로 검색하기 위한 지식 탐사 기법이다. 본 논문에서는 데이타마이닝 기법을 이용하여 문서를 자동적으로 분류하기 위한 새로운 모델을 제안하였다. 연관 규칙 탐사 알고리즘을 이용하여 학습용 문서 집합으로부터 세부 분야를 대표하는 색인어 집합을 구성하였다. 세부 분야별 색인어 집합에 대하여 전체 문서에 대한 비중에 따라 가중치 배열을 구성하여 문서를 자동으로 분류하기 위한 기준으로 삼았다. 임의의 문서를 자동적으로 분류하는 실험을 통하여 제안된 방법의 효율성을 검정하였다.

  • PDF

과거이력자료를 활용한 요일별 패턴분류 알고리즘 개발 (Development of a Daily Pattern Clustering Algorithm using Historical Profiles)

  • 조준한;김보성;김성호;강원의
    • 한국ITS학회 논문지
    • /
    • 제10권4호
    • /
    • pp.11-23
    • /
    • 2011
  • 이 연구는 시계열 과거 속도자료를 활용하여 유사한 패턴 변화를 보이는 요일을 그룹핑하는 알고리즘을 개발하였다. 알고리즘에 적용할 이력자료 시간적 범위는 과거 2개월치 자료를 사용하였으며, 공간적 범위는 도시부도로를 대상으로 하였다. 이 연구에서 제안한 알고리즘은 크게 거시적인 관점과 미시적인 관점으로 나누어 요일별 패턴분류를 수행하였다. 먼저 거시적인 관점에서 요일별 첨두/비첨두 시간대와 요일별 속도변화가 크게 나타나는 중점시간대를 도출하였다. 미시적인 관점에서는 거시적인 관점에서 도출된 중점시간대를 대상으로 요일간 속도 차이를 개별(요일별) 혹은 그룹간의 유사성을 비교하여 단계적으로 분류하는 2단계 속도 군집 알고리즘(Two-step speed clustering algorithm, TSC)을 개발하였다. TSC 알고리즘은 중점시간대의 매 가공주기(또는 제공주기)마다 요일별(월~일) 속도차이를 토대로 그룹핑하는 1단계와 1단계에서 도출된 각 그룹의 평균과 요일간의 속도차이를 비교하여 재할당하는 2단계로 구성된다. TSC 알고리즘은 실제 지점검지기에서 수집된 시간대별 시계열 자료를 토대로 개발 및 성능평가가 수행되었다. 따라서, 교통정보센터에서 수집 가공 저장되는 과거이력자료를 이용하여 요일별 패턴분류 수행이 가능하고 알고리즘 구현도 실제 가공체계에 적용하기 용이하다. 이 연구에서 제안한 알고리즘은 통행패턴기반 정보가공 알고리즘 개발, 요일별 반복정체구간 운영관리, TOD에 근거한 신호운영 개선 등 교통운영 및 관리 전반에 적용이 가능하다.

상황인식 기반 클러스터링의 적응적 자율 학습 분할 알고리즘 (Context-awareness Clustering with Adaptive Learning Algorithm)

  • 전일규;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.612-614
    • /
    • 2022
  • 본 논문은 이동 노드간 클러스터링을 함에 있어 보다 효율적인클러스터링을 제공하고 유지하기 위한 딥러닝의 자율학습에 따른 군집적 알고리즘을 제안한다. 대부분 이동 노드의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 새롭게 입력되거나 변경된 데이터가 비교정보에서 오염된 정보로 분류될 경우 기존 분류된 클러스터링으로부터 오염된 정보로 이해되어 군집성을 저하시키는 요인으로 작용 할 수가 있다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 학습 모델을 제시 한다.

  • PDF

차량 단말기 기반 돌발상황 검지 알고리즘 개발 (Development of a Emergency Situation Detection Algorithm Using a Vehicle Dash Cam)

  • 이상현;김진영;노종민;이환필;이수목;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.97-113
    • /
    • 2023
  • 전방 낙하물과 같은 돌발상황이 발생했을 때 신속하고 적절한 정보 제공은 도로 위 이용자들의 편의를 가져다주고 2차 교통사고 또한 효과적으로 줄일 수 있다. 도로 상의 돌발상황은 현재 국내에서 루프 검지기나 CCTV 등 ITS 기반 검지 체계를 사용하여 주로 검지하고 있다. 이러한 방식은 검지기의 검지 구간에서의 도로 위 데이터만을 얻을 수 있다. 때문에, 기존 ITS 기반 검지체계의 공간적 음영구간에서 돌발상황을 찾아내기 위하여 새로운 검지 수단이 필요하다. 이에 본 연구에서는 차량 내 설치된 단말기에서 촬영된 영상으로부터 돌발상황을 검지 및 분류하는 ResNet 기반 알고리즘을 제안한다. 국내 고속도로 전방 주행영상을 수집하였고, 돌발상황 유형을 클래스로 정의하여 각 데이터를 라벨링한 후, 제안한 알고리즘으로 데이터를 학습시켰다. 학습 결과, 개발한 알고리즘은 데이터 수가 상대적으로 적었던 일부 클래스를 제외하고 정의한 돌발상황 클래스에 대하여 높은 검지율을 보였다.

DTW를 이용한 SVM 기반 이진트리 구조 설계 (Binary Tree Architecture Design for Support Vector Machine Using Dynamic Time Warping)

  • 강윤정;이재일;배진호;이승우;이종현
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.201-208
    • /
    • 2014
  • 본 논문은 DTW 결과를 이용하여 분류기 구조를 설계하는 알고리즘을 제안한다. 제안된 알고리즘은 다수 클래스의 데이터를 분류하기 위한 SVM 기반 이진트리 구조를 설계하는데 있어 DTW 결과를 이용한다. 각 클래스에 대한 데이터를 DTW의 입력으로 하여 얻어진 결과행렬의 열의 합을 이용하여 계산된 임계치를 기준으로 SVM 기반 이진트리 구조(SVM-BTA)를 설계한다. 제안된 알고리즘의 성능 비교를 위해 데이터베이스와 k-means 알고리즘을 이용한 이진트리 구조의 분류 결과를 비교한다. 분류에 사용된 데이터는 수중과도소음 데이터베이스의 18개 클래스 333개의 데이터이다. 제안된 분류기는 데이터베이스의 체계를 이용한 분류기에 비해 분류성능이 향상되었고, k-means 알고리즘을 이용한 분류기에 비해 비 생물소음의 검출 확률이 향상되었다. 제안된 SVM-BTA는 생물 소음(BO) 68.77%, 기계 소음인 체인(CHAN) 92.86%, 그 외의 기계 소음 및 음향학적 소음, 기타소음의 6종은 100%로 분류한다.

Big 5 성격 요소와 머신 러닝 알고리즘을 통한 창의적인 사람들의 특징 연구 (Feature Selection for Creative People Based on Big 5 Personality traits and Machine Learning Algorithms)

  • 김용준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-102
    • /
    • 2019
  • 창의적인 사람에 대한 정확한 기준이나 수치화를 사용하여 체계적인 분류와 분석 방법이 없었기에 정의하는 데에 어려움이 많다. 이 문제를 해결하기 위하여 본 연구에서는 창의적인 사람을 어떻게 구분 지을 수 있을지에 대한 것과 어떤 유사한 성격이 있는지 분석한다. 본 연구에서 우선 Big 5 성격 특성 기법을 이용하여 설문조사를 진행하고, 그 설문조사로 얻은 데이터 세트를 가지고 데이터 마이닝 도구인 WEKA를 이용하여 데이터 세트를 분류하고 분석한 뒤, 창의적인 사람들과 연관성 있는 성격 특징들을 다양한 머신 러닝 기법을 이용하여 분석하는 것을 목표로 진행하였다. 7개의 특징 선택 알고리즘을 활용하고, 특징 선택 알고리즘들로 분류된 특징 집단을 선택하여 머신 러닝 알고리즘에 적용하여 정확도를 알아냈고, 서포트 벡터 머신을 통해 나온 특징이 가장 높은 분류 결과를 도출하였다.

디지털 유전자를 사용하는 추상 이미지의 분류 (Classification of Abstract Images using Digital Chromosome)

  • 서동수;이혜리
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.870-874
    • /
    • 2009
  • 추상 이미지를 자동 생성하는 기법으로 유전자 알고리즘을 이용하는 방법은 다양한 형태의 이미지를 자동 생성할 수 있는 기법으로 유용하게 쓰일 수 있다. 그러나 다수의 자동 생성된 이미지를 보관하고 검색하는 과정에서 적절한 분류 방법이 제공되지 않아 관리의 어려움이 존재한다. 본 연구에서는 아핀 추상 이미지를 효과적으로 분류하기 위한 체계로 형태요소, 감성요소, 색채요소를 이용한 분류 방법을 제안하고 이를 검색할 수 있는 데이터베이스를 설계한다.

  • PDF

Expectation Maximization (EM)과 Least Mean Square(LMS) algorithm을 이용하여 초음파 비파괴검사 신호의 분류를 하기 위한 새로운 접근법 (A novel approach to the classification of ultrasonic NDE signals using the Expectation Maximization(EM) and Least Mean Square(LMS) algorithms)

  • Daewon Kim
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.15-26
    • /
    • 2003
  • 초음파 검사 방법은 여러 가지 물질들의 흠집이나 틈새, 그리고 티끌 등을 감지해내는데 널리 쓰이고 있다. 그 중 초음파 신호를 분석하는 절차는 전체의 신호처리 과정에서 아주 중요한 역할을 담당하고 있다. 많은 초음파 신호처리와 신호분류의 방법들이 제기 되었는데 그 중 가장 널리 쓰이는 방법은 신호들의 특징 공간상에서 그 특정의 성분들을 추출해내고 그 후 신경망 네트웍을 통한 분류 방법을 이용하여 초음파 신호들을 구별해 내는 방법이다. 이 논문은 기존의 신호 분류 체계와는 다른 대체 신호 분류법을 제시하고 있는데 이것은 최소 평균 제곱 (LMS) 알고리즘을 이용하여 핵 전력 발전소에서 쓰이는 증기 발생기 튜브로부터 감지되어진 초음파 비파괴 검사 신호 (ultrasonic nondestructive evaluation signal) 을 분류해내는데 쓰일 수가 있다 이 초음파 비파괴 검사 신호는 튜브내의 흠집이나 틈새로부터 감지되어진 신호일수도 있고 또는 튜브내의 침전물에 의해서 발생된 신호일 수도 있는데 이 두가지 신호는 매우 유사하기 때문에 반드시 분류를 해내어 침전물에 의한 신호일 경우는 무방하지만 흠집이나 갈라진 틈새에서 나오는 신호일 경우는 더 이상의 오염이나 사고 등을 방지하기 위해 수리 또는 교체 등의 후속 조치로 이어져야 한다. 이러한 절차를 밟기 위하여 증기 발생기 튜브의 내부에서의 초음파 센서로부터 증기 발생기 튜브 사이의 거리를 측정하는데 모델링 기법에 기반한 deconvolution 방법이 제시되었고 여기서 나온 결과가 정리, 분석되었다 이 방법은 space alternating generalized expectation maximization (SAGE) 알고리즘을 이차원 미분 파라미터인 Hessian의 사용으로 인하여 수렴 속도가 빠른 Newton-Raphson 알고리즘과 함께 병행 사용하여 초음파 신호의 초점 도달 시간과 그 크기를 측정하여 초점 도달 거리에 따라 두 종류의 신호를 분류, 차별화 하는 기법이다. 이 알고리즘을 이용한 접근법으로 얻어진 결과가 흠집이나 틈새로부터 나온 신호일 경우와 퇴적물에 의해 나온 신호일 경우로 정리, 분류되었고 적절한 분류 효과를 보인 결과가 이 논문에 제시되었다.

  • PDF

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

CNS 운전원의 행위자료 및 정신부하 측정체계 개발

  • 이동하;손영숙;심봉식;이정운;박근옥;박재창;오인석;차경호;이현철
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1995년도 추계학술대회논문집
    • /
    • pp.37-37
    • /
    • 1995
  • CNS의 인간공학적 실험 평가 항목중 중요 요소의 하나인 운전원의 인지적 작업부하(정보입력, 의사결정, 및 정서적 부하)를 평가하기 위해 인지적부하를 부과할 수 있는 사건 시나리오 구성방법, 피실험자에 대한 훈련 방법, 실험과 디브리핑을 통한 운전원 행위 및 사건 경위 기록 체계를 개발하였다. 운전원 행위자료 데이타베이스에는 특정 요소행위 시점, 관측행위 분류, 사용된 표시장치, 의사결정내용, 사용된 조종장치, 조종행위분류, 운전원간 의사소통 내용, 정서상태, 표시장치 및 조종장치의 사용편의성 여부 및 불편이유, 주요사건 발생시점에 관한 정보가 기록되었다. 운전중 CNS 운전원에 제시되는 자극의 변화에 수반되는 운전원의 생리적 변화를 측정하여 이로부터 운전원이 받는 정신부하를 측정하는 체계를 개발하였다. 이를 위해 ECG, EEG, 호흡패턴,피부온도, 수평EOG, 수직EOG, 심박률, 및 호흡률의 생리변수에 대한 측정이 이루 어졌으며 각각의 신호를 초당 100개씩 샘플링하여 A/D 변환하고 정신부하 추정 알고리즘을 거쳐 정신부하 여부를 판정하는 점수를 구하였다. 다차원의 정신부하 판정 점수는 OR gate에 의해 통합되어 정신부하 발생시점과 함께 정신부하데이터베이스에 기록되었다.

  • PDF