• 제목/요약/키워드: machine learning

검색결과 5,177건 처리시간 0.032초

영상의 색체 강도 엔트로피를 이용한 나비 종 자동 인식 향상 방법 (A Performance Improvement of Automatic Butterfly Identification Method Using Color Intensity Entropy)

  • 강승호;김태희
    • 한국콘텐츠학회논문지
    • /
    • 제17권5호
    • /
    • pp.624-632
    • /
    • 2017
  • 영상을 이용한 나비 종 자동 인식 기법은 생물종 다양성 연구 및 종의 진화, 발달 과정의 연구를 위한 기초 작업을 돕는 것으로 연구자들의 관심이 높다. 기계학습 기반의 나비 종 인식 시스템은 사용하는 특징 추출 방법에 성능이 크게 좌우되는 성질을 가지고 있다. 본 논문은 나비 영상이 가진 색채 강도의 분포를 이용하는 색채 강도 (Color Intensity) 엔트로피를 제안하고 기존에 제시된 가지 길이 유사성 (Branch Length Similarity) 엔트로피와 함께 사용할 경우 10% 이상의 인식률 향상을 얻을 수 있음을 보인다. 제안한 방법의 신뢰성 있는 성능 평가를 위해 영상 인식에 자주 사용되는 대표적인 특징 추출 방법인 아이겐 이미지, 2D 푸리에 변환, 2D 웨이블릿 변환 방법들을 비교 대상으로 다양한 기계학습을 이용해 성능을 평가한다.

유사도 임계치에 근거한 최근접 이웃 집합의 구성 (Formation of Nearest Neighbors Set Based on Similarity Threshold)

  • 이재식;이진천
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.1-14
    • /
    • 2007
  • 사례기반추론은 다양한 예측 문제에 있어서 성공적으로 활용되고 있는 데이터 마이닝 기법 중 하나이다. 사례기반추론 시스템의 예측 성능은 예측에 사용되는 최근접 이웃 집합을 어떻게 구성하느냐에 따라 영향을 받게 된다. 최근접 이웃 집합의 구성에 있어서 대부분의 선행 연구들은 고정된 값인 K개의 사례를 포함시키는 k-NN 방법을 채택해왔다. 그러나 k-NN 방법을 채택하는 사례기반추론 시스템은 k 값을 너무 크게 혹은 작게 설정하게 되면 예측 성능이 저하된다. 본 연구에서는 이러한 문제를 해결하기 위해 최근접 이웃 집합을 구성함에 있어서 유사도의 임계치 자체를 이용하는 s-NN 방법을 제안하였다. UCI의 Machine Learning Repository에서 제공하는 데이터를 사용하여 실험한 결과, s-NN 방법을 적용한 사례기반추론 모델이 k-NN 방법을 적용한 사례기반추론 모델보다 더 우수한 성능을 보여주었다.

  • PDF

주성분 분석법과 선형판별 분석법을 이용한 최적화된 방사형 기저 함수 신경회로망 분류기의 설계 (Design of Optimized Radial Basis Function Neural Networks Classifier with the Aid of Principal Component Analysis and Linear Discriminant Analysis)

  • 김욱동;오성권
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.735-740
    • /
    • 2012
  • 본 연구에서는 주성분 분석법 및 선형 판별 분석법을 이용한 다항식 방사형 기저 함수 신경회로망 분류기의 설계 방법론을 소개한다. 주성분 분석법과 선형판별 분석법을 사용하여 주어진 데이터의 정보 손실을 최소화한 특징데이터를 생성하고 이를 다항식 방사형 기저함수 신경회로망의 입력데이터로 사용한다. 방사형 기저 함수 신경회로망의 은닉층은 FCM 클러스터링 알고리즘으로 구성되며 연결가중치는 1차 선형식을 사용하였다. 최적의 분류기 설계를 위해서 최근에 제안된 Artificial Bee Colony(ABC) 최적화 알고리즘을 사용하여 구조 및 파라미터를 동조하였다. ABC 알고리즘을 통해 주성분 분석법과 선형판별 분석법의 고유벡터의 수 및 FCM 클러스터링 알고리즘의 퍼지화 계수등의 파라미터를 동조한다. 제안된 분류기는 대표적인 Machine Learning(ML) 데이터를 사용하여 성능을 평가하며 기존 분류기와 성능을 비교한다.

성별에 따른 대사증후군의 위험요인 탐색을 위한 융복합 연구 (Convergence study to detect metabolic syndrome risk factors by gender difference)

  • 이소은;이현실
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.477-486
    • /
    • 2021
  • 본 연구의 목적은 국민건강영양조사 2016-2019년 자료 중 성인을 대상으로 대사증후군의 위험요인 탐색하고, 성별에 따른 위험요인의 차이를 규명하여 대사증후군 예방 및 치료에 기초자료로 제공하기 위함이다. 다양한 선행연구를 통해 대사증후군 위험요인을 수집하고, 4개의 머신러닝(Logistic Regression, Decision Tree, Naïve Bayes, Random Forest)의 방법을 이용하여 분석하였다. 남성과 여성 모두에서 Random Forest의 대사증후군 예측 정확도가 높았다. 대사증후군 유병에 영향을 주는 상위 위험요인으로는 여성과 남성 모두에서 BMI, 식이(지방, 비타민 C, 비타민 A, 단백질, 에너지 섭취), 기저질환의 개수, 연령으로 나타났다. 여성의 경우 교육수준과 초경 연령, 폐경 여부가 추가적으로 주요 위험요인으로 나타났고, 남성에 비해 연령과 기저질환의 개수에서 영향력이 큰 것으로 나타났다. 대사증후군을 예방하기 위해선 BMI, 식이, 질환의 이환, 초경 및 폐경여부를 고려하여 접근해야하며 후속 연구를 통해 다양한 중재 전략을 수립하고 검증해야 할 것이다.

특수학생들의 행동 분류 기반의 상담관리 모델 (Consultation Management Model based on Behavior Classification of Special-Needs Students)

  • 박원철;박구락
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.21-30
    • /
    • 2021
  • 일반적으로 알려져 있는 행동에 비해 일반적으로 알려져 있지 않은 불특정 행동들에 대한 자료들은 부족한 실정이다. 특수학생들의 불특정 행동들에 대한 교육이나 지도를 위한 데이터 수집 및 관리가 필요하다. 본 논문에서는 기계 학습을 이용한 웹 기반의 특수학생 상담관리 모델을 제안한다. 실시간으로 특수학생들의 행동을 촬영하여 데이터를 수집하고, 행동패턴을 분석하여 데이터 셋을 구성하고 제안 시스템에 학습시킨다. 추후에 촬영되는 특수학생들의 행동을 제안시스템에 입력 및 분석을 통하여 기존 데이터와 비교하여 나온 결과를 다시 학습하여 정확도를 향상 시킬 수 있다. 데이터베이스에 저장되어 있지 않은 불특정 행동들을 임의로 행하여 테스트를 진행하였으며 예측 모델은 입력 데이터를 통해 정확하게 분류 및 그룹화 하였다. 또한 진입 과정에서 약간의 오차가 있더라도 행동의 특징 데이터를 통해 행동을 정확하게 구분 및 분류하는 것이 가능하다는 것을 확인 할 수 있었다.

스마트미터 데이터 활용 방법에 대한 연구 (A study on the practical use of smart meter end-user demand data)

  • 박근영;정동휘;전상훈
    • 한국수자원학회논문집
    • /
    • 제54권10호
    • /
    • pp.759-768
    • /
    • 2021
  • 이 연구는 스마트 미터 최종 사용자 수요 데이터의 특성을 조사하여 개별 가정용 물 사용량을 분류하는 새로운 접근방식을 도입한다. 여기서는 잘 알려진 비지도 기계학습법 중 하나인 K-means 알고리즘을 적용하여 각 가구별 물 사용 분류를 수행한다. 최종 사용자 수요의 물 사용강도와 지속 시간은 물 수요 패턴이 유사한 가구를 결정하는 주요한 특징으로 사용된다. 그 결과 21가구가 13개의 군집으로 분류되었고 각 군집은 1가구, 2가구, 3가구 또는 5가구로 구성된다. 수집된 데이터 및 최종 사용자의 물 수요 패턴과 관련하여 여러 가구가 동일한 클러스터로 분류되는 이유를 본 논문에서 소개한다.

건물별 화재 위험도 예측 및 분석: 재산 피해액과 화재 발생 여부를 바탕으로 (Risk Prediction and Analysis of Building Fires -Based on Property Damage and Occurrence of Fires-)

  • 이인아;오형록;이준기
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.133-144
    • /
    • 2021
  • 본 논문은 서울시에 존재하는 건물을 대상으로 화재 발생 시 재산 피해액, 화재 발생 여부를 예측하여 건물별 화재 위험도를 도출하였다. 본 연구는 건물의 특성뿐 아니라 해당 건물이 속한 행정동의 특성 및 소방 시설 접근성과 같은 변수를 활용하였다는 점에서 기존 선행연구와의 차이점을 지닌다. 앙상블 보팅(Ensemble Voting) 기법을 활용해 서로 다른 알고리즘을 병합했으며, 이를 통해 재산 피해액과 화재 발생 여부를 예측하고 변수 중요도를 추출하여 화재 위험도를 산출하는 방향으로 연구를 진행하였다. 구축된 모델을 사용하여 서울시에 존재하는 300개 건물을 대상으로 적용한 결과, 화재 위험도 1등급의 경우 건물 내 세대 수가 많으며, 관할 119안전센터가 가장 멀리 위치하는 등 화재 발생 시 그 규모를 키울 수 있는 요인들이 많은 것으로 나타났다. 반면 5등급의 경우, 주변 건물 수나 사업체 수는 많지만, 관할 119안전센터가 가장 가까이 위치해 있어 화재에 적절히 대응할 수 있는 건물들로 나타났다.

Analysis of suitable evacuation routes through multi-agent system simulation within buildings

  • Castillo Osorio, Ever Enrique;Seo, Min Song;Yoo, Hwan Hee
    • 한국측량학회지
    • /
    • 제39권5호
    • /
    • pp.265-278
    • /
    • 2021
  • When a dangerous event arises for people inside a building and an immediate evacuation is required, it is important that suitable routes have been previously defined. These situations can happen especially when buildings are crowded, making the occupants have a very high vulnerability and can be trapped if they do not evacuate quickly and safely. However, in most cases, routes are considered based just on their proximity or short distance to the exit areas, and evacuation simulations that include more variables are not performed. This work aims to propose a methodology for building's indoor evacuation activities under the premise of processing simulation scenarios in multi-agent environments. In the methodology, importance indexes of simplified and validated geometry data from a BIM (Building Information Modeling) are considered as heuristic input data in a proposed algorithm. The algorithm is based on AP-Theta* pathfinding and collision avoidance machine learning techniques. It also includes conditioning variables such as the number of people, speed of movement as well as reaction ability of the agents that influence the evacuation times. Moreover, collision avoidance is applied between people or with objects along the route. The simulations using the proposed algorithm are tested in NetLogo for diverse scenarios, showing feasible evacuation routes and calculating evacuation times in a multi-agent environment. The experimental results are obtained by applying the method in a study case and demonstrate the level of effectiveness of the algorithm, and the influence of the conditioning variables analyzed together when performing safe evacuation routes.

Identification of Profane Words in Cyberbullying Incidents within Social Networks

  • Ali, Wan Noor Hamiza Wan;Mohd, Masnizah;Fauzi, Fariza
    • Journal of Information Science Theory and Practice
    • /
    • 제9권1호
    • /
    • pp.24-34
    • /
    • 2021
  • The popularity of social networking sites (SNS) has facilitated communication between users. The usage of SNS helps users in their daily life in various ways such as sharing of opinions, keeping in touch with old friends, making new friends, and getting information. However, some users misuse SNS to belittle or hurt others using profanities, which is typical in cyberbullying incidents. Thus, in this study, we aim to identify profane words from the ASKfm corpus to analyze the profane word distribution across four different roles involved in cyberbullying based on lexicon dictionary. These four roles are: harasser, victim, bystander that assists the bully, and bystander that defends the victim. Evaluation in this study focused on occurrences of the profane word for each role from the corpus. The top 10 common words used in the corpus are also identified and represented in a graph. Results from the analysis show that these four roles used profane words in their conversation with different weightage and distribution, even though the profane words used are mostly similar. The harasser is the first ranked that used profane words in the conversation compared to other roles. The results can be further explored and considered as a potential feature in a cyberbullying detection model using a machine learning approach. Results in this work will contribute to formulate the suitable representation. It is also useful in modeling a cyberbullying detection model based on the identification of profane word distribution across different cyberbullying roles in social networks for future works.

기계학습을 통한 전기화재 예측모델 연구 (Electrical fire prediction model study using machine learning)

  • 고경석;황동현;박상준;문가경
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.703-710
    • /
    • 2018
  • 매년 전기화재사고에 대한 사고유형 분석, 점검 등 전기적 화재사고를 줄이기 위해 다양한 노력이 있었으나, 효율적인 의사결정지원 체계 및 기존 누적 데이터 활용방안의 미비로 효과적인 대처방안이 부재한 현황이다. 본 연구는 전기안전점검데이터, 전기화재사고정보, 건축물정보, 기상청정보 등 데이터 기반의 전기화재를 예측하는 알고리즘을 개발하고 이를 활용하여 전기화재사고를 줄이는데 목적이 있다. 본 연구에서는 한국전기안전공사, 기상청, 국토교통부, 소방본부 등 기관별로 수집된 데이터를 전처리, 융합, 분석, 모델링, 검증 과정을 거쳐 전기화재에 영향을 끼치는 요인과 예측모델을 도출하였다. 주요요인으로 절연저항 값, 습도, 풍속, 건축물 노후년수, 용적율, 건폐율, 건축물용도로 나타났고, Random forest 알고리즘을 활용한 예측모델은 74.7%의 정확도를 얻었다.