• Title/Summary/Keyword: 군집 수 결정

Search Result 365, Processing Time 0.026 seconds

Health Risk Management using Feature Extraction and Cluster Analysis considering Time Flow (시간흐름을 고려한 특징 추출과 군집 분석을 이용한 헬스 리스크 관리)

  • Kang, Ji-Soo;Chung, Kyungyong;Jung, Hoill
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.1
    • /
    • pp.99-104
    • /
    • 2021
  • In this paper, we propose health risk management using feature extraction and cluster analysis considering time flow. The proposed method proceeds in three steps. The first is the pre-processing and feature extraction step. It collects user's lifelog using a wearable device, removes incomplete data, errors, noise, and contradictory data, and processes missing values. Then, for feature extraction, important variables are selected through principal component analysis, and data similar to the relationship between the data are classified through correlation coefficient and covariance. In order to analyze the features extracted from the lifelog, dynamic clustering is performed through the K-means algorithm in consideration of the passage of time. The new data is clustered through the similarity distance measurement method based on the increment of the sum of squared errors. Next is to extract information about the cluster by considering the passage of time. Therefore, using the health decision-making system through feature clusters, risks able to managed through factors such as physical characteristics, lifestyle habits, disease status, health care event occurrence risk, and predictability. The performance evaluation compares the proposed method using Precision, Recall, and F-measure with the fuzzy and kernel-based clustering. As a result of the evaluation, the proposed method is excellently evaluated. Therefore, through the proposed method, it is possible to accurately predict and appropriately manage the user's potential health risk by using the similarity with the patient.

A study on decision tree creation using intervening variable (매개 변수를 이용한 의사결정나무 생성에 관한 연구)

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.671-678
    • /
    • 2011
  • Data mining searches for interesting relationships among items in a given database. The methods of data mining are decision tree, association rules, clustering, neural network and so on. The decision tree approach is most useful in classification problems and to divide the search space into rectangular regions. Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, customer classification, etc. When create decision tree model, complicated model by standard of model creation and number of input variable is produced. Specially, there is difficulty in model creation and analysis in case of there are a lot of numbers of input variable. In this study, we study on decision tree using intervening variable. We apply to actuality data to suggest method that remove unnecessary input variable for created model and search the efficiency.

Reading Children's Mind from Digital Drawings based on Dominant Color Analysis using ART2 Clustering and Fuzzy Logic (ART2 군집화와 퍼지 논리를 이용한 디지털 그림의 색채 주조색 분석에 의한 아동 심리 분석)

  • Kim, Kwang-baek
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.6
    • /
    • pp.1203-1208
    • /
    • 2016
  • For young children who are not spontaneous or not accurate in verbal communication of their emotions and experiences, drawing is a good means of expressing their status in mind and thus drawing analysis with chromatics is a traditional tool for art therapy. Recently, children enjoy digital drawing via painting tools thus there is a growing needs to develop an automatic digital drawing analysis tool based on chromatics and art therapy theory. In this paper, we propose such an analyzing tool based on dominant color analysis. Technically, we use ART2 clustering and fuzzy logic to understand the fuzziness of subjects' status of mind expressed in their digital drawings. The frequency of color usage is fuzzified with respect to the membership functions. After applying fuzzy logic to this fuzzified central vector, we determine the dominant color and supporting colors from the digital drawings and children's status of mind is then analyzed according to the color-personality relationships based on Alschuler and Hattwick's historical researches.

Prediction Model for Specific Cutting Energy of Pick Cutters Based on Gene Expression Programming and Particle Swarm Optimization (유전자 프로그래밍과 개체군집최적화를 이용한 픽 커터의 절삭비에너지 예측모델)

  • Hojjati, Shahabedin;Jeong, Hoyoung;Jeon, Seokwon
    • Tunnel and Underground Space
    • /
    • v.28 no.6
    • /
    • pp.651-669
    • /
    • 2018
  • This study suggests the prediction model to estimate the specific energy of a pick cutter using a gene expression programming (GEP) and particle swarm optimization (PSO). Estimating the performance of mechanical excavators is of crucial importance in early design stage of tunnelling projects, and the specific energy (SE) based approach serves as a standard performance prediction procedure that is applicable to all excavation machines. The purpose of this research, is to investigate the relationship between UCS and BTS, penetration depth, cut spacing, and SE. A total of 46 full-scale linear cutting test results using pick cutters and different values of depth of cut and cut spacing on various rock types was collected from the previous study for the analysis. The Mean Squared Error (MSE) associated with the conventional Multiple Linear Regression (MLR) method is more than two times larger than the MSE generated by GEP-PSO algorithm. The $R^2$ value associated with the GEP-PSO algorithm, is about 0.13 higher than the $R^2$ associated with MLR.

거시경제변수(巨視經濟變數)와 주가(株價) - 한국주식시장(韓國株式市場)에서의 실증분석 -

  • Jeong, Gi-Ung
    • The Korean Journal of Financial Management
    • /
    • v.8 no.2
    • /
    • pp.111-129
    • /
    • 1991
  • 본 논문에서는 재정가격결정모형(裁定價格決定模型)(Arbitrage Pricing Model)을 기초로 우리나라 주식시장에 영향을 주는 거시경제변수가 무엇인가를 찾고자 하였다. 방법론면에서는 과거변수(過去變數)(lagged variables)에 의해서만 기대치를 형성시키는 AIRMA(Autoregressike Integrated with Moving Average) 방법을 이용하기보다는 마코프속성(屬性)(Markov Property)을 갖는 상태공간모형(狀態空間模型) (State Space Model)을 이용하여 보다 합리적인 거시경제 요인의 이노베이션을 하였다. 또한 단순한 요인분석(要因分析)(factor analysis)에 의한 요인추출은 요인의 표본의존성(標本依存性)(Sample dependency)이 심하므로 그룹간 요인분석(inter-battery factor analysis)을 행하여 추정(推定)된 요인(要因)(요인값 : factor score)과 요인수를 결정하여 관련 거시경제변수를 선택한다. 그룹간 요인분석을 위한 그룹을 형성할 때 그룹내에서는 동질성을 그룹간에는 이질성을 최대한 살리는 것이 필요한데, 이를 위해 군집분석(群集分析)(Cluster Analysis)을 사용한 것이 특징이다. 결론적으로 우리나라 주식시장에 영향을 미치는 거시경제요인(巨視經濟要因)으로 단위노동비율, 제조업제품재고지수, 채권프리미엄, 수출물가지수, 정부부문 통화공급, 회사채수익률, 종합주가지수 등 7가지가 있는 것으로 분석되고 있다.

  • PDF

Topic and Sentiment Analysis on COVID19 Research in Korea Using Text Analysis (텍스트 분석을 이용한 코로나19 관련 국내논문의 토픽 및 감성연구)

  • Heo, Seong-Min;Yang, Ji-Yeon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.329-331
    • /
    • 2021
  • 본 연구에서는 코로나19 관련 연구논문의 연구주제를 탐색하고 동향을 검토하고 있다. 또한 감성분석을 통해 부정적인 어조가 강한 경고가 되는 주제들을 알아본다. 잠재 디리슐레 할당(LDA)를 이용하여 총 8개의 토픽을 발견하 였고, 이를 구조적 토픽 모델링(STM)과 비교하여 비교적 안정적인 결과임을 확인하였다. 또한 k-means 군집 알고리즘을 통해 각 토픽별로 세부 연구주제를 발견하였고 주성분 분석을 이용하여 이를 시각적으로 표현하였다. 감성분석을 통해 각 토픽별 긍정적, 부정적인 단어들을 살펴보고 감성점수를 계산하여 연구논문의 주된 어조를 파악하였는데, 특히 생물 의학 관련, 국제적 역학관계, 심리적 영향과 관련된 연구에서 부정적인 어조가 강한 것으로 나타나 해당 부문에 대해서 주의와 관심이 요구된다. 향후 연구자들이 연구의 방향성을 탐색하고 정책결정자들이 연구지원 사업을 결정하는데 기초자료로 활용될 수 있을 것이다.

  • PDF

Establishment of in-house sterilization service based on user activities using eco-friendly materials, AI, and IoT (AI와 친환경 소재 IoT를 활용한 사용자 활동기반 댁내 살균 서비스 구축)

  • Lee, Sang Won;Lee, Hyeon Su;Moon, Jae Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.1105-1108
    • /
    • 2021
  • 국내외 IOT 시장의 성장률은 꾸준히 증가할 것으로 예측된다. 특히 스마트 가전 시장 분야의 경우 다른 스마트 홈 분야보다 규모뿐만 아니라 성장률 역시 높은 편에 속한다. 한편 코로나 시대 도래로 인하여 개인의 가정에 머무르는 시간은 많아졌으며 개인의 살균에 대한 관심 역시 높아지게 되었다. 본 논문은 인공지능 자동 살균기를 설계하여 하나의 스마트 가전제품 서비스를 설계하는 솔루션을 제공하고자 한다. 인공지능 이미지 인식 기술을 통해 사용자 활동 패턴을 파악하고 이를 기반으로 살균 시간 도출 및 살균 시간 추천 알고리즘을 통해 사용자 맞춤형 살균 서비스를 제공하며 사용자의 활동 패턴에 맞춤화된 적절한 살균 강도를 결정할 수 있도록 군집화를 통해 살균 강도 결정 서비스도 제공한다.

EasyMiner : Design and Implementation of DataMining System (EasyMiner : 데이터마이닝 시스템 설계 및 구현)

  • 최재웅;류정우;김종수;차진호;손영경;도영아;김산성;이진숙;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.87-89
    • /
    • 2000
  • 정보기술의 발전은 기업들로 하여금 많은 양의 데이터를 기업내부에 축적할 수 있도록 하였지만, 축적된 데이터로부터 기업의 경쟁력을 강화시킬 수 있는 정보를 얻을 수 있는가의 여부는 별개의 문제이다. 즉, 최근 기업들은 최선의 의사결정을 내리는데 필요한 정보 또는 지식을 축적된 데이터로부터 가공해 낼 수 있는가의 여부에 중요한 관심사를 가지고 있다. 데이터마이닝은 바로 이와 같은 요구사항을 충족시키는 새로운 정보기술의 활용방법이다. 본 논문에서는 사용자가 쉽게 데이터마이닝을 접할 수 있게 하기 위해서 데이터마이닝 솔루션인 EasyMiner를 설계하였다. EasyMiner는 데이터베이스에 독립적으로 접근하여, 제공되는 마이닝 기법을 수행할 수 있다. 제공되는 마이닝 기법으로는 분류, 군집화, 연관규칙 그리고 기초통계를 지원하고 있으며 또한 기법들에 의해 생성된 지식들을 사용자에게 쉽게 이해시키기 위해 각 기법의 결과에 대한 가시화를 설계하였다. 본 논문에서는 데이터마이닝 솔루션인 EasyMiner 설계 및 구현에 관하여 제시한다.

  • PDF

Visualized Determination for Installation Location of Monitoring Devices using CPTED (CPTED기법을 통한 모니터링 시스템 설치위치 시각화 결정법)

  • Kim, Joohwan;Nam, Doohee
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.15 no.2
    • /
    • pp.145-150
    • /
    • 2015
  • Needs about safety of residents are important in urbanized society, elderly and small-size family. People are looking for safety information system and device of CPTED. That is, Needs and Installations of CCTV increased steadily. But, scientific analysis about validity, systematic plan and location of security CCTV is nonexistent. It is simply put these devised in more demanded areas. It has limits to look for safety of residents by increasing density of CCTVs. One of the characteristics of crime is clustering and stong interconnectivity. So, exploratory spatial data of crime is geo-coded using 2 years data and carried out cluster analysis and space statistical analysis through GIS space analysis by dividing 18 variables into social economy, urban space, crime prevention facility and crime occurrence index. The result of analysis shows cluster of 5 major crimes, theft, violence and sexual violence by Nearest Neighbor distance analysis and Ripley's K function. It also shows strong crime interconnectivity through criminal correlation analysis. In case of finding criminal cluster, you can find criminal hotspot. So, in this study I found concept of hotspot and considered technique about selection of hotspot. And then, selected hotspot about 5 major crimes, theft, violence and sexual violence through Nearest Neighbor Hierarchical Spatial Clustering.

Species Diversity of Forest Vegetation in Mt.Jangan, Chollabuk-do (전라북도 장안산 삼림식생의 종다양성)

  • Kim, Chang-Hwan;Myung, Hyun;Shin, Byung-Chuel
    • Korean Journal of Environment and Ecology
    • /
    • v.13 no.3
    • /
    • pp.271-279
    • /
    • 1999
  • 전라북도 장안산의 72군락 지점에서 식물사회학적 조사에 의하여 구분된 10개 군락. 즉 신갈나무 군락, 신갈나무-철쭉꽃 군락, 신갈나무-노린재나무 군락, 신갈나무-졸참나무 군락, 졸참나무 군락, 굴참나무 군락, 서어나무 군락, 물푸레나무 군락, 층층나무 군락, 들메나무 군락에서 풍부도지수, 이질성지수, 균등도지수, 우점도지수를 산출하여 고도, 토양 특성 및 우점종군에 따른 종다양성의 변활르 분석하였으며 종서열-중요치 곡선을 이용하여 각 식물의 우점서열을 결정하고 각 종이 식물군락 내의 자원을 어떻게 분배하고 있는가를 결정하였다 고도, 토양요인(pH, base) 및 우점종의 차이는 삼림의 종 다양성에 영향을 미치는 중요한 변수로서 작용하였으며 우점종군에 따른 다양성의 변화는 지형과 교란에 의하여 영향을 받았다 종서열-중요치 곡선에서 조사된 10개 군락은 대수정규분포에 접근하고 있어서 군락간 약간의 차이는 있지만 대체적으로 어떤 특정 종이 군집 내 자원 공간을 독점하지 않고 적절히 분배하여 사용하고 있었다.

  • PDF