• 제목/요약/키워드: K-Means 클러스터링

검색결과 366건 처리시간 0.027초

사용자 맞춤형 건강정보 추천 앱 구현 (Implementation of App System for Personalized Health Information Recommendation)

  • 박성민;박정수;이윤규;채우준;신문선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.316-318
    • /
    • 2019
  • 최근 고령화사회의 진입으로 건강수명이 이슈가 되고 있으며 삶의 질 향상을 위한 지속적 건강관리에 관심이 높아지고 있다. 본 논문에서는 사용자들의 편리한 건강관리를 위한 사용자 맞춤형 건강정보 추천 앱 시스템을 구현하였다. 사용자는 생활습관, 질병, 신체조건 등의 기본 정보를 입력하고 입력된 사용자의 PHR(Personal Health Record)는 서버에 저장된다. 저장된 다수의 사용자들을 PHR프로파일에 따라 유사한 군집으로 분류하여 유사 사용자들에게 헬스케어 관련 콘텐츠를 제공하고자 하였다. 사용자의 PHR에 따른 유사군집의 생성을 위하여 K-Means 클러스터링을 적용하였으며 지식베이스에 저장된 건강정보 콘텐츠들을 맞춤형으로 제공하기 위하여 개미군집 알고리즘을 사용하였다. 개발된 앱은 사용자의 PHR 프로파일로 분류된 군집에 따라 위험한 질병, 개선해야 할 생활 습관 등에 대한 정보를 제공하여 사용자의 자가 헬스케어에 활용될 수 있다.

  • PDF

오토인코더 기반 수치형 학습데이터의 자동 증강 기법 (Automatic Augmentation Technique of an Autoencoder-based Numerical Training Data)

  • 정주은;김한준;전종훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.75-86
    • /
    • 2022
  • 본 연구는 딥러닝 기반 변분 오토인코더(Variational Autoencoder)를 활용하여 수치형 학습데이터 내 클래스 불균형 문제를 해결하고, 학습데이터를 증강하여 학습모델의 성능을 향상시키고자 한다. 우리는 주어진 테이블 데이터에 대하여 인위적으로 레코드 개수를 늘리기 위해 'D-VAE'을 제안한다. 제안 기법은 최적의 데이터 증강을 지원하기 위해 우선 이산화와 특징선택을 수반한 전처리 과정을 수행한다. 이산화 과정에서 k-means 클러스터링을 적용하여 그룹화한 후, 주어진 데이터가 원-핫 인코딩(one-hot encoding) 기법으로 원-핫 벡터(one-hot vector)로 변환한다. 이후, 특징 선택 기법 중 RFECV 기법을 활용하여 예측에 도움이 되는 변수를 가려내고, 이에 대해서만 변분 오토인코더를 활용하여 새로운 학습데이터를 생성한다. 제안 기법의 성능을 검증하기 위해 4가지 유형의 실험 데이터를 활용하여 데이터 증강 비율별로 그 유효성을 입증한다.

수요대응형 모빌리티 최적 운영을 위한 동적정류장 배정 모형 개발 (Development of a Model for Dynamic Station Assignmentto Optimize Demand Responsive Transit Operation)

  • 김진주;방수혁
    • 한국ITS학회 논문지
    • /
    • 제21권1호
    • /
    • pp.17-34
    • /
    • 2022
  • 본 논문은 수요대응형 모빌리티 이용객의 출발지와 목적지까지 최적 경로 산정을 위한 동적정류장 배정 모형을 개발하였다. 여기서 최적화를 위한 변수로는, 운영자 측면에서 버스통행시간과 이용자 측면에서 서비스 이용 시 추가로 소요되는 정류장까지 도보시간 및 대기시간, 우회시간을 사용하였다. 미국 캘리포니아주 애너하임과 주변 도시를 포함하는 네트워크를 대상으로 승객이 예약한 시종점에서 접근 가능한 동적정류장 리스트를 산정하고 K-means 클러스터링 기법을 이용하여 시종점 그룹들을 각기 차량에 배정하였다. 버스통행시간과 이용자 추가소요시간을 최소화하는 동적정류장 위치 및 버스노선 결정을 위한 모형을 개발하고 다목적 최적화를 위해 NSGA-III 알고리즘을 적용하였다. 최종적으로, 모델의 효용성을 평가하기 위해 이용자 추가소요시간 간의 변수를 조정하여 7개의 시나리오를 설정하였고 이를 통해 목적함수의 타당성을 분석하였다. 그 결과, 운영자 측면에서는 버스통행시간과 승객 대기시간만 고려한 시나리오가, 이용자 측면에서는 버스통행시간, 도보시간, 우회시간을 적용한 시나리오가 가장 우수하였다.

이 기종 네트워크에서 퍼지 알고리즘과 MAUT에 기반을 둔 적응적 보안 관리 모델 (Adaptive Security Management Model based on Fuzzy Algorithm and MAUT in the Heterogeneous Networks)

  • 양석환;정목동
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.104-115
    • /
    • 2010
  • 유비쿼터스 기술의 보편화에 따라 유비쿼터스 환경의 보안 취약성을 해결하기 위한 보안기술의 연구가 주목받고 있다. 그러나 현재의 대다수 보안 시스템은 고정된 규칙을 기반으로 하는 것으로서, 유비쿼터스 기반 사용자의 다양한 상황에 제대로 대응하지 못하는 문제점이 있다. 또한 기존의 상황인식 보안 연구는 ACL (Access Control List) 혹은 RBAC (Role-Based Access Control) 계열의 연구가 많이 수행되고 있으나 보안정책의 관리에 대한 오버헤드가 크고, 또한 예상하지 못한 상황에 대한 대응이 어렵다는 문제점을 보이고 있다. 이에 본 논문에서는 퍼지 알고리즘과 MAUT를 이용하여 다양한 상황을 인식하고 적절한 보안기능을 제공하는 상황인식 보안 서비스를 제안한다.

HCM 클러스터링 기반 FNN 구조 설계 (Design of FNN architecture based on HCM Clustering Method)

  • 박호성;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2821-2823
    • /
    • 2002
  • In this paper we propose the Multi-FNN (Fuzzy-Neural Networks) for optimal identification modeling of complex system. The proposed Multi-FNNs is based on a concept of FNNs and exploit linear inference being treated as generic inference mechanisms. In the networks learning, backpropagation(BP) algorithm of neural networks is used to updata the parameters of the network in order to control of nonlinear process with complexity and uncertainty of data, proposed model use a HCM(Hard C-Means)clustering algorithm which carry out the input-output dat a preprocessing function and Genetic Algorithm which carry out optimization of model The HCM clustering method is utilized to determine the structure of Multi-FNNs. The parameters of Multi-FNN model such as apexes of membership function, learning rates, and momentum coefficients are adjusted using genetic algorithms. An aggregate performance index with a weighting factor is proposed in order to achieve a sound balance between approximation and generalization abilities of the model. NOx emission process data of gas turbine power plant is simulated in order to confirm the efficiency and feasibility of the proposed approach in this paper.

  • PDF

소동물 PET기반 종양분할영역 위험구간변화에 따른 형태특성추출 (Extraction of the shape feature according to the risk area of the segmented tumor region based on the small-animal PET)

  • 이정민;김경민;김명희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.376-378
    • /
    • 2006
  • 본 논문에서는 소동물 양전자방출단층촬영 영상(Positron Emission Tomography, PET) 내 종양영역을 자동분할하고 분할된 윤곽선주변의 기하학적 위험구간에 따른 종양의 형태특성을 분석하기 위한 방법을 제시한다. PET 영상내 검출된 종양영역의 신뢰성을 위해 위음성(False negative, FN) 및 위양성(False positive, FP)의 위험구간을 같이 제공하는 것이 필요하다. 따라서, 방사선 특이적 특성이 반영된 명암값을 기반으로 Fuzzy C-Means(FCM) 클러스터링을 수행하여 종양영역을 자동 분할한다. 분활된 종양영역의 위험구간은 클러스터 간 공유되는 영역의 소속값을 이용하여 위음성, 위양성을 계산한다. 또한, 임의의 소속값 임계치 변화를 통해 위험구간의 변화에 따른 종양의 형태적 특성변화를 관측한다. 이러한 지역적 변화의 관측을 통해 위험구간의 형태학적 위치를 판단할 수 있어 위험구간에 따른 추가적인 잔여 암의 위치 및 형태 파악을 용이하게 한다.

  • PDF

Context-based 클러스터링에 의한 Granular-based RBF NN의 설계 (The Design of Granular-based Radial Basis Function Neural Network by Context-based Clustering)

  • 박호성;오성권
    • 전기학회논문지
    • /
    • 제58권6호
    • /
    • pp.1230-1237
    • /
    • 2009
  • In this paper, we develop a design methodology of Granular-based Radial Basis Function Neural Networks(GRBFNN) by context-based clustering. In contrast with the plethora of existing approaches, here we promote a development strategy in which a topology of the network is predominantly based upon a collection of information granules formed on a basis of available experimental data. The output space is granulated making use of the K-Means clustering while the input space is clustered with the aid of a so-called context-based fuzzy clustering. The number of information granules produced for each context is adjusted so that we satisfy a certain reconstructability criterion that helps us minimize an error between the original data and the ones resulting from their reconstruction involving prototypes of the clusters and the corresponding membership values. In contrast to "standard" Radial Basis Function neural networks, the output neuron of the network exhibits a certain functional nature as its connections are realized as local linear whose location is determined by the values of the context and the prototypes in the input space. The other parameters of these local functions are subject to further parametric optimization. Numeric examples involve some low dimensional synthetic data and selected data coming from the Machine Learning repository.

동시인용정보를 이용한 동명이인 저자의 중의성 해소 (Disambiguation of Author Names Using Co-citation)

  • 강인수
    • 정보관리연구
    • /
    • 제42권3호
    • /
    • pp.167-186
    • /
    • 2011
  • 동시인용은 서로 다른 두 연구가 이후의 새로운 연구에서 동시 인용되는 것이다. 이 연구는 동시인용과 저자식별의 관계를 다룬다. 저자식별은 문헌에 출현한 동명의 저자명들을 실 세계 저자로 식별하는 것이다. 동시인용은, 한 사람의 관련된 연구들이 이후 또 다른 연구들에서 타인 혹은 자신에 의해 동시 인용되는 증거를 수집함으로써, 저자식별의 절차와 성능에 영향을 미칠 수 있다. 이 연구는 구글 스칼라로부터 동시인용을 자동 수집하는 절차를 제시하고 동시인용 정보를 저자식별의 기존 자질들과 효율적으로 결합하는 새로운 군집알고리즘을 제안한다. 실험을 통해 동시인용이 저자식별에 미치는 긍정적 효과를 확인하였다.

Neural Network을 이용한 무선 통신시스템에서의 VAD (VAD By Neural Network Under Wireless Communication Systems)

  • 이호선;김수경;박승권
    • 한국통신학회논문지
    • /
    • 제30권12C호
    • /
    • pp.1262-1267
    • /
    • 2005
  • EBF(Elliptical basis function) 신경망은 비선형 처리를 가능하게 하며, 잡음에 강하고 빠른 수렴을 하는 장점이 있다. 또한 EBF는 설계가 간단하여 실시간 음성 구간 검출기(Voice Activity Detection, VAD)에 적용하기 용이하다. 따라서 전송 효율을 높이기 위해 사용되는 음성구간 검출기를 제안함에 있어 EBF 신경망을 이용하였다. EBF의 학습 알고리즘은 평균 클러스터링(K-means Clustering) 알고리즘과 선형 최소 제곱 방범(Least Mean Square error, LMS)을 사용하였다. G.729 Annex B 와 RBF(Radial Basis Function) 신경망을 이용한 음성구간 검출기와 성능 비교에 있에서, G.729 Annex B 음성 검출기보다 $70\%$ 이상의 높은 성능재선을 나타냈고, RBF 신경망을 이용한 음성구간 검출기 보다 비음성 구간에서 $50\%$정도의 높은 효율을 보였다.

1인 가구 거주자의 생활패턴이 고려된 에너지소요량 유형 분석 (An Analysis of Energy Consumption Types Considering Life Patterns of Single-person Households)

  • 이승희;정성원;임기택
    • 대한건축학회논문집:계획계
    • /
    • 제35권1호
    • /
    • pp.37-46
    • /
    • 2019
  • The energy of the building is influenced by the user 's activity due to the population, society, and economic characteristics of the building user. In order to obtain accurate energy information, the difference in the amount of energy consumption by the activities and characteristics of building users should be identified. The purpose of the study is to identify the difference in the amount of energy consumption by the user's activities in the same building, and to analyse the relationship between user's activities and demographic, social and economic characteristics. For research, energy simulation is performed based on actual user activity schedule. The results of the simulation were clustered by using K-Means clustering, a machine learning technique. As a result, four types of users were derived based on the amount of energy consumption. The more energy used in a cluster, the lower the user's income level and older. The longer a user's indoor activity times, the higher the energy use, and these activities relate to the user's characteristics. There is more than twice the difference between the group that uses the least energy consumption and the group that uses the most energy consumption.