• 제목/요약/키워드: Big Data Clustering

검색결과 146건 처리시간 0.022초

클라우드 컴퓨팅 환경을 위한 환자 질병 정보의 효율적인 클러스터링 처리 방안에 대한 연구 (A Study of An Efficient Clustering Processing Scheme of Patient Disease Information for Cloud Computing Environment)

  • 정윤수
    • 중소기업융합학회논문지
    • /
    • 제6권1호
    • /
    • pp.33-38
    • /
    • 2016
  • 병원을 방문하는 환자의 질병은 환경과 생활 습관에 따라 같은 질병도 서로 다른 증상이 발생할 수 있다. 최근 환자를 대상으로 제공되는 의료 서비스는 질병에 따라 환자 증상을 분석하여 치료 방법을 선택할 수 있는 환경으로 변화하고 있다. 본 논문에서는 같은 질병을 앓고 있는 환자들의 건강상태를 파악하여 질병 정도에 따라 치료 방법이 달라질 수 있기 때문에 환자 질병 정보에 따른 치료 방법을 그룹핑하여 효율적으로 관리할 수 있는 질병 관리 기법을 제안한다. 제안 기법은 환자 질병 정보를 빅 데이터화하여 의료진의 진료 효율성을 향상시킬 수 있을 뿐만 아니라 환자의 치료 만족도를 향상시킬 수 있는 특징이 있다. 제안 기법은 환자 동의하에 같은 질병을 앓고 있는 환자들의 질병 정보를 소그룹으로 클러스터링하여 빅 데이터 처리가 가능하다. 또한, 제안 기법은 환자 질병 정보에 따른 치료 방법을 특정 키워드를 통해 손쉽게 검색할 수 있는 장점이 있다. 실험 결과, 제안 기법은 기존 기법에 비해 업무 효율성 측면에서 23% 향상되었으며, 질병 관리 시간도 11.3% 향상된 결과를 얻었다. 설문 조사를 통해 살펴본 의료 서비스에 대한 환자 만족도는 31.5% 높은 결과를 얻었다.

K-Means 클러스터링을 활용한 선박입항패턴 단계화 연구 (A Study on Phase of Arrival Pattern using K-means Clustering Analysis)

  • 이정석;이형탁;조익순
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2020년도 추계학술대회
    • /
    • pp.54-55
    • /
    • 2020
  • 4차 산업혁명으로 인공지능, 사물인터넷, 빅데이터 등의 기술이 조선 해운 산업에 매우 밀접하게 연관 되고 있고 이는 자율운항선박의 탄생을 가져왔다. 현재 선박의 기술적 특성상 속력을 갑자기 낮출 수 없으므로 항만에 접안하기 위해 예인선의 도움, 도선사의 승선, 육상관제센터의 선박 컨트롤 등 복잡한 커뮤니케이션을 필요로 한다. 본 연구에서는 자율운항선박이 도입될 경우 선박이 입항하기 위한 컨트롤 기준을 어떻게 설정할지 해결하고자 클러스터링 분석을 사용하였다. 입항 선박의 축적된 AIS 데이터를 기반으로 입항 패턴을 정량적으로 단계화하고자 K-Means 클러스터링을 사용했고 SOG(Speed over Ground), COG(Course over Ground), ROT(Rate of Turn)를 사용하여 입항 단계를 6개로 구분하였다.

  • PDF

빅 데이터 기반의 네트워크 패킷 분석 모델 (The Model of Network Packet Analysis based on Big Data)

  • 최보민;공종환;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.392-399
    • /
    • 2013
  • IT 기술 발달 및 정보화 시대로 인해 우리 사회 전반에 걸쳐 많은 부분이 네트워크에 대한 의존도가 상당히 커지고 있다. 이는 다양한 정보 및 서비스 획득의 용이성을 제공해 주는 이점이 있는 반면에, 네트워크 침입자들로 하여금 더 많은 취약성의 루트를 제공할 수 있는 부정적 효과도 따르고 있다. 이는 네트워크 이용과 함께 증가한 패킷의 다양한 루트를 악용하여 네트워크의 연결된 시스템에 서비스 장애나 마비를 일으키는 악의적인 위협 및 공격 또한 함께 증가하고 있음을 의미하며 이러한 문제에 대한 해결책이 시급히 필요하다. 이에 보안 분야에서는 네트워크 패킷이나 시스템 로그 등을 수집하여 이를 분석하고 이러한 위협에 대응할 수 있는 다양한 보안 솔루션을 개발하고 있으나, 기존의 분석 방식들로는 점차 방대해져가고 있는 보안 데이터들을 처리하는데 데이터 저장 공간 부족 및 이에 따른 성능 저하와 같은 여러 문제점들이 발생하고 있다. 따라서 본 논문에서는 보안 영역 분야에서도 최근 이슈가 되고 있는 빅 데이터 기술을 적용하여 이러한 문제점들을 개선하는 모델을 제안한다. 즉, 대용량 데이터 저장 기술인 NoSQL을 통해 점차 방대해져 가는 패킷데이터를 수집하고, 분산 프로그래밍모델인 맵리듀스 기반의 K-means 클러스터링을 설계하여 네트워크 침입에 대한 특징 및 패턴을 추출 할 수 있는 분석모델을 제안하고 실험을 통하여 이에 대한 우수성을 입증하였다.

통행거리빈도분포를 활용한 고속도로 기능 평가 개선 연구 (A study on improving the evaluation of motorway functions using Trip Length Frequency Distribution(TLFD))

  • 권철우;윤병조
    • 도시과학
    • /
    • 제11권2호
    • /
    • pp.9-17
    • /
    • 2022
  • The purpose of this study is to develop an index for evaluating the function of a new motorway using the travel distance frequency distribution (TLFD) calculated using the vehicle travel route big data, and to overcome the limitations of the evaluation through the existing traffic volume. The mobility evaluation index of motorways was developed by applying it to the TLFD data table in 2019. The smaller the value of the mobility evaluation index of the link is calculated, the more it is a link with mainly short-distance travel, and the higher the value of the mobility evaluation index, the more it means a link with mainly long-distance travel. The accessibility evaluation index was calculated through the result of the mobility evaluation index of all motorways developed, and all motorways were grouped into three groups using K-means clustering. Group A was found to exist inside a large city and consisted of motorways with many short-distance traffic, Group B was investigated as acting as an arterial between groups, and Group C was classified as a motorway consisting mainly of long-distance traffic connecting large cities and large cities. This study is significant in developing a new motorway function evaluation index that can overcome the limitations of motorway function evaluation through the existing traffic volume. It is expected that this study can be a reasonable comprehensive indicator in the operation and planning process of motorways.

클러스터링 환경에 대한 IP 스푸핑 공격 발생시 라우팅 패턴에 기반한 단계별 서비스 암호화 모델 (A step-by-step service encryption model based on routing pattern in case of IP spoofing attacks on clustering environment)

  • 백용진;정원창;홍석원;박재흥
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.580-586
    • /
    • 2017
  • 빅데이터 서비스 환경 구축과 서비스에는 클라우드 기반의 네트워크 기슬과 정보 접근의 효율성 개선을 위한 클러스터링 기술이 함께 요구된다. 이러한 클라우드 기반의 네트워크와 클러스터링 환경은 다양하고 가치있는 정보를 실시간으로 제공 할 수 있기 때문에, 불법적인 접근을 시도하는 공격자들의 집중적이 표적이 될 수 있다. 특히 IP 스푸핑을 시도하는 공격자들은 클러스터링을 구성하고 있는 상호 신뢰 호스트들의 정보를 분석하여, 클러스터 내에 존재하는 시스템으로 직접 공격을 시도할 수 있다. 그러므로 불법적인 공격에 대한 빠른 탐지와 대응이 필요하며, 기존의 단일 시스템에서 구축하여 운용하는 보안시스템 보다 강화된 보안정책이 요구된다고 할 것이다. 본 논문은 이러한 네트워크 환경에서의 불법적인 공격 발생에 능동적인 대응 및 효율적인 정보 서비스가 가능 할 수 있도록 라우팅 패턴 변화를 추적하여 탐지 정보로 활용하였다. 아울러 탐지 과정에서 발생하는 라우팅 정보에 기반한 단계별 암호화를 통하여 재설정을 위한 잦은 정보 서비스의 단절이 발생하지 않으면서 안정적인 서비스 정보의 관리가 가능하도록 하였다.

IoT 도시빅데이터를 활용한 도로교통특성과 유해환경요인 간 영향관계 분석 (Impact of Road Traffic Characteristics on Environmental Factors Using IoT Urban Big Data)

  • 박병훈;유다영;박동주;홍정열
    • 한국ITS학회 논문지
    • /
    • 제20권5호
    • /
    • pp.130-145
    • /
    • 2021
  • 스마트 서울 정책의 일환으로 도시 빅데이터 활용의 중요성이 부각되고 있으며, 미세먼지, 소음과 같이 교통과 관련된 도시환경 요소가 시민들의 삶의 질에 미치는 영향에 대한 사회적 관심이 증가하고 있다. 본 연구에서는 IoT 도시 빅데이터와 교통 빅데이터를 매칭하여 통합 DB를 구축하고, 이를 활용하여 특정 공간이 도로 영향권 내에 포함되는지 여부에 따라 미세먼지, 소음 피해에 유의한 차이가 있는지 분석하였다. 또한 시계열 클러스터링을 통하여 도로교통특성 및 환경요인들이 유사한 특성을 가지는 공간 단위들을 군집화하였으며, 이 결과를 통하여 미세먼지 또는 초미세먼지 hot-spot, 소음 hot-spot 등 도시공간 단위의 환경위험 관리를 체계적으로 구축하는 기반을 마련하고자 하였다.

Development of big data based Skin Care Information System SCIS for skin condition diagnosis and management

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.137-147
    • /
    • 2022
  • 피부상태의 진단과 관리는 뷰티산업종사자와 화장품산업종사자에게 그 역할을 수행함에 있어서 매우 기초적이며 중요한 기능이다. 정확한 피부상태 진단과 관리를 위해서는 고객의 피부상태와 요구사항을 잘 파악하는 것이 필요하다. 본 논문에서는 피부상태 진단 및 관리를 위해 소셜미디어의 빅데이터를 사용하여 피부상태 진단 및 관리를 지원하는 빅데이터기반 피부관리정보시스템 SCIS를 개발하였다. 개발된 시스템을 사용하여 텍스트 정보 중심의 피부상태 진단과 관리를 위한 핵심 정보를 분석하고 추출할 수 있다. 본 논문에서 개발된 피부관리정보시스템 SCIS는 빅데이터 수집단계, 텍스트전처리단계, 이미지전처리단계, 텍스트단어분석단계로 구성되어 있다. SCIS는 피부진단 및 관리에 필요한 빅데이터를 수집하고, 텍스트 정보를 대상으로 핵심단어의 단순빈도분석, 상대빈도분석, 동시출현분석, 상관성분석을 통해 핵심단어 및 주제를 추출하였다. 또한 추출된 핵심단어 및 정보를 분석하고 산포도, NetworkX, t-SNE 및 클러스터링 등의 다양한 시각화 처리를 함으로써 피부상태 진단 및 관리에 있어 이를 효율적으로 사용할 수 있도록 하였다.

A Study on Efficient Memory Management Using Machine Learning Algorithm

  • Park, Beom-Joo;Kang, Min-Soo;Lee, Minho;Jung, Yong Gyu
    • International journal of advanced smart convergence
    • /
    • 제6권1호
    • /
    • pp.39-43
    • /
    • 2017
  • As the industry grows, the amount of data grows exponentially, and data analysis using these serves as a predictable solution. As data size increases and processing speed increases, it has begun to be applied to new fields by combining artificial intelligence technology as well as simple big data analysis. In this paper, we propose a method to quickly apply a machine learning based algorithm through efficient resource allocation. The proposed algorithm allocates memory for each attribute. Learning Distinct of Attribute and allocating the right memory. In order to compare the performance of the proposed algorithm, we compared it with the existing K-means algorithm. As a result of measuring the execution time, the speed was improved.

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

오피니언 마이닝을 통한 브랜드 클러스터링: 자동차 산업 사례연구 (Clustering Corporate Brands based on Opinion Mining: A Case Study of the Automobile Industry)

  • 황현석
    • 한국산학기술학회논문지
    • /
    • 제17권11호
    • /
    • pp.453-462
    • /
    • 2016
  • 인터넷의 등장으로 고객들은 자신의 의견이나 생각을 인터넷 공간에서 다른 사람들과 공유하기 시작하였다. 이에 따라 기업은 인터넷에서 수집된 데이터를 이용하여 기업에 활용할 수 있는 유의미한 결과를 찾으려는 노력을 하고 있다. 과거 설문조사를 기반으로 고객의 브랜드에 대한 태도나 만족도, 충성도 등을 분석하던 방식에서 소셜 네트워크 서비스(Social Network Service) 등에서 추출된 빅데이터를 이용하여 분석하려는 시도가 이루어지고 있다. 본 연구에서는 SNS에서 수집된 결과를 활용하여 브랜드간의 군집을 발견하는 프레임워크를 제시하고자 한다. 또한 제시된 프레임워크의 실무적용 가능성을 살펴보기 위해 자동차 산업에 대한 사례연구를 수행하였다. 두 개의 브랜드 이름이 소셜 미디어에서 동시에 언급되는 빈도가 높을수록 고객이 두 브랜드를 유사하게 인식한다는 가정 하에 자동차 브랜드 사이의 유사성을 측정하고 거리의 개념으로 변화한 후 다차원 척도법을 이용하여 3차원 상에 표시하였다. 또한 자동차 브랜드에 대한 고객의 인식을 파악하기 위해 유사한 브랜드간의 군집을 도출하고 각 군집을 특징을 기술하였다. 아울러 연구의 한계점과 향후 연구방향을 제시하였다.