• 제목/요약/키워드: 시-공간 클러스터링

검색결과 44건 처리시간 0.027초

위치기반 소셜 미디어 데이터의 텍스트 마이닝 기반 공간적 클러스터링 분석 연구 (Spatial Clustering Analysis based on Text Mining of Location-Based Social Media Data)

  • 박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제23권2호
    • /
    • pp.89-96
    • /
    • 2015
  • 위치기반 소셜 미디어 데이터는 빅데이터, 위치기반서비스 등 다양한 분야에서 활용가능성이 매우 큰 데이터이다. 본 연구에서는 위치기반 소셜 미디어 데이터의 텍스트 정보를 분석하여 주요한 키워드들이 공간적으로 어떻게 분포하고 있는지를 파악할 수 있는 일련의 분석방법론을 적용해보았다. 이를 위해, 위치태그를 지닌 트윗 데이터를 서울시 강남지역과 그 주변지역에 대하여 2013년 8월 한달 간 수집하였으며, 이 데이터를 대상으로 하여 텍스트 마이닝을 통해 주요 키워드들을 도출하였다. 이러한 키워드들 중 음식, 엔터테인먼트, 업무 및 공부의 세 카테고리에 해당하는 키워드들만 추출, 분류하였으며 각 카테고리에 해당하는 트윗 데이터들에 대해서 공간적 클러스터링을 실시하였다. 도출된 각 카테고리별 클러스터들을 실제 그 지역의 건물 또는 벤치마크 POI들과 비교한 결과, 음식 카테고리 클러스터는 대규모 상업지역들과 일치도가 높았고 엔터테인먼트 카테고리의 클러스터는 공연장, 극장, 잠실운동장 등과 일치하였다. 업무 및 공부 카테고리 클러스터들은 학원 밀집지역 및 사무용 빌딩 밀집지역과 높은 일치도를 나타내었다.

PSO 기반 최적화 다항식 RBF 뉴럴 네트워크 (Optimized Polynomial RBF Neural Networks Based on PSO Algorithm)

  • 백진열;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1887-1888
    • /
    • 2008
  • 본 논문에서는 퍼지 추론 기반의 다항식 RBF 뉴럴네트워크(Polynomial Radial Basis Function Neural Network; pRBFNN)를 설계하고 PSO(Particle Swarm Optimization) 알고리즘을 이용하여 모델의 파라미터를 동정한다. 제안된 모델은 "IF-THEN" 형식으로 기술되는 퍼지 규칙에 의해 조건부, 결론부, 추론부의 기능적 모듈로 표현된다. 조건부의 입력공간 분할에는 HCM 클러스터링에 기반을 두어 구조가 결정되며, 기존에 주로 사용된 가우시안 함수를 RBF로 이용하고, 원뿔형태의 선형 함수를 제안한다. 또한 입력공간 분할시 데이터 집합의 특성을 반영하기 위해 분포상수를 각 입력마다 고려하여 설계함으로서 공간 분할의 정밀성을 높인다. 결론부에서는 기존 상수항의 연결가중치를 다항식 형태로 표현하는 pRBFNN을 제안한다. 제안한 모델의 성능을 평가하기 위해 Box와 Jenkins가 사용한 가스로 시계열 데이터를 적용하고, 기존 모델과의 근사화와 일반화 능력에 대하여 토의한다.

  • PDF

SDN 스위치의 효율적인 TCAM 사용을 위한 플로우 엔트리 클러스터링 기법 (Flow Entry Clustering for Space-Efficient TCAM utilization in SDN Switches)

  • 이용승;염상길;김동수;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.196-198
    • /
    • 2014
  • 최근 차세대 네트워크 패러다임으로 주목받는 소프트웨어 정의 네트워킹 (SDN)에서는 네트워크를 컨트롤 플레인과 데이터 플레인으로 나누고 중앙집중형 제어를 통해 효과적이고 유연한 네트워크 관리를 가능하게 한다. 하지만 잦은 컨트롤 이벤트 발생으로 인한 컨트롤러 및 컨트롤 채널의 부하와 거대한 플로우 엔트리 크기로 인한 스위치 내 TCAM(Temary Content Addressable Memory) 메모리 부족문제 등의 본질적인 문제로 실제 네트워크 적용 시 확장성 문제가 야기된다. 이러한 문제를 해결하기 위해 기존의 연구들은 컨트롤러의 연산능력을 향상시키거나, 컨트롤 이벤트의 발생을 줄이는데 초점이 맞춰져 왔으며, 한정적인 TCAM 공간의 효율적인 사용에 대한 연구는 부족한 상황이다. 따라서 본 논문에서는 효율적인 TCAM 자원 활용을 위한 플로우테이블 관리 기법을 제안한다. 제안 기법은 플로우 엔트리의 클러스터링을 통해 플로우 엔트리를 특성에 따라 그룹화하고 사용빈도를 기준으로 분할 및 병합을 수행함으로써 스위치 내의 가용한 플로우 수를 최대화한다.

MOC: 다중 오브젝트 클러스터링을 통한 BSD VM의 페이지-아웃 성능 향상 (MOC: A Multiple-Object Clustering Scheme for High Performance of Page-out in BSD VM)

  • 양종철;안우현;오재원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권6호
    • /
    • pp.476-487
    • /
    • 2009
  • BSD 가상 메모리 시스템(BSD VM)은 페이지-아웃 시 디스크 I/O 횟수를 줄이기 위해 클러스터링 기법을 사용한다. 이 기법은 페이지-아웃 대상 페이지와 가상 메모리 공간에서 인접한 변경 페이지들을 그 대상 페이지와 함께 클러스터(그룹)를 만들어 한 번의 디스크 I/O로 디스크에 저장한다. 하지만 응용 프로그램이 가상 메모리 공간에서 서로 인접하지 않은 다수의 페이지들을 변경하면 클러스터들의 크기가 작아져 클러스터링의 효과가 감소된다. 이 문제점을 해결하기 위해 본 논문에서는 Multiple-Object Clustering(MOC) 기법을 제안한다. MOC는 클러스터별로 디스크 I/O를 하는 대신 여러 클러스터들을 모아 단일 디스크 쓰기로 페이지-아웃시킨다. 따라서 이 페치지-아웃 방식은 디스크 I/O 횟수를 감소시켜 시스틴 성능을 크게 향상시킨다. MOC는 성능 검증을 위해 FreeBSD 6.2 운영체제 커널에서 구현되었다. NS2, Scimark2 SOR, nbench LU 벤치마크를 통한 MOC 성능 측정 결과 기존 BSD VM보다 MOC의 실행 씨간이 9~45% 단축되었다.

기상예보정보를 활용한 월 댐유입량 예측 (Monthly Dam Inflow Forecasts by Using Weather Forecasting Information)

  • 정대명;배덕효
    • 한국수자원학회논문집
    • /
    • 제37권6호
    • /
    • pp.449-460
    • /
    • 2004
  • 본 논문에서는 월 댐유입량을 예측하는데 있어서 기상예보정보를 활용한 뉴로-퍼지 시스템의 적용성을 검토하였다. 뉴로-퍼지 알고리즘으로 퍼지이론과 신경망이론의 결합형태인 ANFIS(Adaptive Neuro-Fuzzy Inference System)을 이용하여 모형을 구성하였다. ANFIS의 공간분할에 의한 제어규칙의 선정에 있어 퍼지변수가 증가함에 따라 제어규칙이 기하급수적으로 증가하는 단점을 해결하기 위해 퍼지 클러스터링(Fuzzy Clustering)방법 중 하나인 차감 클러스터링(Subtractive Clustering)을 사용하였다. 또한 본 연구에서는 정성적인 기상예보정보를 정량화 시키는 방법을 제안하였다. AMFIS를 이용하여 월 댐유입량 예측 시, 관측자료만으로 구성된 모형에 의한 예측결과와 관측자료에 기상예보정보를 더하여 구성된 모형에 의한 예측결과를 비교하였다. 그 결과 ANFIS는 기상예보정보를 활용하여 댐유입량을 예측했을 때가 관측자료만으로 예측했을 때보다 예측능력이 더욱 정확함을 보였다.

공간정보기반 클러스터링을 이용한 초고속인터넷 결합유형별 해지의 지역별 특성연구 (A Study on the Regional Characteristics of Broadband Internet Termination by Coupling Type using Spatial Information based Clustering)

  • 박장혁;박상언;김우주
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.45-67
    • /
    • 2017
  • "2016 인터넷이용실태조사"에 따르면 인터넷 이용자수 및 이용률은 점점 증가하고 있으며 접속방법에 있어서는 컴퓨터보다 스마트폰을 통한 접속이 많아지고 있다. 스마트기기의 증가에 따라 초고속인터넷의 수요가 감소할 것이라는 전망도 있다. 하지만, 스마트기기의 증가에도 불구하고 기가인터넷을 통한 속도 향상과 IoT 시장의 성장으로 인해 초고속인터넷 시장은 당분간 유지될 것으로 전망된다. 시장의 포화로 인해 통신사업자들이 신규고객 확보를 위해 과도한 경쟁을 하고 있지만, 고객이탈의 원인을 알 수 있다면 보다 효과적인 마케팅을 통해 과도한 마케팅비용을 절감할 수 있을 것으로 기대된다. 본 연구에서는 통신사업자 A사가 보유하고 있는 안양시, 군포시, 의왕시 3개 도시의 결합유형별 해지 데이터와, 통계청으로부터 구한 지역별 데이터를 결합하여, 지역별 해지율과 이에 영향을 미치는 지역특성간의 관계를 분석하고자 하였다. 특히 인접지역에 따라 결합유형별 해지율의 분포에 차이가 있을 것으로 보고, 클러스터링을 이용하여 해지유형이 유사한 지역을 도출 및 분석하고자 하였다. 공간검색통계도구인 SatScan은 기존의 클러스터링 방법에 공간정보를 추가하여 인접지역을 중심으로 군집이 형성되도록 한다. 따라서 본 연구에서는 SatScan을 이용해 지역의 공간정보를 기반으로 유사지역을 군집화하고, 군집별 해지율과 지역별 데이터와의 연관성을 분석하였다. 분석 단계에서는 먼저 공간정보와 해지데이터를 결합하여 도출된 군집들의 특성을 정리하였으며, 다음으로 군집분석 결과를 바탕으로 하여 각 동의 초고속 인터넷 해지율과 지역별 데이터와의 연관성을 분산분석, 상관분석, 회귀분석을 이용하여 분석하였다. 그리고, 분석결과를 기반으로 하여 지역에 따른 적절한 마케팅 방안을 제안하였다.

문맥 독립 화자인식을 위한 공간 분할 벡터 양자기 설계 (A Classified Space VQ Design for Text-Independent Speaker Recognition)

  • 임동철;이행세
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.673-680
    • /
    • 2003
  • 이 논문은 문맥 독립 화자인식에 사용될 벡터 양자기의 설계법 개선에 관한 연구이다. 구체적으로 벡터 양자기 코드북 생성 과정에서 특징 벡터 공간을 분할하여, 양자기 설계 시 학습에 필요한 계산 복잡도를 획기적으로 줄이는 방법을 제안한다. 제안된 공간 분할 벡터 양자기 설계법은 저자가 제안한 문맥 종속 화자인식을 위한 준비반복 벡터 양자기 설계법의 벡터 공간에 대한 일반화이다. 공간 분할 벡터 양자기 설계법은 종래의 설계법이 코드북 생성에 반복적 학습 설계를 사용한다는 것과 대조를 이룬다. 또한 공간 분할 벡터 양자기 설계법의 특징은 다음과 같다. 첫째, 이 설계법은 특징 벡터 공간을 분할한 공간 분할 군집을 이용함으로써 반복 학습을 하지 않는다. 둘째, 설계된 각 양자 영역은 공간 분할 군집의 양자 영역을 원용하며, 양자점은 각각의 통계 분포에 대해 최적점으로 설정된다. 셋째, 공간 분할 군집은 특징 벡터 집합에 대해 표본 벡터 생성법(CSVQ1, 2), 특징 벡터 공간에 대해 균일 초격자 구조 생성법(CSYQ3)으로 형성하였다. 수치 실험은 화자 10명이 발성한 50개의 문장에 대해 문맥 독립 화자인식 실험으로 수행되었다. 특징계수는 12차 멜켑스트럼 벡터를 사용하였고 각각의 공간 분할 코드북 생성법에 대해 코드북 크기를 32부터 128까지 변화시키면서 기존의 벡터 양자기 인식법과 비교하였다. 제안된 방법은 표본 벡터 생성법을 사용한 경우 인식률 100%로 기존의 방법과 같은 결과를 보였다. 따라서 제안된 공간 분할 벡터 양자기 설계법은 설계에 필요한 계산량이 획기적으로 줄면서 인식률은 보존되어 문맥 독립 화자 인식에 새로운 대안이 되며 또한 특징 벡터 공간을 설정할 수 있는 다양한 응용에 적용이 가능할 것으로 사료된다.

지능형 교통 시스템을 위한 Graph Neural Networks 기반 교통 속도 예측 (Traffic Speed Prediction Based on Graph Neural Networks for Intelligent Transportation System)

  • 김성훈;박종혁;최예림
    • 한국ITS학회 논문지
    • /
    • 제20권1호
    • /
    • pp.70-85
    • /
    • 2021
  • 최근 활발히 연구되는 딥러닝 방법론은 인공지능의 성능을 급속도로 향상시켰고, 이에 따라 다양한 산업 분야에서 딥러닝을 활용한 시스템이 제시되고 있다. 교통 시스템에서는 GNN을 활용한 공간-시간 그래프 모델링이 교통 속도 예측에 효과적인 것으로 밝혀졌지만, 이는 메모리 병목 현상을 유발하기 때문에 모델이 비효율적으로 학습된다는 단점이 있다. 따라서 본 연구에서는 그래프 분할 방법을 통해 도로 네트워크를 분할하여 메모리 병목 현상을 완화함과 동시에 우수한 성능을 달성하고자 한다. 제안 방법론을 검증하기 위해 인천시 UTIC 데이터 분석 결과를 바탕으로 Jensen-Shannon divergence를 사용하여 도로 속도 분포의 유사도를 측정하였다. 그리고 측정된 유사도를 바탕으로 스펙트럴 클러스터링을 수행하여 도로 네트워크를 군집화하였다. 성능 측정 결과, 도로 네트워크가 7개의 네트워크로 분할되었을 때 MAE 기준 5.52km/h의 오차로 비교 모델 대비 가장 우수한 정확도를 보임과 동시에 메모리 병목 현상 또한 완화되는 것을 확인할 수 있었다.

위치 기반 서비스 지원을 위한 연관 클래스 집합 생성 기법 (An Associative Class Set Generation Method for supporting Location-based Services)

  • 김호숙;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.287-296
    • /
    • 2004
  • 최근 이동 컴퓨팅 환경 하에서 위치를 기반으로 하는 다양한 서비스가 점차 증가하고 있다. 본 논문은 이동 컴퓨팅 환경에서 대량의 공간 데이타베이스를 기반으로 하는 위치 기반 서비스를 지원하기 위하여, 요청되는 질의들 사이에 존재하는 의미적으로 연관성이 있는 빈발 항목인 연관 클래스 집합을 제안하고, 이를 효과적으로 찾는 방법에 대해 소개한다. 이때 요청되는 질의들의 시간적 연관 관계, 그리고 이러한 서비스를 제공해 주는 공간 객체들 사이의 거리와 사용자의 접근 특성이 함께 고려된다 이러한 연구 결과는 이동 환경이 갖는 제약점을 극복하면서 효과적으로 위치 기반 서비스를 지원하는 바탕이 된다 즉 생성된 연관 클래스 집합은 이동 컴퓨팅 환경에서 지리 정보를 서비스 할 때 관련 자료를 추천하는 시스템에 활용할 수 있고, 지리 정보를 고려한 광고 방송이나 도시 개발 계획 둥에 이용할 수 있으며, 이동 사용자를 위한 클라이언트의 캐쉬 정책에 응용될 수 있다.

차세대 브이월드 시스템 아키텍처 구성에 관한 연구: 최적의 아키텍처 설계를 위한 신기술 분석 (A Study on the Next VWorld System Architecture: New Technology Analysis for the Optimal Architecture Design)

  • 고준희;임용화;김민수;장인성
    • Spatial Information Research
    • /
    • 제23권4호
    • /
    • pp.13-22
    • /
    • 2015
  • 국가 공간정보를 다양한 방법으로 서비스 중인 공간정보 오픈플랫폼은 2012년 서비스 오픈 후 2차원 지도, 3차원 지형, 3차원 건물, 시계열지도 및 각종 주제도 등 지속적으로 다양한 콘텐츠와 서비스를 추가함에 따라 사람들의 관심이 증가하고 있다. 그러나, 공간정보 오픈플랫폼 시스템은 2012년 9월과 2013년 9월에 북한관련 3차원 위성영상 및 백두산 관련 신규 서비스가 추가되면서 사용자 접속의 폭주로 서비스가 중단되는 일이 발생하는 등 시스템의 과도한 부하에 대하여 안정적이지 못한 구조를 가지고 있다. 이는, 신규 콘텐츠 추가나 사용자 접속 증가 등 필요시마다 단순히 서버나 네트워크 장비만을 증설하여 서비스를 수행하였기 때문이다. 이에 본 연구에서는 CDN, 가상화, 클러스터링 등 신기술을 분석하여 방대한 국가 공간정보를 안정적으로 서비스 할 수 있는 새로운 공간정보 오픈플랫폼 아키텍처 구성방안을 제시하고자 한다. 끝으로 본 연구결과는 대용량 공간정보와 다수 사용자를 처리할 수 있는 차세대 공간정보 오픈 플랫폼 아키텍처 수립을 위한 기초 자료로 활용될 수 있을 것으로 기대된다.