• 제목/요약/키워드: 밀도기반군집

검색결과 41건 처리시간 0.021초

밀도기반 선박 도메인을 이용한 안전 성능 지표 활용성 연구 (A Study on the Applicability of Safety Performance Indicators using the Density-Based Ship Domain)

  • 한영재;심성현;배혜림
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.89-97
    • /
    • 2022
  • 선박 충돌 사고는 경제적 손실, 인명피해 등 다양한 부정적 상황을 초래할 수 있기 때문에 사고를 예방하기 위한 다각적인 노력이 필요하다. 따라서 사고 예방을 위한 연구가 활발히 이루어고 있으며, 본 연구에서는 선박 충돌 사고 예방을 위한 새로운 선행 지표를 제안한다. 기존 연구에서는 특정 해역에서 선박들간의 거리를 고려하여 충돌위험을 표현하였지만 이를 다른 해역에 적용하기 위해서는 모델을 새로 개발해야하는 단점이 존재한다. 본 연구에서는 선박 운항 정보인 AIS(Automatic Identification System) 데이터를 활용하여 해역의 환경과 운항의 특징을 포함한 밀도기반 선박 도메인 DESD(Density based Empirical Ship Domain)을 정의하였다. 각 해역별로 만들어진 2차원의 DESD를 대상으로 Deep Clustering을 적용하여 유사한 운항 환경을 가진 해역들을 군집화 한다. 군집화된 해역과 선박 충돌 사고의 연관성 분석을 통해 해역의 특징별로 사고의 발생여부가 달라짐을 통계적으로 검정하여 DESD가 사고의 선행 지표로서 활용될 수 있음을 증명하였다.

발산거리 기반의 신경망에 의한 가우시안 확률 밀도 함수의 군집화 (Guassian pdfs Clustering Using a Divergence Measure-based Neural Network)

  • 박동철;권오현
    • 한국통신학회논문지
    • /
    • 제29권5C호
    • /
    • pp.627-631
    • /
    • 2004
  • 음성인식 모델상의 GPDFs(Gaussian Probability Density Functions)을 효율적으로 군집화 할 수 있는 알고리즘이 제안되었다. 제안된 알고리즘은 데이터 사이의 거리 척도로 발산 거리를 사용하는 새로운 형태의 CNN(Centroid Neural Network)으로, 제한된 자원을 가지는 H/W환경의 음성인식에서 메모리 사용량을 축소하는 응용에 대한 실험 결과, 음성인식 모델인 CDHMM(Continuous Density Hidden Markov Model)에서 기존의 Dk-means(Divergence-based k-means)알고리즘을 이용한 방법과 비교하여 인식 성능의 유지와 함께 약 31.3%의 GPDFs를 더 축소할 수 있었고, 군집화 알고리즘을 적용하지 자은 전체 GPDFs를 사용한 경우와 비교해서 인식 성능의 유지와 함께 약 61.8%의 GPDFs를 압축할 수 있었으며, SNR 10㏈ 잡음 데이터에 대한 성능평가에서도 인식 성능이 유지될 수 있었다.

금강하구 갯벌 내 환경요인과 저서성무척추동물 군집 분포의 상관관계 (Relationship between Environmental Factors and Macrobenthos Assemblages in Geum Estuary Tidal-flat)

  • 유재원;이채린;박미라;윤지현;강성룡
    • 한국습지학회지
    • /
    • 제21권1호
    • /
    • pp.84-94
    • /
    • 2019
  • 금강하구 서천 및 유부도 갯벌은 동아시아-대양주 철새의 이동경로상 에너지 보충을 위한 중요한 중간 기착지점으로, 갯벌의 저서성무척추동물은 이들의 중요한 먹이원이 된다. 즉, 갯벌의 저서성무척추동물은 에너지 흐름의 중요한 생태적 역할을 담당한다. 금강하구 서천 및 유부도 갯벌의 저서성무척추동물 군집 분포와 환경요인 관계를 파악하기 위해 본 연구가 수행되었다. 가을철 이주 기간에 실시한 저서성무척추동물의 군집 분포 조사 결과, 저서성무척추동물은 총 147종, 밀도와 생체량은 각각 $1,772{\pm}1,342$ 개체/$m^2$, $445.1{\pm}807.6g/m^2$으로 나타났다. 출현종과 서식밀도 자료를 기반으로 각 정점 간 상호 유사도 분석결과, 크게 2개의 군집으로 구분되었다. A 군집은 칠게-고리버들갯지렁이 군집(Macrophthalmus-Heteromastus community)이었고, B군집은 달걀얼굴갯지렁이류-단각류 군집(Spio-Urothoe-Mandibulophoxus community)이었다. B 군집이 A 군집에 비하여 평균 출현종수, 서식밀도, 생체량 등이 월등히 높았다. BIO-ENV 분석 결과, 저서성무척추동물 군집은 퇴적환경 변수인 모래함량과 분급도 조합에 의한 영향을 가장 크게 받는 것(${\rho}=0.500$)으로 나타났다. 종수와 가장 큰 상관성을 보이는 환경변수는 분급도(p=0.015)로 나타났고, 생체량과 가장 높은 상관관계를 보이는 환경변수는 공극수 DO(p=0.003)였다.

폐가스 처리용 바이오필터에 미생물 군집 분석 기법의 적용 (Application of Methodology for Microbial Community Analysis to Gas-Phase Biofilters)

  • 이은희;박현정;조윤성;류희욱;조경숙
    • Korean Chemical Engineering Research
    • /
    • 제48권2호
    • /
    • pp.147-156
    • /
    • 2010
  • 폐가스 처리용 바이오필터의 핵심 요소 기술은 생촉매(미생물), 담체, 설계 운전 기술 및 진단 관리 기술이다. 특히, 바이오필터의 성능은 부하 조건과 바이오필터 내 미생물 군집 구조에 의해 영향을 받는다. 지금까지 바이오필터의 미생물 연구는 대부분 배양법을 기초로 하여 수행되어 왔으나, 최근에 보다 신속하고 정확하게 미생물 군집을 분석할 수 있는 방법들이 제시되고 있다. 본 논문에서는 생리적, 생화학적 및 분자생물학적 미생물 군집 분석 방법과 이를 활용한 바이오필터의 미생물 군집 특성을 조사한 연구사례를 소개하고, 미생물 군집 분석법의 바이오필터에 적용 가능성에 대해 고찰하였다. Community-level physiological profile 방법은 시료 중에 포함된 종속영양미생물의 탄소기질 이용능력을 기반으로 군집 특성을 조사하는 것이며, Phospholipid fatty acid analysis는 미생물 세포막 지방산을 분석하여 군집 특성을 조사하는 방법이다. 환경시료로부터 직접 추출한 DNA를 활용하는 분자생물학적 분석법에는 "partial community DNA analysis"와 "whole community DNA analysis"가 있다. 전자의 방법은 PCR 과정에 의해 증폭시킨 염기서열을 분석하는 것으로 ribosomal operon 유전자가 가장 많이 활용되었다. 이 방법은 다시 PCR fragment cloning 및 genetic fingerprinting으로 구분되며, genetic fingerprinting 방법으로는 denaturing gradient gel electrophoresis, terminal-restriction fragment length polymorphism, ribosomal intergenic spacer analysis 및 random amplified polymorphic DNA 방법으로 세분화된다. 추출된 전체 군집의 DNA를 분석하는 방법에는 total genomic cross-DNA hybridization, 총 추출 DNA의 열 변성/재결합 방법 및 밀도구배를 이용하여 추출한 DNA를 분획화하는 방법 등이 있다.

Z-인덱스 기반 MOLAP 큐브 저장 구조 (A Z-Index based MOLAP Cube Storage Scheme)

  • 김명;임윤선
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.262-273
    • /
    • 2002
  • MOLAP(multi-dimensional online analytical processing)은 데이타의 다차원적 분석 기술로서, 이는 질의 처리 속도를 높이기 위해 데이타를 큐브(cube)라고 불리는 다차원 배열에 저장하고 배열 인덱스를 사용하여 데이타를 엑세스한다. 큐브는 다양한 방식으로 디스크에 저장될 수 있으며 이 때 사용되는 방식에 따라 MOLAP의 주요 연산인 슬라이스와 다이스 연산 속도가 크게 영향을 받는다. 이러한 연산들을 효율적으로 처리하기 위해 다차원 배열을 작은 크기의 청크로 나누고 이 들 중에서 희박한 청크들을 압축하여 저장하는 기법이 [1]에 제안되어 있다. 이 방식에서는 청크들을 행우선 순서로 디스크에 저장한다. 본 연구에서는 청크들을 밀도와 인접도 기준으로 배치시킴으로써 슬라이스와 다이스 연산 속도를 향상시키는 방법을 제시한다. 청크 밀도를 이용하여 청크들을 디스크 블록 경계에 가능한 한 맞추었고, Z 인덱싱을 사하여 인접한 저밀도 청크들을 군집화 함으로써 디스크 I/O의 속도를 높였다. 제안한 큐브 저장 방식은 일반적 비즈니스 데이타의 분석에 흔히 사용되는 3~5차원의 큐브 저장에 효율적이라는 것을 실험적으로 보였다.

세균성 이질의 탐색적 공간분석 (An Explorator Spatial Analysis of Shigellosis)

  • 박기호
    • 대한지리학회지
    • /
    • 제34권5호
    • /
    • pp.473-491
    • /
    • 1999
  • 세균성 이질은 국내 제1종 법정 전염병으로 분류되어 관리되고 있는 질환으로서 1998년 이후 그 발병 사례가 급속히 증가하고 있다. 본 연구는 1999년 3월 부산시 사상구에서 집단 발병한 세균성 이질을 대상으로 하여, 각 환자들의 발병 시점과 장소의 분포패턴에 대한 지리학적 고찰을 목적으로 한다. 환자분포의 특징적 공간패턴과 그들의 시계열적 확산 양상 등을 탐색하기 위한 방법론은 보건지리학과 지도학 및 공간통계학에 기반을 둔 공간분석기법을 중심으로 설정하였다. 분석자료는 해당 지역의 수치지형도, 지적도, 인구 센서스 자료를 포함한 GIS 데이터베이스로 구축되었다. 인구분포를 감안한 밀도구분도를 바탕으로 개별환자의 위치자료와 동 단위로 집계된 자료를 자료의 형태에 따라 분석기법을 달리하였으며, 환자 발생 밀도, 상대적 위험지수 등을 지도화하여 역학자료의 시각적 통계적 분석을 수행하였다. 환자분포의 공간적 중심위치와 분산의 변화 등 기술적 통계분석과 함께 제1차 공간속성을 커널추정법으로 찾아보았다. 이와 더불어 ‘공간적 의존성’과 관련된 제2차 공간속성은 K-함수와 시뮬레이션을 통해 분석하여 군집성 등이 통계적으로 확인되었다. 본 연구를 통해 역학조사시 GIS의 활용사례가 제시되었으며, 모집단 인구를 고려한 확률지도 작성 기법과 다양한 데이터 가시화 방법, 그리고 시계열별 발생 환자들의 지리적 변이를 분석 하는데 따르는 문제들이 논의되었다.

  • PDF

TFT-LCD 영상에서 결함 군집도 특성 기반의 확률밀도함수를 이용한 결함 검출 알고리즘 (Defect Detection algorithm of TFT-LCD Polarizing Film using the Probability Density Function based on Cluster Characteristic)

  • 구은혜;박길흠
    • 한국멀티미디어학회논문지
    • /
    • 제19권3호
    • /
    • pp.633-641
    • /
    • 2016
  • Automatic defect inspection system is composed of the step in the pre-processing, defect candidate detection, and classification. Polarizing films containing various defects should be minimized over-detection for classifying defect blobs. In this paper, we propose a defect detection algorithm using a skewness of histogram for minimizing over-detection. In order to detect up defects with similar to background pixel, we are used the characteristics of the local region. And the real defect pixels are distinguished from the noise using the probability density function. Experimental results demonstrated the minimized over-detection by utilizing the artificial images and real polarizing film images.

B2B 전자상거래보증 환경에서의 이용고객의 성향에 대한 연구 (A Study about the client feature who uses credit guarantee fund for B2B e-commerce)

  • 유순덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.933-934
    • /
    • 2009
  • 본 연구 과제에서 살펴보고자 하는 내용은 한국의 신용보증기금에서 운용하는 B2B전자상거래 보증을 어떤 업체가 가장 많이 사용하는지에 대한 분석을 Data mining 기법중의 하나인 군집분석의 밀도기반기법을 사용하여 알아본 후 본 연구상품에 가장 적합한 고객을 선정하여 타깃 마케팅에 이용하고자 한다. B2B 전자상거래 보증 상품을 사용하는 고객을 대상으로 어떤 기업고객이 본 상품을 잘 이용하는지, 어떤 기업에게 적용하기에 적절한 상품인지에 대해 살펴보고자 한다. 그 결과에 따라 영업에 활용할 타켓 고객이 누구인지를 찾아서 마케팅에 활용하는데 도움이 되고자 한다. B2B 전자상거래 대출 사용에 대한 증가 요인을 알아보고 본 제품이 기업에 주는 파급효과에 대해서도 살펴보고자 한다.

사용자 선호도와 군집 알고리즘을 이용한 퍼지-계층적 분석 기법 기반 영화 추천 시스템 (A Movie Recommendation System based on Fuzzy-AHP with User Preference and Partition Algorithm)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.425-432
    • /
    • 2017
  • 현재 추천 시스템은 실제 사용자가 선호하는 항목을 추천하는지, 아니면 단순히 관심 정도의 항목을 추천하는지 알 수 없다는 문제와 사용자들이 매우 적어 적합한 항목을 추천할 수 없는 데이터 희소성 문제, 새로운 사용자들이 유입됨에 따라 사용자들이 만족하는 항목을 추천하기 위해 시스템의 성능이 저하되는 Cold-Start 문제 등이 발생한다. 본 연구에서는 이러한 문제점을 해결하기 위해 불확실한 상황이나 문제들을 반영할 수 있는 퍼지-계층적 분석(Fuzzy-Analytic Hierarchy Process)과 주어진 항목들을 비슷한 항목들끼리 모으는 데이터 군집화 알고리즘을 활용하여 사용자들에게 만족할 수 있는 영화를 추천하기 위한 시스템을 구현하였다. 61명을 대상으로 영화 선호도에 대한 설문 조사를 실시한 데이터를 본 시스템에 적용한 결과 Fuzzy-AHP 기법을 통해서 데이터 희소성 문제를 해소할 수 있었으며, 또한 데이터 군집화 알고리즘을 통해 새로운 사용자들이 유입되어도 사용자에게 적합한 항목이 추천되었음을 확인할 수 있었다. 향후 노이즈 데이터나 아웃라이어(Outlier) 데이터를 걸러낼 수 있는 밀도 기반 클러스터링에 대한 연구가 필요할 것으로 생각된다.

역방향 인덱스 기반의 저장소를 이용한 이상 탐지 분석 (Anomaly Detection Analysis using Repository based on Inverted Index)

  • 박주미;조위덕;김강석
    • 정보과학회 논문지
    • /
    • 제45권3호
    • /
    • pp.294-302
    • /
    • 2018
  • 정보통신 기술의 발전에 따른 새로운 서비스 산업의 출현으로 개인 정보 침해, 산업 기밀 유출 등 사이버 공간의 위험이 다양화 되어, 그에 따른 보안 문제가 중요한 이슈로 떠오르게 되었다. 본 연구에서는 기업 내 개인 정보 오남용 및 내부 정보 유출에 따른, 대용량 사용자 로그 데이터를 기반으로 기존의 시그니처(Signature) 보안 대응 방식에 비해, 실시간 및 대용량 데이터 분석기술에 적합한 행위 기반 이상 탐지방식을 제안하였다. 행위 기반 이상 탐지방식이 대용량 데이터를 처리하는 기술을 필요로 함에 따라, 역방향 인덱스(Inverted Index) 기반의 실시간 검색 엔진인 엘라스틱서치(Elasticsearch)를 사용하였다. 또한 데이터 분석을 위해 통계 기반의 빈도 분석과 전 처리 과정을 수행하였으며, 밀도 기반의 군집화 방법인 DBSCAN 알고리즘을 적용하여 이상 데이터를 분류하는 방법과 시각화를 통해 분석을 간편하게 하기위한 한 사례를 보였다. 이는 기존의 이상 탐지 시스템과 달리 임계값을 별도로 설정하지 않고 이상 탐지 분석을 시도하였다는 것과 통계적인 측면에서 이상 탐지 방식을 제안하였다는 것에 의의가 있다.