• 제목/요약/키워드: DBSCAN

검색결과 70건 처리시간 0.026초

머신러닝을 이용한 오디오북 플랫폼 기반의 웹케어 모형 구축에 관한 연구 (A Study on Developing a Web Care Model for Audiobook Platforms Using Machine Learning)

  • 정다훈;이민혁;이태원
    • 경영정보학연구
    • /
    • 제26권1호
    • /
    • pp.337-353
    • /
    • 2024
  • 본 연구는 소비자 리뷰와 관리자 답변 간의 관계를 조사하여 소비자 리뷰를 효율적으로 관리하기 위한 웹케어의 필요성을 탐색하는데 목적이 있다. 효과적인 웹케어를 위한 방법론을 제안하고 오디오북 플랫폼 기반의 머신러닝을 이용한 웹케어 모형을 구축하고자 한다. 본 연구에서는 오디오북 플랫폼 4개를 선정하여 소비자 리뷰와 관리자 답변에 대한 데이터 수집 및 전처리 과정을 거쳐 토픽모델링, 주제불일치성, DBSCAN을 활용하고, 다양한 머신러닝 기법을 적용하여 분석을 시행하였다. 실험 결과 관리자 답변의 군집화 및 소비자 리뷰에 대한 답변 예측에서 유의미한 결과를 도출하였으며, 자원의 제한과 비용을 고려한 효율적인 방법론을 제안하였다. 본 연구는 머신러닝을 통해 웹케어 모형을 구축했다는 점에서 학술적인 시사점을 제공하며, 기업의 제한된 비용과 인력을 고려하여 웹케어 모형이라는 효율적인 방법론을 제시함으로써 실무적인 시사점을 지닌다. 본 연구에서 제안된 웹케어 모델은 개별화된 답변과 표준화된 관리자 답변을 제공하여 소비자 참여 및 유용한 정보 제공을 위한 전략적인 기초 자료로 활용될 수 있을 것이다.

기계학습 군집 알고리즘을 이용한 미세먼지 비선형성 완화방안 (Non-linearity Mitigation Method of Particulate Matter using Machine Learning Clustering Algorithms)

  • 이상권;조경우;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.341-343
    • /
    • 2019
  • 고농도 미세먼지 발생이 증가함에 따라 미세먼지 예측에 많은 관심이 집중되고 있다. 미세먼지는 대기 중에 있는 직경 $10{\mu}m$ 이하의 밀입자 물질을 말하며, 온도, 상대습도, 풍속 등의 기상 변화에 영향을 받는다. 따라서 미세먼지 예측을 위해 기상 정보와의 상관관계를 분석하는 다양한 연구가 진행되었다. 하지만 미세먼지의 비선형적 시계열 분포는 예측 모델의 복잡도를 증가시키고, 부정확한 예측값을 초래할 수 있다. 본 연구에서는 기계학습의 군집 알고리즘 및 분류알고리즘을 이용하여 미세먼지의 비선형적 특성을 완화하고자 한다. 사용된 기계학습 알고리즘은 병합군집, 밀도기반군집이며, 각 알고리즘을 통한 군집결과를 비교, 분석하였다.

  • PDF

블록 HOG 군집화 기반의 1-D 바코드 크로스라인 결정 (Determination of Bar Code Cross-line Based on Block HOG Clustering)

  • 김동욱
    • 한국정보통신학회논문지
    • /
    • 제26권7호
    • /
    • pp.996-1003
    • /
    • 2022
  • 본 논문에서는 비전 기반의 1-D 바코드 검출을 위한 스캔 라인 및 범위 결정을 위한 새로운 방법을 제시한다. 블록 HOG(histogram of gradient)를 바탕으로 DBSCAN 군집화 방법을 적용하여 유효한 바코드 대표점 및 방향을 검출하고 이를 바탕으로 스캔 라인 및 바코드 크로스라인을 결정하는 방법에 관한 연구이다. 본 논문에서는 얻어진 스캔라인을 바탕으로 바코드의 크로스라인 범위를 결정하기 위해 최소 및 최대탐색 기법이 적용되었다. 이것은 바코드의 크기에 무관하게 적용될 수 있다. 제안된 기법은 바코드의 일부 영역만 검출해도 바코드 인식이 가능하며, 또한 바코드 영역 검출 후 코드를 읽기 위해 회전을 필요로 하지 않는다. 또한, 다양한 크기의 바코드 검출이 가능하다. 본 논문의 제안된 기법에 대한 성능을 평가를 위해 다양한 실험결과를 제시하였다.

A Method of Extracting Features of Sensor-only Facilities for Autonomous Cooperative Driving

  • Hyung Lee;Chulwoo Park;Handong Lee;Sanyeon Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.191-199
    • /
    • 2023
  • 본 논문에서는 자율협력주행을 위한 인프라로써 제작된 5가지 센서 전용 시설물들에 대해 라이다로 취득한 포인트 클라우드 데이터로부터 시설물들의 특징을 추출하는 방법을 제안한다. 자율주행차량에 장착된 영상 취득 센서의 경우에는 기후 환경 및 카메라의 특성 등으로 인해 취득 데이터의 일관성이 낮기 때문에 이를 보완하기 위해서 라이다 센서를 적용했다. 또한, 라이다로 기존의 다른 시설물들과의 구별을 용이하게 하기 위해서 고휘도 반사지를 시설물의 용도별로 디자인하여 부착했다. 이렇게 개발된 5가지 센서 전용 시설물들과 데이터 취득 시스템으로 취득한 포인트 클라우드 데이터로부터 측정 거리별 시설물의 특징을 추출하는 방법으로 해당 시설물에 부착된 고휘도 반사지의 평균 반사강도을 기준으로 특징 포인트들을 추출하여 DBSCAN 방법으로 군집화한 후 해당 포인트들을 투영법으로 2차원 좌표로 변경했다. 거리별 해당 시설물의 특징은 3차원 포인트 좌표, 2차원 투영 좌표, 그리고 반사강도로 구성되며, 추후 개발될 시설물 인식을 위한 모형의 학습데이터로 활용될 예정이다.

시추공 수리 이상점 탐지를 위한 기계학습 알고리즘의 적용성 연구 (A Study on the Applicability of Machine Learning Algorithms for Detecting Hydraulic Outliers in a Borehole)

  • 최승범;박경우;이창수
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.561-573
    • /
    • 2023
  • 한국원자력연구원은 심부 암반의 수리/지화학 특성 분석을 위해 KURT (KAERI Underground Research Tunnel)를 건설하였고, 다수의 조사용 시추공을 시추하여 각종 시험을 수행 중이다. 시추공 조사에서 목적에 적합한 조사 구간 선정은 매우 중요하며 수리 유동 파악 및 지하수 채수가 목적인 경우, 유량이 풍부한 구간이 조사 목적에 부합한다. 본 연구에서는 이러한 구간을 수리 이상점으로 정의했으며, 심도 1km 수준의 시추공 물리검층 자료(온도, 전기전도도)를 활용하여 이를 탐지하고자 하였다. 체계적이고 효율적인 이상점 탐지를 위해 기계학습 알고리즘 중 DBSCAN, OCSVM, kNN, isolation forest을 적용하고 그 적용성을 파악하였다. 데이터 전처리와 알고리즘 최적화를 수행했으며, 그 결과 네 가지 알고리즘은 각각 55, 12, 52, 68개의 수리 이상점을 탐지하였다. 본 논문을 통해 기계학습 알고리즘의 활용 가능성을 확인했으나, 학습에 활용된 입력자료가 제한적이었기 때문에, 향후 추가적인 검증과 보완이 바람직한 것으로 판단된다.

가버 필터와 밀도 기반 공간 클러스터링을 이용한 피부의 이상 영역 검출 (Detection of Abnormal Region of Skin using Gabor Filter and Density-based Spatial Clustering of Applications with Noise)

  • 전민성;최경주
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.117-129
    • /
    • 2018
  • In this paper, we suggest a new system that detects abnormal region of skim. First, an illumination elimination algorithm which uses LAB color model is processed on input facial image to obtain robust facial image for illumination, and then gabor filter is processed to detect the reactivity of discontinuity. And last, the density-based spatial clustering of applications with noise(DBSCAN) algorithm is processed to classify areas of wrinkles, dots, and other skin diseases. This method allows the user to check the skin condition of the images taken in real life.

CNN Based Lithography Hotspot Detection

  • Shin, Moojoon;Lee, Jee-Hyong
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제16권3호
    • /
    • pp.208-215
    • /
    • 2016
  • The lithography hotspot detection process is crucial for semiconductor design development process. But, the lithography hotspot detection using optical simulation method takes much time and it slowdown the layout design development cycle. Though the geometry based approach is introduced as an alternative, it still revealed low detection performance and sophisticated framework. To solve this problem, we introduce a deep convolutional neural network based hotspot detection method. Our method made better results in ICCCAD 2012 dataset. To reach this score, we used lots of technical effort to improve the result in addition to just utilizing the nature of convolutional neural network. Inspection region reduction, data augmentation, DBSCAN clustering helped our work more stable and faster.

해시 색인 군집화 기반 스카이라인 질의 (Clustered Hash Index-based Skyline Query)

  • 최종혁;나스리디노프 아지즈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 동계학술대회
    • /
    • pp.45-48
    • /
    • 2018
  • 스카이라인 질의는 지배라는 개념을 활용, 주어진 데이터로부터 데이터를 대표할 수 있는 데이터들을 탐색하기 때문에 사용자의 요청에 부합하는 최적의 결과를 탐색하거나 기업에서 의사결정을 이루기 위해 사용되는 등 넓은 활용을 보이고 있다. 하지만 스카이라인 질의는 데이터의 차원이 증가하는 경우 전체적인 성능의 감소와 함께 스카이라인으로 선택되는 데이터의 수가 급증하여 사용자에게 유용한 결과를 반환하지 못하게 된다. 이러한 문제를 해결하기 위해 최근에는 Top-k 질의 기반의 방식이나 군집화 기반의 기법을 적용한 방식의 스카이라인 질의들이 새롭게 제안되고 있지만 이들은 데이터의 편향이나 사용자로부터 입력된 k에 큰 영향을 받는 등 해당 질의 결과가 데이터들을 충분히 대표하거나 다양성을 만족시키지 못했다. 이러한 문제를 해결하기 위해 본 논문에서는 해시 색인 기법과 군집화 기법인 DBSCAN을 통해 주어진 데이터들을 충분히 대표함과 동시에 다양성을 만족할 수 있는 새로운 방식의 스카이라인인 CHI-SQ의 이론적 배경을 제안하고자 한다.

  • PDF

MapReduce 기반 POI를 추출하기 위한 GPS 데이터 분할 방법 (GPS Data Partitioning Method for POI Extraction Based MapReduce)

  • 오주성;전혜지;이혜진;정민아;이성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1199-1201
    • /
    • 2015
  • 위치 기반 서비스는 여러 분야에서 활용되어지고 있다. 사용자들에게 정확한 정보를 제공하기 위해서는 대량의 위치 데이터를 분석하여 POI를 추출하고 분석해야 된다. 본 논문에서는 POI를 추출하는 방법으로 DBSCAN 클러스터링을 이용하고 이를 MapReduce 환경에서 구현한다. 또한 알고리즘의 수행속도를 향상시키기위해 데이터를 분할하는 방법을 제안한다.

A Study on Representative Skyline Using Connected Component Clustering

  • Choi, Jong-Hyeok;Nasridinov, Aziz
    • Journal of Multimedia Information System
    • /
    • 제6권1호
    • /
    • pp.37-42
    • /
    • 2019
  • Skyline queries are used in a variety of fields to make optimal decisions. However, as the volume of data and the dimension of the data increase, the number of skyline points increases with the amount of time it takes to discover them. Mainly, because the number of skylines is essential in many real-life applications, various studies have been proposed. However, previous researches have used the k-parameter methods such as top-k and k-means to discover representative skyline points (RSPs) from entire skyline point set, resulting in high query response time and reduced representativeness due to k dependency. To solve this problem, we propose a new Connected Component Clustering based Representative Skyline Query (3CRS) that can discover RSP quickly even in high-dimensional data through connected component clustering. 3CRS performs fast discovery and clustering of skylines through hash indexes and connected components and selects RSPs from each cluster. This paper proves the superiority of the proposed method by comparing it with representative skyline queries using k-means and DBSCAN with the real-world dataset.