• 제목/요약/키워드: Data partitioning

검색결과 390건 처리시간 0.027초

평가와 선택기법에 기반한 대표패턴 생성 알고리즘 (A Representative Pattern Generation Algorithm Based on Evaluation And Selection)

  • 이형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.139-147
    • /
    • 2009
  • 메모리 기반 추론 기법은 단순히 학습패턴이나 대표패턴의 형태로 메모리에 저장하며 테스트 패턴과의 거리 계산을 통하여 분류한다. 이 기법의 가장 큰 문제점은 학습 패턴 전체를 메모리에 저장하거나 학습 패턴들을 대표 패턴으로 대체하는 방법을 사용함으로 다른 기계학습 방법에 비하여 많은 메모리 공간을 필요로 하며, 저장되는 학습패턴이 증가할수록 분류에 필요한 시간도 많이 소요된다는 단점을 갖는다. 본 논문은 효율적인 메모리 사용과 분류 성능의 향상을 위한 EAS 기법을 제안하였다. 즉, 학습패턴에 대해 분할공간을 생성한 후 생성된 각 분할공간을 MDL기법과 PM기법으로 평가하였다. 그리고 평가 결과 가장 우수한 분할공간만을 취하여 대표패턴으로 삼고 나머지는 다시 분할하여 평가를 반복하는 기법이다. UCI Machine Learning Repository에서 벤치마크 데이터를 발췌한 실험 자료를 사용하여 제안한 기법의 성능과 메모리 사용량에 있어 우수함을 입증하였다.

Soft computing based mathematical models for improved prediction of rock brittleness index

  • Abiodun I. Lawal;Minju Kim;Sangki Kwon
    • Geomechanics and Engineering
    • /
    • 제33권3호
    • /
    • pp.279-289
    • /
    • 2023
  • Brittleness index (BI) is an important property of rocks because it is a good index to predict rockburst. Due to its importance, several empirical and soft computing (SC) models have been proposed in the literature based on the punch penetration test (PPT) results. These models are very important as there is no clear-cut experimental means for measuring BI asides the PPT which is very costly and time consuming to perform. This study used a novel Multivariate Adaptive regression spline (MARS), M5P, and white-box ANN to predict the BI of rocks using the available data in the literature for an improved BI prediction. The rock density, uniaxial compressive strength (σc) and tensile strength (σt) were used as the input parameters into the models while the BI was the targeted output. The models were implemented in the MATLAB software. The results of the proposed models were compared with those from existing multilinear regression, linear and nonlinear particle swarm optimization (PSO) and genetic algorithm (GA) based models using similar datasets. The coefficient of determination (R2), adjusted R2 (Adj R2), root-mean squared error (RMSE) and mean absolute percentage error (MAPE) were the indices used for the comparison. The outcomes of the comparison revealed that the proposed ANN and MARS models performed better than the other models with R2 and Adj R2 values above 0.9 and least error values while the M5P gave similar performance to those of the existing models. Weight partitioning method was also used to examine the percentage contribution of model predictors to the predicted BI and tensile strength was found to have the highest influence on the predicted BI.

제한된 메모리를 가진 GPU를 이용한 효율적인 그래프 알고리즘 처리 기법 (An Efficient Graph Algorithm Processing Scheme using GPUs with Limited Memory)

  • 송상호;이현병;최도진;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.81-93
    • /
    • 2022
  • 최근 대용량 그래프의 반복 처리를 위하여 GPU를 이용하는 연구가 진행되고 있다. 메모리가 제한된 GPU를 이용하여 대용량 그래프를 처리하기 위해서는 그래프를 서브 그래프로 분할한 후 서브 그래프들을 스케줄링해서 처리해야 한다. 그러나 활성 정점에 따라 서브 그래프가 처리되기 때문에 그래프 처리 과정 속에서 불필요한 데이터 전송이 반복된다. 본 논문에서는 메모리가 제한된 GPU 환경에서 효율적인 그래프 알고리즘 처리 기법을 제안하고 성능 평가를 수행한다. 제안하는 기법은 그래프 차등 서브 그래프 스케줄링 방법과 그래프 분할 방법으로 구성된다. 대용량 그래프 분할 방법은 GPU에서 효율적으로 처리할 수 있도록 대용량 그래프를 서브 그래프로 분할할 수 있는 방법을 결정한다. 차등 서브그래프 스케줄링 방법은 GPU에서 처리하는 서브그래프를 스케줄링하여 반복적으로 사용되는 HOST-GPU 간의 데이터 중복 전송을 줄인다. 다양한 그래프 처리 알고리즘들의 성능 평가를 수행함으로써 제안하는 기법은 기존 분할 기법 대비 170%, 기존 처리 기법 대비 268% 향상되었다.

이진 탐색 트리를 이용한 개인화된 머리 전달 함수의 탐색 (Selection of Personalized Head Related Transfer Function Using a Binary Search tree)

  • 이기승;이석필
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.409-415
    • /
    • 2009
  • 가상 음원의 공간화에 중요한 역할을 담당하는 머리전달 함수는 개인 별로 각기 다른 특성을 갖는다. 개인화된 머리 전달 함수를 얻기 위해서는 많은 시간과 특정한 장치를 필요로하며, 이에 따라 타인으로부터 얻어진 머리 전달 함수를 청취자의 특성에 맞도록 개인화 시키는 방법이 주로 사용된다. 본 논문에서는 머리 전달 함수의 개인화 방법으로 여러 개의 미리 측정된 머리 전달 함수 중에서 사용자에 가장 적합한 머리 전달 함수를 찾는 방법을 제안하였다. 제안된 방법은 청취자에게 적합한 머리 전달 함수를 빠르고 정확하게 찾기 위해 이진 탐색 트리를 이용한 분할 기법을 사용하였다. 분할 시 왜곡 척도는 사람이 귀에 방향감의 차이를 가장 잘 인지하는 왜곡 척도를 실험적으로 결정하였다. 캘리포니아 데이비스 대학에서 제공하는 CIPIC 머리 전달 함수 데이터 베이스를 이용하여 본 기법의 유용성을 평가하였다. 10명의 실험자가 참여한 청취 테스트에서 제안된 기법을 통해 탐색된 머리 전달 함수는 청취자 본래의 머리 전달 함수와 비교하여 가상 음원의 방향감에 있어서 매우 근접한 결과를 나타내었으며, 기존의 해부학적인 파라메터를 이용한 머리 전달 함수의 탐색 기법과 비교하여 우수한 성능을 나타내었다.

배아 데이터의 효율적 검색을 위한 계층적 구조화 방법 (Hierarchical Organization of Embryo Data for Supporting Efficient Search)

  • 원정임;오현교;장민희;김상욱
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.16-27
    • /
    • 2011
  • 배아란 동물이나 식물과 같은 다세포 생물의 초기 단계를 의미한다. 배아의 단계에서 다세포 생물의 기초적인 체제가 결정되기 때문에 배아는 개체발생의 기구를 연구하는 중요한 연구대상이 된다. 생물학자들은 배아 연구를 위해 대용량의 배아 이미지 데이터를 소유하고 있으며, 이러한 대용량 데이터 중 원하는 이미지를 효율적으로 검색하기 위해서는 데이터 구조화가 필요하다. 데이터베이스 구조화를 위해 주로 사용되는 방법으로 계층적 클러스터링이 있다. 그러나 기존의 계층적 클러스터링 방법은 데이터베이스를 트리 형태로 구조화 하는 과정에서 클러스터의 크기와 클러스터 내의 객체 수를 동시에 고려하지 못하기 때문에 결과 클러스터링 트리가 경사 트리일 가능성이 매우 높다. 경사 트리인 경우 사용자가 원하는 이미지를 검색하기 위해 트리를 순회할 때 많은 시간이 걸린다. 따라서 본 논문에서는 대용량의 배아 이미지 데이터를 경사 되지 않으며 균형 상태에 가까운 트리 형태로 구조화하기 위한 방안을 제시한다. 제안하는 방안은 데이터베이스 내에 저장된 배아 이미지를 그래프로 변환하고 반복적으로 그래프 분할 알고리즘을 적용하여 클러스터를 생성한다. 이 때 클러스터의 크기와 클러스터 내의 객체 수를 동시에 고려하여 특정 클러스터의 크기가 지나치게 커지거나 객체 수가 많아지는 것을 방지한다. 실험을 통해서 제안하는 방안의 우수성을 규명하고 시각화 툴을 제공하여 사용자가 원하는 배아 이미지를 쉽게 찾을 수 있도록 돕는다.

공간분석 기법을 이용한 만리포 유분의 시·공간 변동 패턴 분석 (A Spatio-Temporal Variation Pattern of Oiling Status Using Spatial Analysis in Mallipo Beach of Korea)

  • 김태훈;최현우;김문구;심원준
    • 한국지리정보학회지
    • /
    • 제15권4호
    • /
    • pp.90-103
    • /
    • 2012
  • 만리포는 2007년 12월 허베이 스피리트호 유류유출 사고로 유류오염 피해를 입은 대표적인 해변이다. 본 연구는 만리포 전체 영역과 5개로 분할된 영역을 대상으로 유분(TPH: Total Petroleum Hydrocarbon)의 시 공간적 변화 패턴에 대해 두 계절(동계와 하계)의 차이를 비교하고자 한다. 만리포 전체 영역에서 4년간 시간에 따른 유분농도의 감소율은 동계가 하계보다 약 두 배 크게 나타났다. 유분농도의 가중공간중심(weighted mean center)과 가중표준거리(weighted standard distance)를 이용한 유분분포의 공간적 변화 패턴 분석 결과, 동계에는 유분이 만리포의 남서 해변으로 군집된 패턴을 보인 반면, 하계에는 전 영역으로 분산된 패턴을 보였다. 만리포 내 분할 영역에서 유분의 시간적 변동은 동계에 모든 영역에서 농도가 지속적으로 감소한 반면, 하계에는 2009년 이후 남서 해변을 제외한 모든 영역에서 농도 변화를 보이지 않았다. 따라서 유류오염의 진행 상황을 평가하고 예측하기 위해서는 동계와 하계와 같이 시기를 구분하여 공간분석 기법을 이용한 유분의 시 공간 변동 패턴 분석이 필요하다. 또한, 지역적으로 불균등한 유분분포의 시간적 변동 패턴을 해석하기 위해서는 전체 해변에서 보다는 공간분할을 통한 지역 규모에서의 시계열적 분석이 유용하다.

3D레이저스캐닝을 이용한 옥트리기반 구조물 형상정보 가시화 (Visualization of Structural Shape Information based on Octree using Terrestrial Laser Scanning)

  • 차기춘;이동환;박승희
    • 한국산학기술학회논문지
    • /
    • 제17권8호
    • /
    • pp.8-16
    • /
    • 2016
  • 본 논문은 대형구조물의 형상관리를 위해 3D 레이저 스캐닝을 이용하여 옥트리기반 구조물 형상정보 가시화를 진행하였다. 이를 위해 3D스캔데이터를 옥트리 데이터 구조로 변환할 수 있는 프로세스를 정립하고, 메쉬기법과 래스터/백터변환 처리를 통해 점(point) 데이터가 2차원 면 형태를 거처 3D객체로 생성되는 프로세스를 진행하였다. 생성된 3D객체는 옥트리 데이터 구조로 전달할 수 있는 형식인 Binary file type로 변환하는 작업이 진행되었고, 변환된 Binary file을 옥트리 최상의 노드인 Root노드로 전달하였다. Root 노드를 시작으로 옥트리 내부에서의 세부분할 작업 후 내부노드 데이터 저장과 비어있는 영역제거를 통해 옥트리기반 구조물 형상정보모델을 구축하였다. 본 연구가 수행된 Test-bed는 성균관대학교 내에 위치한 강교량 구조물로, 구축된 옥트리기반 형상정보는 스캔데이터를 89.3% 압축하였으며 독일의 사무용빌딩, 대학캠퍼스와 미국 소재 단과대학건물 스캔데이터와의 비교를 통하여 옥트리 데이터 압축률을 확인하였다. 본 연구를 통해 대형구조물 및 복층터널의 내부형상정보관리를 위한 형상정보 가시화의 기반을 마련하였으며, 형상정보 가시화를 통해 구조물 모니터링 및 유지관리 효율을 높일 수 있을 것이라 기대한다.

넙치 질병 증상 분류를 위한 객체 탐지 딥러닝 모델 성능 평가 (Performance Evaluation of Object Detection Deep Learning Model for Paralichthys olivaceus Disease Symptoms Classification)

  • 조경원;백란;정종호;김찬진;최한석;정석원;손현승
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.71-84
    • /
    • 2023
  • 넙치 양식은 우리나라 양식 산업의 절반 이상 차지할 정도로 큰 비중을 차지한다. 그러나 연중 총사육량의 25~30% 정도가 질병으로 인한 집단 폐사가 발생하여 양식장의 경제성에 매우 나쁜 영향을 준다. 넙치 양식장의 경제성 성장을 위해서는 넙치 질병 증상 진단을 자동화하여 빠르고 정확하게 질병 진단을 하는 방법이 필요하다. 본 연구에서는 독창적인 학습 데이터 수집 방법과 학습 정제 알고리즘 및 학습 데이터 분리 기법을 사용하여 학습 데이터를 구축하고 4가지 객체 탐지 딥러닝 모델(YOLOv8, Swin, Vitdet, MvitV2)의 넙치 질병증상 감지 성능을 비교한다. 실험 결과 YOLOv8 모델이 평균 인식률(mAP)과 예상 도착 시간(ETA) 관점에서 우수하다는 결론을 얻었다. 본 연구에서 제안하는 AI 모델의 성능이 검증되면 넙치 양식장에서는 실시간으로 넙치 질병을 진단할 수 있고, 진단 결과에 따른 신속한 예방 조치로 양식장의 생산성은 크게 향상될 것이라 기대된다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

쑥갓 스테롤배당체의 아질산염소거작용 및 SOD 유사활성 (Nitrite Scavenging Ability and SOD-like Activity of a Sterol Glucoside form Chrysanthemum coronarium L. var. spatiosum)

  • 조민정;박미정;이흠숙
    • 한국식품과학회지
    • /
    • 제39권1호
    • /
    • pp.77-82
    • /
    • 2007
  • 쑥갓의 항산화 활성을 알아보기 위해 쑥갓 총 메탄올추출물의 아질산염 소거작용과 SOD 유사활성을 측정하였다. 아질산염 소거작용과 SOD 유사활성을 가지고 있는 총 메탄올 추출물로부터 클로로포름, n-부탄올 및 물 분획물을 제조하여 각각의 활성을 측정하였다. pH가 1.5일 때의 클로로포름 분획물의 $IC_{50}$값은 39ppm으로 가장 우수한 아질산염 소거작용을 보였으며, vitamin C와 chlorogenic acid의 $IC_{50}$값이 15ppm과 36ppm일 때 클로로포름 분획물은 양성대조군인 chlorogenic acid와 동등한 소거작용을 보였다. 아질산염 소거작용에 대하여 유의성 있게 높은 활성을 나타낸 클로로포름 분획물을 silica gel 컬럼크로마토그래피와 sephadex LH-20 컬럼크로마토그래피를 이용하여 분획의 활성성분인 compound I을 분리하였다. 분리된 compound를 $^{1}H-NMR$$^{13}C-NMR$ spectral data를 통하여 구조를 동정한 결과 compound I은 ${\beta}-sitosterol-O-{\beta}-D-glucoside$임을 확인하였다. Compound I과 그 aglycone인 ${\beta}-sitosterol$의 아질산염 소거작용과 SOD 유사활성은 다소 차이가 있었다. 양성대조군으로 사용한 vitamin C와 chlorogenic acid의 $IC_{50}$값이 pH 1.5에서 각각 15ppm과 36ppm일때 compound I의 $IC_{50}$값이 335ppm, ${\beta}-sitosterol$$IC_{50}$값이 41ppm으로 가수분해된 aglycone이 아질산염 소거작용이 훨씬 높았다. SOD 유사활성의 경우 vitamin C와 chlorogenic acid의 $EC_{50}$ 값은 38ppm, 449ppm으로 이와 비교시 ${\beta}-sitosterol$과 배당체의 $EC_{50}$ 값은 1,291ppm과 2,000ppm 이상으로 나타났다.