• 제목/요약/키워드: Preprocessing method

검색결과 1,070건 처리시간 0.026초

QRS 특징점 변화에 따른 바이너리 코딩 기반의 부정맥 분류 (Arrhythmia Classification based on Binary Coding using QRS Feature Variability)

  • 조익성;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1947-1954
    • /
    • 2013
  • 부정맥 검출을 위한 기존 연구들은 분류의 정확성을 높이기 위해 신경망, 퍼지 이론, SVM 등과 같은 비선형 방법이 주로 사용되어 왔다. 이러한 대부분의 방법들은 P-QRS-T 지점의 정확한 측정을 필요로 하며, 데이터의 가공 및 연산이 복잡하다. 또한 P파, T파의 개인차가 있어 파형을 구분할 수 없을 경우도 존재한다. 따라서 이러한 문제점을 극복하기 위해서는 최소한의 특징점을 추출함으로써 연산의 복잡도를 줄이고, 실시간으로 다양한 부정맥을 분류할 수 있는 적합한 알고리즘의 설계가 필요하다. 따라서 본 연구에서는 QRS 특징점 변화에 따른 바이너리 코딩 기반의 실시간 부정맥 분류 방법을 제안한다. 이를 위해 전처리를 통해 잡음이 제거된 심전도 신호에서 R파, RR 간격, QRS 폭을 추출하고, 각 특징점들의 문턱치(threshold) 만족 여부를 바이너리 코드화시킴으로써 실시간으로 부정맥을 분류 하였다. 제안한 방법의 우수성을 입증하기 위해 39개의 MIT-BIH 부정맥 데이터베이스 레코드를 대상으로 PVC, PAC, Normal, BBB, Paced beat의 검출률을 비교하였다. 실험결과 PVC, PAC, Normal, BBB, Paced beat는 각각 97.18%, 94.14%, 99.83%, 92.77%, 97.48%의 우수한 평균 검출률을 나타내었다.

선형분석 기반의 심방세동 분류를 위한 불규칙 RR 간격의 최적값 검출 (Optimal Value Detection of Irregular RR Interval for Atrial Fibrillation Classification based on Linear Analysis)

  • 조익성;정종혁;조영창;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2551-2561
    • /
    • 2014
  • 심방세동 검출을 위한 기존 연구방법으로는 비선형 분석법과 주파수 분석법 등을 들 수 있지만 시간 영역 알고리즘에 비해 연산이 복잡하고 불규칙한 리듬 검출에 필요한 일반적 규칙을 제공하지 못한다. 이를 위해 본 연구에서는 선형 분석 기반의 심방세동 분류를 위한 불규칙 RR 간격의 최적값 검출 방법을 제안하였다. 이를 위해 먼저 전처리과정과 차감 기법을 통해 R파를 검출하였다. 이후 불규칙 RR 간격의 세그먼트 길이에 대한 범위를 설정하고 정규화 절대 편차와 절대치와 같은 선형 분석상의 심방세동 분류를 위한 최적값을 검출하였다. 제안된 알고리즘의 타당성 평가를 위해 MIT-BIH 부정맥과 심방세동 데이터베이스를 이용하여 RR 간격의 세그먼트 길이와 최적값에 대한 심방세동 분류율을 각각 비교 실험하였다. 성능 평가 결과, RR 간격과 연속하는 RR 간격 차에 대한 최적값은 ${\alpha}=0.75$, ${\beta}=1.4$, ${\gamma}=300ms$ 일 때 제일 높은 성능을 나타나는 것을 확인할 수 있었다.

수입식품 빅데이터를 이용한 부적합식품 탐지 시스템에 관한 연구 (Study on Anomaly Detection Method of Improper Foods using Import Food Big data)

  • 조상구;최경현
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.19-33
    • /
    • 2018
  • FTA체결의 증가, 식품교역 증가 및 소비자의 다양한 식품 선호도 등으로 농축수산물 및 가공식품의 수입량은 매년 증가하고 있는 추세이다. 수입식품의 안전성을 확인하는 정밀검사는 전체 수입식품건수 대비 20%정도를 차지하고 계속 증가하고 있는 반면에 정부의 수입안전관리에 필요한 예산과 인력은 그 한계점에 다다르고 있다. 수입식품 안전사고가 발생하게 되면 막대한 사회적, 경제적 손실을 야기할 수 있으므로 수입식품의 수입허용여부를 정확하게 예측하여 선제 대응하는 것은 수입안전관리의 효율성과 경제성을 획기적으로 높일 수 있게 된다. 식품분야에서는 이미 엄청난 양의 정형 데이터가 과거로부터 쌓여 왔으며 이에 대한 충분한 분석을 통한 활용은 아직은 부족한 것이 현실이다. 전체 수입건수와 중량 중에서 차지하는 가공식품의 비중은 평균 75%에 달하고 있어 식품분야에서도 빅데이터의 분석, 분석기법의 적용 등으로 다량의 데이터로부터 의미 있는 정보를 추출하는 과학적이고 자동화된 부적합탐지시스템의 연구가 절실한 상황이다. 이러한 배경에서 본 연구는 기계학습분야의 다양한 부적합 예측 모형을 적용하였으며 예측 모형의 정확도를 개선시키기 위한 방편으로 새로운 파생변수의 생성을 통한 데이터 전처리 방안을 제시하였다. 또한 본 연구에서는 기계학습분야의 일반적인 기저 분류기를 적용하여 예측 모형의 성능을 비교하였으며 여러 기저분류기 중 Gaussian Naïve Bayes예측 모형이 수입식품의 부적합을 탐지하여 예측하는 가장 좋은 성과를 보여주었다. 향후 Gaussian Naïve Bayes 예측 모형을 이용한 부적합 탐지 모형을 적용하여 수입식품의 정밀검사 비중을 낮추고 부적합률을 제고시킴으로써 수입안전관리 국가사무의 효율성과 수입통관의 신속성에 지대한 효과를 거둘 수 있으리라 기대한다.

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

기계학습 분석을 위한 차원 확장과 차원 축소가 적용된 지진 카탈로그 (Application of Dimensional Expansion and Reduction to Earthquake Catalog for Machine Learning Analysis)

  • 장진수;소병달
    • 지질공학
    • /
    • 제32권3호
    • /
    • pp.377-388
    • /
    • 2022
  • 최근, 다수의 연구가 지수적으로 증가하는 지진 자료를 효율적이고 정확하게 처리하기 위해 기계학습을 활용하고 있다. 본 연구는 지진의 발생 시간, 위치, 규모의 정보를 확장하여 기계학습에 적용 가능한 자료를 제작한 후, 주성분 분석을 통해 추출한 자료의 주요 성분으로 자료의 차원을 축소하였다. 차원이 확장된 자료는 36,699개의 지진 사건을 포함하는 Global Centroid Moment Tensor 카탈로그로부터 얻은 지진 정보의 통계량으로 구성되었다. 표준화와 최대-최소화 스케일링을 활용하여 자료 전처리를 수행하였으며, 스케일링이 완료된 자료에 주성분 분석을 적용하여 자료의 주요 특징을 추출하였다. 스케일링은 상이한 단위로 인한 특징 값의 차이를 현저히 감소시켰으며, 그 중 표준화는 다른 전처리에 비해서 각 특징의 중앙값을 더 균등하게 변환하였다. 주성분 분석이 스케일링이 적용되지 않은 자료로부터 추출한 여섯 개의 주성분은 원본 자료의 정보를 99% 설명하였다. 표준화와 최대-최소 스케일링이 적용된 자료로부터 추출한 열여섯 개의 주성분은 원본 자료의 정보의 98%를 재구성하였다. 이는 특징 값의 분포가 균등한 자료의 정보를 보존하기 위해서는 더 많은 주성분이 필요함을 지시한다. 본 연구는 지진 데이터와 지진 거동과의 관계를 분석하는 효율적이고 정확한 기계 학습 모형을 훈련시키기 위한 데이터 처리 방법을 제안하였다.

머신러닝 기법을 활용한 수입 수산물 통관검사결과 분류 모델 (A Classification Model for Customs Clearance Inspection Results of Imported Aquatic Products Using Machine Learning Techniques)

  • 엄지성;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.157-165
    • /
    • 2023
  • 수산물은 많은 국가의 주요한 단백질 공급원이며 소비가 증가하고 있다. 우리나라도 수산물 소비는 증가하는 반면 자급률은 낮아지고 있으며, 수산물의 수입량이 증가함에 따라 안전관리의 중요성이 높아지고 있다. 국내로 수입되는 수산물은 110여 개 국가로부터 수백 종에 이르며, 수입 수산물의 안전관리를 검사관의 경험에만 의존하는 것은 한계가 있다. 데이터를 기반으로 수입 수산물 통관검사 결과를 예측할 수 있는 모델을 개발하여 수입신고서가 제출되었을 때 수산물의 부적합 가능성을 판단하는 머신러닝 분류 모델을 생성한다. 수입수산물 통관검사 결과 부적합율은 1% 미만으로 매우 낮은 불균형 데이터이므로 이러한 특성을 보완할 수 있는 샘플링 방법을 비교 연구하였고, 분류결과를 해석할 수 있는 전처리 방법을 적용하였다. 여러 가지 머신러닝 기반의 분류모델 중에서 랜덤포레스트와 XGBoost가 좋은 성능을 보였다. 통관검사 결과 적합과 부적합을 모두 잘 예측하는 모델은 ADASYN과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이며 정확도 99.88%, 정밀도 99.87%, 재현율 99.89%, AUC 99.88%이다. XGBoost는 오버샘플링과 인코딩 종류에 상관없이 모든 지표가 90%를 넘겨 가장 안정적인 모델이다.

그래프 트랜스포머 기반 농가 사과 품질 이미지의 그래프 표현 학습 연구 (A Study about Learning Graph Representation on Farmhouse Apple Quality Images with Graph Transformer)

  • 배지훈;이주환;유광현;권경주;김진영
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2023
  • 최근 농가의 사과 품질 선별 작업에서 인적자원의 한계를 극복하기 위해 합성곱 신경망(CNN) 기반 시스템이 개발되고 있다. 그러나 합성곱 신경망은 동일한 크기의 이미지만을 입력받기 때문에 샘플링 등의 전처리 과정이 요구될 수 있으며, 과도 샘플링의 경우 화질 저하, 블러링 등 원본 이미지의 정보손실 문제가 발생한다. 본 논문에서는 위 문제를 최소화하기 위하여, 원본 이미지의 패치 기반 그래프를 생성하고 그래프 트랜스포머 모델의 랜덤워크 기반 위치 인코딩 방법을 제안한다. 위 방법은 랜덤워크 알고리즘 기반 위치정보가 없는 패치들의 위치 임베딩 정보를 지속적으로 학습하고, 기존 그래프 트랜스포머의 자가 주의집중 기법을 통해 유익한 노드정보들을 집계함으로써 최적의 그래프 구조를 찾는다. 따라서 무작위 노드 순서의 새로운 그래프 구조와 이미지의 객체 위치에 따른 임의의 그래프 구조에서도 강건한 성질을 가지며, 좋은 성능을 보여준다. 5가지 사과 품질 데이터셋으로 실험하였을 때, 다른 GNN 모델보다 최소 1.3%에서 최대 4.7%의 학습 정확도가 높았으며, ResNet18 모델의 23.52M보다 약 15% 적은 3.59M의 파라미터 수를 보유하여 연산량 절감에 따른 빠른 추론 속도를 보이며 그 효과를 증명한다.

기계학습 기반 회절파 분리 적용을 통한 GPR 탐사 자료의 도로 하부 공동 및 구조물 탐지 성능 향상 (Improvement of Underground Cavity and Structure Detection Performance Through Machine Learning-based Diffraction Separation of GPR Data)

  • 김수윤;변중무
    • 지구물리와물리탐사
    • /
    • 제26권4호
    • /
    • pp.171-184
    • /
    • 2023
  • 최근 도심지 도로에서 빈번하게 발생하는 도로 파임의 주원인인 지하 공동의 발생을 파악하기 위해, 차량 부착형 지표투과레이더(GPR)를 통해 얻은 대량의 취득 자료를 효율적으로 처리하기 위한 기계학습 기반 공동 탐지 기술이 활발하게 연구되고 있다. 그러나 기계학습 자료 생성 시 단순한 영상 처리 기법들만 활용되고 있고, 탄성파 탐사나 GPR 자료 처리에 시도되었던 여러 기법들은 충분히 활용되지 못하고 있다. 이 연구에서는 지하 공동의 탐지가 대부분 회절파의 탐지에 의해 이루어진다는 점에 착안하여 GPR 자료로부터 회절파를 분리하여 YOLO v5 모델을 이용한 도로 하부 공동 탐지 모델의 성능을 향상시켰다. 탄성파에서 개발된 기계학습 기반 회절파 분리 기법을 GPR 자료에 맞게 변형한 후, GPR 현장 자료에서 회절파를 분리하여 공동 탐지 모델의 입력으로 사용하였다. 서울시 공공 개방 GPR 자료를 이용하여 제안된 방법의 성능을 검증한 결과, 회절파 분리를 이용했을 때 더 정확하게 공동 및 지하 구조물을 탐지하는 것을 확인하였다. 또한 제안된 회절파 분리 기법은 향후 GPR 탐사가 이용되는 다양한 분야에서 활용될 수 있을 것으로 기대된다.

실내환경에서의 자율주행차 무선 전력 전송을 위한 딥러닝 기반 UWB 거리 측정 (Deep Learning-based UWB Distance Measurement for Wireless Power Transfer of Autonomous Vehicles in Indoor Environment)

  • 김혜정;박용주;한승재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제13권1호
    • /
    • pp.21-30
    • /
    • 2024
  • 최근 자율주행차 시장이 지속해 성장함에 따라 충전 인프라에 대한 필요성이 커지고 있다. 그러나 무선 충전 시스템의 경우 기존 유선 충전에 비해 대출력이 요구되어 안정성 문제가 제기되고 있다. 자율주행차 무선 충전 인프라를 구축하기 위한 표준으로는 SAE J2954가 존재하며 해당 표준에서는 차량과 전력 전송 시스템 간의 통신 방법에 대해 정의한다. SAE J2954에서는 자율주행차량의 무선 충전 통신 방법으로 Wi-Fi, Bluetooth 및 UWB와 같은 물리적 미디어를 사용해 차량과 충전 패드 간의 통신을 활성화할 것을 권장한다. 특히 UWB는 실내 환경에서 견고한 통신 능력을 보이고 간섭에 민감하지 않기 때문에 실내외 충전 환경에서 적합한 솔루션이다. 해당 표준에서는 무선전력전송 시스템을 구축하기 위한 프로세스로 충전 시작부터 충전 완료까지를 여러 단계로 구분하였다. 본 연구에서는 UWB 기술을 사용하여 무선전력전송 시스템의 한 가지 프로세스인 Fine alignment의 수단으로 사용한다. 실제 자율주행차 무선전력전송 시스템에 적용 가능성을 판단하기 위해 거리에 따라 실험을 수행하였으며 UWB로부터 거리 정보를 수집하였다. UWB로부터 얻어진 거리 데이터의 정확도를 향상시키기 위해 수집한 데이터를 세 단계의 전처리 과정을 거쳐 머신러닝과 딥러닝 기법을 적용한 Single Model과 Multi Model을 제안한다.

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.