• Title/Summary/Keyword: 데이터 전처리

Search Result 1,170, Processing Time 0.044 seconds

Development of Preprocessing module for Korean online handwriting recognition (한글 온라인 필기 인식을 위한 전처리 모듈 개발)

  • Jeong, Min Jin;Jeong, Dabin;Lee, Kang Eun;Kim, Sungsuk;Yang, Sun Ok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.63-65
    • /
    • 2019
  • 본 논문은 개발하고자 하는 기계학습 기반 한글 필기 인식 시스템의 첫 연구 결과를 담고 있다. 즉, 기계학습을 위해서는 학습용 및 테스트용 필기 데이터가 아주 많이 필요하므로, 이를 수집하고 전처리하는 방법을 제안하였다. 한글의 한 글자는 자음과 모음을 결합하여 생성되는데, 실제 만 개 이상의 글자가 생성될 수 있다. 따라서 각각의 글자 데이터를 수집하는 대신, 수집한 글자 데이터로부터 초성, 중성, 종성을 구분하여 최종적으로 자음, 모음 데이터로 저장하고자 한다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.

Preprocessing Techniques for On-Line Handwritten Character Recognition based on Table-Top Display (테이블-탑 디스플레이 기반의 온라인 필기 문자인식을 위한 전처리 기법)

  • Kim, Ji-Woong;Kim, Eui-Chul;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.171-174
    • /
    • 2007
  • 최근에 인간과 컴퓨터의 상호작용을 위한 입력장치 중 테이블-탑 디스플레이라는 멀티터치 입력장치가 활발히 연구되고 있다. 본 논문에서는 테이블-탑 디스플레이라는 환경에서 인간에게 가장 직관적인 도구인 손을 사용하여 입력된 온라인 필기 숫자를 전처리하는 방법을 제안한다. 테이블-탑 디스플레이 환경에 적합한 전처리 기법으로 대표점 추출을 위한 거리 필터링과 획 구분 및 잡음제거 등을 사용하였고, 데이터를 16방향 체인코드로 변환하였다. 이는 실제 필기운동 시의 궤적을 크게 왜곡 시키지 않으면서 테이블-탑 디스플레이가 갖는 환경에 기인한 잡음을 없애고, 데이터양을 줄일 수 있는 장점이 있다. 총450개의 필기 숫자 데이터를 사용하여 실험한 결과, 잡음이 제거되고 데이터양이 줄어들었으며 인식에 용이한 체인코드를 형성해 내었다.

  • PDF

Development of Dataset Cllection RPA for Machine Learning (머신러닝을 위한 데이터셋 수집 RPA 개발)

  • Kim, Ki-Tae;Seo, Bo-in;Yun, Sang-Hyeok;Lee, Sei-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.295-296
    • /
    • 2020
  • 본 논문에서는 RPA(Robotic Process Automation) Tool 개발 과정 중 머신 러닝, 딥러닝에 필요한 이미지 크롤링 및 전처리 기능을 이용한 가공된 데이터 셋 처리 과정을 기술한다. 개발된 RPA 툴에서 머신러닝 및 딥러닝에 사용될 데이터 확보 기능을 제공하며, 세부적으로 이미지 전처리(Convert Gray, Histogram Equalization, Binary, Resize)등 반복적으로 사용되는 기능들을 제공한다. 개발된 툴을 통해 RPA의 자동화 기능과, 전처리 기능의 융합을 통해 업무의 효율성을 제공한다.

  • PDF

A Study on Preprocessing Image Text Using Yolov4 in OCR System (OCR 시스템에서 YOLOv4를 활용한 텍스트 이미지 전처리 연구)

  • Kim, Ha-Yoon;Yu, Sang-Yin;Ju, Hye-gyeong;Choi, Yeo-jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.964-966
    • /
    • 2022
  • 본 연구는 유료 OCR 서비스를 이용하여 야외 촬영 이미지의 텍스트를 검출하는 프로젝트에서 야외 촬영 텍스트를 학습시킨 Yolov4 모델을 통한 전처리 작업을 제안한다. 텍스트 감지를 통한 이미지 텍스트 전처리 진행은 불필요한 OCR 실행을 줄여 리소스를 절약하고 유료 서비스의 경우 비용 절감 효과까지 도모할 수 있다는 장점이 있다.

A Study on the Performance Improvement of a Biometric Fingerprint Preprocessing Algorithm (생체지문 전처리 알고리즘의 성능 개선에 관한 연구)

  • Baek, Young-Hyun;Kim, Byunggeun;Kim, Seock-Han;Kim, Sun-Dong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.974-975
    • /
    • 2017
  • 본 논문에서는 생체지문인식의 전처리 단계에서 정보 손실여부를 판단할 수 있는 중요한 파트인 전처리 이진화를 보다 효율적으로 수행하기 위한 알고리즘을 제안한다. 제안된 알고리즘은 각 인접 픽셀의 값을 계산하고, 적응적으로 이진화 여부를 판단 및 지문방향에 대한 방향성 향상을 통해, 융선(ridge)와 골(Valley)의 구분이 명확하지 않은 영역에서 발생하는 생체지문 데이터 손실과 연산량을 개선하였다. 본 논문의 성능평가를 위해 미국 NIST에서 제공하는 MINEX 지문샘플 데이터를 사용하였다. 모의실험 결과 기존 전처리 알고리즘보다 연산량은 평균 50% 감소하였고, 지문정보 손실 영역 부분이 효과적으로 개선됨을 확인하였다.

Development of Water Velocity Data Preprocessing Method for PAVOs (PAVOs 활용을 위한 유속데이터 전처리 기법 개발)

  • Soyeon Lim;Youngmoo Yu;Sinjae Lee;Yeongil Lee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.85-85
    • /
    • 2023
  • 유량 측정을 위해 도섭법, 횡측선법 등의 인력에 의한 방법이 적용되고 있으나, 이는 야간 및 휴일 측정, 인력 부족 등 여러 제약으로 인해 고수위 홍수를 측정하는 데에 한계가 있다. 이를 해결하기 위해 시공간적 제약이 없는 도플러 방식 초음파유속계(Acousitc Doppler Velocity Meter, ADVM)와 자동유속관측시스템(Portable Automatic Velocity Observation System; PAVOs)이 제안되었다. 이 방법들은 교량에 설치된 장치를 통해 실시간으로 유속이 계측되어 시공간적 제약이 없으며 홍수 관리에 유용하게 사용될 수 있다. 실시간으로 계측된 유속 데이터는 오·결측 값이 발생하며 ADVM의 경우 수위-유량관계식을 활용하는 등 전처리 방법이 활용되고 있지만 전자파표면유속계를 활용한 PAVOs 데이터의 전처리 방법에 대한 연구는 부족하다. 따라서 본 연구에서는 PAVOs에서 실시간으로 계측된 유속 데이터의 전 처리 과정(Pre-processing)을 개발하였다. PAVOs를 통해 측정된 데이터는 5분 단위로 10개의 유속이 한번에 측정되며 비정상성(Non-stationary)인 특징을 가진다. 이 데이터의 전처리 과정으로 오·결측값에 대한 처리 및 보간법 적용 이후 10개 값 중 실제 유속을 판단하고 잡음제거(Denoising)를 수행하였다. 이를 강원도 홍천강에 위치한 홍천교에서 계측된 유속 데이터에 적용하였다. 그 결과 데이터의 상승부와 하강부에서 일정한 경향성을 파악할 수 있다. 이 데이터를 통해 산정한 유량과 실측 기반의 평균유속과 관계를 통해 계산한 유량을 비교해 보았을 때 낮은 편차율을 가지는 것을 확인하였다. 전 처리 된 실시간 유속 데이터를 활용한다면 최고수위가 발생하였을 경우 홍수량을 산정할 수 있을 것이다. 또한, 강우 또는 하천 공사에 의해 변동하는 수위-유량관계곡선식을 실시간으로 개발할 수 있을 것이며 이는 효과적인 홍수관리에 큰 역할을 할 수 있을 것이다.

  • PDF

On-Line Multimedia Pre-Processing for Distributed Object Activation (온라인 멀티미디어 전처리를 위한 분산 객체 활성화)

  • 허진경;이웅기
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.565-568
    • /
    • 2002
  • 클라이언트로부터 전송되는 멀티미디어 데이터를 실시간으로 서버에서 분석하여 처리하는 시스템의 경우에는 입력되는 데이터의 양에 비례하여 서버의 부담은 증가하게 된다. 이때 서버에서는 데이터의 병목현상이 발생하게 되고, 이는 바로 전체적인 시스템의 성능을 저하시키는 결과를 초래하게 된다. 본 논문에서는 데이터 처리의 병목현상을 해결하여 시스템의 성능을 높일 뿐만 아니라, 인터넷상의 유휴 서버들을 활용할 수 있게 하기 위한 방안으로 분산처리 기술을 이용한 전처리 작업 시스템과 그 성능을 향상시키기 위한 분산 객체 활성화 시스템을 제안한다.

  • PDF

Modified ARIMA-based Distance Learning Learner Preprocessing Study (수정된 ARIMA 기반 원격교육 학습자 전처리 연구)

  • Min, Youn A;Baek, YeongTae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.535-536
    • /
    • 2022
  • 본 논문 원격교육환경에서 학습자가 남긴 개별 데이터에 대한 장기적 관리 및 효율적 학습자 관리를 위한 데이터 전처리 방법으로 전통적인 ARIMA를 수정하여 연구하였다. ARIMA는 과거시점 데이터에 대한 회귀식과 변화율을 현 시점 데이터에 반영하는 방식이며 본 연구에서는 ARIMA 처리과정에서 딥러닝 알고리즘인 RNN의 변형방법인 LSTM을 적용하여 부분 데이터셋의 전처리과정에 대한 정확성과 재현율을 높이도록 하였다. 본 연구의 결과 전통적인 ARIMA 적용시와 대비하여 7~9%의 성능향상을 확인하였다.

  • PDF

Ontology based Preprocessing Scheme for Mining Data Streams from Sensor Networks (센서 네트워크의 데이터 스트림 마이닝을 위한 온톨로지 기반의 전처리 기법)

  • Jung, Jason J.
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.3
    • /
    • pp.67-80
    • /
    • 2009
  • By a number of sensors and sensor networks, we can collect environmental information from a certain sensor space. To discover more useful information and knowledge, we want to employ data mining methodologies to sensor data stream from such sensor spaces. In this paper, we present a novel data preprocessing scheme to improve the performances of the data mining algorithms. Especially, ontologies are applied to represent meanings of the sensor data. For evaluating the proposed method, we have collected sensor streams for about 30 days, and simulated them to compare with other approaches.

  • PDF

Preprocessing performance of convolutional neural networks according to characteristic of underwater targets (수중 표적 분류를 위한 합성곱 신경망의 전처리 성능 비교)

  • Kyung-Min, Park;Dooyoung, Kim
    • The Journal of the Acoustical Society of Korea
    • /
    • v.41 no.6
    • /
    • pp.629-636
    • /
    • 2022
  • We present a preprocessing method for an underwater target detection model based on a convolutional neural network. The acoustic characteristics of the ship show ambiguous expression due to the strong signal power of the low frequency. To solve this problem, we combine feature preprocessing methods with various feature scaling methods and spectrogram methods. Define a simple convolutional neural network model and train it to measure preprocessing performance. Through experiment, we found that the combination of log Mel-spectrogram and standardization and robust scaling methods gave the best classification performance.