• 제목/요약/키워드: Pre Processing

검색결과 1,992건 처리시간 0.03초

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

VIS/NIR 스펙트럼 측정모드에 따른 신고 배의 당도 예측성능 비교 (Comparison of Performance of Measuring Method of VIS/NIR Spectroscopic Spectrum to Predict Soluble Solids Content of 'Shingo' Pear)

  • 서상룡;이경환;유승화;유수남;최영수
    • Journal of Biosystems Engineering
    • /
    • 제36권2호
    • /
    • pp.130-139
    • /
    • 2011
  • Three modes of VIS/NIR spectroscopic measurement (interactance and two modes of transmission) were compared for their ability to estimate soluble solids content (SSC) of 'Shingo' pear non-destructively. The two transmission modes are named as full- and semi-transmission, where full-transmission stands for passing of light through abdomen of pear and semi-transmission is for transit of light mainly through flesh of pear. For comparison of the modes, prediction models developed from the collected spectroscopic data by the three modes were developed and tested for comparison of their performance. Partial least square regression (PSLR) was used to develop the models and various pre-processing methods were applied to develop models of high accuracy. The experiment was repeated three times with pears produced in different regions. The experiments resulted that selection of pre-processing is very important to attain accurate models, and multiplicative scatter correction (MSC) was selected as a pre-processor of high accuracy for the three modes of spectroscopic measurement in every experiment. Except for MSC, different group of pre-processing methods were selected for the three modes of measurement in every experiment without any tendency to the tested modes of measurement and pears of different produced region. Root-mean-square error of prediction (RMSEP) of prediction models of the three modes of measurement using prepreocessor of MSC were compared for their ability to estimate SSC. The models resulted in ranges of $0.37{\sim}0.57^{\circ}Brix$, $0.65{\sim}0.72^{\circ}Brix$, $0.39{\sim}0.51^{\circ}Brix$ for interactance, full- and semi-transmission, respectively. As shown, modes of semi-transmission and interactance resulted about the same level of prediction accuracy and were noted as modes of high performance to predict SSC.

딥러닝 기반 넙치 질병 식별 향상을 위한 전처리 기법 비교 (A Comparison of Pre-Processing Techniques for Enhanced Identification of Paralichthys olivaceus Disease based on Deep Learning)

  • 강자영;손현승;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제22권3호
    • /
    • pp.71-80
    • /
    • 2022
  • 과거 양식장에서 어류 질병은 세균성이었던 반면 최근은 바이러스성 및 혼합된 형태가 되면서 어류 질병의 빈도가 높아졌다. 양식장이라는 밀폐된 공간에서 바이러성 질병은 확산속도가 높으므로 집단 폐사로 이어질 확률이 매우 높다. 집단 폐사를 방지하기 위해서는 어류 질병의 빠른 식별이 중요하다. 그러나 어류의 질병 진단은 고도의 전문지식이 필요하고 매번 어류의 상태를 눈으로 확인하기 어렵다. 질병의 확산을 막기 위해서는 병이든 어류의 자동식별 시스템이 필요하다. 본 논문에서는 딥러닝 기반의 넙치의 질병 식별 시스템의 성능을 높이기 위해서 기존 전처리 방법을 비교 실험한다. 대상 질병은 넙치에서 가장 빈번히 발생하는 3가지 질병 스쿠티카병, 비브리오증, 림포시스티스를 선정하였고 이미지 전처리 방법으로 RGB, HLS, HSV, LAB, LUV, XYZ, YCRCV를 사용하였다. 실험결과 일반적인 RGB를 사용하는 것보다 HLS가 가장 좋은 결과를 얻을 수 있었다. 간단한 방법으로 질병의 인식률을 향상해 어류 질병 식별 시스템을 고도화 할 수 있을 것으로 예상한다.

말단흑색점흑색종 판별을 위한 전처리 과정 (Pre-Processing for Determining Acral Lentiginous Melanoma(ALM))

  • 함성원;오병호;양세정
    • 대한의용생체공학회:의공학회지
    • /
    • 제36권1호
    • /
    • pp.22-30
    • /
    • 2015
  • Melanoma is originated from the melanocyte producing the melanin which determines the complexion, and it has the highest mortality among skin cancers. Acral lentiginous melanoma(ALM) arises from extremities such as hands, feet or fingernails. Since the appearance of ALM is different from melanoma on the body, conventional auto diagnosis systems for melanoma is inappropriate to detect ALM. Therefore, ALM is typically difficult to distinguish from general nevus, resulting in delayed diagnosis and bad prognosis. In this paper, we firstly introduce a determination method for ALM by dermatologists and propose a method to rotate dermoscopic images automatically as a pre-processing for facilitating the easy determination of ALM and to select the optimal value of the Gaussian differentiation filter parameter which is significant for precise pattern extraction using the scale space analysis. From experimental results, it is shown that there exists the consistency between empirical values of the Gaussian differential filter parameter and optimal values derived from the scale space analysis to distinguish nevus and ALM.

3D 얼굴 성형 제작 시스템 구현 (Design and Implementation of 3D Facial Aesthetic Surgery System)

  • 조세홍
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권1호
    • /
    • pp.149-155
    • /
    • 2008
  • 본 논문은 3D 그래픽 기술을 이용하여 성형 시술 전후의 입체 얼굴을 제작하여 얼굴 성형 시술자의 만족도를 높이는 응용프로그램 시스템에 관한 구현 및 연구이다. 사용자의 실물에 최대한 유사한 원형 3D 입체 얼굴을 Pre-Processing 과정 및 Face-Part-Making 과정으로 구분하여 각 과정에 필요한 기술들을 사용하여 구현하였다. 또한 각 얼굴 부위를 담당하는 변형 Controller를 구현하여 제작된 입체 얼굴의 변화를 볼 수 있는 성형 제작 시스템을 구현하였다. 본 논문에서 구현한 얼굴 성형 제작 시스템은 현재 성형외과 등에서 활용되고 있는 2D 시스템에 비하여 효율성과 정확성, 만족도 등에서 보다 좋은 결과를 보여주고 있다.

  • PDF

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술 (Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems)

  • 서진호;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.416-422
    • /
    • 2005
  • 디지털 통신 시스템에서의 음성 인식은 음성 부호화기에 의한 음성 신호의 왜곡으로 인하여 성능이 크게 저하된다. 본 논문에서는 음성 부호화기에 의한 스펙트럼 왜곡을 분석하고 왜곡된 주파수 정보를 보상하는 전처리 과정을 통하여 음성 인식 성능을 향상시키는 방법을 제안한다. 현재 널리 사용되는 표준 음성 부호화기인 IS-127 EVRC, ITU G.729 CS-ACELP. IS-96 QCELP를 사용하여 부호화에 의한 왜곡을 분석하고, 모든 음성 부호화기에 공통으로 적용하여 왜곡을 보상할 수 있는 전처리 방법을 개발하였다. 본 논문에서 제안하는 왜곡 보상 방법을 세 종류의 음성부호화기에 각각 적용하였으며, 왜곡된 음성 신호에 대한 음성 인식률에 비하여 최대 $15.6\%$의 인식률 향상을 얻을 수 있었다.

PAIVS: prediction of avian influenza virus subtype

  • Park, Hyeon-Chun;Shin, Juyoun;Cho, Sung-Min;Kang, Shinseok;Chung, Yeun-Jun;Jung, Seung-Hyun
    • Genomics & Informatics
    • /
    • 제18권1호
    • /
    • pp.5.1-5.5
    • /
    • 2020
  • Highly pathogenic avian influenza (HPAI) viruses have caused severe respiratory disease and death in poultry and human beings. Although most of the avian influenza viruses (AIVs) are of low pathogenicity and cause mild infections in birds, some subtypes including hemagglutinin H5 and H7 subtype cause HPAI. Therefore, sensitive and accurate subtyping of AIV is important to prepare and prevent for the spread of HPAI. Next-generation sequencing (NGS) can analyze the full-length sequence information of entire AIV genome at once, so this technology is becoming a more common in detecting AIVs and predicting subtypes. However, an analysis pipeline of NGS-based AIV sequencing data, including AIV subtyping, has not yet been established. Here, in order to support the pre-processing of NGS data and its interpretation, we developed a user-friendly tool, named prediction of avian influenza virus subtype (PAIVS). PAIVS has multiple functions that support the pre-processing of NGS data, reference-guided AIV subtyping, de novo assembly, variant calling and identifying the closest full-length sequences by BLAST, and provide the graphical summary to the end users.

단일 레이저 스캐너와 Integrated Probabilistic Data Association Filter를 이용한 도심환경에서의 다중 차량추적 (Multiple Vehicle Tracking in Urban Environment using Integrated Probabilistic Data Association Filter with Single Laser Scanner)

  • 김동철;한재현;선우명호
    • 한국자동차공학회논문집
    • /
    • 제21권4호
    • /
    • pp.33-42
    • /
    • 2013
  • This paper describes a multiple vehicle tracking algorithm using an integrated probabilistic data association filter (IPDAF) in urban environments. The algorithm consists of two parts; a pre-processing stage and an IPDA tracker. In the pre-processing stage, measurements are generated by a feature extraction method that manipulates raw data into predefined geometric features of vehicles as lines and boxes. After that, the measurements are divided into two different objects, dynamic and static objects, by using information of ego-vehicle motion. The IPDA tracker estimates not only states of tracks but also existence probability recursively. The existence probability greatly assists reliable initiation and termination of track in cluttered environment. The algorithm was validated by using experimental data which is collected in urban environment by using single laser scanner.

한약재유통지원시설의 건축계획에 관한 연구 (A Study on the Architectural Planning of traditional herbal medicine distribution supporting facilities)

  • 배좌섭;오종희;강원필
    • 의료ㆍ복지 건축 : 한국의료복지건축학회 논문집
    • /
    • 제14권2호
    • /
    • pp.53-64
    • /
    • 2008
  • This study is the architectural planning of 5 distribution supporting facilities for traditional herbal medicine cultivated in the rural areas. The main function of the facility consists of storage, pre-treatment/processing, loading/unloading and the assistant function consists of inspection, office, exhibition/sale, technical equipment etc. The planning shows the modular plan and the section plan of the storage space reflecting the shape and size of storage container, the action radius of carrier and the possibilities of space lease. The total floor area of the storage is 3,192$m^2$ consisting of 27 space. The total floor area of the pre-treatment/processing is 1,488$m^2$ consisting of 7 space. The total floor area of the loading/unloading is 329$m^2$ consisting of 4 space. The total floor area of each facility storage is 8,284$m^2$ including of public space 2,170$m^2$. Also this planning shows the preliminary design, "fundamental model design" for 5 rural government BTL project. Therefore, this result of planning will be the guidelines of the RFP(Request For Proposal) for the private sector company interested in this BTL project.

  • PDF

Application of recursive SSA as data pre-processing filter for stochastic subspace identification

  • Loh, Chin-Hsiung;Liu, Yi-Cheng
    • Smart Structures and Systems
    • /
    • 제11권1호
    • /
    • pp.19-34
    • /
    • 2013
  • The objective of this paper is to develop on-line system parameter estimation and damage detection technique from the response measurements through using the Recursive Covariance-Driven Stochastic Subspace identification (RSSI-COV) approach. To reduce the effect of noise on the results of identification, discussion on the pre-processing of data using recursive singular spectrum analysis (rSSA) is presented to remove the noise contaminant measurements so as to enhance the stability of data analysis. Through the application of rSSA-SSI-COV to the vibration measurement of bridge during scouring experiment, the ability of the proposed algorithm was proved to be robust to the noise perturbations and offers a very good online tracking capability. The accuracy and robustness offered by rSSA-SSI-COV provides a key to obtain the evidence of imminent bridge settlement and a very stable modal frequency tracking which makes it possible for early warning. The peak values of the identified $1^{st}$ mode shape slope ratio has shown to be a good indicator for damage location, meanwhile, the drastic movements of the peak of $2^{nd}$ mode slope ratio could be used as another feature to indicate imminent pier settlement.