• 제목/요약/키워드: Imbalance Problem

검색결과 271건 처리시간 0.024초

딥 러닝 기반 코로나19 흉부 X선 판독 기법 (A COVID-19 Chest X-ray Reading Technique based on Deep Learning)

  • 안경희;엄성용
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.789-795
    • /
    • 2020
  • 전 세계적으로 유행하는 코로나19로 인해 많은 사망자가 보고되고 있다. 코로나19의 추가 확산을 막기 위해서는 의심 환자에 대해 신속하고 정확한 영상판독을 한 후, 적절한 조치를 취해야 한다. 이를 위해 본 논문은 환자의 감염 여부를 의료진에게 제공해 영상판독을 보조할 수 있는 딥 러닝 기반 코로나19 흉부 X선 판독 기법을 소개한다. 우선 판독모델을 학습하기 위해서는 충분한 데이터셋이 확보되어야 하는데, 현재 제공하는 코로나19 오픈 데이터셋은 학습의 정확도를 보장하기에 그 영상 데이터 수가 충분하지 않다. 따라서 누적 적대적 생성 신경망(StackGAN++)을 사용해 인공지능 학습 성능을 저하하는 영상 데이터 수적 불균형 문제를 해결하였다. 다음으로 판독모델 개발을 위해 증강된 데이터셋을 사용하여 DenseNet 기반 분류모델 학습을 진행하였다. 해당 분류모델은 정상 흉부 X선과 코로나 19 흉부 X선 영상을 이진 분류하는 모델로, 실제 영상 데이터 일부를 테스트데이터로 사용하여 모델의 성능을 평가하였다. 마지막으로 설명 가능한 인공지능(eXplainable AI, XAI) 중 하나인 Grad-CAM을 사용해 입력 영상의 질환유무를 판단하는 근거를 제시하여 모델의 신뢰성을 확보하였다.

비정상 산과력을 가진 부부에서의 균형전좌형 염색체 보인자의 빈도 및 그 보인자들에서의 산전 세포유전학적 진단 (Prevalence of Balanced Chromosomal Translocations in Couples with Abnormal Reproductive Outcomes and Prenatal Cytogenetic Diagnosis in the Carriers)

  • 박소연;강인수;류현미;전종영;이문희;김진미;최수경
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제24권3호
    • /
    • pp.393-398
    • /
    • 1997
  • Cytogenetic analysis was performed in 1321 couples and 141 women with history of abnormal reproductive outcome during 1988-1996. The use of high resolution banding technique and fluorescence in situ hybridization (FISH) in the chromosome analysis has made the precise evaluation of chromosome aberrations. The prevalence of balanced chromosomal translocation carriers were 3.74% (104/2783 patients). 70 cases (2.52%) were reciprocal translocation carriers and 34 (1.22%) had Robertsonian translocations. Chromosome aberrations were more frequent in women (73 cases) than in men (31 cases). No phenotypical abnormalities were found in all carriers, but they experienced abnormal reproductive outcomes such as recurrent spontaneous abortions, anomalous offsprings or infertility problem. Prenatal diagnosis was carried out on 36 subsequent pregnancies in balanced translocation carriers. The fetal karyotypes showed that 12 cases (33%) were normal, 22 (61%) were balanced translocations, and two (6%) were unbalanced translocations. It is concluded that the prevalence of balanced chromosomal translocations in patients with abnormal reproductive outcome is higher than that of the normal population. Most of the fetal samples showed normal karyotypes or balanced translocations. Although the incidence of chromosomal imbalance in the fetuses was relatively low in prenatal diagnosis, individuals with balanced translocations are predisposed to abnormal offspring with partial trisomy or monosomy. Therefore we recommend that genetic counselling and cytogenetic prenatal diagnosis for translocation carriers have to be offered to prevent recurrent chromosomal abnormal babies.

  • PDF

신용카드 불법현금융통 적발을 위한 축소된 앙상블 모형 (Illegal Cash Accommodation Detection Modeling Using Ensemble Size Reduction)

  • 이화경;한상범;지원철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.93-116
    • /
    • 2010
  • 불법현금융통 적발모형 개발에 앙상블 접근방법을 사용하였다. 불법현금융통은 국내 신용카드사의 손익에 영향을 미치며 최근 국제화되고 있음에도 불구하고 학문적인 접근이 이루어지지 않았다. 부정행위 적발모형(Fraud Detection Model, FDM)은 데이터 불균형 문제로 인하여 좋은 성능을 얻기 어려운데, 다수의 모형을 결합하는 앙상블이 대안으로 제시되어 왔다. 앙상블에 포함된 모형들의 다양성이 보장된다면 단일모형에 비해 더 좋은 성능을 보인다는 점은 이미 인정되고 있으며, 최근 연구 결과는 학습된 모든 기본모형들을 사용하는 것보다 적절한 기본모형들만 선택하여 앙상블에 포함시키는 것이 바람직하다는 것이다. 본 논문에서는 효과적인 불법현금융통 적발을 위하여 축소된 앙상블 기법을 사용하는데, 정확성과 다양성 척도를 사용하여 앙상블에 참여할 기본모형을 선택하는 것이다. 다양성은 앙상블을 구성하는 기본모형들 사이의 불일치 (Disagreement or Ambiguity)를 의미하는데, FDM에 내재된 데이터 불균형문제를 고려하여 두 가지 측면에 중점을 두었다. 첫째, 학습 자료의 추출 과정에서 다양성을 확보하기 위한 소수 범주의 과잉추출 방법과 적절한 훈련 방법에 대해 설명하였다. 둘째, 소수범주에 초점을 맞추어 기존의 다양성 척도를 효과적인 척도로 변형시키고, 전진추가법과 후진소거법의 동적 다양성 계산법을 도입하여 앙상블에 참여할 기본모형을 평가하였다. 실험에 사용된 학습 알고리즘은 신경망, 의사결정수와 로짓 회귀분석이었으며, 동질적 앙상블과 이질적 앙상블을 구성하여 성능평가를 하였다. 실험결과 불법현금융통 적발모형에 있어 축소된 앙상블은 모든 기본모형이 포함된 앙상블과 성능 차이가 없었다. 축소된 앙상블은 앙상블 구성의 복잡성을 감소시키고 구현을 용이하게 한다는 점에서 FDM에서도 유력한 모형 수립 접근방법이 될 수 있음을 보였다.

온라인 저작권 침해 수익원 제공자인 광고의 책임에 대한 연구 - 미국 사례와의 비교를 중심으로 - (A Feasibility Study on the Aid and Abet of Providers of Revenue for Copyright Infringement - Focusing on Comparing with the US Cases -)

  • 김창화
    • 기술혁신학회지
    • /
    • 제20권4호
    • /
    • pp.1288-1308
    • /
    • 2017
  • 온라인에서 저작권 침해가 발생하는 경우를 보면, 대부분의 침해 사이트들에게 수입원이 되는 것은 광고이다. 따라서 최근 저작권자들과 국가 기관들은 저작권 침해를 막기 위하여 그 광고의 게재를 중지하거나 철회하도록 요청하고 있다. 이러한 방법은 침해를 막기 위하여 손쉽고 효율적인 방법이라 할 수 있다. 그런데 문제는 이러한 광고 게재에 대한 중지나 철회에 대한 요청이 타당한 것인지 여부가 불분명하다는 것이다. 그러한 요청이 타당하기 위해서는 해당 광고가 저작권 침해에 대하여 간접침해의 행위로 인정되거나 그렇지 않은 경우 그에 합당한 이유가 있어야 한다. 만일, 둘 다에 대한 근거나 이유가 없다면, 광고 게재에 대한 중지나 철회의 요청은 함부로 이루어져서는 아니 될 것이다. 미국의 여러 사례들을 살펴볼 때, 저작권 침해에 대한 간접책임이 인정되기 위해서는 직접침해자와의 단순한 관계 이상의 것을 요구하거나, 직접침해에 대한 실질적 기여를 요구하고 있다. 하지만, 광고는 저작권 직접침해자와 밀접한 관계도 실질적인 기여도 하지 않고 있어, 간접책임을 질 수 없는 것으로 판단되고 있다. 또한, 미국의 법안으로 제출되었던 SOPA나 PIPA에서 제기되었던 반대 의견들에 의하면, 광고의 철회를 할 수 있도록 하는 것은 검열의 문제, 사이트에 대한 지나친 부담, 과중한 저작권 보호로 인한 불균형의 문제가 발생하였다. 또한, 광고차단기 사례들을 볼 때, 광고를 임의로 제거하는 것은 적법하지 않거나 저작권 침해를 구성한다. 따라서 이러한 것들을 살펴볼 때, 광고의 게재를 중지하거나 철회하는 것은 그 근거나 이유가 적정하지 못하며, 이러한 이유로 그러한 요청은 보다 신중을 기하여 이루어져야 할 것이다.

일본 국립 순환기 센타형 전기유압식 인공심장의 개발과 동물실험 (Development and in Vivo Test of an Electrohydraulic Total Artificial Heart at the National Cardiovascular Center in Japan)

  • 손영상
    • 대한의용생체공학회:의공학회지
    • /
    • 제19권2호
    • /
    • pp.163-170
    • /
    • 1998
  • 인공심장의 주된 합병증인 혈전과 감염의 문제를 줄이고 장착 환자의 삶의 질을 높이기 위하여 체내 완전 매립형 전기 유압식 인공심장을 개발하고 있는 것과 이 모델을 이용한 동물실험에 대하여 보고하는 바이다. 이 인공심장은 혈액펌프, 유압구동기, 구동제어회로, 경피적 에너지-정보 전송시스템, 체내 받테리 등으로 구성되어 있다. 실험동물은 체중 62Kg의 송아지를 이용하였다. 흉강내 이식하는데 어려움은 없었고, 수술 후 생존하는 동안 혈역학적으로 문제는 없었으며 특이한 합병증도 발생하지 않았다. 그러나 이식 11일째 기계적인 결함으로 작동이 정지하였다. 앞으로 기계적 수명이나 생체적 합성 등의 문제 등히 해결되어야 할 것이다.

  • PDF

드론의 고도 유지를 위한 가속도센서 기반 고도 측정 알고리즘 개선 (Improvement of Altitude Measurement Algorithm Based on Accelerometer for Holding Drone's Altitude)

  • 김덕엽;윤보람;이성희;이우진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권10호
    • /
    • pp.473-478
    • /
    • 2017
  • 드론은 비행 목적을 달성하기 위해 고도 유지를 필요로 하는 경우가 많다. 일반적으로 드론의 고도 유지 기능은 현재 측정되는 고도 정보에 따라 드론을 상승시키거나 하강시키는 작업을 반복하는 것을 의미한다. 고도 유지 중에 모터 속도 차이로 인한 추력의 불균형이나 바람 등의 외적 요인으로 인해 드론의 고도가 계속 변한다. 그럼에도 불구하고 고도를 유지하기 위해서는 기본적으로 계속해서 변하는 드론의 고도를 정확하게 측정해야 한다. 드론의 고도 측정 방법은 일반적으로 가속도센서를 사용한다. 이 방법은 적분 오차 누적으로 인한 측정값이 발산하는 문제와 드론의 기체 진동조차 고도 변화로 인지하는 문제가 존재한다. 그래서 상용 드론이나 기존 연구에서는 가속도센서를 제외한 별도의 센서를 추가하여 고도 측정에 사용한다. 그러나 추가하는 센서 대부분은 측정거리에 제한이 있으며 여러 센서들을 같이 사용하는 경우 센서 값들의 연산 처리가 많아져 고도 측정 속도가 지연될 우려가 있다. 따라서 드론의 고도 유지, 고도 측정 성능에 영향을 주지 않으면서 정확한 고도를 측정할 수 있는 방안이 필요하다. 본 논문에서는 가속도센서를 이용하는 일반적인 고도 측정 방법을 개선한 측정 알고리즘을 제안하고 본 알고리즘을 적용한 결과로 고도 유지와 고도 측정의 정확성이 향상됨을 보인다.

심야시간 대 택시 서비스 취약예상지역 분석 연구 (A Study on the Analysis of the Weak Areas of Taxi Service during Late Night Time)

  • 송재인;강민희;조윤지;황기연
    • 한국ITS학회 논문지
    • /
    • 제19권6호
    • /
    • pp.163-179
    • /
    • 2020
  • 플랫폼 기반의 택시서비스의 확대로 이용자의 이동성 및 편의성이 개선되고 있으나, 수익성의 문제로 공급 취약지역이 발생할 것으로 예상된다. 이에 따라 본 연구에서는 대중교통이 종료되는 심야시간을 중심으로 수요 공급의 불균형에 따른 택시 서비스의 공간적 취약성을 분석하였다. Hot-spot 분석결과 승차대비 공차량 및 승차대비 하차량의 경우 도시 외곽지역 및 주거밀집 지역에서 높게 도출되었고, 반대로 도심 및 부도심에서 낮게 나타나는 것을 확인하였다. 중심성 분석 결과 또한 Hot-spot 분석결과와 유사한 패턴으로 분석되었다. 이는 운전자의 관점에서 내향 대비 외향중심성이 낮은 지역은 다음 영업에 한계로 간접승차 거부의 문제가 발생할 수 있으며, 승객의 입장에서는 대기시간 증가로 이어질 것으로 예상된다. 이에 향후 수요공급의 불일치에 의한 공간적 취약성 개선이 필요할 것으로 판단되며, 본 연구의 결과를 기초자료로 활용 할 수 있을 것으로 기대된다.

Sentiment Analysis of Product Reviews to Identify Deceptive Rating Information in Social Media: A SentiDeceptive Approach

  • Marwat, M. Irfan;Khan, Javed Ali;Alshehri, Dr. Mohammad Dahman;Ali, Muhammad Asghar;Hizbullah;Ali, Haider;Assam, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.830-860
    • /
    • 2022
  • [Introduction] Nowadays, many companies are shifting their businesses online due to the growing trend among customers to buy and shop online, as people prefer online purchasing products. [Problem] Users share a vast amount of information about products, making it difficult and challenging for the end-users to make certain decisions. [Motivation] Therefore, we need a mechanism to automatically analyze end-user opinions, thoughts, or feelings in the social media platform about the products that might be useful for the customers to make or change their decisions about buying or purchasing specific products. [Proposed Solution] For this purpose, we proposed an automated SentiDecpective approach, which classifies end-user reviews into negative, positive, and neutral sentiments and identifies deceptive crowd-users rating information in the social media platform to help the user in decision-making. [Methodology] For this purpose, we first collected 11781 end-users comments from the Amazon store and Flipkart web application covering distant products, such as watches, mobile, shoes, clothes, and perfumes. Next, we develop a coding guideline used as a base for the comments annotation process. We then applied the content analysis approach and existing VADER library to annotate the end-user comments in the data set with the identified codes, which results in a labelled data set used as an input to the machine learning classifiers. Finally, we applied the sentiment analysis approach to identify the end-users opinions and overcome the deceptive rating information in the social media platforms by first preprocessing the input data to remove the irrelevant (stop words, special characters, etc.) data from the dataset, employing two standard resampling approaches to balance the data set, i-e, oversampling, and under-sampling, extract different features (TF-IDF and BOW) from the textual data in the data set and then train & test the machine learning algorithms by applying a standard cross-validation approach (KFold and Shuffle Split). [Results/Outcomes] Furthermore, to support our research study, we developed an automated tool that automatically analyzes each customer feedback and displays the collective sentiments of customers about a specific product with the help of a graph, which helps customers to make certain decisions. In a nutshell, our proposed sentiments approach produces good results when identifying the customer sentiments from the online user feedbacks, i-e, obtained an average 94.01% precision, 93.69% recall, and 93.81% F-measure value for classifying positive sentiments.

식물공장 기류해석을 위한 디지털트윈 개발 및 실증 (Development and Validation of Digital Twin for Analysis of Plant Factory Airflow)

  • 정진립;원보영;유호동;김탁곤;강대현;홍경진
    • 한국시뮬레이션학회논문지
    • /
    • 제31권1호
    • /
    • pp.29-41
    • /
    • 2022
  • 이상기후로 인한 불안정한 식량 수급을 해결하기 위한 대안 중 하나로 식물공장의 필요성이 증대되고 있다. 식물공장 내 기류는 재배작물의 증산작용과 열교환에 중요한 인자 중 하나로 인식되고 있다. 한편, 디지털트윈(Digital Twin: DT)은 실체계를 가상세계에 복제한 것으로 실체계만으로 불가능한 다양한 서비스를 제공하는 수단으로 주목받고 있다. 본 연구에서는 디지털트윈 개념을 실제 운용중인 식물공장 기류해석에 적용하여 다양한 상황에 기류를 예측할 수 있는 기류 예측 DT 모델 개발을 목표로 하였다. 이를 위해 먼저 기류 해석용 디지털트윈 수학적 형식론을 제시하고, 이를 기반으로 실제 운용중인 식물공장의 기류예측 모델링에 필요한 정보들을 명세한다. 이어서 식물공장 내 형상을 CAD로 구현하고 유동해석을 위한 전산유체역학(CFD) 구성요소들을 결합하여 DT 모델을 개발하였다. 마지막으로 DT 모델의 시뮬레이션 해석 결과를 식물공장에서 수집한 실제 기류값과 비교하는 모델의 실증 및 기계학습 기반 보정을 통해 정확도가 높은 기류 예측용 DT 모델을 완성하였다.

다양한 데이터 전처리 기법 기반 침입탐지 시스템의 이상탐지 정확도 비교 연구 (Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems Based on Various Data Preprocessing Techniques)

  • 박경선;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.449-456
    • /
    • 2021
  • 침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.