• 제목/요약/키워드: Deep Features

검색결과 1,071건 처리시간 0.027초

XAI 기법을 이용한 리뷰 유용성 예측 결과 설명에 관한 연구 (Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction)

  • 류동엽;이흠철;김재경
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.35-56
    • /
    • 2023
  • 정보통신 기술의 발전에 따라 웹 사이트에는 수많은 리뷰가 지속적으로 게시되고 있다. 이로 인해 정보 과부하 문제가 발생하여 사용자들은 본인이 원하는 리뷰를 탐색하는데 어려움을 겪고 있다. 따라서, 이러한 문제를 해결하여 사용자에게 유용하고 신뢰성 있는 리뷰를 제공하기 위해 리뷰 유용성 예측에 관한 연구가 활발히 진행되고 있다. 기존 연구는 주로 리뷰에 포함된 특성을 기반으로 리뷰 유용성을 예측하였다. 그러나, 예측한 리뷰가 왜 유용한지 근거를 제시할 수 없다는 한계점이 존재한다. 따라서 본 연구는 이러한 한계점을 해결하기 위해 리뷰 유용성 예측 모델에 eXplainable Artificial Intelligence(XAI) 기법을 적용하는 방법론을 제안하였다. 본 연구는 Yelp.com에서 수집한 레스토랑 리뷰를 사용하여 리뷰 유용성 예측에 관한 연구에서 널리 사용되는 6개의 모델을 통해 예측 성능을 비교하였다. 그 다음, 예측 성능이 가장 우수한 모델에 XAI 기법을 적용하여 설명 가능한 리뷰 유용성 예측 모델을 제안하였다. 따라서 본 연구에서 제안한 방법론은 사용자의 구매 의사결정 과정에서 유용한 리뷰를 추천할 수 있는 동시에 해당 리뷰가 왜 유용한지에 대한 해석을 제공할 수 있다.

적대적 학습 기반 오토인코더(ATAE)를 이용한 다차원 상수도관망 데이터 생성 (Multidimensional data generation of water distribution systems using adversarially trained autoencoder)

  • 김세형;전상훈;정동휘
    • 한국수자원학회논문집
    • /
    • 제56권7호
    • /
    • pp.439-449
    • /
    • 2023
  • 최근 계측 기술의 발전으로 압력계와 유량계 등 다양한 센서를 설치하여 상수도관망의 상태를 효과적으로 파악할 수 있게 되었으나, 도시가 광범위하게 개발됨에 따라 계측 신뢰도에 영향을 미치는 변수는 다양해지고 있다. 특히 상수도관망 분석에 중요한 영향력을 가지는 수요 데이터의 경우 직접 계측의 난이도가 높고 결측이 발생하기 쉬운 것으로 알려져 데이터 생성의 중요도가 증가하고 있다. 본 논문에서는 상수도관망에서 누락된 데이터를 정확하게 생성하기 위해 생성적 딥러닝 모델에 기반한 적대적 학습 기반 오토인코더(ATAE) 모델을 제안한다. 제안된 모델은 판별 신경망과 생성 신경망의 두 가지 신경망의 적대적 학습을 사용하여 압력 데이터로부터 수요 데이터를 생성한다. 학습이 완료된 ATAE 모델의 생성 신경망은 관망의 계측되는 압력 데이터가 존재하는 경우, 그로부터 추정된 관망 수요 데이터를 제공할 수 있다. ATAE 모델은 미국 텍사스주 오스틴의 실제 상수도망에 적용되어 성능이 검증되었다. 수요 및 압력 시계열 데이터의 불확실성 정도에 따른 ATAE 예측 결과의 정확도를 비교하여 데이터 불확실성의 영향을 분석하였으며, 또한 수요 수준에 따른 데이터 수집 기간별 생성 결과를 비교하여 이에 따른 데이터 생성 성능을 검토하였다.

BERT 모형을 이용한 주제명 자동 분류 연구 (A Study on Automatic Classification of Subject Headings Using BERT Model)

  • 이용구
    • 한국문헌정보학회지
    • /
    • 제57권2호
    • /
    • pp.435-452
    • /
    • 2023
  • 이 연구는 딥러닝 기법의 전이학습 모형인 BERT를 이용하여 주제명의 자동 분류를 실험하고 그 성능을 평가하였으며, 더 나아가 주제명이 부여된 KDC 분류체계와 주제명의 범주 유형에 따른 성능을 분석하였다. 실험 데이터는 국가서지를 이용하여 주제명의 부여 횟수에 따라 6개의 데이터셋을 구축하고 분류 자질로 서명을 이용하였다. 그 결과, 분류 성능으로 3,506개의 주제명이 포함된 데이터셋(레코드 1,539,076건)에서 마이크로 F1과 매크로 F1 척도가 각각 0.6059와 0.5626 값을 보였다. 또한 KDC 분류체계에 따른 분류 성능은 총류, 자연과학, 기술과학, 그리고 언어 분야에서 좋은 성능을 보이며 종교와 예술 분야는 낮은 성능을 보였다. 주제명의 범주 유형에 따른 성능은 '식물', '법률명', '상품명'이 높은 성능을 보인 반면, '국보/보물' 유형의 주제명에서 낮은 성능을 보였다. 다수의 주제명을 포함하는 데이터셋으로 갈수록 분류기가 주제명을 제대로 부여하지 못하는 비율이 늘어나 최종 성능의 하락을 가져오기 때문에, 저빈도 주제명에 대한 분류 성능을 높이기 위한 개선방안이 필요하다.

Attention 알고리즘 기반 약물의 태아 독성 예측 연구 (Predicting fetal toxicity of drugs through attention algorithm)

  • 정명현;유선용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.273-275
    • /
    • 2022
  • 임산부에게 약물을 사용하는 것은 태아에게 잠재적인 위협이 될 수 있으므로 임산부가 복용을 피해야 할 약물을 분류하는 것은 필수적이다. 하지만 많은 화합물이 태아에게 독성을 나타낼 수 있는지에 대한 근거가 불분명하며, 그것을 밝혀내기 위해서는 많은 시간과 비용이 투자된다. In silico 기반 가상 스크리닝은 광범위한 화합물에 대해서 적은 비용과 시간으로 어떤 화합물이 태아에게 높은 위험을 보일 수 있는지 예측하는데 활용될 수 있다. 우리는 한국과 호주 정부의 임신 중 약물 처방을 위한 위험 분류 리스트를 활용해 약물의 분류 등급 정보를 가져왔다. 약물의 구조적 특징과 화학적 특징을 기반으로 다양한 머신 러닝 기법을 적용하여 약물의 태아 독성 여부를 예측하는 모델을 생성하였으며, 정량적 성능 평가를 수행하였다. 나아가, attention 알고리즘을 활용하여 제안하는 모델이 약물의 태아 독성을 예측하는 과정에서 화합물의 어떤 하위 분자 구조가 중요하게 활용되었는지 확인하였다. 해당 연구를 통해 광범위한 화합물에 대해 높은 태아 독성 위험도를 가진 약물을 머신 러닝을 통해 예측할 수 있는 것을 확인하였다. 우리의 연구는 단순한 약물의 태아 독성 예측에서 나아가, 유의미한 하위 분자구조를 제공함으로써 연구자들이 약물의 태아 독성을 증명하기 위해 수행하는 실험에서 핵심적인 역할이 가능할 것이다.

  • PDF

조기위암으로 위 절제술 후 갑자기 발생한 췌담도암으로 오인되었던 재발성 위암 1례 (Recurrent Early Gastric Cancer with Liver Metastasis Mimicking Pancreaticobiliary Cancer)

  • 이병후;조주영
    • Journal of Digestive Cancer Research
    • /
    • 제1권1호
    • /
    • pp.48-51
    • /
    • 2013
  • 73세 남자 환자로 약 1개월 전부터 상복부 불편감 주소로 본원 내원 후 시행한 상부 내시경 검사상 하체부 전벽측의 조기위암으로 내시경 점막하 박리술을 시행하였다. 조직검사 결과 저분화도(poorly differentiated type)의 선암이 발견되었고, 절제면의 암세포 침범 소견은 없었으나, 점막하 2층(900 um)까지 침윤된 소견과 일부 림프선 전이 소견이 보여 위 절제 수술(subtotal gastrectomy)을 시행하였다. 조직검사 결과 점막층에 국한된 저분화도의 선암이 발견되었고, 그 외 림프절 전이 등의 소견은 보이지 않아 수술 후 병기 1기의 조기위암(T1N0M0, stage IA) 으로 진단 후 추가적인 항암치료 없이 추적관찰을 하였다. 이후 6개월 마다 복부 전산화단층촬영술과 상부 내시경 검사를 시행하였으며, 수술 후 2년째 시행한 복부 전산화단층촬영 결과 간의 다발성의 전이성암으로 의심되는 소견이 관찰되었다. 간 조직 검사를 시행하였고, 조직검사 결과 저분화도의 선암으로 발견되었으며, 원발 병소를 확인하기 위해 면역화학 검사를 시행한 결과 췌담도 계통의 암에서 특징적으로 보일 수 있는 CK7과 CK19이 강양성 소견을 보여 담도암의 간전이로 의심하였다. 이후 췌담도 MRI 및 PET 검사 등을 시행 하였으나, 담도암 등의 소견은 관찰되지 않았다. 위암은 특징적으로 발생 기전에서 다양한 내적 및 외적 원인들(nitrosamine, H. pylori, E-cadherin mutation 등)로 인해 면역 화학 조직검사 결과가 다양하게 나타날 수 있기 때문에(heterogeneous cytokeratin expression pattern) 면역화학 검사 결과만으로 위암 가능성을 배제할 수 없는 것으로 보고되고 있다. 따라서 위암의 간전이로 진단 후 항암치료를 시행하였으며, 면역화학 검사에서 췌담도 계통의 암으로 오인되었던 재발성 전이성 위암의 증례 1례를 문헌고찰과 함께 보고한다.

  • PDF

Automatic Detection of Type II Solar Radio Burst by Using 1-D Convolution Neutral Network

  • Kyung-Suk Cho;Junyoung Kim;Rok-Soon Kim;Eunsu Park;Yuki Kubo;Kazumasa Iwai
    • 천문학회지
    • /
    • 제56권2호
    • /
    • pp.213-224
    • /
    • 2023
  • Type II solar radio bursts show frequency drifts from high to low over time. They have been known as a signature of coronal shock associated with Coronal Mass Ejections (CMEs) and/or flares, which cause an abrupt change in the space environment near the Earth (space weather). Therefore, early detection of type II bursts is important for forecasting of space weather. In this study, we develop a deep-learning (DL) model for the automatic detection of type II bursts. For this purpose, we adopted a 1-D Convolution Neutral Network (CNN) as it is well-suited for processing spatiotemporal information within the applied data set. We utilized a total of 286 radio burst spectrum images obtained by Hiraiso Radio Spectrograph (HiRAS) from 1991 and 2012, along with 231 spectrum images without the bursts from 2009 to 2015, to recognizes type II bursts. The burst types were labeled manually according to their spectra features in an answer table. Subsequently, we applied the 1-D CNN technique to the spectrum images using two filter windows with different size along time axis. To develop the DL model, we randomly selected 412 spectrum images (80%) for training and validation. The train history shows that both train and validation losses drop rapidly, while train and validation accuracies increased within approximately 100 epoches. For evaluation of the model's performance, we used 105 test images (20%) and employed a contingence table. It is found that false alarm ratio (FAR) and critical success index (CSI) were 0.14 and 0.83, respectively. Furthermore, we confirmed above result by adopting five-fold cross-validation method, in which we re-sampled five groups randomly. The estimated mean FAR and CSI of the five groups were 0.05 and 0.87, respectively. For experimental purposes, we applied our proposed model to 85 HiRAS type II radio bursts listed in the NGDC catalogue from 2009 to 2016 and 184 quiet (no bursts) spectrum images before and after the type II bursts. As a result, our model successfully detected 79 events (93%) of type II events. This results demonstrates, for the first time, that the 1-D CNN algorithm is useful for detecting type II bursts.

SWT-SVD 전처리 알고리즘을 적용한 예측적 베어링 이상탐지 모델 (A Predictive Bearing Anomaly Detection Model Using the SWT-SVD Preprocessing Algorithm)

  • 박소향;김광훈
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.109-121
    • /
    • 2024
  • 섬유, 자동차와 같은 여러 제조 공정에서 설비가 고장이 나 멈추게 되면 기계가 작동하지 않게 되고 이는 기업의 시간적, 금전적 손실로 이어진다. 따라서 설비의 고장이 발생하기 전, 고장을 예측하여 정비할 수 있도록 설비의 이상을 사전에 탐지하는 것이 중요하다. 대부분의 설비 고장 원인은 설비의 필수 부품인 베어링의 고장으로, 베어링의 고장을 진단하는 것은 설비예지보전 연구의 핵심이기도 하다. 본 논문에서는 베어링의 진동 신호를 분석하여 SWT-SVD 전처리 알고리즘을 제안하고 이를 시계열 이상탐지 모델 네트워크 중 하나인 어노멀리 트랜스포머에 적용하여 베어링 이상탐지 모델을 구현한다. 제조공정의 베어링 진동신호는 실시간으로 센서값들의 이력이 작성되어 노이즈가 존재하므로, 이를 줄이기 위해 본 연구에서는 정상 웨이블릿 변환(Stationary Wavelet Transform)을 사용하여 주파수 성분을 추출하고, 특이값 분해(Singular Value Decomposition) 알고리즘을 통해 유의미한 특징들을 추출하는 전처리를 진행한다. 제안하는 SWT-SVD 전처리 방법을 적용한 베어링 이상탐지 모델 실험을 위해 IEEE PHM학회에서 제공하는 PHM-2012-Challenge 데이터 세트를 활용하였으며, 실험 결과는 0.98의 정확도와 0.97의 F1-Score로 우수한 성능을 보였다. 추가로, 성능 향상을 입증하기 위해 선행 연구들과 성능 비교를 진행한다. 비교 실험을 통해 제안한 전처리 방법이 기존의 전처리보다 높은 성능을 보임을 확인하였다.

Stem Rot of Pearl Millet Prevalence, Symptomatology, Disease Cycle, Disease Rating Scale and Pathogen Characterization in Pearl Millet-Klebsiella Pathosystem

  • Vinod Kumar Malik;Pooja Sangwan;Manjeet Singh;Pavitra Kumari;Niharika Shoeran;Navjeet Ahalawat;Mukesh Kumar;Harsh Deep;Kamla Malik;Preety Verma;Pankaj Yadav;Sheetal Kumari;Aakash;Sambandh Dhal
    • The Plant Pathology Journal
    • /
    • 제40권1호
    • /
    • pp.48-58
    • /
    • 2024
  • The oldest and most extensively cultivated form of millet, known as pearl millet (Pennisetum glaucum (L.) R. Br. Syn. Pennisetum americanum (L.) Leeke), is raised over 312.00 lakh hectares in Asian and African countries. India is regarded as the significant hotspot for pearl millet diversity. In the Indian state of Haryana, where pearl millet is grown, a new and catastrophic bacterial disease known as stem rot of pearl millet spurred by the bacterium Klebsiella aerogenes (formerly Enterobacter) was first observed during fall 2018. The disease appears in form of small to long streaks on leaves, lesions on stem, and slimy rot appearance of stem. The associated bacterium showed close resemblance to Klebsiella aerogenes that was confirmed by a molecular evaluation based on 16S rDNA and gyrA gene nucleotide sequences. The isolates were also identified to be Klebsiella aerogenes based on biochemical assays, where Klebsiella isolates differed in D-trehalose and succinate alkalisation tests. During fall 2021-2023, the disease has spread all the pearl millet-growing districts of the state, extending up to 70% disease incidence in the affected fields. The disease is causing considering grain as well as fodder losses. The proposed scale, consisting of six levels (0-5), is developed where scores 0, 1, 2, 3, 4, and 5 have been categorized as highly resistant, resistant, moderately resistant, moderately susceptible, susceptible, and highly susceptible disease reaction, respectively. The disease cycle, survival of pathogen, and possible losses have also been studied to understand other features of the disease.

울주에서 발생한 땅밀림 특성 (Analysis of Land Creep in Ulju, South Korea)

  • 박재현;이상현;강한별;김현;정은석
    • 한국산림과학회지
    • /
    • 제113권1호
    • /
    • pp.14-30
    • /
    • 2024
  • 본 연구는 한국의 울주군에서 발생한 땅밀림지의 지질, 지형, 유효 토심, 토양경도, 전기비저항탐사, 지반조사를 통해 땅밀림 위험지 특성을 파악하여 땅밀림에 의한 인적, 물적 피해를 완화하기 위한 기초자료를 제공하기 위해 실시하였다. 이 지역은 2022년 도로 확장공사의 영향으로 땅밀림이 발생하였는데, 하층식생이 크게 발달하지 않은 경사지로 상단부는 강우 시 집수가 잘 되는 요형 지형으로 나타났다. 땅밀림지의 주 구성 암석은 셰일, 사암, 역암으로 구성되어 있으며 땅밀림지의 토양은 대조구의 토양보다 점토함량이 약 3.6배 많은 것으로 분석되었으며, 모래와 점토가 많고, 실트가 적은 결과로 전형적인 땅밀림 토양으로 나타났으며, 전기비저항 탐사결과 저비저항이상대가 나타나 지하수대가 형성되는 것으로 나타났다. 토양 경도는 대조구보다 땅밀림지가 낮았으며, 땅밀림지의 평균토심은 30.4 cm로 대조구 24.7 cm보다 깊은 붕적토 지역이었다. 이러한 땅밀림의 특징을 파악하여 효과적인 선제적 대응 체계와 모니터링 시스템 구축이 필요하다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.