• 제목/요약/키워드: detecting accuracy

검색결과 959건 처리시간 0.025초

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

Development of a lateral flow dipstick test for the detection of 4 strains of Salmonella spp. in animal products and animal production environmental samples based on loop-mediated isothermal amplification

  • Wirawan Nuchchanart;Prapasiri Pikoolkhao;Chalermkiat Saengthongpinit
    • Animal Bioscience
    • /
    • 제36권4호
    • /
    • pp.654-670
    • /
    • 2023
  • Objective: This study aimed to develop loop-mediated isothermal amplification (LAMP) combined with lateral flow dipstick (LFD) and compare it with LAMP-AGE, polymerase chain reaction (PCR), and standard Salmonella culture as reference methods for detecting Salmonella contamination in animal products and animal production environmental samples. Methods: The SalInvA01 primer, derived from the InvA gene and designed as a new probe for LFD detection, was used in developing this study. Adjusting for optimal conditions by temperature, time, and reagent concentration includes evaluating the specificity and limit of detection. The sampling of 120 animal product samples and 350 animal production environmental samples was determined by LAMP-LFD, comparing LAMP-AGE, PCR, and the culture method. Results: Salmonella was amplified using optimal conditions for the LAMP reaction and a DNA probe for LFD at 63℃ for 60 minutes. The specificity test revealed no cross-reactivity with other microorganisms. The limit of detection of LAMP-LFD in pure culture was 3×102 CFU/mL (6 CFU/reaction) and 9.01 pg/μL in genomic DNA. The limit of detection of the LAMP-LFD using artificially inoculated in minced chicken samples with 5 hours of pre-enrichment was 3.4×104 CFU/mL (680 CFU/reaction). For 120 animal product samples, Salmonella was detected by the culture method, LAMP-LFD, LAMP-AGE, and PCR in 10/120 (8.3%). In three hundred fifty animal production environmental samples, Salmonella was detected in 91/350 (26%) by the culture method, equivalent to the detection rates of LAMP-LFD and LAMP-AGE, while PCR achieved 86/350 (24.6%). When comparing sensitivity, specificity, positive predictive value, and accuracy, LAMP-LFD showed the best results at 100%, 95.7%, 86.3%, and 96.6%, respectively. For Kappa index of LAMP-LFD, indicated nearly perfect agreement with culture method. Conclusion: The LAMP-LFD Salmonella detection, which used InvA gene, was highly specific, sensitive, and convenient for identifying Salmonella. Furthermore, this method could be used for Salmonella monitoring and primary screening in animal products and animal production environmental samples.

히스토그램의 최적 높이의 폭에 기반한 3차원 필름 영상 검사 (3D Film Image Inspection Based on the Width of Optimized Height of Histogram)

  • 이재은;김종남
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.107-114
    • /
    • 2022
  • 3차원 필름 영상을 양품 또는 불량품으로 분류하기 위해서는 필름의 영상 내 무늬를 검출해야 한다. 하지만 만약 필름 내 화소의 명암이 낮다면 영상 내 무늬가 선명하지 않아서 분류하기가 쉽지 않다. 본 논문에서는 3D 필름 영상들의 히스토그램을 구한 후, 각 히스토그램의 특정 빈도에서의 폭을 비교하여 정품과 불량품으로 분류하는 방법을 제안한다. 실험을 통하여 정품과 불량품의 히스토그램이 뚜렷하게 다르다는 것을 보였으며, 이러한 특징을 반영한 제안 알고리즘을 이용하여 히스토그램의 특정 빈도에서 모든 3D 필름 영상들이 정확하게 분류되는 것을 보였다. 기존에 연구된 방법들인 차영상, 오츠의 이진화 알고리즘, 캐니 엣지, 모폴로지 지오데식 엑티브 컨투어, 그리고 서포트 벡터 머신과의 성능 비교를 통하여 제안한 알고리즘의 성능이 가장 우수함을 검증하였으며, 영상 내 무늬를 검출할 필요 없이도 우수한 분류 정확도를 얻을 수 있다는 것을 보였다.

유전자변형 면화 MON757, MON88702, COT67B, GHB811의 동시검출법 개발 (Development of simultaneous detection method for living modified cotton varieties MON757, MON88702, COT67B, and GHB811)

  • 김일룡;설민아;윤아미;이중로;최원균
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.415-422
    • /
    • 2021
  • 면화는 중요한 섬유 작물로 종자는 가축의 사료로 사용된다. 작물 생명공학은 농업 분야에서 농업적 형질과 질을 향상시키기 위해 활용되어져 왔다. 국내 식품, 사료, 가공 제품에 유전자변형(LM) 면화의 사용이 증가함에 따라 환경으로의 LM 면화의 비의도적 유출 또한 증가하고 있다. LMO 모니터링 사업에서 수집된 LM 면화를 검정하기 위하여 국내 수입 승인된 LM 면화의 검출법 개발이 필요하다. 본 연구에서는 LM 면화 MON757, MON88792, COT67B, GHB811 4종을 대상으로 동시검출법을 개발하였다. 이벤트에 대한 유전 정보는 유럽 JRC와 농림축산검역본부에서 확보하였다. LM 면화의 동시검출법 개발을 위해 이벤트 특이적인 프라이머를 설계하였으며 특이적인 증폭을 확인하였다. 특이도 검정, 무작위 표준물질 혼합물 분석, 검출한계 분석을 통하여 동시검출법의 정확도와 특이도를 검증하였다. 그 결과 본 동시검출법은 각각의 이벤트를 검출할 수 있으며 LM 표준물질을 활용하여 특이도를 검정하였다. 또한 무작위 표준물질 조합도 정확하게 검출할 수 있다. 검출한계 분석에서는 25 ng의 미량의 주형 DNA로 단회 분석으로 검출이 가능하다. 결론적으로 4종의 LM 면화 동시검출법을 개발하였으며 LM 면화 자생체 분석에 활용될 것으로 사료된다.

그래프 임베딩을 활용한 코로나19 가짜뉴스 탐지 연구 - 사회적 참여 네트워크의 이용 여부에 따른 탐지 성능 비교 (A study on the detection of fake news - The Comparison of detection performance according to the use of social engagement networks)

  • 정이태;안현철
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.197-216
    • /
    • 2022
  • 인터넷 및 모바일 기술의 발달과 소셜미디어의 확산으로 인해 다량의 정보들이 온라인 상에서 생성, 유통되고 있다. 이중에는 대중에게 도움이 되는 유익한 정보들도 있지만, 역기능을 하는 이른바 가짜뉴스들도 함께 유통되고 있다. 지난 2020년 코로나19의 전세계적인 확산 이후, 온라인 상에는 이와 관련한 수많은 가짜뉴스들이 유통되었다. 다른 가짜뉴스들과 달리 코로나19와 관련된 가짜뉴스는 사람들의 건강, 나아가 생명까지 위협할 수 있다는 점에서 그 심각성이 매우 크다고 할 수 있다. 때문에 코로나19와 관련한 가짜뉴스를 자동으로 탐지하고, 이를 예방하는 지능형 기술은 사회적 건강도를 제고하는데 매우 의미 있는 연구주제라 할 수 있다. 이러한 배경에서 본 연구에서는 코로나19 관련 가짜뉴스 탐지를 효과적으로 수행하기 위해 그래프 임베딩 방법 중 하나인 Graph2vec을 활용한 방법을 제안한다. 가짜뉴스 탐지에 대한 주류 방법은 뉴스 콘텐츠 기반 즉, 텍스트에 대한 특징 분석으로 진행되었으나 본 연구에서는 사회적 참여 네트워크 내에서의 정보 전달 관계를 추가로 활용함으로써 보다 효과적으로 코로나19와 관련된 가짜뉴스를 탐지할 수 있었으며 성능 측면에서 정확도 향상을 확인할 수 있었다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

CodeBERT 모델의 전이 학습 기반 코드 공통 취약점 탐색 (Detecting Common Weakness Enumeration(CWE) Based on the Transfer Learning of CodeBERT Model)

  • 박찬솔;문소영;김영철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.431-436
    • /
    • 2023
  • 소프트웨어 공학 영역에 인공지능의 접목은 큰 화두 중 하나이다. 전 세계적으로 1) 인공지능을 통한 소프트웨어 공학, 2) 소프트웨어 공학을 통한 인공지능 두 가지 방향으로 활발히 연구되고 있다. 그 중 소프트웨어 공학에 인공지능을 접목하여 나쁜 코드 영역을 식별하고 해당 부분을 리팩토링하는 연구가 진행되고 있다. 해당 연구에서 인공지능이 나쁜 코드 요소의 패턴을 잘 학습하기 위해서는 학습하려는 나쁜 코드 요소가 라벨링 된 데이터셋이 필요하다. 문제는 데이터셋이 부족할뿐더러, 자체적으로 수집한 데이터셋의 정확도는 신뢰할 수 없다. 이를 해결하기 위해 코드 데이터 수집 시 전체 코드가 아닌 높은 복잡도를 가진 코드 모듈 영역을 대상으로만 나쁜 코드 데이터를 수집한다. 이후 수집한 데이터셋을 CodeBERT 모델의 전이 학습하여 코드 공통 취약점을 탐색하는 방법을 제안한다. 해당 데이터셋을 통해 CodeBERT 모델이 코드의 공통 취약점 패턴을 더 잘 학습할 수 있다. 이를 통해 전통적인 방법보다 인공지능 모델을 이용해 코드를 분석하고 공통 취약점 패턴을 더 정확하게 식별할 수 있을 것으로 기대한다.

서포트벡터머신 기반 PVDF 센서의 결함 예측 기법 (Fault Detection Technique for PVDF Sensor Based on Support Vector Machine)

  • 김승욱;이상민
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.785-796
    • /
    • 2023
  • 본 연구에서는 구조물 건전성 모니터링에 널리 활용되고 있는 PVDF(: Polyvinylidene fluoride) 센서에 나타날 수 있는 결함을 실시간으로 분류 및 예측하기 위한 방법론을 제안하였다. 센서 부착 환경에 따라 나타나는 센서의 결함 유형을 분류하였고, 임팩트 해머를 이용한 충격 시험을 수행하여 결함 유형에 따른 출력 신호를 획득하였다. 결함 유형에 따른 출력 신호간의 차이를 식별하기 위해 이들의 시간영역 통계 특징을 추출하여 데이터 집합을 구축하였다. 머신러닝 기반 분류 알고리즘들 중 센서 결함 유형 감지에 가장 적합한 알고리즘 선정을 위해 구축한 데이터 집합의 학습 및 이에 따른 결과를 분석하였고, 이들 중 SVM(: Support vector machine)이 가장 높은 성능을 보임을 확인하였다. 선정된 SVM 알고리즘의 추가적인 정확도 향상을 위해 하이퍼 파라미터 최적화 작업을 수행하였으며, 결과적으로 92.5%의 정확도로 센서 결함 유형을 분류하였고 이는 타 분류 알고리즘에 비하여 최대 13.95% 높은 정확도를 보였다. 본 연구에서 제안한 센서 결함 예측 기법은 PVDF 센서뿐만 아니라 실시간 구조물 건전성 모니터링을 위한 다양한 센서의 신뢰성을 확보하기 위한 기반 기술로 활용될 수 있을 것으로 사료된다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

큐싱 공격 탐지를 위한 AutoML 머신러닝 기반 악성 URL 분류 기술 연구 및 서비스 구현 (AutoML Machine Learning-Based for Detecting Qshing Attacks Malicious URL Classification Technology Research and Service Implementation)

  • 김동영;황기성
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.9-15
    • /
    • 2024
  • 최근 정부 기관을 사칭한 가짜 QR(Quick Response)코드를 이용하여 개인정보와 금융정보를 탈취하는 QR코드와 스미싱을 결합한 '큐싱(Qshing)' 공격이 증가하는 추세이다. 특히, 이 공격 방식은 사용자가 단지 QR코드를 인식하는 것만으로 스미싱 페이지에 연결되거나 악성 소프트웨어를 다운로드하게 만들어 피해자가 자신이 공격당했는지조차 인지하기 어려운 특징이 있다. 본 논문에서는 머신러닝 알고리즘을 활용해 QR 코드 내 URL의 악성도를 파악하는 분류 기술을 개발하고, 기존의 QR 코드 리더기와 결합하는 방식에 관해 연구를 진행하였다. 이를 위해 QR코드 내 악성 URL 128,587개, 정상 URL 428,102개로부터 프로토콜, 파라미터 등 각종 특징 35개를 추출하여 데이터셋을 구축한 후, AutoML을 이용하여 최적의 알고리즘과 하이퍼파라미터를 도출한 결과, 약 87.37%의 정확도를 보였다. 이후 기존 QR코드 리더기와 학습한 분류 모델의 결합을 설계하여 큐싱 공격에 대응할 수 있는 서비스를 구현하였다. 결론적으로, QR코드 내 악성 URL 분류 모델에 최적화된 알고리즘을 도출하고, 기존 QR코드 리더기에 결합하는 방식이 큐싱 공격의 대응 방안 중 하나임을 확인하였다.