• 제목/요약/키워드: Label Information

검색결과 732건 처리시간 0.028초

GEMS 영상과 기계학습을 이용한 산불 연기 탐지 (Detection of Wildfire Smoke Plumes Using GEMS Images and Machine Learning)

  • 정예민;김서연;김승연;유정아;이동원;이양원
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.967-977
    • /
    • 2022
  • 산불의 발생과 강도는 기후 변화로 인하여 증가하고 있다. 산불 연기에 의한 배출가스 대기질과 온실 효과에 영향을 미치는 주요 원인 중 하나로 인식되고 있다. 산불 연기의 효과적인 탐지를 위해서는 위성 산출물과 기계학습의 활용이 필수적이다. 현재까지 산불 연기 탐지에 대한 연구는 구름 식별의 어려움 및 모호한 경계 기준 등으로 인한 어려움이 존재하였다. 본 연구는 우리나라 환경위성 센서인 Geostationary Environment Monitoring Spectrometer (GEMS)의 Level 1, Level 2 자료와 기계학습을 이용한 산불 연기 탐지를 목적으로 한다. 2022년 3월 강원도 산불을 사례로 선정하여 산불 연기 레이블 영상을 생성하고, 랜덤 포레스트 모델에 GEMS Level 1 및 Level 2 자료를 투입하여 연기 픽셀 분류 모델링을 수행하였다. 훈련된 모델에서 입력변수의 중요도는 Aerosol Optical Depth (AOD), 380 nm 및 340 nm의 복사휘도 차, Ultra-Violet Aerosol Index (UVAI), Visible Aerosol Index (VisAI), Single Scattering Albedo (SSA), 포름알데히드, 이산화질소, 380 nm 복사휘도, 340 nm 복사휘도의 순서로 나타났다. 또한 2,704개 픽셀에 대한 산불 연기 확률(0≤p≤1) 추정에서 Mean Bias Error (MBE)는 -0.002, Mean Absolute Error (MAE)는 0.026, Root Mean Square Error (RMSE)는 0.087, Correlation Coefficient (CC)는 0.981의 정확도를 보였다.

배암차즈기의 투여가 고형암환자에 미치는 영향을 평가하기 위한 선행적 인체적용시험 (Effect of Salvia plebeia Extract on Patients with Solid Cancer: A Preliminary Clinical Trial Protocol)

  • 이보람;표숙진;김애란;곽은빈;최장기;유화승;정환석;조종관
    • 대한한의학방제학회지
    • /
    • 제30권4호
    • /
    • pp.241-248
    • /
    • 2022
  • Objective : The purpose of this trial is to observe the preliminary effects of Salvia plebeia (SP) extract on quality of life in patients with solid cancer. Methods : This is a prospective, open-label, single-arm, and single-dose clinical trial. Twenty participants who have been diagnosed with solid cancer between the ages of 20 and 65 will be included. All participants will be administered SP granules for 12 weeks. Data will be collected at 4, 8, and 12 weeks after enrollment. The primary outcome is quality of life, using the Korean version of the Functional Assessment Cancer Therapy-General questionnaire. Secondary outcomes include tumor markers in blood tests for each cancer type, soluble programmed death-ligand 1, the percentage of natural killer cells among lymphocytes, ratio of T-helper and T-suppressor cells, ratio of total T, T-helper, T-suppressor, and B cells in lymphocytes, level of C-reactive protein, and tumor size via radiology examination. Safety will be assessed by clinical laboratory tests and monitoring of adverse events. Discussion : This study aims to observe the effects of an oral administration of SP preparations in patients with solid cancer on changes in quality of life and an improvement in immune function. It is expected to provide objective evidence of the effect and safety of SP for patients with solid cancer. Trial registration: KCT0007315 (Clinical Research Information Service)

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

국내 온라인 유통 복어 제품의 종판별 및 표시사항 모니터링 연구 (Species Identification and Monitoring of Labeling Compliance for Commercial Pufferfish Products Sold in Korean On-line Markets)

  • 이지영;김건희;강태선
    • 한국식품위생안전성학회지
    • /
    • 제38권6호
    • /
    • pp.464-475
    • /
    • 2023
  • 본 연구에서는 온라인 마켓에서 판매되는 50개 복어제품의 종판별 및 표시사항 일치여부 모니터링을 수행했다. 복어의 종판별을 위해 cytochrome c oxidase subunit I 및 cytochrome b 유전자의 염기서열을 분석하여 NCBI GenBank 데이터베이스에 등록되어있는 생물종의 염기서열과 비교 후 계통 분석을 수행했다. 참복, 흰점참복, 까치복, 복섬, 검복, 국매리복, 흑밀복 총 7종이 동정되었으며, 35개 제품(70%)에서 표시사항과의 불일치를 나타냈다. 12개의 제품(24%)에서는 식품공전에서 제시한 식용 가능한 복어 21종의 국명 대신 일반명(복어)을 사용하였다. 가공 정도별 불일치율은 다중가공 제품(n=9, 81.8%)이 단순가공 제품(n=26, 66.7%)보다 높은 비율을 보였으며, 원산지별 불일치율의 경우 중국산 제품(n=8, 80%)이 국산 제품(n=26, 66.7%)보다 높은 비율을 보였다. 시장명, 방언 등의 이름이 혼용되어 다수의 복어종을 밀복, 졸복으로 표시하였다. 이러한 분류체계의 어려움으로 인해 흰점참복, 국매리복과 같은 식용불가 복어가 식용 가능한 복어인 졸복으로 혼용되어 판매되는 것이 확인되었다. 따라서 식용 가능한 복어를 정확히 분류할 수 있는 방법의 개발이 필요하며, 수입 및 국내 유통 복어 제품의 주기적인 모니터링이 필요하다.

멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합 (Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images)

  • 배혜림;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.505-518
    • /
    • 2023
  • 3차원 포인트 클라우드 의미적 분할은 각 포인트별로 해당 포인트가 속한 물체나 영역의 분류 레이블을 예측함으로써, 포인트 클라우드를 서로 다른 물체들이나 영역들로 나누는 컴퓨터 비전 작업이다. 기존의 3차원 의미적 분할 모델들은 RGB 영상들에서 추출하는 2차원 시각적 특징과 포인트 클라우드에서 추출하는 3차원 기하학적 특징의 특성을 충분히 고려한 특징 융합을 수행하지 못한다는 한계가 있다. 따라서, 본 논문에서는 2차원-3차원 멀티-모달 특징을 이용하는 새로운 3차원 의미적 분할 모델 MMCA-Net을 제안한다. 제안 모델은 중기 융합 전략과 멀티-모달 교차 주의집중 기반의 융합 연산을 적용함으로써, 이질적인 2차원 시각적 특징과 3차원 기하학적 특징을 효과적으로 융합한다. 또한 3차원 기하학적 인코더로 PTv2를 채용함으로써, 포인트들이 비-정규적으로 분포한 입력 포인트 클라우드로부터 맥락정보가 풍부한 3차원 기하학적 특징을 추출해낸다. 본 논문에서는 제안 모델의 성능을 분석하기 위해 벤치마크 데이터 집합인 ScanNetv2을 이용한 다양한 정량 및 정성 실험들을 진행하였다. 성능 척도 mIoU 측면에서 제안 모델은 3차원 기하학적 특징만을 이용하는 PTv2 모델에 비해 9.2%의 성능 향상을, 2차원-3차원 멀티-모달 특징을 사용하는 MVPNet 모델에 비해 12.12%의 성능 향상을 보였다. 이를 통해 본 논문에서 제안한 모델의 효과와 유용성을 입증하였다.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

소셜미디어 분석을 통한 소비자들의 L-글루타민산나트륨에 대한 인식 조사 (Consumers Perceptions on Monosodium L-glutamate in Social Media)

  • 이수연;이원성;문일철;권훈정
    • 한국식품위생안전성학회지
    • /
    • 제31권3호
    • /
    • pp.153-166
    • /
    • 2016
  • 본 연구에서는 소셜미디어 콘텐츠를 소프트웨어 시스템을 이용하거나 정성적으로 분석함으로써 L-글루타민산나트륨에 대한 소비자 인식도를 조사하고자 하였다. 첫 번째로, 1년 (2013.7~2014.6)의 기간 동안 네이버와 카페에서 작성된 글들을 수집하였으며, 수집한 문서들을 무료 텍스트 분석 소프트웨어인 TONK를 사용하여 분석하였다. 블로그와 카페에서 작성된 글들은 주로 L-글루타민산나트륨의 사용과 관련된 음식점 후기 및 MSG (L-글루타민산나트륨)-무첨가 제품에 대한 홍보 내용을 담은 글들로 파악되었으며, 기타 L-글루타민산나트륨의 안전성 또는 식품첨가물 제거법에 대한 내용으로 파악되었다. 두 번째로, 네이버 트렌드 검색 서비스를 이용하여 L-글루타민산나트륨에 대한 검색량 증가 구간에 발생한 언론보도 사건을 조사하였다. PC 검색량의 경우 총 5개 증가 구간 중 3개의 구간에서, 모바일 검색량의 총 9개 증가 구간 중 6개의 구간에서 시사 프로그램에서 L-글루타민산나트륨에 대해 보도한 것으로 나타났다. 나머지 구간에서는 일간지나 TV 뉴스로 기사를 보도한 구간들로 나타났다. 세 번째로 식품의약품안전처의 L-글루타민산나트륨의 안전성 발표를 보도한 연합뉴스의 댓글을 분석하였다. 공감수 100개 이상인 댓글의 내용을 분석한 결과, L-글루타민산나트륨의 안전성, 질 낮은 재료의 사용 지적, MSG (L-글루타민산나트륨) 과다사용에 대한 우려, 정부 불신을 표현하는 댓글들이 파악되었다. 시판 제품들의 표시사항을 분석한 결과, 일일섭취허용량을 설정할 필요가 없을 정도로 안전한 식품첨가물임에도 불구하고 L-글루타민산나트륨을 첨가하지 않은 제품들은 L-글루타민산나트륨 무첨가라는 표시를 강조하고 있는 것으로 조사되었다. 이는 국가기관, 교육청과 지방자치단체에서 MSG 미사용을 원칙으로 제도를 운용하고 있어 이러한 정책이 산업계와 소비자 인식에 영향을 미쳤을 가능성도 고려해볼 수 있다. 본 연구 결과 소비자들은 대체로 소셜 미디어를 이용하여 검색하거나 관련 제품을 구매하고자 할 때 L-글루타민산나트륨을 사용하지 않는 것이 좋다는 인식을 하게 될 가능성이 있는 것으로 파악되며, L-글루타민산나트륨의 과다 사용에 관심이 있는 것으로 나타났다. TV 시사 프로그램에서 방송하거나 일간지 또는 TV 뉴스에서 기사를 보도할 경우 네이버 검색량이 증가하였으며, 검색량 증가구간은 PC 환경에서보다는 모바일 환경에서 더욱 증가하는 것으로 나타났다. 따라서 L-글루타민산나트륨과 관련한 커뮤니케이션 수단으로 소비자들이 관심있어 하는 방송프로그램, 뉴스 프로그램 등 언론을 활용하고, PC보다는 모바일을 통하여 소비자에게 접근한다면 효과적으로 소비자에게 정보를 전달할 수 있을 것이다.

레토르트식품에 함유되어 있는 당 함량 분석 (Sugar Contents Analysis of Retort Foods)

  • 정다운;임준;김천회;김영경;박윤진;정윤화;엄애선
    • 한국식품영양과학회지
    • /
    • 제44권11호
    • /
    • pp.1666-1671
    • /
    • 2015
  • 본 연구에서는 서울 및 경기 지역에서 유통되고 있는 레토르트식품 중 카레류 21건, 짜장류 16건, 소스류 17건, 고기류 16건인 총 70건을 수거하여 당 함량을 분석하였다. 분석결과 값과 제품의 영양성분표에 표시된 당 함량을 비교하여 제품에 표시된 당 함량이 소비자에게 신뢰성 있는 영양정보를 제공하는지 확인하기 위해 연구를 진행하였으며 식품공전의 방법에 따라 실험하였다. 분석 결과 카레류, 짜장류, 소스류, 고기류 제품의 전체 당 함량 분포는 $0.35{\pm}0.02{\sim}25.44{\pm}0.78g/100g$을 보였으며, 그중 소스류가 $0.35{\pm}0.02{\sim}25.44{\pm}0.78g/100g$으로 상대적으로 가장 높은 함량 분포를 보였고, 고기류 $1.98{\pm}0.08{\sim}11.07{\pm}0.10g/100g$, 짜장류 $1.76{\pm}0.02{\sim}5.16{\pm}0.00g/100g$, 카레류 $1.05{\pm}0.03{\sim}4.63{\pm}0.03g/100g$의 순서임을 확인하였다. 이는 제품에 표시된 영양성분 함량 대비 소스류 18~118%, 고기류 70~119.8%, 짜장류 29~118%, 카레류 40~119.5%였으며, 분석 결과는 제품에 표시된 당 함량 대비 120% 미만으로 레토르트식품 70건 모두 허용 오차 기준을 준수하고 있어 소비자에게 신뢰성 있는 영양성분표시 정보를 제공하고 있음을 확인하였다. 가공식품의 선택 및 구매 시 제품의 영양성분표에 표시된 당 함량을 확인하여 WHO의 하루 당 섭취 권고량인 50 g의 범위를 넘지 않도록 당 함량이 적은 제품을 선택하도록 하고, 산업체에서도 물엿이나 설탕과 같은 당 성분의 사용을 줄이도록 노력해야 할 것이다. 이상의 결과로 소비자들이 식품에 표시된 당 함량의 확인을 통하여 건강에 적합한 식품을 구매할 수 있을 것으로 판단되며, 지속적으로 영양표시의무 식품을 대상으로 하여 영양성분 함량 표시 조사 연구가 필요하다고 생각된다.

해양 이상 자료 탐지를 위한 오토인코더 활용 기법 최적화 연구 (An Outlier Detection Using Autoencoder for Ocean Observation Data)

  • 김현재;김동훈;임채욱;신용탁;이상철;최영진;우승범
    • 한국해안·해양공학회논문집
    • /
    • 제33권6호
    • /
    • pp.265-274
    • /
    • 2021
  • 해양 이상 자료 탐지의 연구는 이전부터 활발하게 이루어지고 있으며, 통계 및 거리 기반의 기계 학습 알고리즘을 활용하는 기법들이 개발되었다. 최근에는 AI 기반의 해양 자료 이상 탐지 기법이 많은 관심을 받고 있으며, AI를 활용한 해양 이상 자료 탐지 기법은 정답이 주어지는 지도학습 기법이 주를 이루고 있다. 이러한 방법은 학습에 필요한 모든 자료에 수작업으로 분류 정보(라벨)를 지정해야 한다는 점에서 많은 시간과 비용이 요구된다. 본 연구에서는 이러한 문제를 극복하기 위해 비지도학습 기반의 오토인코더를 이상 자료 탐지 기법에 사용하였다. 실험으로는 오토인코더의 평가를 위해 단변수·다변수학습 두가지 실험을 구성하였고, 단변수 학습은 기상청에서 제공하는 덕적도 부이 정점 관측 자료 중 수온만 사용하였으며, 다변수 학습은 수온과 기온, 풍향, 풍속, 기압, 습도 등을 사용하였다. 사용기간은 1996~2020년의 25년간이며 학습 자료에 해양-기상 자료의 특성을 고려한 전처리 기법을 적용하였다. 학습된 다변수와 단변수 오토인코더를 활용하여 실제 표층 수온에 대한 이상 탐지를 시도하였다. 모델성능 비교를 위해 오차를 삽입한 합성 자료에 다변수와 단변수 오토인코더를 포함한 여러 이상 탐지 기법을 적용하여 정량적으로 평가하였으며, 다변수/단변수의 정확도가 각각 약 96%/91%로써 다변수 오토인코더가 더 나은 이상자료 탐지 성능을 보였다. 오토인코더를 이용한 비지도학습 기반 이상 탐지 기법은 주관적 판단에 의한 오류와 자료 라벨링에 필요한 시간과 비용을 줄일 수 있다는 점에서 다양하게 활용될 것으로 판단된다.