• 제목/요약/키워드: data labeling

검색결과 474건 처리시간 0.024초

해양사고 예방을 위한 사전학습 언어모델의 순차적 레이블링 기반 복수 인과관계 추출 (Sequence Labeling-based Multiple Causal Relations Extraction using Pre-trained Language Model for Maritime Accident Prevention)

  • 문기영;김도현;양태훈;이상덕
    • 한국안전학회지
    • /
    • 제38권5호
    • /
    • pp.51-57
    • /
    • 2023
  • Numerous studies have been conducted to analyze the causal relationships of maritime accidents using natural language processing techniques. However, when multiple causes and effects are associated with a single accident, the effectiveness of extracting these causal relations diminishes. To address this challenge, we compiled a dataset using verdicts from maritime accident cases in this study, analyzed their causal relations, and applied labeling considering the association information of various causes and effects. In addition, to validate the efficacy of our proposed methodology, we fine-tuned the KoELECTRA Korean language model. The results of our validation process demonstrated the ability of our approach to successfully extract multiple causal relationships from maritime accident cases.

비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법 (Method for improving video/image data quality for AI learning of unstructured data)

  • 김승희;류동주
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.55-66
    • /
    • 2023
  • 최근 전세계적으로 사회 모든 분야에서 인공지능 학습용 데이터에 관한 선행연구를 기반으로, 인공지능 학습용 데이터의 가치를 높이고 고품질 데이터를 확보하고자 하는 움직임이 늘고 있다. 따라서, 고품질 데이터를 확보하기 위한 구축사업에서는 품질관리가 매우 중요하다. 이에, 본 논문에서는 인공지능 학습용 데이터를 구축할 시 고품질데이터 확보를 위한 품질관리와 그에 따른 구축공정별 개선방안을 제시하였다. 특히, 인공지능 학습을 위해 구축되는 비정형데이터는 데이터 품질의 80% 이상이 구축과정에서 결정된다. 본 논문에서는 비정형데이터 이미지/영상데이터에 대한 품질검사를 통해 구축단계에서의 획득, data cleaning, labeling 모델에서 발생된 검사절차 및 문제 요소를 해결함으로써 고품질 데이터 확보 방안을 제시하였으며, 제시한 방안을 토대로 인공지능 학습용 데이터 구축에 참여하는 연구단체와 사업자들에게 데이터의 품질편차를 극복하기 위한 대안이 될 것으로 기대된다.

RDF 접근 제어에서 소수 그래프 레이블링을 사용한 효율적 권한 충돌 발견 (Efficient Authorization Conflict Detection Using Prime Number Graph Labeling in RDF Access Control)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.112-124
    • /
    • 2008
  • RDF와 OWL은 시맨틱 웹을 위한 두 가지 핵심 기반 기술이다. 이러한 RDF와 OWL을 이용하는, 또한 이에 관련된 많은 연구들이 최근 소개되었다. 하지만, RDF와 OWL에 대한 정보 보안 관련 연구는 미비한 실정이다. 본 논문에서는 RDF 보안 기술과 관련하여, RDF 트리플에 기반을 둔 안전한 접근제어 명세 모델을 간단히 소개한다. 다음으로 RDF 접근 제어 명세 시의 추론에 의한 권한 충돌을 효율적으로 발견하기 위하여 소수 그래프 레이블링을 기법을 활용하는 방법을 자세히 소개한다. 추론에 의한 접근 권한 충돌 문제는 비록 하위 개념에 대한 접근 권한이 허용이지만, 하위 개념은 상위 개념으로 추론될 수 있으므로, 만약 상위 개념에 대한 접근 권한이 불허로 되어 있는 경우 하위 개념 또한 허용되어서는 안 되는 문제이다. 몇 가지 실험에서는 제안하는 소수 그래프 레이블링을 사용하는 방법이 기존의 단순한 권한 충돌 발견 방법보다 현저히 나은 성능을 가짐을 보여 준다.

Mice에서 Calcein 표지를 이용한 골 변화 관찰 (Bone Changes in Femoral Bone of Mice Using Calcein Labeling)

  • 심문정
    • 대한임상검사과학회지
    • /
    • 제48권2호
    • /
    • pp.114-117
    • /
    • 2016
  • 골은 일생에 걸쳐 지속적인 재형성과장을 거치면서 유지되고 이러한 기전에 대한 연구는 골다공증을 비롯한 골대사 질환의 병태생리와 치료에 있어 큰 진전을 이루고 있다. 특히 생체 내 골형성 및 재생과정을 연구하는데 있어 형광표지자를 이용하는 방법이 널리 알려져 있는데, 그 중 calcein은 칼슘 킬레이터로 골이 새롭게 형성하는 부위에 녹색을 띔으로써 유용한 마커로 사용된다. 그러나 대부분의 골형성 연구에서 실험동물의 경우 표본제작을 할 때 크기가 작고 뼈가 부숴지기 쉬워 rat이나 rabbit을 이용하였으며, mice의 femur를 cross-section해서 관찰한 연구는 거의 없는 실정이다. 그래서 본 연구에서는 어린 mice를 실험동물로 이용하였으며, 생체 내 calcein을 4주간, 8주간 투여한 후 골 형성 변화를 형광현미경으로 관찰한 결과 8주차 쥐에서 4주차보다 진하고 골 형성 간격도 넓게 관찰된 것을 확인 할 수 있었다. Mice는 빠른 시일 내에 결과를 얻을 수 있고 부작용이 적은 장점이 있어서 앞으로 knock-out mice를 이용한 생체 내 실험에 활용하기 적합하다고 생각되며, 골형성 속도 평가 등 다양한 분야에서의 골 형성과 재생연구에 있어 기초 정보를 제공할 것으로 기대한다.

불확정적으로 색인된 이미지 데이터베이스를 개념 기반으로 검색하기 위한 자료형 (A Data Type for Concept-Based Retrieval against Image Databases Indefinitely Indexed)

  • 양재동
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.27-33
    • /
    • 2002
  • 트리플 이미지 색인 기법에는 두 가지 문제점이 있는 데 그 하나는 개념기반 이미지 검색을 지원하지 않는다는 것이고 다른 하나는 이접 레이블링(labeling)이 허용되지 않는다는 점이다. 이 문제점들을 해결하기 위해서 본 논문에서는 불확정적 퍼지 트리플(I-퍼지 트리플)이라는 새로운 이미지 색인 자료 형을 제안한다. I-퍼지 트리플에 의한 이미지 색인 방식에서는 이접 레이블링을 허용하기 때문에, 이미지 내 객체들이 꼭 확정적으로 인식될 필요가 없으며, 또 확정적으로 인식되지 않는 이미지들에 대해서도 개념 기반 이미지 정합이 가능하다. 본 논문에서 제안하는 이접 레이블링은 확장된 폐 세계 가정에 기반을 두고 있으며, 기념 기반 이미지 검색은 퍼지 술어에 의한 정합에 근거를 두고 있다. 본 논문에서는 또한 이접 레이블링에 의해 불확정적으로 색인된 이미지 데이터베이스로부터 원하는 답을 $\alpha$$\in$[0,1]확정도로 구해내는 개념기반 질의 평가 방식도 제안한다.

조경분야 탄소성적표지제도 적용실태 및 대응전략 (Status and Response Strategies of Carbon Labeling in Landscape Architecture)

  • 김정호;윤용한
    • 한국환경과학회지
    • /
    • 제24권6호
    • /
    • pp.709-720
    • /
    • 2015
  • After analyzing the actual acquisition status of carbon labeling by year and by product for the past four years, as well as its certification in the construction-related sectors of greenhouse gas emission, this study attempted to present the problems and coping strategies upon issuing the carbon labeling certification in the landscape architecture. During the period of this analysis, the carbon labelings were acquired by 134 enterprises, 267 workplaces, and 735 products, while the percentage of acquisition was highest in the regular non-durable goods(49%), followed by energy-consuming durable goods(26%), regular production goods (19%), regular durable goods(3%), and service(3%). Furthermore, the acquisition certifications in construction sectors, were highest in the various pipes/panel(8 cases), followed by concrete(6 cases), gypsum board(4 cases), and landscape architecture materials(2 cases). The landscape architecture only had two cases in the acquisition certification for the first time in 2012, which accounted for 0.27% of the entire certification products, due to the uncertainty in the process, the lack of professionalism, and the lack of comprehension. However, the study conducted on the coping strategies for carbon labeling in the landscape architecture revealed the following: (1) regular reporting system management through the division of labor in the head office and factories, (2) the building of objective DB through the adoption of data management programs such as SAP, (3) continuous promotion and vitalization of the incentive system, (4) the adoption of mandatory or preferential application system in landscaping projects, management, and bidding, (5) enhancement of elasticity in deliberation of certification by recruiting experts in the landscape architecture sectors, and (6) provision of incentives for the cooperative firms acquiring the certification and support for their participation.

해양GIS XML 응용스키마 결합방법 연구 (A study on integration of XML application schema for MGIS)

  • 오세웅;박계각;박종민;서상현
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.236-241
    • /
    • 2009
  • 분산되어 있거나 이기종의 데이터베이스 통합을 위해 많은 연구가 수행되었으며, 특히 데이터베이스 통합을 위해 데이터베이스의 스키마 매칭이 이슈가 되고 있다. 본 연구에서는 해양GIS 데이터베이스 통합을 위해 해양GIS 데이터베이스 구조를 XML 응용스키마로 변환하고 유사도 측정법과 relaxation labeling 기법을 이용하여 매칭 방법을 연구하였다. XML 응용스키마의 항목 간 유사도 측정은 각 항목이 가지고 있는 범주와 속성으로 계산하며, 각 항목이 계층간 의미적 연계관계를 적용하기 위하여 relaxation labeling 기법을 이용하여 초기 유사도 측정값에 반복적으로 적용하여 유사도 측정값의 변이를 측정하였다. 본 연구에서는 해양GIS 메타데이터 응용 스키마의 예시를 들어 알고리즘을 통한 매칭을 시도하였고, 실험 결과 알고리즘에 따른 초기 계산 값의 변화를 확인하였다.

시판 배추김치의 나트륨 함량 모니터링 (Monitoring of Sodium Content in Commercial Baechu (Kimchi Cabbage) Kimchi)

  • 문은우;이희민;김성현;서혜영
    • 한국식품영양학회지
    • /
    • 제35권6호
    • /
    • pp.537-542
    • /
    • 2022
  • This study was conducted to provide basic data on the amount of sodium and the setting of permissible error range of actual measurement, which is a problem for cabbage kimchi nutrients subject to labeling. The sample targeted was baechu (Kimchi cabbage) kimchi, which might have a large variation in sodium content by part of kimchi. Kimchi samples were collected twice from eight companies by season (spring, summer, fall, and winter). The average sodium content in kimchi samples was 619±87 mg/100 g (range, 534±63 mg/100 g to 783±40 mg/100 g). The error in average annual sodium content of abandonment kimchi (maximum value difference compared to the minimum value) was 26.8 to 64.3%. Sodium contents in kimchi produced in spring and summer were relatively low. However, deviation between individuals was large. It was found that cases exceeding the permissible error (120%) standard varied depending on the criteria for setting the amount of sodium. In addition, due to seasonal differences, sodium content in kimchi exceeded 120% of the labeling value. Thus, it is necessary to set standards suitable for characteristics of kimchi to prevent unintentional violations of labeling standards by raw materials and manufacturing processes.

물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발 (Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model)

  • 임송원;박구만
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.386-398
    • /
    • 2020
  • 본 논문에서는 물체인식 딥러닝 모델을 구성하는데 필요한 데이터 레이블링 과정을 하나의 프로그램에서 사용할 수 있는 Annotation 툴을 개발했다. 프로그램의 인터페이스는 파이썬의 기본 GUI 라이브러리를 활용하였으며, 실시간으로 데이터 수집이 가능한 크롤러 기능을 구성하였다. 기존의 물체인식 딥러닝 모델인 Retinanet을 활용하여, 자동으로 Annotation 정보를 제공하는 기능을 구현했다. 또한, 다양한 물체인식 네트워크의 레이블링 형식에 맞추어 학습할 수 있도록 Pascal-VOC, YOLO, Retinanet 등 제각기 다른 학습 데이터 레이블링 형식을 저장하도록 했다. 제안하는 방식을 통해 국산 차량 이미지 데이터셋을 구축했으며, 기존의 물체인식 딥러닝 네트워크인 Retinanet과 YOLO 등에 학습하고, 정확도를 측정했다. 차량이 진입하는 영상에서 실시간으로 차량의 모델을 구별하는 정확성은 약 94%의 정확도를 기록했다.

의료 영상에 최적화된 딥러닝 모델의 개발 (Development of an Optimized Deep Learning Model for Medical Imaging)

  • 김영재;김광기
    • 대한영상의학회지
    • /
    • 제81권6호
    • /
    • pp.1274-1289
    • /
    • 2020
  • 최근, 의료 영상 분야에서 딥러닝은 가장 활발하게 연구되고 있는 기술 중 하나이다. 충분한 데이터와 최신의 딥러닝 알고리즘은 딥러닝 모델의 개발에 중요한 요소이다. 하지만 일반화된 최적의 딥러닝 모델을 개발하기 위해서는 데이터의 양과 최신의 딥러닝 알고리즘 외에도 많은 것을 고려해야 한다. 데이터 수집부터 가공, 전처리, 모델의 학습 및 검증, 경량화까지 모든 과정이 딥러닝 모델의 성능에 영향을 미칠 수 있기 때문이다. 본 종설에서는 의료 영상에 최적화된 딥러닝 모델을 위해 개발 과정 각각에서 고려해야 할 중요한 요소들을 살펴보고자 한다.