• 제목/요약/키워드: 레이블링 데이터

검색결과 96건 처리시간 0.035초

음운 자동 레이블링 시스템의 처리단위에 의한 성능비교 (Performance compare by the processing unit of the automatic phoneme labelling system)

  • 박순철;김태환;김봉완;이용주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-177
    • /
    • 1999
  • 본 논문에서는 레이블링 시스템에서 기본단위로 새롭게 제안된바 있는 demiphone의[1] 성능을 평가하기 위하여 monophone과 triphone, demiphone을 단위로 하는 레이블링 시스템을 구축하여 demiphone의 성능을 평가하였다. 음성 데이터 베이스는 PBW 452단어를 대상으로 남자 30명분의 데이터를 훈련에 사용하였으며, 훈련에 사용하지 않는 남자 4명분의 데이터를 시스템의 평가에 사용하였다. 평가결과 demiphone을 사용한 경우 경계오차가 20ms 이하의 경우에는 monophone에 비하여 6.31%, triphone에 비해 6.21%로 성능이 우수하다. 그리고, 40ms 이하의 경우에는 각각 4.33% 와 3.68%의 성능 향상을 가져왔다.

  • PDF

프롬프트 튜닝기법을 적용한 한국어 속성기반 감정분석 (Prompt Tuning For Korean Aspect-Based Sentiment Analysis)

  • 김봉수;전현규;최승호;김지윤;장정훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-55
    • /
    • 2023
  • 속성 기반 감정 분석은 텍스트 내에서 감정과 해당 감정이 특정 속성, 예를 들어 제품의 특성이나 서비스의 특징에 어떻게 연결되는지를 분석하는 태스크이다. 본 논문에서는 속성 기반 감정 분석 데이터를 사용한 다중 작업-토큰 레이블링 문제에 프롬프트 튜닝 기법을 적용하기 위한 포괄적인 방법론을 소개한다. 이러한 방법론에는 토큰 레이블링 문제를 시퀀스 레이블링 문제로 일반화하기 위한 감정 표현 영역 검출 파이프라인이 포함된다. 또한 분리된 시퀀스들을 속성과 감정에 대해 분류 하기 위한 템플릿을 선정하고, 데이터셋 특성에 맞는 레이블 워드를 확장하는 방법을 제안함으써 모델의 성능을 최적화한다. 최종적으로, 퓨샷 세팅에서의 속성 기반 감정 분석 태스크에 대한 몇 가지 실험 결과와 분석을 제공한다. 구축된 데이터와 베이스라인 모델은 AIHUB(www.aihub.or.kr)에 공개되어 있다.

  • PDF

벡터 표현을 기반으로 한 XML 동적 레이블링 기법 (XML Dynamic Labeling Scheme Based On Vector Representation)

  • 홍석희
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.14-23
    • /
    • 2014
  • 인터넷 상에서 광범위한 데이터 교환 및 저장의 수단으로 XML에 대한 많은 연구가 진행되어왔다. 특히, XML 문서에 대한 구조 정보를 검색하기 위해서 XML 트리의 각 노드에 레이블을 부여하는 레이블링 기법에 대한 연구가 요구되었다. 레이블링 기법은 각 노드에 레이블을 할당하여 XML 트리 상에서 조상-후손 또는 부모-자식 등의 구조 정보를 검색 할 수 있게 한다. 또한, 레이블링 기법은 기존의 레이블들에 영향을 주지 않도록 동적인 XML 문서 환경을 효율적으로 지원해야 하는 요구 사항을 가진다. 본 논문에서 제안하는 레이블링 기법은 벡터 표현 방식을 기반으로 동적인 XML 문서의 변경을 효율적으로 지원하고 레이블의 길이를 줄임으로서 XML 문서의 레이블 크기를 작게 하여 저장 공간을 적게 요구할 뿐 아니라 검색시간을 향상시킨다. 성능 실험을 통하여 기존의 레이블링 기법보다 레이블 크기와 검색 시간 등에서 우수함을 보인다.

물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발 (Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model)

  • 임송원;박구만
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.386-398
    • /
    • 2020
  • 본 논문에서는 물체인식 딥러닝 모델을 구성하는데 필요한 데이터 레이블링 과정을 하나의 프로그램에서 사용할 수 있는 Annotation 툴을 개발했다. 프로그램의 인터페이스는 파이썬의 기본 GUI 라이브러리를 활용하였으며, 실시간으로 데이터 수집이 가능한 크롤러 기능을 구성하였다. 기존의 물체인식 딥러닝 모델인 Retinanet을 활용하여, 자동으로 Annotation 정보를 제공하는 기능을 구현했다. 또한, 다양한 물체인식 네트워크의 레이블링 형식에 맞추어 학습할 수 있도록 Pascal-VOC, YOLO, Retinanet 등 제각기 다른 학습 데이터 레이블링 형식을 저장하도록 했다. 제안하는 방식을 통해 국산 차량 이미지 데이터셋을 구축했으며, 기존의 물체인식 딥러닝 네트워크인 Retinanet과 YOLO 등에 학습하고, 정확도를 측정했다. 차량이 진입하는 영상에서 실시간으로 차량의 모델을 구별하는 정확성은 약 94%의 정확도를 기록했다.

동적 XML 데이타 스트링의 안전한 질의 처리를 위한 효율적인 접근제어 레이블링 (Efficient Access Control Labeling for Secure Query Processing on Dynamic XML Data Streams)

  • 안동찬;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.180-188
    • /
    • 2009
  • 유비쿼터스 데이타 스트림 환경에서 동적 XML 데이타 스트림에 대한 효율적이고 안전한 접근제어 기법은 최근에 활발한 연구분야가 되어왔다. 본 논문에서 동적 XML 데이타 스트림 환경에서 효율적이고 안전한 접근제어를 위한 향상된 롤-기반 소수 레이블링 기법을 제안한다. 또한 지속적으로 갱신되는 XML 문서의 효율적인 레이블링 기법과 효율적이고 안전한 접근제어를 위한 기존연구의 문제점을 지적한다. 제안하는 향상된 레이블링 기법은 문서가 갱신될 때 다시 레이블링 하지 않고도 노드 사이의 조상-후손 관계와 형제 관계를 유지할 수 있으며, 레이블의 충돌 없이 XML 트리에 임의의 지속적인 노드 삽입 또는 갱신을 지원한다. 또한, 롤-기반 소수 레이블링 기법을 통해 효율적인 접근제어를 구현하였다. 끝으로 본 논문의 제안 방법이 효율적이고 안전함을 실험을 통해 보여줄 것이다.

엣지 디바이스와 카메라 센서 퓨전을 활용한 사람 자세 데이터 자동 수집 시스템 (An Automatic Data Collection System for Human Pose using Edge Devices and Camera-Based Sensor Fusion)

  • 김영근;김승현;김정곤;김원중
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.189-196
    • /
    • 2024
  • 지능형 선별 관제 시스템의 잦은 오탐지로 인해 관제 요원들의 업무 능률 및 시장 신뢰도 저하 문제가 꾸준히 보고되고 있다. 오탐지 문제 개선을 위해 새 AI 모델을 개발하거나 교체하는 것은 기회비용이 크므로, 훈련 데이터 세트 품질을 향상하여 문제를 개선하는 것이 현실적이다. 그러나 소규모 조직은 데이터 세트 수집 및 정제 역량이 부족한 실정이다. 이에 본 논문에서는 사람 자세 추정 모델을 중심으로 엣지 디바이스와 카메라 센서 퓨전을 활용한 사람 자세 데이터 자동 수집 시스템을 제안한다. 이 시스템은 네트워크 말단에서 현장 데이터를 직접 수집하고 레이블링하는 과정을 실시간으로 처리하도록 만들어, 중앙으로 집중되는 연산 부하를 분산시킨다. 또한 현장 데이터를 직접 레이블링하므로 새로운 훈련 데이터 구축에 도움을 준다.

칼라-공간 히스토그램의 통계 정보를 이용한 자연 영상의 영역 분할 및 레이블링 기법 (Natural Image Segmentation and Labeling Technique by Color-Spatial Histogram and Statistics)

  • 신수연;김우생
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.154-159
    • /
    • 2002
  • 영역 분할과 영역 레이블링은 내용에 기반한 영상 검색이나 영상 이해를 위해 선행되어야 하는 중요한 작업중의 하나이다. 본 논문에서는 칼라-공간 히스토그램의 통계정보를 통해 자연 영상내의 영역을 효율적으로 분할하고 또한 이러한 데이터를 생성규칙으로 만들어 레이블링 하는 새로운 방법을 제안한다. 제안하는 방법은 자연영상처럼 많지 않은 영역으로 이루어진 경우 매우 효율적임을 보였다.

  • PDF

변형된 비속어 탐지를 위한 토큰 분류 (Token Classification for Detecting Modified Profanity)

  • 고성민;신유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.498-499
    • /
    • 2023
  • 비속어 탐지 기법으로 주로 사용되는 비속어 데이터베이스 활용 방식 혹은 문장 자체를 혐오, 비혐오로 분류하는 방식은 변형된 비속어 탐지에 어려움이 있다. 본 논문에서는 자연어 처리 태스크 중 하나인 개체명 인식 방법에서 착안하여 시퀀스 레이블링 기반의 비속어 탐지 방법을 제안한다. 한국어 악성 댓글 중 비속어 부분에 대해 레이블링 된 데이터셋을 구축하여 실험을 진행하고, 이를 통해 F1-Score 약 0.88 의 결과를 보인다.

Slice 정보에 기반한 3차원 볼륨 데이터의 레이블링 알고리즘 (A Slice Information Based Labeling Algorithm for 3-D Volume Data)

  • 최익환;최현주;이병일;최흥국
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.922-928
    • /
    • 2004
  • 본 논문에서는 볼륨데이타에서의 레이블링(labeling)을 위한 알고리즘을 제안하고자한다. 3차원 볼륨은 2차원 슬라이스 데이타의 연속으로 보고 각 슬라이스의 레이블링 정보를 바탕으로 하는 SIL(Slice Information based Labeling)방법을 제안한다. 이는 기존의 알고리즘에 비해 효율적인 메모리 사용이 가능하고 분석하고자 하는 데이타의 특성에 맞는 2차원 레이블링과의 조합이 가능한 장점이 있다. 기존 알고리즘과 제안하는 방법을 3차원 세포영상에서 비교하여 보았으며, SIL을 2차원 레이블링 CCCL(Contour based Connected Component Labeling)과 함께 볼륨데이타에 적용하여 본 결과 기존의 알고리즘 보다 약 2배 빠른 성능을 보였다. 다양한 3차원 레이블링 방법 중 적용되는 영상에 따라 각기 다른 결과를 얻었지만, 3차원 세포영상의 분석에서는 SIL 방법이 우수하다는 결론을 얻었다.

동적으로 갱신가능한 XML 데이터에서 레이블 재작성하지 않는 원형 레이블링 방법 (A Circle Labeling Scheme without Re-labeling for Dynamically Updatable XML Data)

  • 김진영;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.150-167
    • /
    • 2009
  • XML은 인터넷과 유비쿼터스 환경의 데이타에 대한 저장과 교환, 출판의 목적으로 널리 사용되고 있다. XML의 광범위한 사용에 따라 XML 데이타를 효율적으로 저장하고 활용하기 위한 방법으로 레이블링 방법이 연구되고 있다. 레이블링 방법에 대한 최근 연구들은 동적으로 업데이트 가능한 XML 문서에 대한 효과적인 레이블링 방법에 중점을 두고 있다. 그러나 레이블 재작성 비용, 레이블 저장을 위한 큰 저장공간 할당 등의 문제점이 있다. 이러한 문제점은 새로운 데이타가 지속적으로 삽입될 경우 더욱 심화된다. 본 논문에서는 XML 문서를 원으로 나타냄으로써 회전수, 부모/자식원의 개념을 적용하여 전체 레이블 저장공간의 효율을 얻는 방법을 제시한다. 그리고 반지름 개념을 적용하여 동일 위치에 지속적인 새로운 데이타 삽입 시에도 레이블의 길이가 증가하지 않으면서 기존 레이블의 변경을 초래하지 않는 방법을 제시한다. 또한 실험을 통해 제안하는 원형 레이블링 방법의 우수성을 보인다. 본 논문은 XML 문서를 원으로 이해하는 새로운 시도를 한 점과 XML 문서의 크기 증가 시 레이블 저장공간의 효율을 얻을 수 있는 점과 동적 XML 환경에서 새로운 데이타의 업데이트 시에 기존 노드들에 대해 레이블 재작성을 피할 수 있는 점에 의미가 있다.