• 제목/요약/키워드: 레이블링

검색결과 289건 처리시간 0.025초

문맥종속 반음소단위에 의한 자동 음운 레이블링 시스템의 구현 및 성능평가 (Implementation of Automatic Phoneme Labelling System Using Context-dependent Demi-phone Unit and Performance Evaluation)

  • 박순철;김태환;김봉완;이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.65-70
    • /
    • 1999
  • 음소 단위로 레이블링된 데이터베이스는 음성연구에 있어 매우 중요하다. 그러나 수작업에 의한 음소분할 및 레이블링 작업은 많은 시간과 노력이 필요하기 때문에 자동 음소분할 및 레이블링 시스템에 대한 많은 연구가 진행되고 있다. 저자들은 자동레이블링 시스템에서 레이블링 분할의 단위로monophone과 triphone의 장점을 포함하는 문맥 종속 반음소 단위 모델을 이용한 자동 음소분할 및 레이블링 시스템을 제안한바 있다[1]. 본 논문에서는 문맥종속 반음소 단위 자동음소분할 및 레이블링 시스템의 성능을 개선하기 위하여, 반음소의 단위를 개선하였다. 기존에 제안된 반음소 단위는 음소의 중점을 기준으로 left/right의 반음소 단위로 양분하였다. 본 논문에서는 음소의 길이가 120ms 이상일 경우 음소의 천이구간의 특성을 잘 나타낼 수 있도록, 음소의 앞뒤구간 각각 60ms를 전반음소와 후반음소로 나누고, 나머지 안정구간을 별도의 모델로 구성하였다. 본 논문에서 제안한 반음소 단위의 성능을 평가하기 위하여 PBW 452단어를 발성한 남자 30명분의 데이터를 이용하여 레이블링 시스템을 훈련하고, 훈련에 사용하지 않은 남자 4명분의 데이터를 이용하여 테스트 하였다. 실험결과, 기존의 반음소 단위에 비하여 10ms에서 $69.09\%$$1.65\%$, 20ms에서 $85.32\%$$1.02\%$의 성능향상을 가져왔다.

  • PDF

문맥종속 반음소단의 모델을 이용한 자동 음소분할 및 레이블링 시스템의 구현 (The Implementation of Automatic Segmentation and Labelling System Using Context-dependent Demi-phone)

  • 김태환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.351.2-356
    • /
    • 1998
  • 음소 단위로 레이블링된 데이터베이스는 음성연구에 있어 매우 중요하다. 그러나 수작업에 의한 음소분할 및 레이블링 작업은 많은 시간과 노력이 필요하기 때문에 자동 음소분할 및 레이블링 시스템에 대한 많은 연구가 진행되고 있다. 본 논문에서는 monophone과 triphone의 장점을 포함하는 문맥 종속 반음소 단위 모델을 이용한 자동 음소분할 및 레이블링 시스템을 구현하였다. 레이블링 단위로는 68개의 유사음소와 묵음 등 총 69개로 정하였으며, 음소 모델링은 연속 HMM을 사용하였다. 기존의 subword 단위모델과 본 논문에서 제안한 문맥종속 반음소 모델을 이용한 자동 음소분할 및 레이블링 시스템의 성능 비교 음소경계오차가 10ms 이내인 경우 각각 60.17%, 66.32%를 포함하여 6.15%의 향상을 보이고, 40ms 이내인 경우 90.36%, 94.27%를 포함하여 3.92%의 성능향상을 보였다.

  • PDF

XML 데이타를 위한 EP2 레이블링 스킴 (EP2 Labeling Scheme for XML Data)

  • 진주용;배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.79-81
    • /
    • 2004
  • 범위 기반 레이블링 스킴(range-based labeling scheme)을 이용하면 임의의 두 노드에 대한 조상-자손 관계를 쉽게 판별할 수 있으므로, XPath나 XQuery 형태의 질의를 효율적으로 처리할 수 있다. 그러나 노드의 삽입이 일어나는 동적인 상황에서는 불가피하게 전체 또는 일부의 레이블을 다시 할당(re-labeling)할 가능성이 있다는 문제점이 있다. 본 논문에서는 Dietz 레이블링 스킴을 개선한 EP2(extended preorder & postorder) 레이블링 스킴을 제안한다. 제안하는 스킴은 동일한 저장 공간상에서 범위 기반 레이블링 스킴에 비해 동적인 갱신에 유리하며, 기존의 구조 조인 알고리즘(structural join algorithm)을 이용하여 효율적으로 구조 질의(structural query)를 처리할 수 있다.

  • PDF

동적 XML 데이터 관리를 위한 트리 분해 기반의 소수 레이블링 기법 (A Prime Number Labeling Based on Tree Decomposition for Dynamic XML Data Management)

  • 변창우
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.169-177
    • /
    • 2011
  • 갱신 연산의 허용으로 동적 XML 데이터의 처리 효율성의 요구가 증대하면서 새로운 동적 XML 레이블링 기법들이 연구되어 왔다. 동적 XML 레이블링 기법의 핵심적인 해결 사항으로는 조상-자손-형제 관계 결정, 레이블 저장공간의 절약, 빠른 응답시간, 갱신에 의한 레이블 재작성의 최소화이다. 대표적인 동적 레이블링 기법으로 소수 기반 레이블링 기법이 있다. 소수 기반 레이블링 기법은 소수의 특성을 이용하여 조상-자손 관계를 쉽게 결정한다. 또한 새로운 엘리먼트를 삽입할 때도 기존 노드의 레이블을 재작성하는 비용이 발생되지 않는 장점을 갖고 있다. 하지만 소수를 많이 사용하면 레이블의 값이 상당히 커지게 되는 레이블 오버플로우 문제가 발생된다. 본 논문에서는 레이블 오버플로우 문제를 효과적으로 줄이는 새로운 방법을 소개한다. 제안하는 방법의 핵심 개념은 트리 분해이다. 레이블 오버플로우가 발생하면 트리를 하부 트리들로 분해하고 레이블은 각 하부 트리에 한해서 부여하는 것이다. 실험을 통해 트리 분해 기반의 소수 기반 레이블링 기법의 효과를 보인다.

대용량 XML 문서에서 효율적인 갱신을 위한 비트-패턴 기반의 XML 레이블링 기법 (XML Labeling Scheme based on Bit-Pattern for Efficient Updates of Large Volume of XML Documents)

  • 서동민;박용훈;임종태;김명호;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.130-134
    • /
    • 2010
  • 기존에 제안된 XML 레이블링 기법은 XML 문서 변경 시, 문서 내 노드들의 구조 관계를 정확하게 유지하기 위해 재레이블링을 수행하거나 한 노드의 레이블이 많은 정보를 표현할 수 있는 레이블링 기법을 사용한다. 하지만, 대용량 XML 문서 내에서의 재레이블링은 많은 비용이 요구되고, 많은 정보를 표현할 수 있는 레이블링 기법은 많은 저장 공간이 요구돼 질의 처리 성능이 저하되는 문제를 야기한다. 그래서 본 논문에서는 재레이블링을 피하고 질의 처리 성능을 향상시키기 위해 최적화된 저장 공간을 사용하는 비트-패턴 기반의 레이블링 기법을 제안한다. 제안하는 비트-패턴 기반의 레이블링 기법은 노드들의 구조관계를 하나의 비트열에 표현함으로써 기존에 제안된 레이블링 기법들에 비해 우수한 성능을 가진다.

무선 환경에서 XML 조각 스트림 질의 처리를 위한 효율적인 레이블링 기법 (Efficient Labeling Scheme for Query Processing over XML Fragment Stream in Wireless Computing)

  • 고혜경
    • 정보처리학회논문지D
    • /
    • 제17D권5호
    • /
    • pp.353-358
    • /
    • 2010
  • 전통적인 데이터베이스와 달리, XML 스트림에 대한 질의는 실시간 처리와 메모리 사용량에 제한이 있다. 이 논문에서는 XML 조각들 사이의 구조적인 관계를 빠르게 확인할 수 있는 강력한 레이블링 기법을 제안한다. 제안된 레이블링 기법은 많은 중복된 작업과 처리해야 하는 조각들의 수를 최소화하여 효율적인 질의 처리를 제공한다. 실험 결과, 제안된 레이블링 기법은 효율적으로 질의를 처리하고 메모리 사용량을 최소화 할 수 있다.

KE-T5 기반 한국어 대화 문장 감정 분류 (KE-T5-Based Text Emotion Classification in Korean Conversations)

  • 임영범;김산;장진예;신사임;정민영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.496-497
    • /
    • 2021
  • 감정 분류는 사람의 사고방식이나 행동양식을 구분하기 위한 중요한 열쇠로, 지난 수십 년간 감정 분석과 관련된 다양한 연구가 진행되었다. 감정 분류의 품질과 정확도를 높이기 위한 방법 중 하나로 단일 레이블링 대신 다중 레이블링된 데이터 세트를 감정 분석에 활용하는 연구가 제안되었고, 본 논문에서는 T5 모델을 한국어와 영어 코퍼스로 학습한 KE-T5 모델을 기반으로 한국어 발화 데이터를 단일 레이블링한 경우와 다중 레이블링한 경우의 감정 분류 성능을 비교한 결과 다중 레이블 데이터 세트가 단일 레이블 데이터 세트보다 23.3% 더 높은 정확도를 보임을 확인했다.

  • PDF

Semi-supervised learning 기법을 활용한 병리학 이미지 분석 (Semi-Supervised Learning for Pathological Image Analysis)

  • 이유진;박지영;이상민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.675-677
    • /
    • 2023
  • 본 연구는 병리학 이미지 분석에서 자주 발생하는 문제 중 하나인 레이블링 불일치 문제를 해결하고자 준지도학습(semi-supervised learning) 기법을 적용하였다. 기존의 병리 진단 과정은 정확한 판정 및 치료를 위해 전문가의 판단을 필요로 한다. 이로 인해, 시간이 매우 많이 소모되며 전문가의 피로도가 증가한다. 최근 이를 해결하고자 지도학습(supervised learning) 기법을 사용하여 업무의 피로도를 감소시키고자 하는 연구가 진행되고 있다. 하지만 병리 이미지 데이터에 대한 접근이 어렵고, 병변의 위치를 레이블링 하는 부분에서 많은 비용이 발생한다. 또한 암 병변의 스펙트럼적 특성으로 인해 레이블링 과정 속에서 레이블링 불일치 문제가 발생할 가능성이 높다. 이러한 문제를 극복하기 위해, 우리는 제한된 레이블 된 데이터와 많은 양의 레이블 되지 않은 데이터를 활용하는 준지도학습 방법론을 제안한다. 이 제안하는 방법은 필요한 수동 레이블링 작업량을 줄여, 병리학자들에게 보다 효과적인 진단 도구를 제공할 것으로 예상된다.

벡터 표현을 기반으로 한 XML 동적 레이블링 기법 (XML Dynamic Labeling Scheme Based On Vector Representation)

  • 홍석희
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.14-23
    • /
    • 2014
  • 인터넷 상에서 광범위한 데이터 교환 및 저장의 수단으로 XML에 대한 많은 연구가 진행되어왔다. 특히, XML 문서에 대한 구조 정보를 검색하기 위해서 XML 트리의 각 노드에 레이블을 부여하는 레이블링 기법에 대한 연구가 요구되었다. 레이블링 기법은 각 노드에 레이블을 할당하여 XML 트리 상에서 조상-후손 또는 부모-자식 등의 구조 정보를 검색 할 수 있게 한다. 또한, 레이블링 기법은 기존의 레이블들에 영향을 주지 않도록 동적인 XML 문서 환경을 효율적으로 지원해야 하는 요구 사항을 가진다. 본 논문에서 제안하는 레이블링 기법은 벡터 표현 방식을 기반으로 동적인 XML 문서의 변경을 효율적으로 지원하고 레이블의 길이를 줄임으로서 XML 문서의 레이블 크기를 작게 하여 저장 공간을 적게 요구할 뿐 아니라 검색시간을 향상시킨다. 성능 실험을 통하여 기존의 레이블링 기법보다 레이블 크기와 검색 시간 등에서 우수함을 보인다.

전사텍스트를 이용한 반자동 레이블링 구현 (Implement of Semi-automatic Labeling Using Transcripts Text)

  • 원동진;장문수;강선미
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.585-591
    • /
    • 2015
  • 구어 연구를 위한 전사 과정에서 문자로 표현된 발화를 녹음 음성에 연결해주는 작업을 레이블링이라고 한다. 기존 레이블링 도구들은 대부분 수동으로 작업이 이루어진다. 제안하는 반자동 레이블링은 자동화 모듈과 수동 조정 모듈로 구성된다. 자동화 모듈은 G.Saha 알고리즘을 활용하여 음성구간을 추출하고, 기구축된 발화텍스트의 발화 수와 발화의 길이 정보를 이용하여 발화구간을 예측한다. 본 논문에서는 기존 수동 도구의 정확성을 유지하기 위하여 자동 레이블링된 발화구간을 보정하기 위한 수동 조정 사용자 인터페이스를 제공한다. 제안하는 반자동 레이블링 알고리즘으로 구현한 도구는 기존 수동 레이블링 도구와 비교하여 작업 속도가 평균 27% 향상되었다.