• Title/Summary/Keyword: 보조단위

Search Result 146, Processing Time 0.029 seconds

Generative Korean Inverse Text Normalization Model Combining a Bi-LSTM Auxiliary Model (Bi-LSTM 보조 신경망 모델을 결합한 생성형 한국어 Inverse Text Normalization 모델)

  • Jeongje Jo;Dongsu Shin;Kyeongbin Jo;Youngsub Han;Byoungki Jeon
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.716-721
    • /
    • 2023
  • Inverse Text Normalization(ITN) 모델은 음성 인식(STT) 엔진의 중요한 후처리 영역 중 하나이며, STT 인식 결과의 가독성을 개선한다. 최근 ITN 모델에 심층신경망을 활용한 연구가 진행되고 있다. 심층 신경망을 사용하는 대부분의 선행연구는 문장 내 변환이 필요한 부분에 토큰 태깅을 진행하는 방식이다. 그러나 이는 Out-of-vocabulary(OOV) 이슈가 있으며, 학습 데이터 구축 시 토큰 단위의 섬세한 태깅 작업이 필요하다는 한계점이 존재한다. 더불어 선행 연구에서는 STT 인식 결과를 그대로 사용하는데, 이는 띄어쓰기가 중요한 한국어 ITN 처리에 변환 성능을 보장할 수 없다. 본 연구에서는 BART 기반 생성 모델로 생성형 ITN 모델을 구축하였고, Bi-LSTM 기반 보조 신경망 모델을 결합하여 STT 인식 결과에 대한 고유명사 처리, 띄어쓰기 교정 기능을 보완한 모델을 제안한다. 또한 보조 신경망을 통해 생성 모델 처리 여부를 판단하여 평균 추론 속도를 개선하였다. 실험을 통해 두 모델의 각 정량 성능 지표에서 우수한 성능을 확인하였고 결과적으로 본 연구에서 제안하는 두 모델의 결합된 방법론의 효과성을 제시하였다.

  • PDF

신경회로망을 이용한 연속음성중 키워드(keyword)인식에 관한 연구

  • 최관선;한민홍
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1993.04a
    • /
    • pp.275-281
    • /
    • 1993
  • 본 발표에서는 신경회로망을 이용하여 연속음성중에서 키워드를 인식하는 방법을 설명한다. 연속음성에서 파형소편 및 음절을 식별하는 휴리스틱 알고리즘을 개발하였고, 연속음성을 음절단위로 파형소편 스펙트럼분석(선형예측법)으로 특성치를 추출하였다. 음절의 특성치는 코호넨 신경회로망을 통하여 학습을 시켰으며, 연속음성중 키워드인식은 먼저 음절을 인식하여 단어를 찾고, 인식된 단어가 키워드와 일치하는가를 확인한다. 본 연구의 의의는 파형소편 및 음절식별 알고리즘을 통하여, 크기불변성(Scaling invariance), 시간불변성(Time warping 및 Time-shift invariance), 중복성제거의 문제점을 해결하였고, 신경회로망의 학습을 통하여 화자독립적인 연속음성인식시스템 구축의 기반을 확립한데 있다. 본 음성인식모델은 학교구내 전화번호 안내시스템으로 활용단계에 있으며 전화번호뿐만아니라 주소안내시스템으로도 활용될 예정이다. 또한 자동차 운전보조시스템 및 주행안내시스템의 음성명령에 응용될 수 있는데, 예로 음성명령은 "핸들 좌로 20도", "시청까지 주행", "시청 지도안내"등이 될 수 있다. 현재 자동차 운전보조시스템은 컴퓨터 화면상 모의동작시스템으로 운영되고 있다. 본 음성인식모델은 화자종속시 90%이상, 화자독립시 70%의 인식결과를 보였다.시 90%이상, 화자독립시 70%의 인식결과를 보였다.

  • PDF

A Study on the Two Transport Streams Synchronization for Left and Right Videos (좌우영상 전송스트림의 동기화 방법에 관한 연구)

  • Cho, Sukhee;Kim, Jongho;Choo, Hyon-Gon;Choi, Jin Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.222-224
    • /
    • 2012
  • 본 논문에서는 듀얼 스트림 기반의 지상파 양안식 3DTV 서비스를 위하여, 상용제품의 MPEG-2 인코더와 AVC/H.264 인코더를 이용하여 부호화할 경우, 두 개의 인코더에서 출력되는 MPEG-2 전송스트림을 입력받아 좌우 영상의 스트림을 프레임단위로 동기화하는 방법을 제안한다. 제안하는 동기화 방법은 좌우 HD-SDI 신호의 수직 보조 데이터 공간(VANC-Vertical ANCillary data space)에 동기정보를 삽입하고, 이 동기정보를 바탕으로 2 개의 DTV 인코더에서 출력되는 좌우영상의 전송스트림을 동기화할 수 있도록 한다. 따라서, 본 논문에서 동기정보는 기존의 상용 DTV 인코더에서 프레임 단위로 부호화를 지원하는 폐쇄자막(Closed caption) 구문에 따라 VANC 에 삽입하는 방법을 제안한다.

  • PDF

Adding New Information in DCS (DCS의 정보확장)

  • Lee, Chang-In
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.253-257
    • /
    • 1995
  • 본 논문은 DCS(Dynamic Comprehension System) 정보확장 과정을 어휘 정보의 첨가를 통해 묘사하고자한다. 즉, 현존의 사전정보의 보완작용없이, 시스템을 확장하는 과정이 이 논문에서 보여진다. 새로운 언어정보에 유연하게 대처하기 위해 화자와 청자간의 새로운 지식의 학습과정이 나무구조 형식의 보조메뉴를 통해 상호 교환방식으로 나타내진다. 본 논문은 새로운 지식의 인지과정 중 현존의 정보망(network)에 각 단위망(nection)이 첨가될 때의 과정을 구현시키고자 시도된 것이다.

  • PDF

Methods to Raise the Efficiency of External Shading in Greenhouse (온실에서 외부차광의 효율성 증대 방안)

  • 이현우;이석건;김길동;이종원
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 2000.10b
    • /
    • pp.124-127
    • /
    • 2000
  • 시설원예의 궁극적인 목적은 인위적인 환경조절을 통해 주년생산과 단위면적당 생산성을 증대시키면서 품질향상을 극대화시키는 것이라 할 수 있다. 특히, 시설원예의 주년생산과 관련하여 냉ㆍ난방에너지의 절약에 관한 많은 연구가 수행되어 왔으며, 현재 많은 냉ㆍ난방장치들이 실용화되어지고 있다. 그 중에서, 여름철의 적극적인 냉방방법으로 증발냉각방식, 히터펌프, 에어컨 등이 농가에 보급되어 널리 이용되고 있으나 항상 경제성에 있어서 문제점으로 제기되고 있으며 이런 경제적인 부담을 줄이고자 냉방장치의 보조적 수단으로서 차광시스템이 널리 이용되고 있는 실정이다. (중략)

  • PDF

Improvement of Lead Time at A PCB Manufacturing Line Using TOC Methodology (TOC를 이용한 PCB 제조라인의 리드타임 개선)

  • ;Park Jeong-Hyeon
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2006.05a
    • /
    • pp.1240-1245
    • /
    • 2006
  • PCB는 수십개의 주공정과 보조공정으로 구성된 제품으로 동일한 생산라인에서 로트 단위로 다품종 혼류 생산되고 있다. 따라서 PCB 제조라인에서는 많은 공정수, 높은 불량률, 다양한 공정설비 및 빈번한 설비고장, 중소기업의 낮은 설계 및 생산기술력, 빈번한 수주 변경 및 다품종 혼류, 긴급 수주 등과 같이 제조원가를 증가시키는 다양한 교란요인들이 항상 발생하고 있다. 본 연구에서는 생산성, 품질 등을 고려하면서 리드 타임을 단축하기 위하여 TOC DBR 기법을 개선한 2개의 DBR 개념을 도입하여 성공적으로 리드타임을 개선한 사례를 소개하고자 한다.

  • PDF

홍어연골을 이용한 저 어취 chondroitin sulfate의 제조

  • 최주현;조승목;박현덕;김성구;지청일;이양봉;김선봉
    • Proceedings of the Korean Society of Fisheries Technology Conference
    • /
    • 2003.05a
    • /
    • pp.105-106
    • /
    • 2003
  • 콘드로이틴황산(Chondroitin sulfate)은 생물체내에 널리 분포하는 mucopoly-saccharide의 일종으로 N-acetyl galactosamine과 glucuronic acid의 이당체 단위가 반복적으로 되풀이되는 구조를 가지며, 황산기의 결합 위치에 따라 A타입(4-sulfate) 및 C타입(6-sulfate) 등으로 나누어진다(Mucci et al., 2000). 콘드로이틴황산은 피부노화방지, 골 형성단백질, 항종양 등의 생리활성작용이 우수하고(Bayliss et al., 1999 ; Ha et al., 1999), 특히 퇴행성관절염에 효과(Omata et al., 2000)가 높아 최근 화장품, 건강보조 식품 및 의약품으로 이용되고 있다. (중략)

  • PDF

An Implementation of an Courseware Authoring Tool Using a Concept based Courseware Representation Method (개념 기반의 코스웨어 표현 방법과 이를 이용한 인터넷 기반의 코스웨어 저작 도구의 구현)

  • Kim, Man-Seok;Kim, Chang-Hwa
    • The Journal of Korean Association of Computer Education
    • /
    • v.5 no.2
    • /
    • pp.39-48
    • /
    • 2002
  • It is general that the ICAI(Intelligent Computer Assisted Instruction) consists of 4 modules. Export module, Teacher module, Student module and Interface module. In each module construction, there should be some rules to control strategies efficiently and systematically that are related to the texts and assessment instruments, assessment results and evaluation, feedback, etc. It is necessary to use a method to classify the curriculum into sections with units and to represent the identified relationships between them. These relationships are available to all the process of learning, assessment, evaluation and feedback. In this paper, we propose the method to represent these units and relationships as a graph. In addition, we implement an internet-based courseware authoring tool to support the environment in which several expert can construct concurrently the courseware with cooperation between them.

  • PDF

퍼스날 컴퓨터용 수문데이타베이스(PCHISS)의 개발

  • Sin, Hyeon-Min;Kim, Seung;Seo, Byeong-Ha
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 1991.07a
    • /
    • pp.5-12
    • /
    • 1991
  • 수자원 관련 연구 및 설계는 대부분 수문자료의 분석으로보터 출발하며, 따라서 수문자료의 효율적 관리 및 제공시스템의 필요성이 강조되어 왔다. 또한 설계회사 또는 학계, 연구소 등에서 수문자료의 분석시 퍼스날 컴퓨터를 이용하는 경우가 상당히 많으며, 단위 프로젝트에 필요한 비교적 적은 양 - 예를 들어 전국 중 특정 수계만을 대상으로 하는 경우 - 의 수문자료는 퍼스날 컴퓨터로도 처리가 가능하므로, 프로젝트 단위 수문자료의 검색, 출력 및 기본적 분석기능을 제공하는 퍼스날 컴퓨터용 수문데이타베이스의 개발 필요성이 제기되었다. PCHISS(Personal Computer Hydrological Information Support System)는 이러한 필요성에 의해 폭넓게 보급, 사용되고 있는 퍼스날 컴퓨터 - MS-DOS로 운영되는 IBM 호환 16비트 AT 또는 XT - 를 대상으로 상기한 수문자료의 검색, 출력 및 기본적 분석기능과 관측소 정보의 출력기능을 제공하도록 개발되었다. 개발에 사용된 언어는 C언어이며, C언어 프로그램에 의해 색인화된 자료처리기능을 제공하는 C-ISAM(C-Indexed Sequential Access Method)이라는 라이브러리를 사용하였다. 개발된 수문데이타베이스는 반복되는 수문자료의 검색, 출력 및 분석업무의 효율성 제고를 기할 수 있으며, 퍼스날 컴퓨터 및 보조기억장치를 포함한 주변장치의 성능이 계속 향상되고, 반면 가격은 상대적으로 낮추어지고 있으므로 프로젝트 단위의 수문자료관리시스템의 역할을 충분히 수행할 수 있을 것으로 기대된다.

  • PDF

Another Choice for Parsing : Using Syntactic Morpheme (파싱을 위한 선택 : 구문 형태소의 이용)

  • Hwang, Y.G.;Song, Y.J.;Lee, H.Y.;Lee, Y.S.
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.249-254
    • /
    • 1999
  • 자연어 분석에서 발생하는 가장 큰 문제점은 분석의 각 단계에서 필요 이상의 모호성이 발생하는 것이다. 이러한 모호성은 각각의 분석 단계에서는 반드시 필요한 결과일 수 있지만 다음 단계의 관점에서는 불필요하게 과생성된 자료로 볼 수 있다. 특히 한국어 형태소 분석 단계는 주어진 문장에 대해 최소의 의미를 가지는 형태소로 분석하기 때문에 과생성된 결과를 많이 만들어 내는데, 이들 대부분이 보조용언이나 의존 명사를 포함하는 형태소열에서 발생한다. 품사 태깅된 코퍼스에서 높은 빈도를 나타내는 형태소들을 분석해 보면 주위의 형태소와 강한 결합 관계를 가지는 것을 발견할 수 있다. 이러한 형태소는 대부분 자립성이 없는 기능형태소로서, 개개의 형태소가 가지는 의미의 합으로 표현되기보다는 문장내에서 하나의 구문 단위로 표현될 수 있다. 본 논문에서는 이 형태소 열을 구문 형태소로 정의하고, 필요한 경우 일반 형태소 해석의 결과를 구문 형태소 단위로 결합하고 이를 바탕으로 구문 해석을 하는 방법을 제안한다. 구문 형태소 단위를 이용하여 구문해석을 수행함으로써, 형태소 해석 결과의 축소를 통해 불필요한 구문 해석 곁과를 배제할 수 있다.

  • PDF