Search | Korea Science

Segmentation Methods for Different Speech Rate in Simultaneous Interpretation (발화자별 발화 속도를 고려한 실시간 동시통역 분절 방법론)

Koo, Youngeun;Kim, Jiyoun;Hong, Jungpyo;Hong, Munpyo;Choi, Sung-Kwon
- Annual Conference on Human and Language Technology
- /
- 2020.10a
- /
- pp.369-374
- /
- 2020
동시통역은 원천텍스트의 의미를 잘 전달하는 것 뿐만 아니라, 순차통역이나 번역과 달리, 지연 시간없이 즉각적으로 번역하는 것이 매우 중요하다. 따라서 적절한 길이의 지점에서 원천텍스트를 분절해야 한다. 그러나 발화자마다 발화 속도가 서로 다르며, 이 발화 속도는 전체 발화에서 늘 일정하지 않기 때문에, 분절단위의 적절한 길이를 설정하는 것은 상당히 어려운 과제이다. 본 연구에서는 발화자마다 발화 속도가 다른 상황과 발화가 진행되는 동안 실시간으로 발화 속도가 변화하는 상황에 적응 가능한 동시통역 분절 방법론(개인화 기법)을 제안한다. 이를 위해 본 논문에서는 먼저 동시통역 데이터를 이용하여 기준 발화 속도를 설정하였다. 그 다음 이를 원천 발화의 현재 속도와 비교하여 실시간으로 해당 발화자에게 있어 최적의 분절길이가 얼마인지 계산한다. 제안한 개인화 기법의 효력을 검증하기 위해 실험을 진행하였고, 그 결과 개인화를 적용하면 분절 성능이 높아졌다.
PDF

Comparison of Regional Myocardial Perfusion, Left Ventricular Volume and Ejection Fraction between 8- and 16-Frame Gated SPECT (8-단위영상과 16-단위영상으로 얻은 게이트 심근관류 스펙트에서 국소 심근관류, 좌심실 용적과 구혈률의 비교)

Lee, Sang-Woo;Lee, Jae-Tae;Bae, Jin-Ho;Jeong, Shin-Young;Chun, Kyung-Ah;Ha, Jeoung-Hee;Ahn, Byeong-Cheol;Lee, Kyu-Bo
- The Korean Journal of Nuclear Medicine
- /
- v.37 no.5
- /
- pp.269-277
- /
- 2003
목적: 게이트 심근관류 스펙트는 심근의 관류와 좌심실 기능을 동시에 평가할 수 있는 유용한 방법이다. 현재, 게이트 영상 획득시 8 단위영상이 널리 사용되지만, 아직 가장 적절한 단위영상의 수에 대해서는 논의의 여지가 있다. 본 연구는 동일한 환자에서 8 단위영상과 16 단위영상으로 게이트 심근관류 스펙트를 2회 연속적으로 시행하여 국소적 심근관류, 좌심실 용적과 구혈률등을 비교하였다. 대상 및 방법: 42명(평균 연령: 55세, 남: 녀=26: 16)의 관상동맥 질환이 의심되거나 알려진 환자를 대상으로 안정시 Tc-99m MIBI를 이용한 게이트 스펙트를 8 단위영상과 16 단위영상으로 2회 연속하여 시행하였다. 좌심실의 확장기말 용적, 수축기말 용적과 구혈률을 각각 얻었으며 확장기말의 단층영상을 18 분절로 나누고 각 분절마다 심근의 관류정도를 4등급으로 나누어 국소적 심근관류를 평가하였다. 결과: 8 단위영상과 16 단위영상 게이트 스펙트에서 국소적 심근관류의 일치도는 85.7% (tau-b=0.786, p<0.001)로 우수하였다. 두 방법간에 1등급의 차이는 100 분절(13.2%), 2등급 차이는 8 분절(1.1 %)이 있었고 3등급 차이는 없었다. 좌심실의 확장기말 용적, 수축기말 용적, 구혈률은 두 방법간에 높은 상관성을 보였으며(r=0.993, 0.989, 0.935), 좌심실 구혈률은 8 단위영상을 사용할 때 평균 1.8% 낮게 측정되어 통계적인 유의성은 있었으나(p<0.05), 그 차이는 크지 않았다. 결론: 8 단위영상과 16 단위영상을 사용한 게이트 심근관류 스펙트에서 국소적 심근관류의 일치도는 우수하였으며, 좌심실의 기능적 계수의 차이도 크지 않았다. 비록 높은 단위영상을 사용했을 때 더 정확하고 자세한 정보를 얻을 수 있다 하더라도, 구혈률과 용적 등을 얻는 일상적인 임상검사에는 8 단위영상 또한 그 역할을 충분히 할 수 있을 것으로 사료된다.
PDF KSCI

A Comparative study on the Effectiveness of Segmentation Strategies for Korean Word and Sentence Classification tasks (한국어 단어 및 문장 분류 태스크를 위한 분절 전략의 효과성 연구)

Kim, Jin-Sung;Kim, Gyeong-min;Son, Jun-young;Park, Jeongbae;Lim, Heui-seok
- Journal of the Korea Convergence Society
- /
- v.12 no.12
- /
- pp.39-47
- /
- 2021
The construction of high-quality input features through effective segmentation is essential for increasing the sentence comprehension of a language model. Improving the quality of them directly affects the performance of the downstream task. This paper comparatively studies the segmentation that effectively reflects the linguistic characteristics of Korean regarding word and sentence classification. The segmentation types are defined in four categories: eojeol, morpheme, syllable and subchar, and pre-training is carried out using the RoBERTa model structure. By dividing tasks into a sentence group and a word group, we analyze the tendency within a group and the difference between the groups. By the model with subchar-level segmentation showing higher performance than other strategies by maximal NSMC: +0.62%, KorNLI: +2.38%, KorSTS: +2.41% in sentence classification, and the model with syllable-level showing higher performance at maximum NER: +0.7%, SRL: +0.61% in word classification, the experimental results confirm the effectiveness of those schemes.
https://doi.org/10.15207/JKCS.2021.12.12.039 인용 PDF KSCI

Exploration on Tokenization Method of Language Model for Korean Machine Reading Comprehension (한국어 기계 독해를 위한 언어 모델의 효과적 토큰화 방법 탐구)

Lee, Kangwook;Lee, Haejun;Kim, Jaewon;Yun, Huiwon;Ryu, Wonho
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.197-202
- /
- 2019
토큰화는 입력 텍스트를 더 작은 단위의 텍스트로 분절하는 과정으로 주로 기계 학습 과정의 효율화를 위해 수행되는 전처리 작업이다. 현재까지 자연어 처리 분야 과업에 적용하기 위해 다양한 토큰화 방법이 제안되어 왔으나, 주로 텍스트를 효율적으로 분절하는데 초점을 맞춘 연구만이 이루어져 왔을 뿐, 한국어 데이터를 대상으로 최신 기계 학습 기법을 적용하고자 할 때 적합한 토큰화 방법이 무엇일지 탐구 해보기 위한 연구는 거의 이루어지지 않았다. 본 논문에서는 한국어 데이터를 대상으로 최신 기계 학습 기법인 전이 학습 기반의 자연어 처리 방법론을 적용하는데 있어 가장 적합한 토큰화 방법이 무엇인지 알아보기 위한 탐구 연구를 진행했다. 실험을 위해서는 대표적인 전이 학습 모형이면서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 최종 성능 비교를 위해 토큰화 방법에 따라 성능이 크게 좌우되는 과업 중 하나인 기계 독해 과업을 채택했다. 비교 실험을 위한 토큰화 방법으로는 통상적으로 사용되는 음절, 어절, 형태소 단위뿐만 아니라 최근 각광을 받고 있는 토큰화 방식인 Byte Pair Encoding (BPE)를 채택했으며, 이와 더불어 새로운 토큰화 방법인 형태소 분절 단위 위에 BPE를 적용하는 혼합 토큰화 방법을 제안 한 뒤 성능 비교를 실시했다. 실험 결과, 어휘집 축소 효과 및 언어 모델의 퍼플렉시티 관점에서는 음절 단위 토큰화가 우수한 성능을 보였으나, 토큰 자체의 의미 내포 능력이 중요한 기계 독해 과업의 경우 형태소 단위의 토큰화가 우수한 성능을 보임을 확인할 수 있었다. 또한, BPE 토큰화가 종합적으로 우수한 성능을 보이는 가운데, 본 연구에서 새로이 제안한 형태소 분절과 BPE를 동시에 이용하는 혼합 토큰화 방법이 가장 우수한 성능을 보임을 확인할 수 있었다.
PDF

Effects of the Orthographic Representation on Speech Sound Segmentation in Children Aged 5-6 Years (5~6세 아동의 철자표상이 말소리분절 과제 수행에 미치는 영향)

Maeng, Hyeon-Su;Ha, Ji-Wan
- Journal of Digital Convergence
- /
- v.14 no.6
- /
- pp.499-511
- /
- 2016
The aim of this study was to find out effect of the orthographic representation on speech sound segmentation performance. Children's performances of the orthographic representation task and the speech sound segmentation task had positive correlation in words of phoneme-grapheme correspondence and negative correlation in words of phoneme-grapheme non-correspondence. In the case of words of phoneme-grapheme correspondence, there was no difference in performance ability between orthographic representation high level group and low level group, while in the case of words of phoneme-grapheme non-correspondence, the low level group's performance was significantly better than the high level group's. The most frequent errors of both groups were orthographic conversion errors and such errors were significantly more noticeable in the high level group. This study suggests that from the time of learning orthographic knowledge, children utilize orthographic knowledge for the performance of phonological awareness tasks.
https://doi.org/10.14400/JDC.2016.14.6.499 인용 PDF KSCI

A Study on Automatic Phoneme Segmentation of Continuous Speech Using Acoustic and Phonetic Information (음향 및 음소 정보를 이용한 연속제의 자동 음소 분할에 대한 연구)

박은영;김상훈;정재호
- The Journal of the Acoustical Society of Korea
- /
- v.19 no.1
- /
- pp.4-10
- /
- 2000
The work presented in this paper is about a postprocessor, which improves the performance of automatic speech segmentation system by correcting the phoneme boundary errors. We propose a postprocessor that reduces the range of errors in the auto labeled results that are ready to be used directly as synthesis unit. Starting from a baseline automatic segmentation system, our proposed postprocessor trains the features of hand labeled results using multi-layer perceptron(MLP) algorithm. Then, the auto labeled result combined with MLP postprocessor determines the new phoneme boundary. The details are as following. First, we select the feature sets of speech, based on the acoustic phonetic knowledge. And then we have adopted the MLP as pattern classifier because of its excellent nonlinear discrimination capability. Moreover, it is easy for MLP to reflect fully the various types of acoustic features appearing at the phoneme boundaries within a short time. At the last procedure, an appropriate feature set analyzed about each phonetic event is applied to our proposed postprocessor to compensate the phoneme boundary error. For phonetically rich sentences data, we have achieved 19.9 % improvement for the frame accuracy, comparing with the performance of plain automatic labeling system. Also, we could reduce the absolute error rate about 28.6%.
PDF

The Word Structure of the North Korean Morphological Analyzer (북한 문화어 형태소 분석기(NKMA)의 어절 구조)

Choi, Woon-Ho;Chung, Hoi-Sun
- Annual Conference on Human and Language Technology
- /
- 1998.10c
- /
- pp.49-55
- /
- 1998
분단 이후 북한은 우리와는 다른 언어정책을 추진해 왔고, 그 결과로 지금은 남북한 언어 정책에서 많은 차이를 드러내게 되었다. 본 논문은 북한 문화어 형태소 분석 시스템(NKMA)의 구축을 위한 어절 구조를 제시한다. 북한 문화어의 형태소 분절 및 분석을 위해 사용된 어절 구조는 대체로 말토막 단위와 일치하므로, 음성언어의 인식을 위한 분절 방법에 응용될 수도 있으리라 기대한다.
PDF

On-line signature verification method using local partition matching (구간 분할 매칭에 의한 온라인 서명 검증 기법)

류상연;이대종;이석종;전명근
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2003.05a
- /
- pp.169-172
- /
- 2003
본 논문에서는 기존의 분절 단위 비교방법에서 참조서명과 비교서명간에 분할점 개수와 위치에 대한 불일치 문제를 개선하기 위해 구간 분할 매칭 방법을 제안한다. 제안된 분할방법은 시간에 대한 x와 y좌표 상에서 서명마다 변하지 않는 특징점을 구간 분할점으로 선택하여 구간별로 매칭시킴으로서 분절의 안정적인 분할을 통해 인식률을 높이고자 한다. 실험 결과에서 진서명과 위조서명을 포함한 기타서명에 대해 FAR이 0.06%일 때 FRR 1.25%의 오류율을 확인하였으며 FAR이 0%일 때의 평균인식율이 98.7%를 보임으로써 제안한 서명 검증 기법이 우수함을 확인 할 수 있었다.
PDF

A Study on the Prosody Generation of Korean Sentences (한국어 문장 단위운율 발생에 관한 연구)

민경중
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.419-423
- /
- 1998
법칙합성 시스템은 합성단위 합성기, 합성방식 등에 따라 여러 가지 다양한 음성합성시스템이 있으나 순수한 법칙합성 시스템이 아니고 기본 합성단위를 연결하여 합성음을 발생시키는 연결합성 시스템은 연결단위사이 그리고 문장단위에서의 매끄러운 합성계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연감을 높이기 위해 보다 자연음에 가까운 운율을 발생시키기 위해 먼저 운율에 영향을 주는 요소들을 고려하여 신경망 입력 패턴을 구성한다. 분절요인에 의한 영향을 고려해주기 위해 전후 3음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다. 신경망을 훈련시키기 위한 언어자료로는 고립단어군과 음소균형 문장군 그리고 삽입음절연결어 등으로 구성한다. 특정화자로 하여금 신경망을 훈련시켜 자연음의 운율과 유사한 합성운을 발생시켰다.
PDF

A Study on the Input Pattern of Neural Network for Prosody Control in a Korean Sentence (문장 단위 운율 제어를 위한 신경망의 입력 패턴에 관한 연구)

민경중
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.08a
- /
- pp.105-109
- /
- 1998
법칙 합성 시스템은 합성 단위, 합성기, 합성방식 등 여러 가지 다양한 시스템이 있으나 순수한 법칙 합성 시스템이 아니고 기본 합성 단위를 연결하여 합성음을 발생시키는 연결 합성 시스템은 연결 단위사이 그리고 문장 단위에서의 매끄러운 합성 계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연감에 영향을 끼치는 주요 원인중의 하나가 운율 법칙의 부정확한 구현이므로 자연음으로부터 추출한 운율에 관한 법칙을 알고리듬화하는 대신 신경망으로 하여금 이 운율 법칙을 학습하도록 하여 좀더 자연음의 운율에 근접한 운율을 발생시키고자 하였다. 신경망으로 운율을 발생시키기 위해 먼저 운율에 영향을 주는 요소들을 정해 신경망 입력 패턴을 선정해야 한다. 먼저 분절요인에 의한 영햐응ㄹ 고려해주기 위해 전후 3음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다.
PDF

Search Result 69, Processing Time 0.024 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)