Search | Korea Science

A Study on the Implementation of an Automatic Segmentation System of Korean Speech based on the Hidden Markov Model (HMM에 의한 한국어음성의 자동분할 시스템의 구현에 관한 연구)

김윤중;김미경;이인동
- Journal of Information Technology Application
- /
- v.1 no.3_4
- /
- pp.1-23
- /
- 1999
본 연구에서는 HMM(Hidden Markov Model) 및 Levelbuilding 알고리즘을 이용하여 인식대상 음소열의 표본 집합(훈련패턴 집합)을 입력으로 하는 음성의 자동 분할 시스템을 구현하였다. 본 시스템은 자연스럽게 발음되어진 연결음 음성으로부터 표준 음소모델을 생성한다. 본 시스템의 구성은 초기화 과정, HMM학습과정 그리고 Levelbuilding을 이용한 분리 및 CLustering 과정으로 구성되어 있다. 초기화 과정에서는 제어 정보를 이용하여 훈련패턴 집합으로부터 초기 음소 집합 군을 생성한다. Levelbuilding을 이용한 분리 및 Clustering 단계에서는 음소 모델과 제어 정보를 이용하여 훈련패턴들을 음소 단위로 분리하고, 분리된 후보 음소들을 Clustering하여 음소집합 군을 생성한다. 음소모델의 구성에 변화가 없을 때까지 이 작업을 반복 수행하여 최적의 음소모델을 생성한다. 본 연구에서는 3개 이하의 숫자단어로 구성된 연결되어 음성 패턴을 대상으로 실험하였다. 연결단어에 대한 음소의 표준모델 생성과정에서 가장 중요한 처리인 훈련패턴의 자동분할 과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.
PDF

Estimation of Jaw and MLC Transmission Factor Obtained by the Auto-modeling Process in the Pinnacle3 Treatment Planning System (피나클치료계획시스템에서 자동모델화과정으로 얻은 Jaw와 다엽콜리메이터의 투과 계수 평가)

Hwang, Tae-Jin;Kang, Sei-Kwon;Cheong, Kwang-Ho;Park, So-Ah;Lee, Me-Yeon;Kim, Kyoung-Ju;Oh, Do-Hoon;Bae, Hoon-Sik;Suh, Tae-Suk
- Progress in Medical Physics
- /
- v.20 no.4
- /
- pp.269-276
- /
- 2009
Radiation treatment techniques using photon beam such as three-dimensional conformal radiation therapy (3D-CRT) as well as intensity modulated radiotherapy treatment (IMRT) demand accurate dose calculation in order to increase target coverage and spare healthy tissue. Both jaw collimator and multi-leaf collimators (MLCs) for photon beams have been used to achieve such goals. In the Pinnacle3 treatment planning system (TPS), which we are using in our clinics, a set of model parameters like jaw collimator transmission factor (JTF) and MLC transmission factor (MLCTF) are determined from the measured data because it is using a model-based photon dose algorithm. However, model parameters obtained by this auto-modeling process can be different from those by direct measurement, which can have a dosimetric effect on the dose distribution. In this paper we estimated JTF and MLCTF obtained by the auto-modeling process in the Pinnacle3 TPS. At first, we obtained JTF and MLCTF by direct measurement, which were the ratio of the output at the reference depth under the closed jaw collimator (MLCs for MLCTF) to that at the same depth with the field size $10{\times}10\;cm^2$ in the water phantom. And then JTF and MLCTF were also obtained by auto-modeling process. And we evaluated the dose difference through phantom and patient study in the 3D-CRT plan. For direct measurement, JTF was 0.001966 for 6 MV and 0.002971 for 10 MV, and MLCTF was 0.01657 for 6 MV and 0.01925 for 10 MV. On the other hand, for auto-modeling process, JTF was 0.001983 for 6 MV and 0.010431 for 10 MV, and MLCTF was 0.00188 for 6 MV and 0.00453 for 10 MV. JTF and MLCTF by direct measurement were very different from those by auto-modeling process and even more reasonable considering each beam quality of 6 MV and 10 MV. These different parameters affect the dose in the low-dose region. Since the wrong estimation of JTF and MLCTF can lead some dosimetric error, comparison of direct measurement and auto-modeling of JTF and MLCTF would be helpful during the beam commissioning.
PDF

Automatic Generation of Synthesizable Hardware-Software Interface from Dataflow Model (데이터 플로우 모델로부터 합성 가능한 하드웨어-소프트웨어 인터페이스의 자동 생성)

Joo, Young-Pyo;Yang, Hoe-Seok;Ha, Soon-Hoi
- Proceedings of the Korean Information Science Society Conference
- /
- 2007.10b
- /
- pp.232-237
- /
- 2007
컴퓨터 시스템의 설계는 알고리즘 수준의 모델링에서부터 시제품 수준까지 시스템을 구체화해 나가는 일련의 과정이다. 시스템 구현의 구체화 과정에는 단순하고 반복적인 구현이 많이 포함되며, 이 과정에서 많은 오류가 발생한다. 이러한 오류는 개발자가 알고리즘 수준에서는 드러나지 않는 복잡하고 아키텍처 의존적인 하드웨어-소프트웨어 동기화 메커니즘의 개발과 같은 시스템 구현의 구체화 과정을 모두 떠안고 있기 때문에 발생하는 것이다. 이 논문에서는, 이러한 문제를 극복하기 위하여, 알고리즘을 데이터 플로우로 모델링하면 이로부터 합성 가능한 하드웨어 플랫폼과 동기화 로직, 그리고 동기화를 위한 드라이버 소프트웨어 일제를 자동 생성하는 설계 과정을 제시하고자 한다. 제시된 설계 과정은 자체 개발한 통합 설계 도구 상에 구현되었으며, 이를 통해서 개발된 H.263 디코더 예제를 상용의 RTL 통합 시뮬레이션 도구인 Seamless CVE와, SoC 프로토타이핑 환경인 Altera Excalibur 시스템 상에서 테스트하여 그 완성도를 검증하였다.
PDF

An Automated Production System Design for Natural Language Processing Models Using Korean Pre-trained Model (한국어 사전학습 모델을 활용한 자연어 처리 모델 자동 산출 시스템 설계)

Jihyoung Jang;Hoyoon Choi;Gun-woo Lee;Myung-seok Choi;Charmgil Hong
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.613-618
- /
- 2022
효과적인 자연어 처리를 위해 제안된 Transformer 구조의 등장 이후, 이를 활용한 대규모 언어 모델이자 사전학습 모델인 BERT, GPT, OPT 등이 공개되었고, 이들을 한국어에 보다 특화한 KoBERT, KoGPT 등의 사전학습 모델이 공개되었다. 자연어 처리 모델의 확보를 위한 학습 자원이 늘어나고 있지만, 사전학습 모델을 각종 응용작업에 적용하기 위해서는 데이터 준비, 코드 작성, 파인 튜닝 및 저장과 같은 복잡한 절차를 수행해야 하며, 이는 다수의 응용 사용자에게 여전히 도전적인 과정으로, 올바른 결과를 도출하는 것은 쉽지 않다. 이러한 어려움을 완화시키고, 다양한 기계 학습 모델을 사용자 데이터에 보다 쉽게 적용할 수 있도록 AutoML으로 통칭되는 자동 하이퍼파라미터 탐색, 모델 구조 탐색 등의 기법이 고안되고 있다. 본 연구에서는 한국어 사전학습 모델과 한국어 텍스트 데이터를 사용한 자연어 처리 모델 산출 과정을 정형화 및 절차화하여, 궁극적으로 목표로 하는 예측 모델을 자동으로 산출하는 시스템의 설계를 소개한다.
PDF

Extraction of Facial Region and features Using Snakes in Color Image (Snakes 알고리즘을 이용한 얼굴영역 및 특징추출)

김지희;민경필;전준철
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.04b
- /
- pp.496-498
- /
- 2001
Snake 모델(active contour model)은 초기값을 설정해주면 자동으로 임의의 물체의 윤곽을 찾아내는 알고리즘으로 영상에서 특정 영역을 분할하여 할 때 많이 이용되고 있다. 본 논문에서는 칼라 영상에서 얼굴과 얼굴의 특징점을 찾는 방법으로 이 알고리즘을 적용한다. 특히, 주어진 영상의 RGB 값을 정규화(normalization) 해주는 전처리 과정을 통해 얼굴의 특징점 후보 영역을 얻어내는 초기 값을 설정해주어야 하는 과정을 생략해주고 보다 정확한 값을 얻을 수 있도록 구현한다. RGB 값을 이용한 정규화 과정을 적용한 방법과 적용하지 않은 방법을 구현한 결과를 비교해줌으로써, 정규화 과정을 거친 방법의 성능이 더 우수함을 보여준다.
PDF

CRFs versus Bi-LSTM/CRFs: Automatic Word Spacing Perspective (CRFs와 Bi-LSTM/CRFs의 비교 분석: 자동 띄어쓰기 관점에서)

Yoon, Ho;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Ho-min;Namgoong, Young;Choi, Minseok;Kim, Jae-Hoon
- Annual Conference on Human and Language Technology
- /
- 2018.10a
- /
- pp.189-192
- /
- 2018
자동 띄어쓰기란 컴퓨터를 사용하여 띄어쓰기가 수행되어 있지 않은 문장에 대해 띄어쓰기를 수행하는 것이다. 이는 자연언어처리 분야에서 형태소 분석 전에 수행되는 과정으로, 띄어쓰기에 오류가 발생할 경우, 형태소 분석이나 구문 분석 등에 영향을 주어 그 결과의 모호성을 높이기 때문에 매우 중요한 전처리 과정 중 하나이다. 본 논문에서는 기계학습의 방법 중 하나인 CRFs(Conditional Random Fields)를 이용하여 자동 띄어쓰기를 수행하고 심층 학습의 방법 중 하나인 양방향 LSTM/CRFs (Bidirectional Long Short Term Memory/CRFs)를 이용하여 자동 띄어쓰기를 수행한 뒤 각 모델의 성능을 비교하고 분석한다. CRFs 모델이 양방향 LSTM/CRFs모델보다 성능이 약간 더 높은 모습을 보였다. 따라서 소형 기기와 같은 환경에서는 CRF와 같은 모델을 적용하여 모델의 경량화 및 시간복잡도를 개선하는 것이 훨씬 더 효과적인 것으로 생각된다.
PDF

Automatic Text Categorization by Term Weighting and Inverted Category Frequency (용어 가중치와 역범주 빈도에 의한 자동문서 범주화)

Lee, Kyung-Chan;Kang, Seung-Shik
- Annual Conference on Human and Language Technology
- /
- 2003.10d
- /
- pp.14-17
- /
- 2003
문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.
PDF

Design of Sentence Semantic Model for Cause-Effect Graph Automatic Generation from Natural Language Oriented Informal Requirement Specifications (비정형 요구사항으로부터 원인-결과 그래프 자동 발생을 위한 문장 의미 모델(Sentence Semantic Model) 설계)

Jang, Woo Sung;Jung, Se Jun;Kim, R.Young Chul
- Annual Conference on Human and Language Technology
- /
- 2020.10a
- /
- pp.215-219
- /
- 2020
현재 한글 언어학 영역에서는 많은 언어 분석 연구가 수행되었다. 또한 소프트웨어공학의 요구공학 영역에서는 명료한 요구사항 정의와 분석이 필요하고, 비정형화된 요구사항 명세서로부터 테스트 케이스 추출이 매우 중요한 이슈이다. 즉, 자연어 기반의 요구사항 명세서로부터 원인-결과 그래프(Cause-Effect Graph)를 통한 의사 결정 테이블(Decision Table) 기반 테스트케이스(Test Case)를 자동 생성하는 방법이 거의 없다. 이런 문제를 해결하기 위해 '한글 언어 의미 분석 기법'을 '요구공학 영역'에 적용하는 방법이 필요하다. 본 논문은 비정형화된 요구사항으로부터 테스트케이스 생성하는 과정의 중간 단계인 요구사항에서 문장 의미 모델(Sentence Semantic Model)을 자동 생성하는 방법을 제안 한다. 이는 요구사항으로부터 생성된 원인-결과 그래프의 정확성을 검증할 수 있다.
PDF

Modeling of Real-Time System for TMO-Based Automatic Code Generator (TMO기반의 코드 자동 생성기 설계를 위한 실시간 시스템 모델링의 기법)

Seok, Mi-Heui;Shin, Young-Sul;Ryu, Ho-Dong;Lee, Woo-Jin
- Proceedings of the Korean Information Science Society Conference
- /
- 2010.06b
- /
- pp.136-139
- /
- 2010
실시간 시스템에서는 계산 결과의 논리적 정확성과 결과가 산출되는 시간의 정확성을 요구한다. 이러한 요구사항을 지원하기 위해 UCI Dream Lab에서 제안한 적시 서비스 능력을 보장하는 실시간 객체인 TMO 객체를 토대로 자동 코드 생성기의 설계를 제시한다. 기존의 모델 기반 개발방법론은 시스템을 추상화하고 그 모델을 상세화 과정을 거쳐 구현에 필요한 정보를 갖게 되고, 이를 바탕으로 자동으로 코드를 생성 할 수 있게 된다. 기존의 도구들은 표준 UML을 사용하고, 표준 UML은 시간 제약 조건을 기술하는 방법을 제공하지 않기 때문에 이에 따라 개발된 실시간 시스템 코드 자동 생성기는 완전한 코드를 생성하지 못한다. 본 논문에서는 실시간 시스템 개발에 모델 기반 개발방법론을 적용하기 위해 TMO객체를 이용하여 기존 UML 모델의 구조 모델과 행위 모델에 실시간 특성을 추가해 확장하고 확장된 모델을 토대로 자동 코드 생성기의 설계를 제안한다.
PDF

Improvement of contour extraction of pottery relics window area for automatic drawings extraction model (고배 유물 도면 자동 생성 모델의 투창 영역 윤곽선 검출 개선)

Kim, Dong-Joo;Ban, Sang-Woo
- Proceedings of the Korea Information Processing Society Conference
- /
- 2019.10a
- /
- pp.1098-1100
- /
- 2019
영상 처리를 기반으로 하는 발굴 유물(고배) 도면 자동 생성 모델의 성능향상을 위한 투창 영역 자동 검출과 투창 영역의 영상 정보의 특성을 반영한 윤곽선 검출을 통한 고배 유물 도면화 성능 향상 모델을 제안하고 실험결과를 통해 투창 영역의 윤곽선 정확도가 향상되었음을 보인다. 투창 영역은 형태적 특성상 고배 유물의 도면 자동 생성 과정에서 왜곡된 윤곽선 검출의 가능성이 높은 부분이어서 투창 영역 윤곽선의 정확도를 높이는 것이 중요한 요소이다.
https://doi.org/10.3745/PKIPS.y2019m10a.1098 인용 PDF

Search Result 93, Processing Time 0.03 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)