• 제목/요약/키워드: 자동모델화과정

검색결과 93건 처리시간 0.025초

HMM에 의한 한국어음성의 자동분할 시스템의 구현에 관한 연구 (A Study on the Implementation of an Automatic Segmentation System of Korean Speech based on the Hidden Markov Model)

  • 김윤중;김미경;이인동
    • 정보기술응용연구
    • /
    • 제1권3_4호
    • /
    • pp.1-23
    • /
    • 1999
  • 본 연구에서는 HMM(Hidden Markov Model) 및 Levelbuilding 알고리즘을 이용하여 인식대상 음소열의 표본 집합(훈련패턴 집합)을 입력으로 하는 음성의 자동 분할 시스템을 구현하였다. 본 시스템은 자연스럽게 발음되어진 연결음 음성으로부터 표준 음소모델을 생성한다. 본 시스템의 구성은 초기화 과정, HMM학습과정 그리고 Levelbuilding을 이용한 분리 및 CLustering 과정으로 구성되어 있다. 초기화 과정에서는 제어 정보를 이용하여 훈련패턴 집합으로부터 초기 음소 집합 군을 생성한다. Levelbuilding을 이용한 분리 및 Clustering 단계에서는 음소 모델과 제어 정보를 이용하여 훈련패턴들을 음소 단위로 분리하고, 분리된 후보 음소들을 Clustering하여 음소집합 군을 생성한다. 음소모델의 구성에 변화가 없을 때까지 이 작업을 반복 수행하여 최적의 음소모델을 생성한다. 본 연구에서는 3개 이하의 숫자단어로 구성된 연결되어 음성 패턴을 대상으로 실험하였다. 연결단어에 대한 음소의 표준모델 생성과정에서 가장 중요한 처리인 훈련패턴의 자동분할 과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.

  • PDF

피나클치료계획시스템에서 자동모델화과정으로 얻은 Jaw와 다엽콜리메이터의 투과 계수 평가 (Estimation of Jaw and MLC Transmission Factor Obtained by the Auto-modeling Process in the Pinnacle3 Treatment Planning System)

  • 황태진;강세권;정광호;박소아;이미연;김경주;오도훈;배훈식;서태석
    • 한국의학물리학회지:의학물리
    • /
    • 제20권4호
    • /
    • pp.269-276
    • /
    • 2009
  • 세기조절방사선치료(IMRT)뿐만 아니라 3차원 입체조형치료(3D-CRT)와 같이 광자선을 이용한 방사선 치료 기술은 방사선을 받아야 하는 표적의 면적을 충분히 증가시키면서, 동시에 정상 조직은 방사선으로부터 보호하기 위하여 정확한 선량 계산을 필요로 한다. Jaw 콜리메이터와 다엽 콜리메이터가 그러한 목적을 위해서 사용되어 왔다. 우리 기관에서 사용하는 피나클 치료계획시스템은 모델기반의 광자선량 알고리듬을 사용하기 때문에 Jaw 콜리메이터 투과계수(JTF)와 다엽 콜리메이터 투과계수(MLCTF)와 같은 모델변수들의 집합이 측정된 데이터로부터 결정된다. 그러나, 이러한 자동모델화과정에 의해서 얻어진 모델변수들이 직접 측정하여 얻은 것들과 다를 수 있는데, 이는 선량분포에 영향을 줄 수 있다. 그래서, 이 연구에서 우리는 피나클 치료계획시스템에서 자동모델화과정에 의해 얻은 JTF와 MLCTF를 평가하였다. 먼저 우리는 이 연구에서 Jaw 콜리메이터 투과계수(JTF)와 다엽 콜리메이터 투과계수(MLCTF)를 직접 측정하여 얻었는데, 이것은 물팬톰 내 기준깊이에서 조사면이 $0{\times}0\;cm^2$일 때의 선량과 $10{\times}10\;cm^2$일 때의 선량의 비로 얻었다. 또한, JTF와 MLCTF는 치료계획시스템내 자동모델화 과정에 의해서도 얻어서, 이 값들이 3차원 입체조형치료시에 선량에 어떠한 영향을 끼치는지 팬톰 연구와 환자 연구를 통해서 평가하였다. 직접 측정한 경우 JTF는 6 MV의 경우에 0.001966, 10 MV의 경우에는 0.002971이었고, MLCTF는 6 MV의 경우에 0.01657, 10 MV의 경우에 0.01925이었다. 한편, 자동모델화 과정에 의해 얻은 경우, JTF는 6 MV의 경우에 0.001983, 10 MV의 경우에는 0.010431이었고, MLCTF는 6 MV의 경우에 0.00188, 10 MV의 경우에 0.00453이었다. JTF와 MLCTF의 경우에 직접 측정한 것은 자동모델화 과정에 의해 얻은 값과 큰 차이를 보였으나, 6 MV와 10 MV의 선질을 고려하면, 보다 합리적이었고, 이러한 값의 차이는 낮은 선량의 영역에서 선량에 영향을 미쳤다. JTF와 MLCTF의 잘못된 값은 선량의 오차를 다소 발생시킬 수도 있기 때문에, JTF와 MLCTF를 자동모델화과정에 의해서 얻은 값과 직접 측정하여 얻은 값을 비교하는 것은 빔커미셔닝 단계에서 도움이 될 것이다.

  • PDF

데이터 플로우 모델로부터 합성 가능한 하드웨어-소프트웨어 인터페이스의 자동 생성 (Automatic Generation of Synthesizable Hardware-Software Interface from Dataflow Model)

  • 주영표;양회석;하순회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.232-237
    • /
    • 2007
  • 컴퓨터 시스템의 설계는 알고리즘 수준의 모델링에서부터 시제품 수준까지 시스템을 구체화해 나가는 일련의 과정이다. 시스템 구현의 구체화 과정에는 단순하고 반복적인 구현이 많이 포함되며, 이 과정에서 많은 오류가 발생한다. 이러한 오류는 개발자가 알고리즘 수준에서는 드러나지 않는 복잡하고 아키텍처 의존적인 하드웨어-소프트웨어 동기화 메커니즘의 개발과 같은 시스템 구현의 구체화 과정을 모두 떠안고 있기 때문에 발생하는 것이다. 이 논문에서는, 이러한 문제를 극복하기 위하여, 알고리즘을 데이터 플로우로 모델링하면 이로부터 합성 가능한 하드웨어 플랫폼과 동기화 로직, 그리고 동기화를 위한 드라이버 소프트웨어 일제를 자동 생성하는 설계 과정을 제시하고자 한다. 제시된 설계 과정은 자체 개발한 통합 설계 도구 상에 구현되었으며, 이를 통해서 개발된 H.263 디코더 예제를 상용의 RTL 통합 시뮬레이션 도구인 Seamless CVE와, SoC 프로토타이핑 환경인 Altera Excalibur 시스템 상에서 테스트하여 그 완성도를 검증하였다.

  • PDF

한국어 사전학습 모델을 활용한 자연어 처리 모델 자동 산출 시스템 설계 (An Automated Production System Design for Natural Language Processing Models Using Korean Pre-trained Model)

  • 장지형;최호윤;이건우;최명석;홍참길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.613-618
    • /
    • 2022
  • 효과적인 자연어 처리를 위해 제안된 Transformer 구조의 등장 이후, 이를 활용한 대규모 언어 모델이자 사전학습 모델인 BERT, GPT, OPT 등이 공개되었고, 이들을 한국어에 보다 특화한 KoBERT, KoGPT 등의 사전학습 모델이 공개되었다. 자연어 처리 모델의 확보를 위한 학습 자원이 늘어나고 있지만, 사전학습 모델을 각종 응용작업에 적용하기 위해서는 데이터 준비, 코드 작성, 파인 튜닝 및 저장과 같은 복잡한 절차를 수행해야 하며, 이는 다수의 응용 사용자에게 여전히 도전적인 과정으로, 올바른 결과를 도출하는 것은 쉽지 않다. 이러한 어려움을 완화시키고, 다양한 기계 학습 모델을 사용자 데이터에 보다 쉽게 적용할 수 있도록 AutoML으로 통칭되는 자동 하이퍼파라미터 탐색, 모델 구조 탐색 등의 기법이 고안되고 있다. 본 연구에서는 한국어 사전학습 모델과 한국어 텍스트 데이터를 사용한 자연어 처리 모델 산출 과정을 정형화 및 절차화하여, 궁극적으로 목표로 하는 예측 모델을 자동으로 산출하는 시스템의 설계를 소개한다.

  • PDF

Snakes 알고리즘을 이용한 얼굴영역 및 특징추출 (Extraction of Facial Region and features Using Snakes in Color Image)

  • 김지희;민경필;전준철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.496-498
    • /
    • 2001
  • Snake 모델(active contour model)은 초기값을 설정해주면 자동으로 임의의 물체의 윤곽을 찾아내는 알고리즘으로 영상에서 특정 영역을 분할하여 할 때 많이 이용되고 있다. 본 논문에서는 칼라 영상에서 얼굴과 얼굴의 특징점을 찾는 방법으로 이 알고리즘을 적용한다. 특히, 주어진 영상의 RGB 값을 정규화(normalization) 해주는 전처리 과정을 통해 얼굴의 특징점 후보 영역을 얻어내는 초기 값을 설정해주어야 하는 과정을 생략해주고 보다 정확한 값을 얻을 수 있도록 구현한다. RGB 값을 이용한 정규화 과정을 적용한 방법과 적용하지 않은 방법을 구현한 결과를 비교해줌으로써, 정규화 과정을 거친 방법의 성능이 더 우수함을 보여준다.

  • PDF

CRFs와 Bi-LSTM/CRFs의 비교 분석: 자동 띄어쓰기 관점에서 (CRFs versus Bi-LSTM/CRFs: Automatic Word Spacing Perspective)

  • 윤호;김창현;천민아;박호민;남궁영;최민석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-192
    • /
    • 2018
  • 자동 띄어쓰기란 컴퓨터를 사용하여 띄어쓰기가 수행되어 있지 않은 문장에 대해 띄어쓰기를 수행하는 것이다. 이는 자연언어처리 분야에서 형태소 분석 전에 수행되는 과정으로, 띄어쓰기에 오류가 발생할 경우, 형태소 분석이나 구문 분석 등에 영향을 주어 그 결과의 모호성을 높이기 때문에 매우 중요한 전처리 과정 중 하나이다. 본 논문에서는 기계학습의 방법 중 하나인 CRFs(Conditional Random Fields)를 이용하여 자동 띄어쓰기를 수행하고 심층 학습의 방법 중 하나인 양방향 LSTM/CRFs (Bidirectional Long Short Term Memory/CRFs)를 이용하여 자동 띄어쓰기를 수행한 뒤 각 모델의 성능을 비교하고 분석한다. CRFs 모델이 양방향 LSTM/CRFs모델보다 성능이 약간 더 높은 모습을 보였다. 따라서 소형 기기와 같은 환경에서는 CRF와 같은 모델을 적용하여 모델의 경량화 및 시간복잡도를 개선하는 것이 훨씬 더 효과적인 것으로 생각된다.

  • PDF

용어 가중치와 역범주 빈도에 의한 자동문서 범주화 (Automatic Text Categorization by Term Weighting and Inverted Category Frequency)

  • 이경찬;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-17
    • /
    • 2003
  • 문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.

  • PDF

비정형 요구사항으로부터 원인-결과 그래프 자동 발생을 위한 문장 의미 모델(Sentence Semantic Model) 설계 (Design of Sentence Semantic Model for Cause-Effect Graph Automatic Generation from Natural Language Oriented Informal Requirement Specifications)

  • 장우성;정세준;김영철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-219
    • /
    • 2020
  • 현재 한글 언어학 영역에서는 많은 언어 분석 연구가 수행되었다. 또한 소프트웨어공학의 요구공학 영역에서는 명료한 요구사항 정의와 분석이 필요하고, 비정형화된 요구사항 명세서로부터 테스트 케이스 추출이 매우 중요한 이슈이다. 즉, 자연어 기반의 요구사항 명세서로부터 원인-결과 그래프(Cause-Effect Graph)를 통한 의사 결정 테이블(Decision Table) 기반 테스트케이스(Test Case)를 자동 생성하는 방법이 거의 없다. 이런 문제를 해결하기 위해 '한글 언어 의미 분석 기법'을 '요구공학 영역'에 적용하는 방법이 필요하다. 본 논문은 비정형화된 요구사항으로부터 테스트케이스 생성하는 과정의 중간 단계인 요구사항에서 문장 의미 모델(Sentence Semantic Model)을 자동 생성하는 방법을 제안 한다. 이는 요구사항으로부터 생성된 원인-결과 그래프의 정확성을 검증할 수 있다.

  • PDF

TMO기반의 코드 자동 생성기 설계를 위한 실시간 시스템 모델링의 기법 (Modeling of Real-Time System for TMO-Based Automatic Code Generator)

  • 석미희;신영술;류호동;이우진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.136-139
    • /
    • 2010
  • 실시간 시스템에서는 계산 결과의 논리적 정확성과 결과가 산출되는 시간의 정확성을 요구한다. 이러한 요구사항을 지원하기 위해 UCI Dream Lab에서 제안한 적시 서비스 능력을 보장하는 실시간 객체인 TMO 객체를 토대로 자동 코드 생성기의 설계를 제시한다. 기존의 모델 기반 개발방법론은 시스템을 추상화하고 그 모델을 상세화 과정을 거쳐 구현에 필요한 정보를 갖게 되고, 이를 바탕으로 자동으로 코드를 생성 할 수 있게 된다. 기존의 도구들은 표준 UML을 사용하고, 표준 UML은 시간 제약 조건을 기술하는 방법을 제공하지 않기 때문에 이에 따라 개발된 실시간 시스템 코드 자동 생성기는 완전한 코드를 생성하지 못한다. 본 논문에서는 실시간 시스템 개발에 모델 기반 개발방법론을 적용하기 위해 TMO객체를 이용하여 기존 UML 모델의 구조 모델과 행위 모델에 실시간 특성을 추가해 확장하고 확장된 모델을 토대로 자동 코드 생성기의 설계를 제안한다.

  • PDF

고배 유물 도면 자동 생성 모델의 투창 영역 윤곽선 검출 개선 (Improvement of contour extraction of pottery relics window area for automatic drawings extraction model)

  • 김동주;반상우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1098-1100
    • /
    • 2019
  • 영상 처리를 기반으로 하는 발굴 유물(고배) 도면 자동 생성 모델의 성능향상을 위한 투창 영역 자동 검출과 투창 영역의 영상 정보의 특성을 반영한 윤곽선 검출을 통한 고배 유물 도면화 성능 향상 모델을 제안하고 실험결과를 통해 투창 영역의 윤곽선 정확도가 향상되었음을 보인다. 투창 영역은 형태적 특성상 고배 유물의 도면 자동 생성 과정에서 왜곡된 윤곽선 검출의 가능성이 높은 부분이어서 투창 영역 윤곽선의 정확도를 높이는 것이 중요한 요소이다.