• 제목/요약/키워드: Clustered-tree

검색결과 128건 처리시간 0.024초

운율경계정보를 이용한 HMM기반 한국어 TTS 자연성 향상 연구 (Improvement of Naturalness for a HMM-based Korean TTS using the prosodic boundary information)

  • 임기정;이정철
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권9호
    • /
    • pp.75-84
    • /
    • 2012
  • HMM 기반 음성합성시스템은 성능향상을 위해 일반적으로 대용량 음성 DB로부터 생성된 문맥의존 tri-phone을 이용한다. 그리고 대용량 DB의 경량화를 위해서 문맥의존정보를 이용하여 결정트리 방식으로 발화특성이 유사한 문맥의존음소들을 군집화한다. 군집화에 사용하는 문맥의존정보는 음소열 뿐만 아니라 운율정보도 포함하는데 이는 합성음의 자연성이 끊어 읽기, 억양패턴, 음의 장단과 같은 운율에 의해 크게 좌우되기 때문이다. 그러나 복잡한 운율정보를 사용할 경우 훈련과정에 포함되지 않은 문맥의존음소는 하나의 대표값으로 평활화되며 이로 인해 합성음의 자연성이 크게 저하된다. 본 논문에서는 합성음의 자연성을 향상시키기 위해 복잡한 운율정보 대신 억양 변화를 상승, 평탄, 하강으로 구분함으로써 운율정보표현을 간소화시킨 운율경계정보를 포함하는 문맥의존정보에 대한 문맥질의, 그리고 해당 질의의 패턴을 정의하는 방법을 제안하였다. 본 논문에서 제안하는 세 가지 운율경계정보를 포함한 문맥의존정보를 이용하여 합성음을 생성하고 MOS평가를 수행한 결과 운율경계정보를 이용한 HMM기반 한국어 TTS 합성음의 자연성이 향상됨을 확인하였다.

계량정보분석시스템으로서의 KnowledgeMatrix 개발 (Development of the KnowledgeMatrix as an Informetric Analysis System)

  • 이방래;여운동;이준영;이창환;권오진;문영호
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.68-74
    • /
    • 2008
  • 데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다 KnowledgeMatrix의 주요 구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

공공용지 녹지의 탄소저감과 증진방안 (Carbon Reduction and Enhancement for Greenspace in Institutional Lands)

  • 조현길;박혜미;김진영
    • 한국조경학회지
    • /
    • 제48권4호
    • /
    • pp.1-7
    • /
    • 2020
  • 본 연구는 도시의 공공용지 녹지에 의한 탄소의 연간 흡수 및 저장을 계량화하고, 탄소저감 효과를 증진하기 위한 녹지구조의 개선방안을 제시하였다. 연구대상 도시는 규모와 분포지방을 고려하여 서울시, 대전시, 대구시, 춘천시, 순천시 등 총 5개 도시를 표본 선정하였다. 대상 도시의 항공사진 상에서 체계적 임의 표본추출방법을 통해 표본 공공용지를 선정하고, 녹지의 수평적 및 수직적 구조를 실사하였다. 도시 조경수목을 대상으로 개발한 수종별 계량모델을 적용하여, 식재수목에 의한 탄소의 연간 흡수 및 저장량을 산정하였다. 연구대상 공공용지의 교목밀도는 도시들 모두에 걸쳐 평균 1.4±0.1주/100㎡이고, 흉고직경은 14.9±0.2cm이었다. 녹지의 수직구조는 교목, 관목 또는 잔디만 식재한 단층구조의 비율이 다층구조보다 더 높았다. 식재수목에 의한 단위면적당 연간 탄소흡수량은 평균 0.65±0.04t/ha/yr이고, 단위면적당 탄소저장량은 7.37±0.47t/ha로서, 국내·외의 타 녹지공간 유형에 비해 낮은 탄소저감 효과를 보였다. 이는 연구대상 공공용지의 식재수목 밀도와 규격이 상대적으로 저조하기 때문이었다. 그럼에도 불구하고, 공공용지의 녹지는 공공용 전력소비에 따른 탄소배출을 도시에 따라 해마다 0.6(서울)~1.9%(춘천) 상쇄시키는 셈이었다. 잠재식재공간 내 수목식재는 기존 연간 탄소흡수량을 약 18% 추가 증진 가능하였다. 공공용지 녹지의 탄소저감 효과를 증진하기 위해서는 잠재식재공간의 적극적 수목식재, 상층 교목, 중층 교목 및 하층 관목으로 구성되는 다층 군식의 추진, 탄소흡수 능력이 양호한 교목종의 상층 식재, 상록수종의 토피어리, 관리회피 등이 요구된다. 본 연구는 국내 미진한 공공용지의 녹지구조 및 탄소상쇄를 구명하는데 중점을 두었다.

Genetic Relationships of Korean Treefrogs (Amphibia; Hylidae) Based on Mitochondrial Cytochrome b and 12S rRNA Genes

  • Jung Eun Lee;Dong Eun Yang;Yu Ri Kim;Hyuk Lee;Hyun Ick Lee;Suh-Yung Yang;Hei Yung Lee
    • Animal cells and systems
    • /
    • 제3권3호
    • /
    • pp.295-301
    • /
    • 1999
  • The nucleotide sequence of a 447 base pair fragment in the mitochondrial cytochrome b gene and the complete sequence of the mitochondrial 12S ribosomal RNA gene, 938 bp, were analyzed to infer inter- and intraspecific genetic relationships of Hyla japonica and H. suweonensis from Korea and H, japonica from Japan. In the mitochondrial cytochrome b gene, genetic differentiation among H. japonica populations were 9.62% and 15.66% between H. japonica and H. suweonensis. Based on the Tamura-Nei distance, the level of sequence divergence ranged from 0.45% to 2.75% within Korean H. japonica, while 8.31%-8.87% between Korean and Japanese H. japonica and 11.51%-12.46% between H. japonica and H. suweonensis. In the neigh-bor-joining tree, Korean populations of H. japonica were clustered first at 2.22% and followed by Japanese H. japonica and H. suweonensis at 8.51% and 12.29%, respectively. In mitochondrial 12S rRNA gene, genetic differentiation between H. japonica and H. suweonensis nras 7.17% (68 bp) including 7 gaps. Based on Tamura-Nei distance, the level of sequence divergence ranged 3.53% between Korean and Japanese H. japonica and from 4.93% to 5.41% between H. japonica and H. suweonensis. Phenogram pattern of the 12S rRNA gene sequence corresponded with that of the mitochondrial cytochrome b gene.

  • PDF

Genetic Relationships of Rana amurensis Based on Mitochondrial Cytochrome b Gene Sequences

  • Lee, Jung-Eun;Yang, Dong-Eun;Kim, Yu-Ri;Lee, Hyuk;Lee, Hyun-Ick;Yang, Suh-Yung;Lee, Hei-Yung
    • Animal cells and systems
    • /
    • 제3권3호
    • /
    • pp.303-309
    • /
    • 1999
  • Inter- and intraspecific genetic relationships between Rana amurensis from Korea and Russia and other brown frogs were investigated by nucleotide sequence of a 504 base pair (bp) fragment of the mitochondrial cytochrome b gene. Nucleotide sequence similarities among Korean populations of R. amurensis ranged from 99.6% to 97.6% and 98.8% within Russian populations. The nucleotide sequence similarity between Korean and Russian R. amurensis ranged from 86.9% to 85.5%. Based on Kimura-2-parameter distance, the sequence divergence between R. amurensis from Korea and Russia was 16.18% and 18.04% among other related brown frogs. interspecific sequence divergences among R. amurensis and other related brown frogs diverged by 20.3%. Using an estimate of 2-4% mitochondrial DNA sequence divergence per million years, Korean and Russian R. amurensis diverged about 8 to 4 million years ago (Mya) and other brown frogs diverged about 9 to 5 Mya from ancestral frogs and distributed from North Asia to Sakhalin in a short time. In the neighbor-joining and UPGMA tree R. amurensis was clustered into two groups with Korean and Russian populations and the other brown frogs were grouped separately with diverged trichotomous clusters (R. dybowskii and R. pirica, R. okinavana and R. tsushimensis, and R. japonica and R. longicrus).

  • PDF

The Diversity of BoLA-DRB3 Gene in Iranian Native Cattle

  • Nassiry, M.R.;Eftekhari Shahroudi, F.;Tahmoorespur, M.;Javadmanesh, A.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제21권4호
    • /
    • pp.465-470
    • /
    • 2008
  • This study describes genetic variability in the BoLA-DRB3 gene in Iranian native cattle (Bos Indicus and Taurus) and relationships between these breeds. This is the first study of genetic polymorphism of the BoLA-DRB3 gene in Iranian native cattle. We examined exon 2 of the major histocompatibility complex (MHC) class II DRB3 gene from 203 individuals in four populations of Iranian native cattle (52 Sarabi, 52 Najdi, 49 Sistani, 50 Golpayegani cattle) using the hemi-nested PCR-RFLP method. We identified the 36 previously reported alleles and one novel pattern (*eac). Analysis of the frequencies of the various BoLA-DRB3.2 alleles in each breed indicated that DRB3.2*52 in Sarabi cattle (23%), DRB3.2 *14 and *24 alleles in Najdi cattle (13%), DRB3.2 *8 allele in Sistani cattle (22%) and DRB3.2*16 allele in Golpayegani cattle (14%), were the most frequent alleles. Allelic frequencies ranged from 1 to 23% among the 36 alleles and there were some alleles that were found only in Iranian cattle. Effective number of alleles in the four breeds was estimated to be 7.86, 11.68, 7.08 and 3.37 in Sarabi, Najdi, Sistani and Golpayegani, respectively. Observed heterozygosities were the highest in Sarabi (94%) and Najdi (94%). A population tree based on the frequency of BoLA-DRB3.2 alleles in each breed suggested that Najdi, Sarabi and Golpayegani cattle clustered together and Najdi and Sarabi were the closest breeds. Sistani cattle differed more from these three breeds. These new data suggest that allele frequencies differ between Iranian cattle breeds.

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of Continuous-Valued Attributes considering Data Distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.391-396
    • /
    • 2003
  • 본 논문에서는 특정 매개변수(parameter)의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(continuous) 속성 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화 하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

Evaluation of the genetic structure of indigenous Okinawa Agu pigs using microsatellite markers

  • Touma, Shihei;Arakawa, Aisaku;Oikawa, Takuro
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제33권2호
    • /
    • pp.212-218
    • /
    • 2020
  • Objective: Agu pigs are indigenous to the Okinawa prefecture, which is the southernmost region of Japan. Agu pigs were exposed to a genetic bottleneck during the 20th century, due to the introduction of European pig breeds. The objective of this study was to elucidate the genetic structure of Agu pigs and to determine their relationships with those of five European breeds, two Chinese breeds and Ryukyu wild boar using microsatellite markers. Methods: A total of 203 DNA samples from 8 pig breeds were used in this study. Genotyping was performed using 21 microsatellite markers distributed across 17 chromosomes. Results: Numbers of effective alleles in Agu pigs were fewer than in European breeds and Ryukyu wild boar. Among domestic pigs, Agu pigs had the lowest heterozygosity (0.423) and highest inbreeding coefficient (FIS = 0.202), indicating a severe loss of heterozygosity in Agu pigs possibly due to inbreeding. Neighbor-joining tree analysis was performed based on Reynolds' genetic distances, which clustered Agu pigs with Duroc pigs. However, principal component analysis revealed a unique genetic position of the Agu pig, and the second principal component separated Agu pigs from all other breeds. Structure analysis with the optimal assumption of seven groups (K = 7) indicated that Agu pigs form an independent cluster from the other breeds. In addition, high and significant FST values (0.235 to 0.413) were identified between Agu pigs and the other breeds. Conclusion: This study revealed a substantial loss of genetic diversity among Agu pigs due to inbreeding. Our data also suggest that Agu pigs have a distinctive genetic structure, although gene flows from European breeds were observed.

음소 질의어 집합 생성 알고리즘 (Phonetic Question Set Generation Algorithm)

  • 김성아;육동석;권오일
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.173-179
    • /
    • 2004
  • 음소 질의어 집합은 문맥 속에서 비슷한 조음 효과를 보이는 음소들을 분류해 놓은 것으로서, 음성 인식 시스템 학습 시 결정트리를 기반으로 HMM (hidden Markov model)의 상태들을 클러스터링할 때 사용된다. 현재까지의 음소 질의어 집합은 대부분 음성학자나 언어학자들에 의해 수작업으로 제시되어 왔는데, 이러한 지식 기반음소 질의어들은 언어 또는 유사음소 단위 (PLU: phone like unit)에 종속될 뿐 아니라 생성된 클러스터 내의 동질성을 저하시킬 수 있다는 단점이 있다. 본 논문에서는 이와 같은 문제점들을 해결하기 위해 음성 데이터를 사용하여 측정한 음소들 사이의 유사도를 기반으로 언어나 유사음소단위에 상관없이 자동으로 음소 질의어 집합을 생성하는 알고리즘을 제안한다. 실험결과, 제안한 방법으로 생성된 음소 질의어들을 사용한 인식기의 에러율이 약 14.3%감소하여 데이터 기반의 음소 질의어 집합이 상태 클러스터링에 효율적임을 관측하였다.

Early Detection of Lung Cancer Risk Using Data Mining

  • Ahmed, Kawsar;Abdullah-Al-Emran, Abdullah-Al-Emran;Jesmin, Tasnuba;Mukti, Roushney Fatima;Rahman, Md. Zamilur;Ahmed, Farzana
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권1호
    • /
    • pp.595-598
    • /
    • 2013
  • Background: Lung cancer is the leading cause of cancer death worldwide Therefore, identification of genetic as well as environmental factors is very important in developing novel methods of lung cancer prevention. However, this is a multi-layered problem. Therefore a lung cancer risk prediction system is here proposed which is easy, cost effective and time saving. Materials and Methods: Initially 400 cancer and non-cancer patients' data were collected from different diagnostic centres, pre-processed and clustered using a K-means clustering algorithm for identifying relevant and non-relevant data. Next significant frequent patterns are discovered using AprioriTid and a decision tree algorithm. Results: Finally using the significant pattern prediction tools for a lung cancer prediction system were developed. This lung cancer risk prediction system should prove helpful in detection of a person's predisposition for lung cancer. Conclusions: Most of people of Bangladesh do not even know they have lung cancer and the majority of cases are diagnosed at late stages when cure is impossible. Therefore early prediction of lung cancer should play a pivotal role in the diagnosis process and for an effective preventive strategy.