• 제목/요약/키워드: Classification and regression trees (CART)

검색결과 30건 처리시간 0.03초

일본어 TTS의 가변 Break를 이용한 합성단위 선택 방법 (A Unit Selection Methods using Variable Break in a Japanese TTS)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.983-984
    • /
    • 2008
  • This paper proposes a variable break that can offset prediction error as well as a pre-selection methods, based on the variable break, for enhanced unit selection. In Japanese, a sentence consists of several APs (Accentual phrases) and MPs (Major phrases), and the breaks between these phrases must predicted to realize text-to-speech systems. An MP also consists of several APs and plays a decisive role in making synthetic speech natural and understandable because short pauses appear at its boundary. The variable break is defined as a break that is able to change easily from an AP to an MP boundary, or from an MP to an AP boundary. Using CART (Classification and Regression Trees), the variable break is modeled stochastically, and then we pre-select candidate units in the unit-selection process. As the experimental results show, it was possible to complement a break prediction error and improve the naturalness of synthetic speech.

  • PDF

TTS 시스템을 위한 휴지기간 모델링 (The Modeling of Pause Duration For Text-To-Speech Synthesis System)

  • 정지혜;이양희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.83-86
    • /
    • 2000
  • 본 논문에서는 비정형 단위를 사용한 음성 합성 시스템의 합성음에 대한 자연성을 향상시키기 위한 휴지 구간 추출 및 휴지 지속시간 예측 모델을 제안한다. 제안된 휴지 지속시간 예측 모델은 트리 기반 모델링 기법 중 하나인 CART (Classification And Regression Trees)방법을 이용하였다. 이를 위해 남성 단일 화자가 발성한 6,220개의 어절경계 포함하는 총 400문장의 문 음성 데이터베이스를 구축하였고, 이 데이터베이스로부터 V-fold Cross-Validation 방법에 의해 최적의 트리를 결정하였다. 이 모델을 평가한 결과, 휴지 구간 추출 정확율은 $81\%$로 휴지 구간 존재 추출 정확율은 $83\%, 휴지 구간 비존재 추출 정확율은 $80\%이었고, 실 휴지지속시간과 예측 휴지지속시간과의 다중상관 계수는 0.84로, 오차 범위 20ms 이내에서 의 정 확율은 $88\%$ 이었다. 또한, 휴지지속시간을 예측하여 적용한 합성음을 청취 실험한 결과 자연 음성과 대체적으로 유사하게 나타났다.

  • PDF

퍼지의사결정을 이용한 RC구조물의 건전성평가 (Integrity Assessment for Reinforced Concrete Structures Using Fuzzy Decision Making)

  • 손용우;정영채;김종길
    • 한국전산구조공학회논문집
    • /
    • 제17권2호
    • /
    • pp.131-140
    • /
    • 2004
  • 철근콘크리트 구조물의 보수ㆍ보강 등의 유지관리를 위해서는 내구성과 내하성을 동시에 고려한 건전성평가의 의사결정기준이 절실히 요구된다. 본 논문은 CART-ANFIS을 사용하는 철근콘크리트 구조물에 대하여 효율적인 모델을 나타내었다. 철근콘크리트 구조물의 손상과 진단 등에 활용되어온 분류형 전문가시스템의 일종인 퍼지이론을 이용한 결정목 구조와 기존의 인공신경망을 이용한 결정목 구조의 건전성평가를 비교 분석한다. 손상된 철근콘크리트의 내구성 회복을 위한 보강설계 이론과 내하력 증가를 위한 보장설계 이론을 정립시켜 손상검출의 산정식을 유도하였다. 본 연구의 건전성 평가시스템 모델을 이용함으로서 보다 효율적인 철근콘크리트 유지관리 뿐만 아니라 생애주기비용 예측을 수행 할 수 있다.

위성영상 자료를 이용한 고해상도 가뭄지수 산정모형 개발 (Generation of Fine Resolution Drought Index using Satellite Data)

  • 김광섭;박한균
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1607-1611
    • /
    • 2009
  • 본 연구에서는 현재 가뭄을 관측하는데 주로 이용되는 가뭄지수의 단점 등을 보완하고자 가뭄에 관련되는 식생지수를 연계한 공간해상도 높은 가뭄지수를 제시하였다. 우리나라 지상관측을 통해 산출할 수 있는 PDSI(Palmer Drought Severity Index)와 SPI(Standardized Precipitation Index) 같은 가뭄지수는 기온과 강수량 등의 기후자료만을 이용하여 산정할 수 있다. 두 가뭄지수는 관측하기 어려운 가뭄의 시기와 심도를 설명하고자 여러 연구를 통해 개발한 지수이지만, 두 가뭄지수만을 가지고 우리나라 전역의 가뭄의 공간적인 분포를 설명하기에는 다소 무리가 있다. PDSI의 경우 강수량과 기온과 토양의 수분함유량을 가지고 산출하는데, 전 관측지점을 똑같은 토양수분함유량을 가지고 있다는 가정 하에 계산되고, SPI의 경우 강수량만을 이용하여 산정한다. PDSI의 경우 과거의 가뭄의 정도를 판단하는데 매우유용하다고 알려져 있다. 하지만, 현재의 가뭄정도를 나타내는 데는 문제를 가지고 있고, SPI의 경우는 누적강수량을 가지고 시간단위로 계산한다는 점에서 다양한 가뭄의 정도를 예측할 수 있지만, 입력 자료로 강수량만 들어간다는 점에서 약점을 가진다. 이런 기후지수만을 이용한 가뭄정보 생산이 공간정보를 구현하는데 한계를 가지는 문제점을 개선하고자 가뭄에 직간접적으로 관련이 있는 보다 세밀한 공간정보를 가진 식생, 토지이용, 고도 등의 자료와 기후정보로부터 산정된 가뭄지수간의 관계를 분석하였다. 나아가 기존의 기후지수보다 고해상도를 가진 위성의 정규식생지수(NDVI; Normalized Difference Vegetation Index)와 같은 식생지수를 이용하여 기존보다 더 향상된 해상도의 가뭄지수를 산정하고자 하였다. 우리나라 지상관측소 76개 지점 중에 MODIS(Moderate Resolution Imaging Spectroradiometer) 정규식생지수 자료와의 관계를 분석하고자 자료의 보유기간이 짧은 지점과 섬지점 등을 제외한 57개 지점을 선정하고, 연구기간동안의 강수량과 기온자료를 이용하여 PDSI와 SPI를 산출하였다. PDSI와 SPI자료를 고해상도 가뭄지수 산정의 기본 변수로 사용하기 위하여 역거리가중평균법을 이용한 연구기간동안의 한반도 지역 PDSI와 SPI 가뭄지수 지도를 생산하였다. 각각의 가뭄지수와 식생 상태를 나타내는 NDVI와의 상관특성과 계절 변화에 따른 변화특성을 분석하고, CART(Classification and Regression Trees) 알고리즘을 이용하여, 지상 자료만을 사용한 가뭄지수가 가지는 시공간적 변화 특성 제시에 대한 문제점을 개선한 보다 해상도가 높은 조합가뭄지수를 제시하였다.

  • PDF

슬통 진단용 설문지개발 및 진단 일치도 평가연구 (Development of Knee Pain Diagnosis Questionnaire and Clinical Study of Diagnostic Correspondent Rate)

  • 황지후;김유종;김은정;이참결;이은용;이승덕;김갑성
    • Journal of Acupuncture Research
    • /
    • 제29권5호
    • /
    • pp.61-74
    • /
    • 2012
  • Objectives : This study is perfomed for preparation of oriental medicine clinical guidelines for drawing up the standards of oriental medicine demonstration and diagnosis classification about the knee pain. Methods : Statistical analysis about Crane's-knee wind(鶴膝風), arthralgia syndrome(痺症), knee injury(膝傷), gout arthritis(痛風), Youk jeol poung(歷節風) classified experts' opinions about knee pain patients by Delphi method is conducted by using oriental medicine diagnosis questionnaire. The result was classified by using linear discriminant analysis(LDA), diagonal linear discriminant analysis(DLDA), diagonal quadratic discriminant analysis(DQDA), K-nearest neighbor classification(KNN), classification and regression trees(CART), support vector machines(SVM). Results : The results are summarized as follows. 1. The result analyzed by using LDA has a hit rate of 81.65% in comparison with the original diagnosis. 2. The result analyzed by using DLDA has a hit rate of 63.3% in comparison with the original diagnosis. 3. The result analyzed by using DQDA has a hit rate of 65.14% in comparison with the original diagnosis. 4. The result analyzed by using KNN has a hit rate of 74.31% in comparison with the original diagnosis. 5. The result analyzed by using CART has a hit rate of 75.23% in comparison with the original diagnosis when the test of selected 13 significant questions based on analysis of variance was performed. 6. The result analyzed by using SVM has a hit rate of 87.16% in comparison with the original diagnosis. Conclusions : Statistical analysis using oriental medicine diagnosis questionnaire on knee pain generally turned out to have a significant result.

MULTIFACTOR DIMENSIONALITY REDUCTION(MDR)을 이용한 한우 도체중에서의 주요 SNP 규명 (Main SNP Identification of Hanwoo Carcass Weight with Multifactor Dimensionality Reduction(MDR) Method)

  • 이제영;김동철
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.53-63
    • /
    • 2008
  • 일반적으로 인간의 질병과 가축의 경제적인 특성은 하나의 유전자가 아닌 여러 유전자의 상호작용으로 일어난다고 믿고 있다. 따라서 본 연구에서는 세대를 거듭할수록 대립유전자의 유전이 안정적으로 발생되어지고 개체의 기능적인 유전적 가치를 직접적으로 추정할 수 있는 single nucleotide polymorphism(SNP)을 한우의 경제적 특성인도체중(carcass cold weight)에 대하여 모수적인 방법인 ANOVA와 비모수적인 방법인 multifactor dimensionality reduction(MDR)을 이용하여 하나의 유전자의 효과와 두 개의 유전자의 상호작용 효과를 비교하였다. ANOVA에서는 하나의 유전자 SNP1이 도체중에 유의한 효과가 있었고 상호작용 효과에서는 도체중에 유의한 효과는 없었다. MDR에서는 하나의 유전자의 효과인 SNP1과 두 개의 유전자의 상호작용인 SNP1*SNP2의 효과가 컸으며 SNP1과 SNP1*SNP2를 비교했을 시에는 SNP1*SNP2의 효과가 더 크게 나타났다. 이는 개별 SNP유전자 보다 복합 SNP유전자의 상호작용이 경제적인 특성인 도체증에 더 영향을 준다는 것을 알 수 있었다.

의사결정나무 CART 알고리즘을 이용한 청소년 아침결식 예측 모형: 제7기 (2016-2018년) 국민건강영양조사 자료분석 (A prediction model for adolescents' skipping breakfast using the CART algorithm for decision trees: 7th (2016-2018) Korea National Health and Nutrition Examination Survey)

  • 최선아;정성석;노정옥
    • Journal of Nutrition and Health
    • /
    • 제56권3호
    • /
    • pp.300-314
    • /
    • 2023
  • 본 연구는 2016-2018년 국민건강영양조사 자료를 이용하여 청소년의 아침결식과 관련된 요인을 찾고 아침결식 예측모형을 분석하여 청소년의 아침결식 예방 교육 및 정책 수립에 기초 자료를 제공하고자 하였다. 2016-2018년 국민건강영양조사의 참여자는 총 24,269명으로 12-18세의 청소년 중 변수 결측자를 제외한 대상자는 1,024명이며, 이중 아침식사 섭취자 579명, 결식자 445명이었다. 남학생의 49.1%, 여학생의 50.9%가 아침결식자였다. 연령은 아침식사 결식군이 유의적으로 높으며, 결식군의 고등학생 비율이 높았다. 가구소득 4분위수는 아침식사 섭취군의 9.1%, 결식군의 15.4%가 '하'로 유의적인 차이를 보였다. 조사대상자의 신체적 요인은 유의적인 차이를 보이지 않았으나 체중감소를 위해 결식을 하는 경우는 아침식사 결식군의 25.3%, 섭취군의 10.4%로 유의적인 차이를 보였다. 조사대상자의 식습관과 정신건강에서 아침식사 결식군이 섭취군보다 1일 1회이상 외식횟수가 유의적으로 높았으며, 최근 1년간 1주 동안 5-7회 이상의 저녁식사 섭취빈도는 아침섭취군이 유의적으로 높았다. 또한, 아침식사 섭취군은 결식군보다 영양교육 경험이 유의적으로 높았으며, 아침식사 섭취군이 결식군보다 에너지, 단백질, 지방, 탄수화물, 식이섬유, 콜레스테롤, 비타민 A, 비타민 B1, 비타민 B2, 니아신, 비타민 C, 칼슘, 인, 나트륨, 칼륨, 철의 섭취율 및 탄수화물, 단백질, 지방의 섭취비율도 유의적으로 높았다. 아침결식 예측 모형을 도출하기 위해 CART 알고리즘을 사용한 의사결정나무 분석결과, 아침식사 섭취여부를 결정하는 주요인은 투입된 7개의 변수 중 교육수준과 영양교육 경험을 제외한 결식을 통한 체중조절, 가구소득 4분위수, 저녁식사 빈도, 연령, 외식 횟수였다. 체중조절을 위하여 결식을 하는 경우는 아침식사 결식군에서 높았다. 체중조절을 위하여 결식을 하지 않는 대상자는 가구소득 4분위수의 수준에서 소득이 '하', '중하'일 때 아침결식 비율이 높았다. 가구소득수준이 '상', '중상' 대상자의 경우는 저녁식사 빈도가 주 3-4회 이하인 경우 아침결식 비율이 높았다. 저녁식사 빈도가 주 5-7회이더라도 연령이 14.5세 초과인 경우 아침결식을 하고 있으며, 연령이 14.5세 미만인 대상자들은 외식횟수가 일 1회 이상인 경우, 주 6회 이하인 경우 아침결식을 하고 있었다. 따라서 아침결식을 감소시키기 위해서 청소년 대상의 각 그룹의 결식 주요인에 따라 올바른 체중조절 방법, 아침식사 배달, 건강정보에 대한 접근성 높이기, 아침결식과 질병과의 관련성 교육을 위한 토론수업 및 역할놀이 등과 같은 맞춤형 교육이 필요하며, 향후 청소년의 저녁식사 결식 감소 방안에 대한 연구가 추가적으로 진행되어야 하겠다.

고품질 한우를 위한 여러 경제형질에서의 주요 SNP 규명 (Important SNPs Identification from the Economic Traits for the High Quality Korean Cattle)

  • 이제영;김동철
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2009
  • 고품질 한우를 만들기 위해 여러 경제형질에 영향을 주는 유전자 즉 single nucleotide polymorphisms(SNPs)를 규명하려고 한다. 이미 Lee 등 (2008a)에 의해 SNP(19_1)$^*$SNP(28_2)가 등심단면적 (LMA: longissimus muscle dorsi area)에 주요한 유전자로 규명되었다. 여기에 추가로 도체중 (CWT: carcass cold weight)과 일당증체량 (ADG: average daily gain)을 선형 모형에 적용하였으며 또한 상호작용에 더 유리하고 연속형 데이터에도 사용할 수 있는 expanded multifactor dimensionality reduction (expanded MDR)을 이용하여 주요한 SNP를 파악하였다. Expanded MDR 적용결과 등심단면적과 같은 결과인 SNP(19_1)과 SNP(19_1)$^*$SNP(28_2)의 상호작용 형태가 가장 좋은 SNP로 선정되었으며, 최종적으로 SNP(19_1)*SNP(28_2) 마커가 한우의 여러 경제형질에 우수 유전자임을 규명하였다.

일 도시 노인의 성공적인 노화 관련 요인 (Factors Associated with Successful Aging of Korean Older People Living in a City)

  • 신영희;이혜정
    • 한국노년학
    • /
    • 제29권4호
    • /
    • pp.1327-1340
    • /
    • 2009
  • 본 연구의 목적은 일 도시 노인의 성공적인 노화의 수준을 알아보고, 성공적인 노화와 관련된 요인을 규명하는 것이며, 또한 의사결정나무분석 방법을 이용하여 성공적인 노화의 점수에 따른 취약 그룹의 특성을 알아보고 우리나라 노인의 성공적인 노화 증진 프로그램을 개발하는데 기초자료로 활용하기 위함이다. 대구의 일 동사무소에 등록된 노인 중에서 연구 참여에 동의하고 설문지 면접을 마친 총 187명을 대상으로 하였다. 연구 참여에 동의한 노인은 면담자가 직접 노인 가구를 방문하여 구조화된 설문지를 이용하여 성공적인 노화, 우울, 신체적 기능상태, 만성 질환 수, 그리고 친구와의 접촉 빈도수에 대한 정보를 수집하였다. 일 도시의 노인에서 남성, 고학력, 배우자와 사별하지 않은, 그리고 가족과 동거하는 노인이 그렇지 않은 노인에 비해 상대적으로 성공적인 노화의 점수가 높았다. 반면에 우울정도가 심하거나 만성질환이 많을수록 성공적인 노화의 점수가 낮았다. 또한 신체기능과 자가 건강 평가수준이 높거나, 규칙적인 운동을 하거나 친구와의 교제가 많을수록 성공적인 노화의 점수가 높았다. 우울은 노인의 성공적인 노화의 점수에 따른 취약그룹을 분류하는데 일차적으로 중요한 결정 요인이었으며, 성공적인 노화의 점수가 가장 낮은 노인 그룹은 우울정도가 심하고 신체적 기능 상태가 좋지 않았으며, 반대로 성공적인 노화의 점수가 가장 높은 그룹은 우울정도가 약하고 신체적 기능상태가 좋은 노인이었다. 우울과 만성질환은 노인이 성공적인 노화를 경험하는데 부정적인 영향을 미칠 뿐 아니라 성공적인 노화의 점수가 낮은 그룹의 공통적인 특성이었으므로 노인의 우울과 만성질환을 위한 중재 프로그램의 제공이 중요하다는 것을 본 연구는 재확인하였다.

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.