• 제목/요약/키워드: Random selection

검색결과 641건 처리시간 0.03초

효율적인 기계학습 자질 선별을 통한 한국어 운율구 경계 예측 모델의 성능 향상 (Performance Improvement of a Korean Prosodic Phrase Boundary Prediction Model using Efficient Feature Selection)

  • 김민호;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.837-844
    • /
    • 2010
  • 운율구 경계 예측은 대화체 음성합성을 실현하기 위한 주요한 자연언어처리 기술 중 하나이다. 본 논문은 자연스러운 한국어 운율구 경계 예측을 실현하고자 기존의 학습 자질을 대신할 새로운 학습 자질을 제안한다. 이 새로운 자질들은 기존의 학습 자질보다 실제 언어생활에서 운율구 경계 발생에 영향을 미치는 여러 요인을 더 잘 반영한다. 특히, 수작업으로 구축한 운율구 경계 예측 규칙을 이용하여 추출한 학습 자질은 높은 정확도 향상에 이바지한다. 본 논문에서 제안한 새로운 학습 자질을 바탕으로 CRFs(Conditional Random Fields)를 이용하여 운율구 경계 예측 모델을 만들었다. 그 결과 3단계 운율구 경계(강한 경계, 약한 경계, 운율구 내부 비경계) 예측에서 86.63%의 정확도를, 6단계 운율구 경계(상승조/하강조 강한 경계, 상승조/하강조/평탄조 약한 경계, 운율구 내부 비경계) 예측에서는 81.14%의 정확도를 보였다.

Genetic Relationships of Four Korean Oysters Based on RAPD and Nuclear rDNA ITS Sequence Analyses

  • 김우진;이정호;김경길;김영옥;남보희;공희정;정현택
    • 한국패류학회지
    • /
    • 제25권1호
    • /
    • pp.41-49
    • /
    • 2009
  • Random amplified polymorphic DNA (RAPD) marker and sequence analyses of the internal transcribed spacer (ITS) region of ribosomal DNA were used to assess phylogenetic relationships of four Korean oyster species. The average number of species-specific markers identified from five universal rice primers (URPs) by RAPD-PCR was 1.8 for Crassostrea gigas, 3.2 for C. nippona, 3.6 for C. ariakensis, and 4.6 for Ostrea denselamellosa. The length of the ITS (ITS1-5.8S-ITS2) region ranged from 1,001 to 1,206 bp (ITS1, 426-518 bp; 5.8S, 157 bp; and ITS2, 418-536 bp), while the GC content ranged from 55.5-61.1% (ITS1, 56.8-61.8%; 5.8S, 56-57.3%; and ITS2, 54.1-62.2%). A phylogenetic analysis of the oysters based on our RAPD, ITS1, and ITS2 sequence data revealed a close relationship between C. gigas and C. nippona and a distant relationship between the genera Crassostrea and Ostrea. Our results indicated that RAPD and ITS sequence analysis was a useful tool for the elucidation of phylogenetic relationships and for the selection of species-specific markers in Korean oysters.

  • PDF

컨텐츠의 저작권 보호를 위한 DWT영역에서의 디지털 워터마킹 기법 (Digital Watermarking Technique in Wavelet Domain for Protecting Copyright of Contents)

  • 서영호;최현준;김동욱
    • 한국정보통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1409-1415
    • /
    • 2010
  • 본 논문에서는 웨이블릿 변환 영역에서 구성한 부대역간의 트리구조와 공간 영역에서의 영상 형태 정보를 이용하여 워터마크의 삽입 위치를 결정한 후에 워터마크를 삽입하는 기법을 제안하였다. 웨이블릿 영역에서 높은 주파수를 가지는 부대역을 다수의 영역으로 나누고 각 블록에 대한 에너지와 전체 에너지의 평균값 등을 이용하여 워터마킹을 위한 후보영역을 얻는다. 또한 공간 영역에서 얻어진 영상의 경계 정보를 이용하여 워터마크가 삽입될 후보 영역을 구한다. 무작위 난수와 웨이블릿 영역에서 이웃 웨이블릿 계수간의 관계를 이용하여 워터마킹 후보영역 내에 워터마크를 삽입한다. 마지막으로 역 웨이블릿 변환을 수행하여 워터마크가 삽입된 영상을 생성한다. 제안된 워터마킹 알고리즘은 JPEG과 같은 압축과 블러링, 선명화, 그리고 가우시안 잡음 등의 공격에 대해서 우수한 특성을 보였다.

나무구조의 분류분석에서 변수 중요도에 대한 고찰 (Comparison of Variable Importance Measures in Tree-based Classification)

  • 김나영;이은경
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.717-729
    • /
    • 2014
  • 본 연구에서는 나무구조의 분류분석에서 자료의 크기가 방대해짐에 따라 중요한 문제로 대두되고 있는 변수의 중요도에 대하여 사영추적분류나무를 중심으로 고찰하였다. 사영추적분류나무(projection pursuit classification tree)는 각 마디에서 사영추적을 이용하여 그룹을 잘 분리하는 변수들의 선형결합을 이용하는 방법으로 이때 사용되는 사영계수들은 각 마디에서의 분류에 대한 정보를 가지고 있다. 이를 종합하여 각 변수의 분류에 대한 중요도를 계산할 수 있다. 먼저 사영추적분류나무의 분류과정에서 계산되는 사영추적계수를 이용하여 분류를 위한 변수선택의 중요도를 계산하고 이들의 특성을 살펴보고 이를 같은 형태의 나무모형방법인 CART와 랜덤 포레스트의 결과와 비교 분석하여 사영추적분류나무의 특성을 살펴보고 비교, 분석하였다. 대부분의 자료에서 사영추적분류나무가 훨씬 좋은 성능을 보이고 있었으며 특히 상관계수가 높은 변수들이 포함되어 있는 경우에는 상대적으로 적은 수의 변수로도 잘 분류를 할 수 있음을 확인하였다. 랜덤 포레스트에서 제공하는 변수 중요도는 변수들 간의 상관관계가 높은 경우에는 사영추적분류나무의 변수중요도와 매우 다르게 나타나며 사영추적분류나무의 변수 중요도가 조금 더 나은 성능을 보이고 있음을 알 수 있다.

경험적 베이지안 방법을 이용한 결측자료 연구 (Analysis of Missing Data Using an Empirical Bayesian Method)

  • 윤용화;최보승
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1003-1016
    • /
    • 2014
  • 조사를 통하여 수집된 자료에 기반하여 분석을 수행하는데 있어서 결측값에 대한 적절한 대체 방법은 보다 정확한 결과를 얻기 위한 매우 중요한 절차이다. 본 연구에서는 모형에 기반하여 결측자료에 대한 대체방법과 모형 추정방법을 다루었다. 특히 최대우도추정 방법의 적용에서 발생할 수 있는 변방값 문제(bounday soluntion problem)를 해결하기 위하여 베이지안 방법을 적용하였다. 분석된 결과를 바탕으로 하여 예측을 수행한 후 결측체계에 따른 정확성 비교를 수행하여 결측체계에 따른 결측모형의 선택 문제를 다루었다. 예측의 정확도를 측정하기 위하여 Bautista 등 (2007)이 제안한 MWPE(modified within precinct error) 이용하여 비교를 수행 하였다. 본 연구에서 제시된 방법들은 2012년에 시행된 제 18대 대통령 선거 당일 시행된 출구조사의 자료를 적용하여 분석을 수행하였다. 분석 결과 임의결측체계의 가정에 따른 결과가 비임의체계 가정에 따른 결과보다 예측의 정확도가 더 높았다.

Identification of Coupling and Repulsion Phase DNA Marker Associated With an Allele of a Gene Conferring Host Plant Resistance to Pigeonpea sterility mosaic virus (PPSMV) in Pigeonpea (Cajanus cajan L. Millsp.)

  • Daspute, Abhijit;Fakrudin, B.
    • The Plant Pathology Journal
    • /
    • 제31권1호
    • /
    • pp.33-40
    • /
    • 2015
  • Pigeonpea Sterility Mosaic Disease (PSMD) is an important foliar disease caused by Pigeonpea sterility mosaic virus (PPSMV) which is transmitted by eriophyid mites (Aceria cajani Channabasavanna). In present study, a F2 mapping population comprising 325 individuals was developed by crossing PSMD susceptible genotype (Gullyal white) and PSMD resistant genotype (BSMR 736). We identified a set of 32 out of 300 short decamer random DNA markers that showed polymorphism between Gullyal white and BSMR 736 parents. Among them, eleven DNA markers showed polymorphism including coupling and repulsion phase type of polymorphism across the parents. Bulked Segregant Analysis (BSA), revealed that the DNA marker, IABTPPN7, produced a single coupling phase marker (IABTPPN $7_{414}$) and a repulsion phase marker (IABTPPN $7_{983}$) co-segregating with PSMD reaction. Screening of 325 F2 population using IABTPPN7 revealed that the repulsion phase marker, IABTPPN $7_{983}$, was co-segregating with the PSMD responsive SV1 at a distance of 23.9 cM for Bidar PPSMV isolate. On the other hand, the coupling phase marker IABTPPN $7_{414}$ did not show any linkage with PSMD resistance. Additionally, single marker analysis both IABTPPN $7_{983}$ (P<0.0001) and IABTPPN $7_{414}$ (P<0.0001) recorded a significant association with the PSMD resistance and explained a phenotypic variance of 31 and 36% respectively in $F_2$ population. The repulsion phase marker, IABTPPN7983, could be of use in Marker-Assisted Selection (MAS) in the PPSMV resistance breeding programmes of pigeonpea.

분자마커에 의한 인삼 적변관련 유전자의 분석 (Gene Analysis Related to Red-skin Disease of Ginseng by Molecular Marker)

  • 이범수;양덕춘
    • 한국자원식물학회지
    • /
    • 제17권2호
    • /
    • pp.116-121
    • /
    • 2004
  • 고려 인삼중 폐포와 4등급 이하를 유발시키는 90%이상이 적변삼이라고 불리는 인삼의 표피 색택이 붉은 삼이 그 원인이다. 이러한 적변삼은 미국삼보다는 고려 인삼에 서 다량 발견되는 바, 적변은 유전적 요인이 있다고 사료된다. 그러므로 이 연구의 목적은 RT-PCR을 이용하여 인삼적병에 내성을 가지는 유전자를 탐색하기 위하여 실시되었다. 고려인삼 3년근 1개체 중에서 적변이 발생된 부위와 건전 부위의 RNA를 추출하여 형성된 cDNA를 여러개의 random primer를 사용하여 PCR 증폭을 한 결과 정상 부위의 cDNA에서 발견되지 않는 band가 적변삼의 부위에서 발견되었다. 따라서 band가 형성된 부위의 유전자가 적변과 관련될 가능성이 있는 것으로 사료되고 이러한 유전자는 향후 염기서열을 분석하여 어떠한 유전자인지 판명을 하여야 하며 적변관련 유전자이면 선발마커로서 사용되고 또한 형질전환을 통한 적변내성 인삼계통을 육성할 수 있으며, 만약 적변과 관련이 없는 유전자로 판명된다면 더 많은 primer를 사용하여 적변관련 유전자를 탐색해야 할 것이다.

일가족 양립 정도에 대한 인식: 집단간 비교 분석을 중심으로 (An Analysis of Group Differences on Perceived Work-Family Balance)

  • 장수정;송다영;김은지
    • 한국사회복지학
    • /
    • 제61권2호
    • /
    • pp.349-370
    • /
    • 2009
  • 본 연구는 일가족 양립 인식정도에 대한 집단간 차이를 탐색하는데 목적이 있다. 이를 위하여 본 연구는 서울 및 수도권 지역에서 배우자와 함께 살고 있으며 일을 하고 있는 25세 이상 성인 1,490명을 대상으로 일가족양립 정도 및 수준에 대한 인식을 연구하기 위해 확률표본에 기반한 설문조사를 실시하였다. 주요 연구결과를 살펴보면, 성별로는 남성보다 여성 특히, 여성홀벌이들이 가족-일 양립 문제가 상당히 심각하였다. 연령대별로는 20대, 자녀수별로는 자녀가 한명인 경우 가족-일 양립에 가장 어려움을 경험하고 있었다. 고용형태별로는 정규직이, 기업규모별로는 300-900인 규모 사업장에서 일을 하고 있는 근로자들이 일-가족 양립의 문제가 심각한 것으로 나타났다. 산업별로는 교육 및 보건 등과 같은 서비스산업에서 일하는 사람들이 가족-일 양립의 문제가 심각한 것으로 나타났다.

  • PDF

개선된 노드 분산율을 위한 적응적 P2P 검색 알고리즘 (An Adaptive Peer-to-Peer Search Algorithm for Reformed Node Distribution Rate)

  • 김분희;이준연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.93-102
    • /
    • 2005
  • 제한된 통신 환경 상에서 P2P 어플리케이션에 의해 발생되는 과도한 트래픽은 네트워크 대역폭 문제와 연관된다. 또한 P2P시스템은 피어들의 P2P 오버레이 네트워크에의 연결성이 매우 약한 약결합 시스템으로 검색 단계에서 원하는 자원을 찾는다 하여도 다운로드 단계에서 반드시 그 피어에서 자원을 다운받을 수 있다는 보장이 없다. 이전 검색 알고리즘(1)에서는 이러한 문제를 해결하기 위해 Random Walks 기반의 휴리스틱 피어 선택 기법을 적용하였다. 본 논문에서는 각 피어의 컴퓨팅 파워에 영향 받는 노드 분산율을 개선하기 위해 이전 알고리즘(1) 기반의 적응적 P2P 검색 알고리즘을 제안하였다. 또한 트래픽 양을 줄이기 위해 부가적으로 질의율 기반의 차별적 리플리케이션 기법을 채택했다. 제안한 시스템의 성능 평가 결과 검색의 방향성과 통신 발생의 분포 측면에서 적절한 타협점에서 동작함을 확인하였다.

  • PDF

음악 정보검색 시스템을 위한 효율적인 특징 벡터 추출에 관한 연구 (A Study on the Efficient Feature Vector Extraction for Music Information Retrieval System)

  • 윤원중;이강규;박규식
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.532-539
    • /
    • 2004
  • 본 논문에서는 Classic, Hiphop, Jazz, Rock 4개의 장르로 곡을 구분하여 각 장르별 60곡씩 총 240곡의 음악 DB를 대상으로 예제 질의 (QBE) 방식의 음악 정보 검색 시스템을 제안하였다. 제안된 시스템은 입력 질의로부터 spectral centroid, rolloff, flux등 STFT기반의 특징들과 MFCC, LPC, Beat 정보 등의 총 60차의 특징 벡터들을 추출한후 Euclidean 유사도를 측정해서 DB내의 해당 음악을 검색한다. 실제 검색에 사용되는 특징 벡터는 SFS (Sequential Forward Selection) 기법을 사용하여 10차 특징 벡터로 최적화 되며 검색 실험결과 평균 84% Hit Rate 와 0.63 MRR의 성공률을 보이고 있어 기존의 연구 결과보다 약 10%이상의 성능 향상을 보였다. 한편 본 논문에서는 실제 시스템 사용 환경을 고려하여 임의 질의 구간과 임의 질의 길이에 대한 시스템 성능 평가를 수행하였으며 실험 결과 이러한 임의성에 기인한 검색 성능의 불안정성을 지적하였다.