• Title/Summary/Keyword: Synthetic data generation

검색결과 116건 처리시간 0.035초

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

FGN과 Daubechies Wavelets을 이용한 빠른 Self-Similar 네트워크 Traffic의 생성 (Fast Self-Similar Network Traffic Generation Based on FGN and Daubechies Wavelets)

  • 정해덕;이종숙
    • 정보처리학회논문지C
    • /
    • 제11C권5호
    • /
    • pp.621-632
    • /
    • 2004
  • 최근의 통신 네트워크에서 teletraffic의 양상은 Poisson 프로세스보다 self-similar 프로세스에 의해서 더 잘 반영된다. 이는 통신 네트워크의 teletraffic에 관련하여 self-similar한 성질을 고려하지 않는다면, 통신 네트워크의 성능에 관한 결과는 부정확 할 수밖에 없다는 의미가 된다. 따라서, 통신 네트워크에 관한 시뮬레이션을 수행하기 위한 매우 중요한 요소 중에 하나는 충분히 긴 self-similar한 sequence를 얼마나 잘 생성하느냐의 문제이다. 본 논문에서는 fractional Gaussian noise와 wavelet 변환을 이용한 새로운 pseudo-random self-similar sequence 생성기를 구현 및 분석하였다. 특별히 본 생성기는 다른 wavelet 변환보다 long range dependent한 프로세스들의 self-similar 구조에 잘 맞기 때문에 좀더 정확한 결과를 유도할 수 있는 Daubechies wavelet을 사용하였다. 본 생성기를 이용하여 매우 긴 sequence를 생성하는데 요구되는 통계적인 정확도와 생성시간에 대해서 분석하였으며, 본 논문에서 제안한 생성기의 성능은 Hurst 변수의 상대적인 정확도로 보았을 때, 그리고 sequence의 생성시간을 고려했을 때에 매우 우수함을 보였다. 이 생성기의 이론적 complexity는 n개의 난수를 발생하는데 0(n)이 요구된다.

고해상도 종합 강우자료 복원 및 검증 (Generation and verification of the synthetic precipitation data)

  • 강형전;오재호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.142-146
    • /
    • 2016
  • 최근 저해상도 기상자료를 바탕으로 한 단기간에 내린 폭우나 극심한 가뭄 등과 같은 국지적인 기상 예보는 한계가 있기 때문에 고해상도 기상자료에 대한 수요가 증대되고 있으며, 특히 지형이 복잡한 한반도의 경우 지형적인 영향을 고려한 고해상도 기상자료가 요구되고 있다. 하지만 현재 기상청에서 제공하는 남한 지역의 지상 관측 자료는 약 10km의 불규칙한 간격으로 분포하고 있으며 이는 복잡한 남한지역의 지형 특성을 고려하기에는 해상도가 낮아 상세한 기상 현상을 예측하기 힘들다. 또한, 북한의 경우 사용가능한 관측 자료가 부족하여 한반도 전체를 대상으로 한 기상 예보 및 기후 특성 분석에는 한계가 있다. 따라서 본 연구에서는 정량적 강수 예측 모형인 QPM(Quantitative Precipitation Model)을 이용하여 3시간 간격의 현재기후(2000-2014년)에 대한 한반도 지역의 1km 강우 자료를 복원하였다. 관측 자료가 부족한 북한의 경우 재분석 자료를 이용하여 1km 해상도의 강우 자료를 복원하였다. 이를 위해 몇 가지 특정한 강우 Case를 선별하였고, QPM 수행 시 필요한 강수, 상대습도, 지위고도, 연직 기온, 연직 바람장 등의 변수에 대하여 남한 지역에 해당하는 지점의 여러 재분석 자료와 실제 남한 지역의 지상/고층 관측 자료와의 비교 및 Correlation 분석을 통해 가장 적절하다고 판단되는 재분석 자료인 NASA에서 제공하는 MERRA Reanalysis data를 선정하였다. 또한, 소규모 지형효과를 고려하기 위한 상세 지형자료로 고해상도 지형 자료인 DEM(*Digital Elevation Model) 1km 자료를 사용하였다. 한반도의 강우를 복원하기 위하여 Barnes 기법을 이용하여 불규칙적으로 분포해 있는 강수량 데이터를 규칙적인 자료로 격자화 하였고, 격자화 한 10km 해상도의 자료를 QPM을 통해 복잡한 지형 특성을 고려한 1km 해상도의 강우 자료로 복원하였다. 또한, QPM의 모의 성능을 검증하기 위하여, 위에서 선별한 특정 강우 Case에 대하여 복원한 1km 강우자료와 200m 이내의 거리에서 겹치는 지상관측자료와의 비교를 통하여 모의 성능을 검증하였다. 본 연구를 통해 복원된 한반도 상세 강우 자료를 통해 통일을 대비한 기상, 농 수산업, 수자원 등 다양한 분야에서 활용 될 수 있으며, 국지적인 폭우 및 가뭄 등의 이상 기상 현상을 분석하는 데 참고 기초 자료로써 활용 될 수 있을 것으로 기대된다.

  • PDF

효과적인 기업부도 예측모형을 위한 ROSE 표본추출기법의 적용 (Application of Random Over Sampling Examples(ROSE) for an Effective Bankruptcy Prediction Model)

  • 안철휘;안현철
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.525-535
    • /
    • 2018
  • 분류 문제에서 특정 범주의 빈도가 다른 범주에 비해 과도하게 높은 경우, 왜곡된 기계 학습을 유발할 수 있는 데이터 불균형(imbalanced data) 문제가 발생한다. 기업부도 예측 문제도 그 중 하나인데, 일반적으로 금융기관과 거래하는 기업들의 부도율은 대단히 낮아서, 부도 사례보다 정상 사례의 빈도가 월등히 높은 데이터 불균형 문제가 발생하고 있다. 이러한 데이터 불균형 문제를 해결하기 위해서는 적절한 표본추출 기법이 적용될 필요가 있으며, 지금껏 소수 범주 데이터를 복원 추출함으로써 다수 범주 데이터와 비율을 맞추어 데이터 불균형을 해결하는 오버 샘플링(oversampling) 기법이 주로 활용되어 왔다. 그러나 전통적인 오버 샘플링은 과적합화(overfitting)가 발생할 위험이 높아질 수 있는 단점이 있다. 이러한 배경에서 본 연구는 효과적인 기업부도 예측 모형 학습을 위한 표본추출 기법으로 2014년에 Menardi와 Torelli가 제안한 ROSE(random over sampling examples) 기법을 제안한다. ROSE 기법은 학습에 사용될 사례를 반복적으로 새롭게 합성하여 생성(synthetic generation)하는 기법으로, 과적합화 문제를 회피하면서도 분류 예측 정확도 개선에 도움을 줄 수 있다. 이에 본 연구에서는 ROSE 기법을 가장 성능이 우수한 이분류기로 알려진 SVM(support vector machine)과 결합하여 국내 한 대형 은행의 기업부도 예측에 적용해 보고, 다른 표본추출 기법들과의 비교연구를 수행하였다. 실험 결과, ROSE 기법이 다른 기법에 비해 통계적으로 유의한 수준으로 SVM의 예측정확도 개선에 기여할 수 있음을 확인하였다. 이러한 본 연구의 결과는 부도예측 외에 다른 사회과학 분야 예측문제의 데이터 불균형 문제 해결에도 ROSE가 우수한 대안이 될 수 있다는 사실을 시사한다.

일루미나에서 제작된 TSLRH (Truseq Synthetic Long-Read Haplotyping)와 10X Genomics에서 제작된 The Chromium Genome 시퀀싱 플랫폼을 이용하여 생산된 한우(한국 재래 소)의 반수체형 페이징 및 단일염기서열변이 비교 분석 (A Comparative Analysis of the Illumina Truseq Synthetic Long-read Haplotyping Sequencing Platform versus the 10X Genomics Chromium Genome Sequencing Platform for Haplotype Phasing and the Identification of Single-nucleotide variants (SNVs) in Hanwoo (Korean Native Cattle))

  • 박원철;크리스나무티 스리칸스;박종은;신동현;고해수;임다정;조인철
    • 생명과학회지
    • /
    • 제29권1호
    • /
    • pp.1-8
    • /
    • 2019
  • 한우(한국 재래 소)에서 반수체형 페이징을 위한 고밀도 시퀀싱을 이용한 비교 분석 논문은 많지가 않다. 이런 고밀도 시퀀싱 플랫폼 중에서, 일루미나에서 서비스 하는 Truseq Synthetic Long-Read Haplotyping 시퀀싱 플랫폼(TSLRH)과 10X Genomics에서 서비스하는 The Chromium Genome 시퀀싱 플랫폼을 특별히 비교 분석하는 논문은 없다. 우리는 한우 연구소의 한우 종모우(아이디: TN1505D2184 or 27214)의 정액에서 DNA를 추출하였으며, 이 DNA로부터 각각의 시퀀싱 플랫폼을 이용하여 시퀀싱 데이터를 생산하였다. 그 후, 우리는 각각의 시퀀싱 플랫폼에 맞는 분석 방법을 이용하여 단일염기서열변이들은 찾아냈다. 그 결과, TSLRH과 10XG의 전체 리드 수는 각각 355,208,304, 1,632,772,004, 맵핑 리드의 개수는 351,992,768(99.09%), 1,526,641,824(93.50%), Q30(%)은 89.04%, 88.60%, 평균 밀도는 13.04X, 74.3X, 가장 긴 페이즈 블락은 1,982,706bp, 1,480,081 bp, N50 페이즈 블락은 57,637 bp, 114,394 bp, 전체 단일염기서열변이는 4,534,989, 8,496,813, 전체 페이징 비율은 72.29%, 87.67%였다. 더욱이, 우리는 각각의 시퀀싱 플랫폼을 비교해서 각각의 시퀀싱 플랫폼의 고유한 단일염기서열변이와 두 시퀀싱 플랫폼에서 공통적으로 존재하는 단일염기서열변이를 각 염색체 별로 확인하였으며, 단일염기서열변이의 개수는 염색체 길이에 정비례한다는 결과를 확인하였다. 결론적으로, 본 연구에서 추천하는 바는 연구비가 충분하지 않을 시에는 TSLRH 보다 10XG을 사용하는 것을 추천한다. 왜냐하면 전체 리드 및 단일염기서열변이 개수, N50 페이즈 블락, 가장 긴 페이즈 블락, 페이즈 비율 그리고 평균 밀도 등이 TSLRH 보다 10XG가 더 높거나 좋기 때문이다.

Plasminogen Activator Inhibitor-1 Antisense Oligodeoxynucleotides Abrogate Mesangial Fibronectin Accumulation

  • Park, Je-Hyun;Seo, Ji-Yeon;Ha, Hun-Joo
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제14권6호
    • /
    • pp.385-390
    • /
    • 2010
  • Excessive extracellular matrix (ECM) accumulation is the main feature of chronic renal disease including diabetic nephropathy. Plasminogen activator inhibitor (PAI)-1 is known to play an important role in renal ECM accumulation in part through suppression of plasmin generation and matrix metalloproteinase (MMP) activation. The present study examined the effect of PAI-1 antisense oligodeoxynucleotide (ODN) on fibronectin upregulation and plasmin/MMP suppression in primary mesangial cells cultured under high glucose (HG) or transforming growth factor (TGF)-${\beta}1$, major mediators of diabetic renal ECM accumulation. Growth arrested and synchronized rat primary mesangial cells were transfected with $1\;{\mu}M$ phosphorothioate-modified antisense or control mis-match ODN for 24 hours with cationic liposome and then stimulated with 30 mM D-glucose or 2 ng/ml TGF-${\beta}1$. PAl-1 or fibronectin protein was measured by Western blot analysis. Plasmin activity was determined using a synthetic fluorometric plasmin substrate and MMP-2 activity analyzed using zymography. HG and TGF-${\beta}1$ significantly increased PAI-1 and fibronectin protein expression as well as decreased plasmin and MMP-2 activity. Transient transfection of mesangial cells with PAI-1 antisense ODN, but not mis-match ODN, effectively reversed basal as well as HG- and TGF-${\beta}1$-induced suppression of plasmin and MMP-2 activity. Both basal and upregulated fibronectin secretion were also inhibited by PAI-1 antisense ODN. These data confirm that PAI-1 plays an important role in ECM accumulation in diabetic mesangium through suppression of protease activity and suggest that PAI-1 antisense ODN would be an effective therapeutic strategy for prevention of renal fibrosis including diabetic nephropathy.

3차원 선소의 Grouping에 의한 3차원 건물 모델 발생 (Generation of 3D Building Model by Grouping of 3D Line Segments)

  • 강연욱;우동민
    • 전기전자학회논문지
    • /
    • 제10권1호
    • /
    • pp.40-48
    • /
    • 2006
  • 본 논문에서는 3차원 선소로부터 건물의 rooftop 평면을 추정하는 새로운 기법이 제안되었다. 3차원 rooftop 평면 추정은 3차원 선소의 계층적 grouping에 기반한 것으로, 끊어진 3차원 선소의 병합으로부터 시작된다. 병합된 3차원 선소는 평면 추정기법에 의해 rooftop 검출에 적용되는데, 평면 추정을 위해 T자형 모서리 및 L자형 모서리 검출을 통해서 신뢰성 있는 접속점이 구해진다. 구해진 접속점에 의해 가정된 rooftop 평면이 발생될 수 있으며, 건물 평면의 속성에 의해 최종적으로 검증되어, 건물의 rooftop 모델이 결정된다. Avenches 항공영상 데이터로부터 구해진 모의영상에 의해 실험이 수행되었는데, 실험 결과 0.4 - 1.3 meter의 오차를 가진 rooftop 평면 모델이 구해졌으며, 이는 종래의 영역기반 스테레오에 의해 구해진 고도에 비해 정확도가 2.5배 정도 향상되었음을 알 수 있었다.

  • PDF

추계학적 저수용량 결정에 관한 연구 (A Study on the Determination for Stochastic Reservoir Capacity)

  • 최한규;최용박;김치홍
    • 물과 미래
    • /
    • 제19권2호
    • /
    • pp.149-156
    • /
    • 1986
  • 저수용량을 결정하기 위한 Rippl의 누가곡선법은 과거의 유량자료가 미래에 동일한 기록으로 반복되리라는 가정하에 오랫동안 사용되어 왔다. 본 연구의 목적은 추계학적 이론에 의한 저수용량을 결정하는 더 좋은 방법을 찾아내는데 있다. 그러므로 본 논문에서는 3개의 다목적 댐과 3개의 단일목적댐에 대한 하천의 월 유량을 Tomas-Fiering 법으로 모의발생하였으며 모의발생된 월 유량은 Range 개념으로 해석하였다. 또한 물의 이용을 최대화하는 저수지의 최적운영 법칙을 이용함으로서 저수지로 부터의 유출량을 결정하고 월 유량의 Range와 평균 유입량을 적절하게 고려함으로서 필요한 저수용량은 추계학적으로 결정하였다. 그러므로 본 연구에서 얻어진 결과는 기본설계 단계에서 제한된 자료, 즉 저수지의 운영기간과 월 평균유량을 가지고 필요한 저수지의 용량을 근사적으로 구할 수 있다.

  • PDF

SRA 알고리즘을 이용한 Self-Similar 네트워크 Traffic의 생성 (Algorithmic Generation of Self-Similar Network Traffic Based on SRA)

  • 정해덕;이종숙
    • 정보처리학회논문지C
    • /
    • 제12C권2호
    • /
    • pp.281-288
    • /
    • 2005
  • 최근의 컴퓨터 네트워크에서 teletraffic의 양상은 Poisson 프로세스보다 self-similar 프로세스에 의해서 더 잘 반영된다. 이는 컴퓨터 네트워크의 teletraffic에 관련하여 self-similar한 성질을 고려하지 않는다면, 컴퓨터 네트워크의 성능에 관한 결과는 부정확 할 수밖에 없다는 의미가 된다. 따라서, 통신 네트워크에 관한 시뮬레이션을 수행하기 위한 매우 중요한 요소 중에 하나는 충분히 긴 self-similar한 sequence를 얼마나 잘 생성하느냐의 문제이다. 본 논문에서는 SRA (successive random addition) 방법을 이용한 pseudo-random self-similar sequence 생성기를 구현 및 분석하였다. 본 pseudo-random self-similar sequence 생성기의 성질을 매우 긴 sequence를 생성하는데 요구되는 통계적인 정확도와 생성시간에 대해서 분석하였다. 본 논문에서 제안한 SRA 방법을 이용한 pseudo-random self-similar sequence 생성기의 성능은 Hurst 변수의 상대적인 정확도로 보았을 때, 그리고 sequence의 생성시간을 고려했을 때에 적합함을 보였다. 이 생성기의 이론적 complexity는 n개의 난수를 발생하는데 O(n)이 요구된다.

Generation and characterization of a monoclonal antibody against MERS-CoV targeting the spike protein using a synthetic peptide epitope-CpG-DNA-liposome complex

  • Park, Byoung Kwon;Maharjan, Sony;Lee, Su In;Kim, Jinsoo;Bae, Joon-Yong;Park, Man-Seong;Kwon, Hyung-Joo
    • BMB Reports
    • /
    • 제52권6호
    • /
    • pp.397-402
    • /
    • 2019
  • Middle East respiratory syndrome coronavirus (MERS-CoV) uses the spike (S) glycoprotein to recognize and enter target cells. In this study, we selected two epitope peptide sequences within the receptor binding domain (RBD) of the MERS-CoV S protein. We used a complex consisting of the epitope peptide of the MERS-CoV S protein and CpG-DNA encapsulated in liposome complex to immunize mice, and produced the monoclonal antibodies 506-2G10G5 and 492-1G10E4E2. The western blotting data showed that both monoclonal antibodies detected the S protein and immunoprecipitated the native form of the S protein. Indirect immunofluorescence and confocal analysis suggested strong reactivity of the antibodies towards the S protein of MERS-CoV virus infected Vero cells. Furthermore, the 506-2G10G5 monoclonal antibody significantly reduced plaque formation in MERS-CoV infected Vero cells compared to normal mouse IgG and 492-1G10E4E2. Thus, we successfully produced a monoclonal antibody directed against the RBD domain of the S protein which could be used in the development of diagnostics and therapeutic applications in the future.