• 제목/요약/키워드: quantitative models

검색결과 1,006건 처리시간 0.025초

생성-선정을 통한 텍스트 증강 프레임워크 (TAGS: Text Augmentation with Generation and Selection)

  • 김경민;김동환;조성웅;오흥선;황명하
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.455-460
    • /
    • 2023
  • 텍스트 증강은 자연어처리 모델의 성능 향상을 목적으로 원본 텍스트의 변환, 생성을 통하여 새로운 증강 텍스트를 생성하는 방법론이다. 기존 연구된 기법들은 표현적 다양성 부족, 의미 왜곡 , 한정적인 양의 증강 텍스트와 같은 한계점이 존재한다. 거대언어모델과 few-shot learning을 활용한 텍스트 증강은 이러한 한계점의 극복이 가능하지만, 잘못된 생성으로 인한 노이즈 발생의 위험성이 존재한다. 본 논문에서는 여러 후보 텍스트를 생성하고 적합한 텍스트를 증강 텍스트로 선정하는 TAGS를 제안한다. TAGS는 기존 텍스트 few shot learning을 통해 다양한 표현을 생성하면서 대조 학습과 유사도 비교를 통해 원본 텍스트가 적더라도 적합한 데이터를 효과적으로 선정한다. 이를 텍스트 증강이 필수적인 업무용 챗봇 데이터에 적용하여 60배 이상의 양적 향상을 달성하였다. 또한 증강 텍스트의 질적 향상을 확인하기 위해 실제 생성된 텍스트를 분석하여 원본 텍스트에 비해 의미론적, 표현적으로 다양한 텍스트를 생성함을 확인하였으며, 증강 텍스트로 실제 분류 모델을 학습하고 실험하여 실질적으로 자연어처리 모델 성능 향상에 도움이 되는 것을 확인하였다.

면적 강우량 산정 기법과 강우-유출 모형이 삼척오십천 유역의 홍수 모의에 미치는 영향 (Effect of Areal Mean Rainfall Estimation Technique and Rainfall-Runoff Models on Flood Simulation in Samcheok Osipcheon(Riv.) Basin)

  • 이현지;신영섭;강동호;김병식
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.775-784
    • /
    • 2023
  • 홍수관리 측면에선 시공간 관점의 정량적인 강우·유출 해석과 단기간 내 집중되는 강우사상에 대한 유출 해석이 필요하다. 강우-유출 모형은 종류와 입력자료에 따라 모의·해석 결과가 달라진다. 특히 강우자료는 중요한 요소이기 때문에 면적 강우량 산정 기법이 매우 중요하다. 본 연 구는 산악지형에 위치한 삼척오십천 유역의 면적 강우량을 산술평균법, 티센 가중법 그리고 등우선법을 이용하여 산정하였으며, 분포형 모형인 S-RAT과 집중형 모형인 HEC-HMS에 적용하여 각 강우 유출 결과를 비교했다. 시간 전이성 검토 결과 분포형 모형과 등우선법 조합이 MAE 64.62 m3/s, RMSE 82.47 m3/s로 통계 성능이 가장 우수하였고, R2 와 NSE도 각각 0.9383, 0.8547로 높게 나왔다. 본 연구는 관측 유량과 모의 유량의 첨두홍수량 발생 시간이 1시간 이내이므로 적절하게 분석되었다고 판단된다. 따라서 연구 결과는 향후 빈도 해석에 활용할 수 있으며, 이를 토대로 경사가 급한 산악지형의 유역에 첨두홍수량 및 첨두홍수 발생 시간 모의 정확도를 개선할 수 있을 것으로 사료된다.

딥러닝을 활용한 전시 정원 디자인 유사성 인지 모형 연구 (Development of Deep Recognition of Similarity in Show Garden Design Based on Deep Learning)

  • 조우윤;권진욱
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.96-109
    • /
    • 2024
  • 본 연구는 딥러닝 모델 중 VGG-16 및 ResNet50 모델을 활용하여 전시 정원의 유사성 평가 방법을 제시하는 것에 목적이 있다. VGG-16과 ResNet50 모델을 기반으로 전시 정원 유사성 판단을 위한 모형을 개발하였고, 이를 DRG(deep recognition of similarity in show garden design)모형이라 한다. 평가를 위한 방법으로 GAP와 피어슨 상관계수를 활용한 알고리즘을 사용하여 모형을 구축하고 1순위(Top1), 3순위(Top3), 5순위(Top5)에서 원본 이미지와 유사한 이미지를 도출하는 총 개수 비교로 유사성의 정확도를 분석하였다. DRG 모형에 활용된 이미지 데이터는 국외 쇼몽가든페스티벌 전시 정원 총 278개 작품과 국내 정원박람회인 서울정원박람회 27개 작품 및 코리아가든쇼 전시정원 이미지 17개 작품이다. DRG모형을 활용하여 동일 집단과 타 집단간의 이미지 분석을 진행하였고, 이를 기반으로 전시 정원 유사성의 가이드라인을 제시하였다. 첫째, 전체 이미지 유사성 분석은 ResNet50 모델을 기반으로 하여 데이터 증강 기법을 적용하는 것이 유사성 도출에 적합하였다. 둘째, 내부 구조와 외곽형태에 중점을 둔 이미지 분석에서는 형태에 집중하기 위한 일정한 크기의 필터(16cm × 16cm)를 적용하여 이미지를 생성하고 VGG-16 모델을 적용하여 유사성을 비교하는 방법이 효과적임을 알 수 있었다. 이때, 이미지 크기는 448 × 448 픽셀이 효과적이며, 유채색의 원본 이미지를 기본으로 설정함을 제안하였다. 이러한 연구 결과를 토대로 전시 정원 유사성 판단에 대한 정량적 방법을 제안하고, 향후 다양한 분야와의 융합 연구를 통해 정원 문화의 지속적인 발전에 기여할 것으로 기대한다.

영상에서 Support Vector Machine과 개선된 Adaptive Median 필터를 이용한 임펄스 잡음 제거 (Support Vector Machine and Improved Adaptive Median Filtering for Impulse Noise Removal from Images)

  • 이대근;박민재;김정욱;김도윤;김동욱;임동훈
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.151-165
    • /
    • 2010
  • 영상은 잡음센서이나 채널 전송에러에 의해 생기는 임펄스 잡음에 의해 자주 오염된다. 본 논문은 영상에서 이런 임펄스 잡음을 제거하는 방법에 대해 논의하고자 한다. 제안된 잡음제거는 SVM(Support Vector Machine)과 개선된 Adaptive Median 필터에 의해 이루어진다. SVM에 의해 영상에서 잡음픽셀여부를 검출하고 검출된 잡음픽셀은 개선된 Adaptive Median 필터에 의해 새로운 픽셀값으로 대체한다. 제안된 방법의 성능을 평가하기 위해 영상 실험을 통하여 salt-and-pepper 임펄스 잡음과 random-valued 임펄스 잡음을 고려하여 기존의 잡음제거 방법들과 정성적이고 MAE, PSNR를 통한 정량적인 비교를 하였다. 실험결과 제안된 방법은 잡음 제거와 미세한 부분에 대한 보존력이 뛰어나고 특히, 많이 오염된 영상에 대해서도 상당한 잡음제거 성능을 보였다.

Ray-Tracing 알고리즘을 이용한 CCTV배치 평가시뮬레이션 (Simulation to Evaluate CCTV Positioning in Use of Ray-Tracing Algorithm)

  • 김석태;안상욱
    • 한국실내디자인학회논문집
    • /
    • 제22권6호
    • /
    • pp.40-48
    • /
    • 2013
  • Utilization of CCTV in crime prevention for public safety is accepted as the most effective measure in terms of crime prevention and control. Also, it is frequently used as a device that shows evidence of an unexpected situation or record on public social relationship. However, it is rare to find a study that qualitatively accessed the monitoring performance of a certain space depending on the choice and positioning of CCTVs. Thus, this study suggested a technology that can quantitatively compare and assess the monitoring performance of CCTVs depending on view angle and effective sight range of cameras as well as the monitoring performance depending on positioning measures. For the analysis, the concept of 3-dimensional surveillance field in the form of a frustum was suggested while deriving 3-dimensional range of sight and quantitative monitoring performance by applying Isovist theory. For the analysis technology, space of analysis subject, point of view (camera), and target point (measurement node) were installed at a 3-dimensional space and in use of ray-tracing algorithm, the line segment that was visually connected between the point of view and target point was extracted and accumulated. For such verification, analysis application was constructed and then applied to four alternative models on view angle and distance as well as four alternatives on positioning in order to verify its efficacy. Through the experiment, it was possible to compare and assess visibility depending on alternatives while quantifying the results by understanding the shadow areas beyond the monitoring range.

계산과학 분야의 교육 및 융합연구 지원을 위한 EDISON 플랫폼 (EDISON Platform to Supporting Education and Integration Research in Computational Science)

  • 진두석;정영진;정회경
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.176-182
    • /
    • 2012
  • 최근에는 응용과학 분야의 교육 및 연구에 실제 실험이 아닌 슈퍼컴퓨터 및 고성능 네트워크 기반의 사이버 인프라에서 과학적 가정에 의해 복잡한 공학문제를 수치적 모델링과 컴퓨터 시뮬레이션을 통해 해결하는 계산과학을 이용하는 기법들의 필요성이 증대되고 있다. 본 논문에서는 컴퓨팅 시뮬레이션 기법을 활용한 실험 체험형 교육의 일환으로, 이공계 교수, 학생, 연구자, 산업체 인력 등이 사이버 인프라스트럭처 기반으로 시뮬레이션 SW를 활용한 교육 및 융합연구를 지원하는 EDISON 플랫폼을 제시한다. EDISON 플랫폼은 사용자들에게 보다 쉽고, 편하고, 효과적인 서비스 제공을 위해 3계층(EDISON 응용 프레임워크, EDISON 미들웨어, EDISON 인프라 자원)으로 구성되고 5개 분야(열유체, 화학, 물리, 구조동역학, 전산설계) 문제해결 환경을 위한 교육 연구용 웹 포털 서비스를 제공한다.

에이전트 행동에 기반한 의도 인식 컴퓨팅 (Agent's Activities based Intention Recognition Computing)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.87-98
    • /
    • 2012
  • 에이전트의 의도를 인식하는 것은 사물지능형 컴퓨팅에서 인간컴퓨터 상호작용의 주요 부분이다. 컴퓨팅 시스템에서 인식 대상의 의도를 정확하게 유추하면 다수의 에이전트간의 협력 상황 이해와 특정 행동이 취해질 때의 상황 파악이 쉽기 때문이다. 본 연구는 다른 이의 행동을 해석하고 행동의 근거가 되는 의도와 목적을 추론하는 인간의 기제를 바탕으로, 컴퓨팅 시스템이 행동을 인식하여 습득한 사전 경험 데이터를 이용, 대상의 의도를 빠르게 인식하는 방법을 제안한다. 의도 인식을 수행하기 위해 제안 방법은 에이전트의 목적에 따른 행동 변화를 검출하고 시스템이 사전에 학습한 행동 정보를 모델링하기 위해 특정 형태의 행동 은닉마코프 형식을 이용한다. 에이전트의 의도를 추론하는 데 관점을 다양하게 취함으로써 시스템이 에이전트의 행동이 끝나기 전에 미리 의도를 추론하도록 한다. 의도 인식의 정확도, 조기 검출률과 정확 지속률에 대한 실험으로 여러 가지 행동을 취하는 에이전트의 의도 검출 결과를 정량적으로 제시함으로써 제안 연구가 효과적인 의도 인식 시스템 구현에 기여함을 보여준다.

Cytotoxicity and Structure-activity Relationships of Naphthyridine Derivatives in Human Cervical Cancer, Leukemia, and Prostate Cancer

  • Hwang, Yu Jin;Chung, Mi Lyang;Sohn, Uy Dong;Im, Chaeuk
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제17권6호
    • /
    • pp.517-523
    • /
    • 2013
  • Naphthyridine compounds are important, because they exhibit various biological activities including anticancer, antimicrobial, and anti-inflammatory activity. Some naphthyridines have antimitotic effects or demonstrate anticancer activity by inhibiting topoisomerase II. These compounds have been investigated as potential anticancer agents, and several compounds are now part of clinical trials. A series of naphthyridine derivatives were evaluated for their in vitro cytotoxic activities against human cervical cancer (HeLa), leukemia (HL-60), and prostate cancer (PC-3) cell lines using an MTT assay. Some compounds (14, 15, and 16) were more potent than colchicine against all three human cancer cell lines and compound (16) demonstrated potency with $IC_{50}$ values of 0.7, 0.1, and $5.1{\mu}M$, respectively. Comparative molecular field analysis (CoMFA) and comparative molecular similarity indices analysis (CoMSIA) were used for quantitative structure-activity relationship (QSAR) molecular modeling of these compounds. We obtained accurate and predictive three-dimensional QSAR (3D-QSAR) models as indicated by the high PLS parameters of the HeLa ($q^2$, 0.857; $r^2$, 0.984; $r^2\;_{pred}$, 0.966), HL-60 ($q^2$, 0.777; $q^2$, 0.937; $r^2\;_{pred}$, 0.913), and PC-3 ($q^2$, 0.702; $q^2$, 0.983; $r^2\;_{pred}$, 0.974) cell lines. The 3D-QSAR contour maps suggested that the C-1 NH and C-4 carbonyl group of the naphthyridine ring and the C-2 naphthyl ring were important for cytotoxicity in all three human cancer cell lines.

Evaluation of Reciprocal Cross Design on Detection and Characterization of Mendelian QTL in $F_2$ Outbred Populations

  • Lee, Yun-Mi;Kim, Eun-Hee;Kim, Jong-Joo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제20권11호
    • /
    • pp.1625-1630
    • /
    • 2007
  • A simulation study was conducted to evaluate the effect of reciprocal cross on the detection and characterization of Mendelian QTL in $F_2$ QTL swine populations. Data were simulated under two different mating designs. In the one-way cross design, six $F_0$ grand sires of one breed and 30 $F_0$ grand dams of another breed generated 10 $F_1$ offspring per dam. Sixteen $F_1$ sires and 64 $F_1$ dams were randomly chosen to produce a total of 640 $F_2$ offspring. In the reciprocal design, three $F_0$ grand sires of A breed and 15 $F_0$ grand dams of B breed were mated to generate 10 $F_1$ offspring per dam. Eight $F_1$ sires and 32 $F_1$ dams were randomly chosen to produce 10 $F_2$ offspring per $F_1$ dam, for a total of 320 $F_2$ offspring. Another mating set comprised three $F_0$ grand sires of B breed and 15 $F_0$ grand dams of A breed to produce the same number of $F_1$ and $F_2$ offspring. A chromosome of 100 cM was simulated with large, medium or small QTL with fixed, similar, or different allele frequencies in parental breeds. Tests between Mendelian models allowed QTL to be characterized as fixed (LC QTL), or segregating at similar (HS QTL) or different (CB QTL) frequencies in parental breeds. When alternate breed alleles segregated in parental breeds, a greater proportion of QTL were classified as CB QTL and estimates of QTL effects for the CB QTL were more unbiased and precise in the reciprocal cross than in the one-way cross. This result suggests that reciprocal cross design allows better characterization of Mendelian QTL in terms of allele frequencies in parental breeds.

Modeling Nutrient Supply to Ruminants: Frost-damaged Wheat vs. Normal Wheat

  • Yu, Peiqiang;Racz, V.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제23권3호
    • /
    • pp.333-339
    • /
    • 2010
  • The objectives of this study were to use the NRC-2001 model and DVE/OEB system to model potential nutrient supply to ruminants and to compare frost damaged (also called "frozen" wheat with normal wheat. Quantitative predictions were made in terms of: i) Truly absorbed rumen synthesized microbial protein in the small intestine; ii) Truly absorbed rumen undegraded feed protein in the small intestine; iii) Endogenous protein in the digestive tract; iv). Total truly absorbed protein in the small intestine; and v). Protein degraded balance. The overall yield losses of the frozen wheat were 24%. Results showed that using the DVE/OEB system to predict the potential nutrient supply, the frozen wheat had similar truly absorbed rumen synthesized microbial protein (65 vs. 66 g/kg DM; p>0.05), tended to have lower truly absorbed rumen undegraded feed protein (39 vs. 53 g/kg DM; p<0.10) and had higher endogenous protein (14 vs. 9 g/kg DM; p<0.05). Total truly absorbed protein in the small intestine was significantly lower (89 vs. 110 g/kg DM, p<0.05) in the frozen wheat. The protein degraded balance was similar and both were negative (-2 vs. -1 g/kg DM). Using the NRC-2001 model to predict the potential nutrient supply, the frozen wheat also had similar truly absorbed rumen synthesized microbial protein (average 56 g/kg DM; p>0.05), tended to have lower truly absorbed rumen undegraded feed protein (35 vs. 48, g/kg DM; p<0.10) and had similar endogenous protein (average 4 g/kg DM; p>0.05). Total truly absorbed protein in the small intestine was significantly lower (95 vs. 108 g/kg DM, p<0.05) in the frozen wheat. The protein degraded balance was not significantly different and both were negative (-16 vs. -19 g/kg DM). In conclusion, both models predict lower protein value and negative protein degraded balance in the frozen wheat. The frost damage to the wheat reduced nutrient content and availability and thus reduced nutrient supply to ruminants by around 12 to 19%.