• 제목/요약/키워드: experimental techniques

검색결과 3,187건 처리시간 0.034초

시각적 어텐션을 활용한 입술과 목소리의 동기화 연구 (Lip and Voice Synchronization Using Visual Attention)

  • 윤동련;조현중
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.166-173
    • /
    • 2024
  • 본 연구에서는 얼굴 동영상에서 입술의 움직임과 음성 간의 동기화 탐지 방법을 제안한다. 기존의 연구에서는 얼굴 탐지 기술로 얼굴 영역의 바운딩 박스를 도출하고, 박스의 하단 절반 영역을 시각 인코더의 입력으로 사용하여 입술-음성 동기화 탐지에 필요한 시각적인 특징을 추출하였다. 본 연구에서는 입술-음성 동기화 탐지 모델이 음성 정보의 발화 영역인 입술에 더 집중할 수 있도록 사전 학습된 시각적 Attention 기반의 인코더 도입을 제안한다. 이를 위해 음성 정보 없이 시각적 정보만으로 발화하는 말을 예측하는 독순술(Lip-Reading)에서 사용된 Visual Transformer Pooling(VTP) 모듈을 인코더로 채택했다. 그리고, 제안 방법이 학습 파라미터 수가 적음에도 불구하고 LRS2 데이터 세트에서 다섯 프레임 기준으로 94.5% 정확도를 보임으로써 최근 모델인 VocaList를 능가하는 것을 실험적으로 증명하였다. 또, 제안 방법은 학습에 사용되지 않은 Acappella 데이터셋에서도 VocaList 모델보다 8% 가량의 성능 향상이 있음을 확인하였다.

특성맵 차분을 활용한 커널 기반 비디오 프레임 보간 기법 (Kernel-Based Video Frame Interpolation Techniques Using Feature Map Differencing)

  • 서동혁;고민성;이승학;박종혁
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.17-27
    • /
    • 2024
  • 비디오 프레임 보간(Video Frame Interpolation)은 움직임의 연속성을 증가시켜 영상을 부드럽게 재생할 수 있어 영상, 미디어 분야에서 사용되는 중요한 기술이다. 딥러닝 기반 비디오 프레임 보간 연구에서 널리 사용되는 방법 중 하나인 커널 기반 방법(Kernel Based Method)의 경우, 지역적인 변화를 잘 포착하지만 전체적인 변화를 처리하는 데 한계가 있었다. 이에 본 논문에서는 주요 변화 포착에 집중하기 위한 특성맵 차분, Two Direction을 적용한 새로운 U-Net 구조를 통해 파라미터 수를 줄이면서 중간 프레임을 보다 정확하게 생성하고자 한다. 실험 결과 제안한 구조가 기존보다 Vimeo, Middle-burry 등의 일반적인 데이터셋과 새로운 YouTube 데이터셋에서 기존 모델보다 약 61% 더 적은 파라미터로 PSNR 수치가 최대 0.3 우수한 성능을 달성하였다. 본 논문에서 사용한 코드는 https://github.com/Go-MinSeong/SF-AdaCoF에서 확인 가능하다.

동해 연근해에서 위상 추정기를 갖는 적응형 등화기의 실험적 성능 검증 (The Experimental Verification of Adaptive Equalizers with Phase Estimator in the East Sea)

  • 김현수;최동현;서종필;정재학;김성일
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.229-236
    • /
    • 2010
  • 위상동기식 변조기법은 주파수 대역폭의 효율과 전송 신뢰도를 높일 수 있으나 수중 채널의 시변 다중경로에 의해 인접 심볼간 간섭이 발생되어 수중통신에 적용하는 데 어려움이 있다. 본 논문에서는 동해 연근해에서 위상동기 변조방식인 BPSK와 QPSK 신호를 전송하고, 시간에 따라 변화하는 다중경로와 위상변동에 의해 왜곡된 수신신호를 보상하기 위한 위상 추정기를 결합한 적응형 등화기를 제안한다. 해상실험을 통해 전송된 위상동기식 변조신호가 수중채널의 시변 다중경로 특성에 의해 왜곡되었음을 보였고 제안된 방법에 의해 왜곡된 신호가 보정됨을 보였다. BPSK와 QPSK 신호 전송시 300 m 거리에서 각각 0.0078, 0.0376의 비트 오류율을 보였으며, 1000 m 거리에서는 0.0146, 0.0293의 비트 오류율을 보였다.

입경 분류된 토양의 RGB 영상 분석 및 딥러닝 기법을 활용한 AI 모델 개발 (Development of Deep Learning AI Model and RGB Imagery Analysis Using Pre-sieved Soil)

  • 김동석;송지수;정은지;황현정;박재성
    • 한국농공학회논문집
    • /
    • 제66권4호
    • /
    • pp.27-39
    • /
    • 2024
  • Soil texture is determined by the proportions of sand, silt, and clay within the soil, which influence characteristics such as porosity, water retention capacity, electrical conductivity (EC), and pH. Traditional classification of soil texture requires significant sample preparation including oven drying to remove organic matter and moisture, a process that is both time-consuming and costly. This study aims to explore an alternative method by developing an AI model capable of predicting soil texture from images of pre-sorted soil samples using computer vision and deep learning technologies. Soil samples collected from agricultural fields were pre-processed using sieve analysis and the images of each sample were acquired in a controlled studio environment using a smartphone camera. Color distribution ratios based on RGB values of the images were analyzed using the OpenCV library in Python. A convolutional neural network (CNN) model, built on PyTorch, was enhanced using Digital Image Processing (DIP) techniques and then trained across nine distinct conditions to evaluate its robustness and accuracy. The model has achieved an accuracy of over 80% in classifying the images of pre-sorted soil samples, as validated by the components of the confusion matrix and measurements of the F1 score, demonstrating its potential to replace traditional experimental methods for soil texture classification. By utilizing an easily accessible tool, significant time and cost savings can be expected compared to traditional methods.

Improving Accuracy of Chapter-level Lecture Video Recommendation System using Keyword Cluster-based Graph Neural Networks

  • Purevsuren Chimeddorj;Doohyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.89-98
    • /
    • 2024
  • 본 논문은 챕터 수준의 강의 동영상 추천 시스템에 있어서 추천의 정확도와 처리속도 간의 균형문제, 즉, 추천 정확도를 향상시키려면 처리 속도가 저하되고, 반대로 처리 속도를 높일 경우 정확도가 감소하는 문제에 대하여 연구한다. 본 논문에서는 이의 해결을 위하여 TF-IDF, K-Means++ Clustering, Graph Neural Network(GNN) 등 다양한 기법을 복합적으로 활용하는 방법을 제안한다. 즉, 챕터들의 유사성을 바탕으로 클러스터를 사전에 구성함으로써 검색 시의 계산량을 줄여 속도를 향상시키면서도, 클러스터를 노드로 하는 그래프에 대하여 GNN을 적용함으로써 추천의 정확도를 향상시키는 방법을 제안한다. 실험 결과 GNN을 사용한 경우 추천의 정확도가 MRR 지표에서 약 19.7% 증가하였으며, 유사도 기반의 정밀도에 있어서 약 27.7% 증가하는 결과를 확인할 수 있었다. 이를 통해 학습자의 질의에 보다 적합한 동영상 챕터를 추천하는 학습시스템 구축에 기여할 것으로 기대한다.

특징 융합을 이용한 농작물 다중 분광 이미지의 의미론적 분할 (Semantic Segmentation of Agricultural Crop Multispectral Image Using Feature Fusion)

  • 문준렬;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제28권2호
    • /
    • pp.238-245
    • /
    • 2024
  • 본 논문에서는 농작물 다중 분광 이미지에 대해 특징 융합 기법을 이용하여 의미론적 분할 성능을 향상시키기 위한 프레임워크를 제안한다. 스마트팜 분야에서 연구 중인 딥러닝 기술 중 의미론적 분할 모델 대부분은 RGB(red-green-blue)로 학습을 진행하고 있고 성능을 높이기 위해 모델의 깊이와 복잡성을 증가시키는 데에 집중하고 있다. 본 연구는 기존 방식과 달리 다중 분광과 어텐션 메커니즘을 통해 모델을 최적화하여 설계한다. 제안하는 방식은 RGB 단일 이미지와 함께 UAV (unmanned aerial vehicle)에서 수집된 여러 채널의 특징을 융합하여 특징 추출 성능을 높이고 상호보완적인 특징을 인식하여 학습 효과를 증대시킨다. 특징 융합에 집중할 수 있도록 모델 구조를 개선하고, 작물 이미지에 유리한 채널 및 조합을 실험하여 다른 모델과의 성능을 비교한다. 실험 결과 RGB와 NDVI (normalized difference vegetation index)가 융합된 모델이 다른 채널과의 조합보다 성능이 우수함을 보였다.

Enhancement of preimplantation mouse embryo development with optimized in vitro culture dish via stabilization of medium osmolarity

  • Hyejin Yoon;Jongwoo Lee;Inyoung Kang;Kyoo Wan Choi;Jaewang Lee;Jin Hyun Jun
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제50권4호
    • /
    • pp.244-252
    • /
    • 2023
  • Objective: We evaluated the efficacy of the newly developed optimized in vitro culture (OIVC) dish for cultivating preimplantation mouse embryos. This dish minimizes the need for mineral oil and incorporates microwells, providing a stable culture environment and enabling independent monitoring of individual embryos. Methods: Mouse pronuclear (PN) zygotes and two-cell-stage embryos were collected at 18 and 46 hours after human chorionic gonadotropin injection, respectively. These were cultured for 120 hours using potassium simplex optimized medium (KSOM) to reach the blastocyst stage. The embryos were randomly allocated into three groups, each cultured in one of three dishes: a 60-mm culture dish, a microdrop dish, and an OIVC dish that we developed. Results: The OIVC dish effectively maintained the osmolarity of the KSOM culture medium over a 5-day period using only 2 mL of mineral oil. This contrasts with the significant osmolarity increase observed in the 60-mm culture dish. Additionally, the OIVC dish exhibited higher blastulation rates from two-cell embryos (100%) relative to the other dish types. Moreover, blastocysts derived from both PN zygotes and two-cell embryos in the OIVC dish group demonstrated significantly elevated mean cell numbers. Conclusion: Use of the OIVC dish markedly increased the number of cells in blastocysts derived from the in vitro culture of preimplantation mouse embryos. The capacity of this dish to maintain medium osmolarity with minimal mineral oil usage represents a breakthrough that may advance embryo culture techniques for various mammals, including human in vitro fertilization and embryo transfer programs.

Clinical and laboratory factors associated with the presence of dysmorphic oocytes in intracytoplasmic sperm injection cycles

  • Tae Eun Kim;Hyun Kyung Lee;Byung Chul Jee
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제50권4호
    • /
    • pp.270-276
    • /
    • 2023
  • Objective: This study investigated the clinical and laboratory factors associated with the presence of dysmorphic oocytes in intracytoplasmic sperm injection (ICSI) cycles. Methods: The study involved 200 ICSI cycles, performed from 2020 to 2021, that yielded at least one mature oocyte. Clinical characteristics and ovarian stimulation methods were compared between 68 cycles with at least one dysmorphic oocyte (the dysmorphic group) and 132 cycles with normal-form oocytes only (the non-dysmorphic group). Dysmorphic oocytes were characterized by dark cytoplasm, cytoplasmic granularity, cytoplasmic vacuoles, refractile bodies in the cytoplasm, smooth endoplasmic reticulum in the cytoplasm, an oval shape, an abnormal zona pellucida, a large perivitelline space, debris in the perivitelline space, or an abnormal polar body. Results: The ages of the women, indications for in vitro fertilization, serum anti-Müllerian hormone levels, and rates of current ovarian endometrioma were similar between the dysmorphic and non-dysmorphic groups. In both groups, the three ovarian stimulation regimens, two types of pituitary suppression, and total gonadotropin dose were employed similarly. However, the dual-trigger method was used more frequently in the dysmorphic group (67.6% vs. 50%, p=0.024). The dysmorphic group contained significantly more immature oocytes and exhibited significantly lower oocyte maturity (50% vs. 66.7%, p=0.001) than the non-dysmorphic cycles. Within the dysmorphic group, significantly lower oocyte maturity was found in the cycles using a dual-trigger, but not in those with a human chorionic gonadotropin trigger. Conclusion: ICSI cycles with dysmorphic oocytes are closely associated with reduced oocyte maturity. This association was observed exclusively in dual-trigger cycles.

An In Silico Drug Repositioning Strategy to Identify Specific STAT-3 Inhibitors for Breast Cancer

  • Sruthy Sathish
    • 통합자연과학논문집
    • /
    • 제16권4호
    • /
    • pp.123-131
    • /
    • 2023
  • Breast cancer continues to pose a substantial worldwide health challenge, thereby requiring the development of innovative strategies to discover new therapeutic interventions. Signal Transducer and Activator of Transcription 3 (STAT-3) has been identified as a significant factor in the development of several types of cancer, including breast cancer. This is primarily attributed to its diverse functions in promoting tumour formation and conferring resistance to therapeutic interventions. This study presents an in silico drug repositioning approach that focuses on identifying specific inhibitors of STAT-3 for the purpose of treating breast cancer. We initially examined the structural and functional attributes of STAT-3, thereby elucidating its crucial involvement in cellular signalling cascades. A comprehensive virtual screening was performed on a diverse collection of drugs that have been approved by the FDA from zinc15 database. Various computational techniques, including molecular docking, cross docking, and cDFT analysis, were utilised in order to prioritise potential candidates. This prioritisation was based on their predicted binding energies and outer molecular orbital reactivity. The findings of our study have unveiled a Dihydroergotamine and Paritaprevir that have been approved by the FDA and exhibit considerable promise as selective inhibitors of STAT-3. In conclusion, the utilisation of our in silico drug repositioning approach presents a prompt and economically efficient method for the identification of potential compounds that warrant subsequent experimental validation as selective STAT-3 inhibitors in the context of breast cancer. The present study highlights the considerable potential of employing computational strategies to expedite the drug discovery process. Moreover, it provides valuable insights into novel avenues for targeted therapeutic interventions in the context of breast cancer treatment.

키값 저장소 기반 블록체인 시스템에서 리드 솔로몬 부호화된 블록 저장 (Reed-Solomon Encoded Block Storage in Key-value Store-based Blockchain Systems)

  • 이성현;최진춘;이명철
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.102-110
    • /
    • 2024
  • 블록체인은 사용자가 수행하는 트랜잭션을 안전하게 기록 및 관리하기 위해 블록체인 네트워크의 참가자에 트랜잭션을 복제하여 저장하고 공유한다. 따라서, 블록체인 네트워크가 운영되는 동안 참가자들이 저장하는 전체 원장의 용량은 계속하여 증가하게 된다. 이러한 문제를 해결하기 위해 저장 효율성을 높이면서 참가자의 장치에 문제가 발생하거나 악의적인 참가자가 있는 경우에도 원장에 올바른 값을 저장할 수 있도록 보장해주는 방법의 연구가 진행되고 있다. 연구 중 한 방향은 리드 솔로몬 부호화와 같은 방식을 블록체인 원장 저장에 적용하는 것이다. 본 논문에서는 원장 저장을 위해 키값 저장소를 사용하는 오픈소스 블록체인에 리드 솔로몬 부호화를 적용하였고, 실험을 통해 이러한 부호화를 통해 얻을 수 있는 저장 효율성과, 증가하는 연산 오버헤드를 측정하였다. 실험 결과, 저장 효율성은 86% 증가하였으며 리드 솔로몬 부호화 과정에 필요한 CPU 연산의 증가 폭은 2.7% 정도로 적어서 부호화 방법의 유용성을 확인하였다.