• 제목/요약/키워드: Masking 모델

검색결과 66건 처리시간 0.024초

텍스트 요약 품질 향상을 위한 의미적 사전학습 방법론 (Semantic Pre-training Methodology for Improving Text Summarization Quality)

  • 전민규;김남규
    • 스마트미디어저널
    • /
    • 제12권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 최근 사용자에게 의미있는 정보만을 자동으로 간추리는 텍스트 자동 요약이 꾸준히 연구되고 있으며, 특히 인공신경망 모델인 트랜스포머를 활용한 텍스트 요약 연구가 주로 수행되고 있다. 다양한 연구 중 특히 문장 단위 마스킹을 통해 모델을 학습시키는 GSG 방식이 가장 주목을 받고 있지만, 전통적인 GSG는 문장의 의미가 아닌 토큰의 중복 정도에 기반을 두어 마스킹 대상 문장을 선정한다는 한계를 갖는다. 따라서 본 연구에서는 텍스트 요약의 품질을 향상시키기 위해, 문장의 의미를 고려하여 GSG의 마스킹 대상 문장을 선정하는 SbGSG(Semantic-based GSG) 방법론을 제안한다. 뉴스기사 370,000건과 요약문 및 레포트 21,600건을 사용하여 실험을 수행한 결과, ROUGE와 BERT Score 측면에서 제안 방법론인 SbGSG가 전통적인 GSG에 비해 우수한 성능을 보임을 확인하였다.

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

잡음환경 음성명료도 향상을 위한 이진 마스크 추정 후처리 알고리즘 (A Post-processing for Binary Mask Estimation Toward Improving Speech Intelligibility in Noise)

  • 김기백
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.311-318
    • /
    • 2013
  • 시간-주파수 영역에서의 이진 마스킹을 이용하여 잡음환경에서 잡음을 제거하여 음질을 향상하는 방법에 대해 논하고자 한다. 잡음이 섞여 있는 음성신호를 시간-주파수 영역으로 분해하여, 상대적으로 잡음이 많이 섞여 있는 시간-주파수 영역 (시간-주파수 유닛의 신호 대 잡음 비 (Signal-to-Noise Ratio: SNR)가 낮은 영역)의 신호에 마스크 "0"을 할당하여 제거함으로써 음성명료도를 향상시킬 수 있다. 이전의 연구에서는 가우시안 혼합 모델을 이용하여 마스크 "0"과 마스크 "1"을 분류하는 방법을 사용하였다. 각 주파수 밴드별로 수집된 데이터를 이용하여 가우시안 혼합 모델을 학습하고 테스트 데이터가 들어오면 현재의 시간-주파수 마스크가 "0"인지 "1"인지 판별하게 된다. 본 논문에서는 이러한 알고리즘에 주파수 영역에서의 종속성을 고려하여 추정된 마스크에 대해 후처리를 수행하는 알고리즘을 제안한다. 주파수 영역에서의 종속성에 관한 후처리는 비터비 (Viterbi) 알고리즘을 이용하며, 제안된 후처리 알고리즘을 적용하여 이진 마스크 추정 오차를 줄여 음성 명료도 향상을 기대할 수 있다.

깊이 기반 블렌딩 기술을 활용한 고스트 일러스트레이션 렌더링 (Ghosted Illustration Rendering using Depth-based Blending Techniques)

  • 김동준;신영길
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권3호
    • /
    • pp.1-8
    • /
    • 2020
  • 고스트 일러스트레이션은 모델의 명확한 형상에 대한 기하학적 정보를 잃지 않으면서 내/외부 구조를 동시에 가시화하는 효과적인 도구이다. 우리는 고스트 일러스트레이션의 전통적인 접근 방식에 모델의 깊이 정보를 활용하는 3차원 블렌딩 기술을 조합하는 새로운 프레임워크를 제안한다. 이 조합은 고스트 일러스트레이션의 요구 사항에 맞는 자연스러운 혼합 효과를 용이하게 한다. 또한, 일반적인 조작 기법(예. 마스킹)과 일러스트 렌더링 효과를 제안 프레임워크에 통합하여 명확한 형상에 대한 기하학적 정보와 깊이 정보를 동시에 제공하는 방법을 기술한다. 제안 기술 및 기존 기술에 대하여, 우리는 이들을 다양하게 조합하여 얻은 시각적 결과를 보이고 그 결과에 대해 논의한다. 이를 통해, 제안 프레임워크가 고스트 일러스트레이션을 위한 효과적인 툴이 될 수 있음을 보인다.

미기상해석모듈 출력물의 정확성에 대한 객체기반 검증법: 한반도 풍속예측모형의 정확성 검증에의 응용 (An Object-Based Verification Method for Microscale Weather Analysis Module: Application to a Wind Speed Forecasting Model for the Korean Peninsula)

  • 김혜중;곽화륜;김상일;최영진
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1275-1288
    • /
    • 2015
  • 미기상해석모듈(microscale weather analysis module)은 복사에너지, 열, 습도 등의 순환을 시-공간적으로 세밀하게 설명하고 모의실험 할 수 있도록 개발한 초고분해능($1km{\times}1km$ 이내)의 기상모델이다. 본 논문은 미기상해석모듈의 정확성을 시공간적으로 검증할 수 있도록 고안한 객체기반 검증법을 제안한다. 이 검증법은 통계그래픽을 사용하는 시각적인 방법이며, 미기상해석모듈의 평가통계출력장 구축단계, 객체식별 및 병합단계, 모듈의 정확성 검증단계로 이루진다. 이를 위해 두 가지 통계를 사용하여 삼차원의 평가통계출력장을 구축하였고, 구축된 출력장에서 정의되는 시계열통계들에 대해 합성(convolution), 가면화(masking) 및 병합작업(merging)을 시행하여 출력장에서 모듈검증대상 지역인 객체를 식별하는 알고리즘을 개발하였다. 또한, 사례연구를 통해 제안된 객체기반 검증법의 유용성을 보였다.

수치고도 모델을 이용한 사천만 해안지역의 3차원 지형분석 (Three Dimensional Analysis Using Digital Elevation Model on the Coastal Landform of the Sacheon Bay, South Sea of Korea)

  • 이민부;김남신;한균형
    • 한국지역지리학회지
    • /
    • 제9권2호
    • /
    • pp.203-216
    • /
    • 2003
  • 본 논문은 경남 사천만을 중심으로 위성영상과 GIS 기법을 이용하여 수치지형도와 수치해도를 결합한 수치고도 모델(DEM) 제작을 통해 육지와 천해를 연계한 해양지형의 분석을 시도한 것이다. 수치고도모델의 제작은 육지 고도 및 해저 수심 레이어 추출 UTM 재투영, 좌표점의 이동과 보간 등의 과정을 거쳐 이루어 졌다. 조류이동, 천해퇴적, 수심 등 해저지형 분석은 Landsat TM 밴드 육안분석, 육지부 마스킹, 밴드합성, 회귀분석 등을 통해 이루어 졌으며 천해 실측자료는 오차를 수정하여 분석에 이용되었다. 수치고도모델에서 분석된 지형요소들은 하천, 선상지, 조류, 단구, 해적퇴적층 등이다. 연안 퇴적작용은 하천 운반물의 영향을 크게 받고 있는데, 특히 진양호의 배수로인 가화천은 계절작으로 여름철에 공급량이 많으며 조류의 영향이 적은 곳에 퇴적층이 잘 발달하였다. 단구지형이 발달한 만안쪽에는 조류퇴적물의 영향이 크고, 소규모 만입은 해안류에 의한 운반물오 폐쇄되는 특성을 보인다. 사천만 동안의 선상지 지형은 해저까지 연장되어 발달하고 있다. 진주만 뱅크는 잔류 구릉이 침수된 것으로 미립물의 해저 퇴적지 역할을 하고 있다.

  • PDF

RGBCMYK 성분의 XYZ 전광 변환 함수를 이용한 모바일 LCD의 특성화 (Mobile LCD Characterization using XYZ Electro-Optical Transfer Functions for RGBCMYK Components)

  • 박기현;권오설;손창환;하영호
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.1-10
    • /
    • 2006
  • 디스플레이 특성화 방법, 예를 들어 gain-offset-gamma (GOG) 모델 혹은 S-curve 모델에서는 일반적으로 디스플레이가 두 가지의 기본적인 특성, 즉 채널 색도 일관성과 채널 독립성을 가지고 있다고 가정한다. 하지만, 모바일 LCD의 경우, 이러한 가정은 잘 적용되지 않는다. 따라서 기존의 디스플레이 특성화 방법을 모바일 디스플레이에 적용하기 위해서는 부분적인 수정이 요구된다. 본 논문에서는 채널 색도 변화성의에 기인하여 나타나는 X, Y, Z 값의 전광 변환 함수의 차이를 고려하기 위해 각 채널당 X, Y, Z 값의 전광 변환 함수를 전부 모델링하는 방법을 제안한다. 또한, 채널 상호작용에 기인하여 나타나는 채널 사이의 충분하지 않은 가산성을 보상하기 위해 채널간 성분, 즉 cyan, magenta, yellow, gray에 대해서도 X, Y, Z 값의 전광변환 함수를 전부 모델링하여 이용한다. 실험을 통하여, 제안한 특성화 방법이 채널 색도 변화 또는 채널 의존성을 고려한 다른 특성화 방법에 비하여 모바일 디스플레이에서의 색 자극 값을 더욱 정확히 예측한다는 것을 보여 주었다.

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

교차 예측 기반의 보컬 추정 방법을 이용한 SAOC Karaoke 모드에서의 음질 향상 기법에 대한 연구 (Quality Improvement of Karaoke Mode in SAOC using Cross Prediction based Vocal Estimation Method)

  • 이동금;박영철;윤대희
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.227-236
    • /
    • 2013
  • 본 논문에서는 SAOC의 Karaoke 모드의 출력 신호 내에 존재하는 잔여 보컬 성분을 추정하여 억제시킴으로써 음질을 향상시킬 수 있는 알고리듬을 제안하였다. 잔여 보컬 성분은 Karaoke 모드 환경으로 합성된 신호와 Solo 모드로 새로 합성된 신호를 서로 교차 예측하여 추정될 수 있다. 그러나, 두 신호는 모두 같은 다운 믹스 신호로부터 합성되는 신호이므로, 두 신호간의 높은 상관성으로 인하여 가라오케 신호내의 잔여 보컬 성분뿐만 아니라 음악 성분도 함께 제거된다. 이러한 열화를 해결하기 위해, 본 논문에서는 교차 예측 과정에서 심리 음향적 특성을 고려한 예측 방해 신호를 적용하였으며, 이 신호의 크기는 심리음향모델의 마스킹 특성에 따라 음악적 음질의 열화가 최소화되도록 적응적으로 설정되었다. 실험은 보컬 객체가 포함된 음악 신호에 대해서 객관적 및 주관적 음질평가를 수행하였으며, 전체적으로 성능 향상이 있음을 확인하였다.

설명 가능 그래프 심층 인공신경망 기반 속도 예측 및 인근 도로 영향력 분석 기법 (Speed Prediction and Analysis of Nearby Road Causality Using Explainable Deep Graph Neural Network)

  • 김유진;윤영
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.51-62
    • /
    • 2022
  • 교통 혼잡을 해결하기 위한 AI 기반 속도 예측 연구는 활발하게 진행되고 있다. 하지만, 인공지능의 추론 과정을 설명하는 설명 가능한 AI의 중요성이 대두되고 있는 가운데 AI 기반 속도 예측의 결과를 해석하고 원인을 추리하는 연구는 미흡하였다. 따라서 본 논문에서는 '설명 가능 그래프 심층 인공신경망 (GNN)'을 고안하여 속도 예측뿐만 아니라, GNN 모델 입력값의 마스킹 기법에 기반하여 인근 도로 영향력을 정량적으로 분석함으로써 혼잡 등의 상황에 대한 추론 근거를 도출하였다. TOPIS 통행 속도 데이터를 활용하여 서울 시내 혼잡 도로를 기준으로 예측 및 분석 방법론을 적용한 후 영향력 높은 인근 도로의 속도를 가상으로 조절하는 시뮬레이션 통하여 혼잡 도로의 통행 속도가 개선됨을 확인하여 제안한 방법론의 타당성을 입증하였다. 이는 교통 네트워크에 제안한 방법론을 적용하고, 그 추론 결과에 기반한 특정 인근 도로를 제어하여 교통 흐름을 개선할 수 있다는 점에 의미가 있다.