• 제목/요약/키워드: Masking 모델

검색결과 66건 처리시간 0.029초

고주파 강조 필터링을 포함하는 마스킹의 조합을 이용한 DRAEM의 텍스쳐 불량 감지 성능 향상 (Improving Texture Defect Detection Performance in DRAEM Using Combinations of Masking with High-Pass Emphasis Filtering)

  • 시종욱;김성영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.21-22
    • /
    • 2023
  • 딥러닝 모델은 영상 처리와 불량 감지 등 다양한 분야에서 높은 성능을 발휘하여 산업적으로 매우 중요하고 필수적인 기술이 되었다. 특히, 불량 감지는 제조업 분야에서 제품 품질 향상과 생산성 향상에 핵심적인 역할을 하는 기술로써 큰 관심을 받고 있다. 본 논문에서는 재건축 방식의 대표적인 모델인 DRAEM에 대해 불량 감지 성능을 향상하는 방법을 제시합니다. 이를 위해 컬러 분포의 차이를 최소화하는 손실 함수와 마스킹에 고주파 필터링을 적용하여 노이즈를 제거하는 방법을 활용한다. 이러한 방법들을 통해 DRAEM 모델의 성능을 개선하고, 정확하고 효과적인 불량 감지를 실현할 수 있다.

  • PDF

이동체의 수신 환경을 고려한 GNSS 신호 생성기 개발 (Development of a GNSS Signal Generator Considering Reception Environment of a Vehicle)

  • 조성룡;박찬식;황상욱;최윤섭;이주현;이상정;백정기;이동국;지규인
    • 한국통신학회논문지
    • /
    • 제37C권9호
    • /
    • pp.811-820
    • /
    • 2012
  • GNSS 신호는 구조가 개방되어 있을 뿐만 아니라 수신 신호 세기가 미약하여 전파교란에 취약하다. 이에 따라 전파교란에 대한 영향 분석 및 대응 기법에 대한 연구의 필요성이 증대되고 있다. 본 논문에서는 실제 전파교란 환경과 유사한 환경에서의 전파교란 영향 분석을 위하여 6가지 전술 환경에 대한 전파 전파 모델과 이동체의 수신환경을 고려한 동체 차단 모델을 설계 하였다. 전파전파 모델은 도심지역, 농촌지역, 수풀지역, 해안지역, 황무지, 눈/얼음 지역에 대해서 Two-ray 모델을 이용하여 설계 하였다. 동체 차단 모델은 안테나가 이동체에 의하여 받는 영향과 사용자가 직접 입력한 안테나 패턴을 이용하여 모델링하였다. 전파교란이 없는 정상 환경과 전파교란 환경에 대하여 이동체의 수신환경을 고려한 GNSS 신호 생성기의 출력은 상용수신기(NordNav)를 이용하여 검증 하였다. 정상 환경에서는 사용자의 항법 성능이 상용 H/W 신호 생성 시뮬레이터(STR4500)과 유사한 것을 확인하였다. 전파교란 환경에서는 이동체 위치에 따른 동체 차단 효과 및 전파교란 신호에 의한 GNSS 신호 획득 및 추적 손실이 정확히 반영됨을 확인 하였다.

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

시간-주파수 구조에 근거한 지각적 오디오 부호화기 (A Perceptual Audio Coder Based on Temporal-Spectral Structure)

  • 김기수;서호선;이준용;윤대희
    • 방송공학회논문지
    • /
    • 제1권1호
    • /
    • pp.67-73
    • /
    • 1996
  • 일반적으로 고음질 오디오 부호화 방법은 전통적인 데이터 압축 기법과 인간의청각 모델을 결합한 구조를 갖고 있다. 고음질 오디오 부호화에 사용되는 주요한 청각 특성은 주파수 영역에서의 마스킹 현상이므로 서브밴드 부호화나 변환 부호화와 같은 주파수 영역 방법들이 널리 사용된다[1][2]. 그러나 지금까지의 고음질 오디오 부호화에서 시간 영역 마스킹과 시간 영역 중복성을 제거하는 방법은 적용되지 않았다. 본 논문에서 제안한 오디오 데이터 압축 방법은 시간 및 주파수 영역에서 통계적, 지각적 중복성을 제거한다. 주파수 영역으로 변환된 오디오 신호는 6프레임으로 구성된 패킷으로 나뉘어진다. 한 패킷은 1536 샘플 ($256{\times}6$)로 되어 있으며 패킷 내에서의 중복성은 시간 및 주파수 영역에서 존재한다. 각 패킷에서 두 중복성이 동시에 제거되어진다. 심리음향 모델에 있어서도 세밀한 주파수 마스킹과 함께 시간 영역 마스킹을 고려하여 보다 정확한 결과를 얻을 수 있도록 향상되었다. 양자화를 위해서 각 패킷은 비선형적인 임계 대역과 시간적인 청각 특성을 반영할 수 있도록 설계된 부블럭으로 분할되었다. 따라서 낮은 비트율에서 고음질의 복원음을 얻을 수 있었다.

  • PDF

인지 시각시스템 및 이산코사인변환을 이용한 디지털 이미지 워터마킹 (Digital Cage Watermarking using Human Visual System and Discrete Cosine Transform)

  • 변성철;김종남;안병하
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권1호
    • /
    • pp.17-23
    • /
    • 2003
  • 본 연구는 사람의 시각시스템(Human Visual System, HVS) 특성 및 이산코사인변환 (Discrete Cosine Transform, DCT)을 이용하여 디지털 이미지에 워터마킹(watermarking)하는 방법을 제시한다. 이미지 압축분야에서 연구되어온 사람의 시각 시스템 모델 중 Tong등의 텍스쳐 마스킹(texture mashing). 휘도 마스킹(luminance masking) 모델과 JPEG(Joint Photographic Experts Group)의 양자화 매트릭스(quantization matrix)를 이용한 주파수 마스킹(frequency masking) 기법을 결합하여 워터마크를 삽입한다. 제안한 인지 시각시스템을 이용한 워터마킹 알고리즘은 워터마크를 삽입할 블록이미지의 특성에 따라서 워터마크의 삽입강도를 적응적으로 조절한다. 두가지 형태의 워터마크(의사난수 또는 로고이미지)를 DCT 영역에서 각각 삽입한다. 이를 위하여 이미지를 $8\times8$블록단위로 분할하고 이산코사인 변환을 수행한 후, 변환계수의 저주파 영역에 워터마킹한다. 다양한 실험을 통하여 제안한 방법이 기존의 워터마킹 방법과 비교하여 놀은 화질을 유지하면서 압축과 잡음 등에 견고함을 보인다.

신조어의 의미 학습을 위한 딥러닝 기반 표적 마스킹 기법 (Deep Learning-based Target Masking Scheme for Understanding Meaning of Newly Coined Words)

  • 남건민;서수민;곽기영;김남규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.391-394
    • /
    • 2021
  • 최근 딥러닝(Deep Learning)을 활용하여 텍스트로 표현된 단어나 문장의 의미를 파악하기 위한 다양한 연구가 활발하게 수행되고 있다. 하지만, 딥러닝을 통해 특정 도메인에서 사용되는 언어를 이해하기 위해서는 해당 도메인의 충분한 데이터에 대해 오랜 시간 학습이 수행되어야 한다는 어려움이 있다. 이러한 어려움을 극복하고자, 최근에는 방대한 양의 데이터에 대한 학습 결과인 사전 학습 언어 모델(Pre-trained Language Model)을 다른 도메인의 학습에 적용하는 방법이 딥러닝 연구에서 많이 사용되고 있다. 이들 접근법은 사전 학습을 통해 단어의 일반적인 의미를 학습하고, 이후에 단어가 특정 도메인에서 갖는 의미를 파악하기 위해 추가적인 학습을 진행한다. 추가 학습에는 일반적으로 대표적인 사전 학습 언어 모델인 BERT의 MLM(Masked Language Model)이 다시 사용되며, 마스크(Mask) 되지 않은 단어들의 의미로부터 마스크 된 단어의 의미를 추론하는 형태로 학습이 이루어진다. 따라서 사전 학습을 통해 의미가 파악되어 있는 단어들이 마스크 되지 않고, 신조어와 같이 의미가 알려져 있지 않은 단어들이 마스크 되는 비율이 높을수록 단어 의미의 학습이 정확하게 이루어지게 된다. 하지만 기존의 MLM은 무작위로 마스크 대상 단어를 선정하므로, 사전 학습을 통해 의미가 파악된 단어와 사전 학습에 포함되지 않아 의미 파악이 이루어지지 않은 신조어가 별도의 구분 없이 마스크에 포함된다. 따라서 본 연구에서는 사전 학습에 포함되지 않았던 신조어에 대해서만 집중적으로 마스킹(Masking)을 수행하는 방안을 제시한다. 이를 통해 신조어의 의미 학습이 더욱 정확하게 이루어질 수 있고, 궁극적으로 이러한 학습 결과를 활용한 후속 분석의 품질도 향상시킬 수 있을 것으로 기대한다. 영화 정보 제공 사이트인 N사로부터 영화 댓글 12만 건을 수집하여 실험을 수행한 결과, 제안하는 신조어 표적 마스킹(NTM: Newly Coined Words Target Masking)이 기존의 무작위 마스킹에 비해 감성 분석의 정확도 측면에서 우수한 성능을 보임을 확인하였다.

  • PDF

패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축 (Construction of a Bidirectional Transformer Model for Paraphrasing Detection)

  • 고보원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2019
  • 자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.

  • PDF

정현파 모델을 이용한 오디오 신호의 심리음향적 분석 및 합성 (Analysis and Synthesis of Audio Signals using a Sinusoidal Model with Psychoacoustic Criteria)

  • 남승현;강경옥;홍진우
    • 한국음향학회지
    • /
    • 제18권2호
    • /
    • pp.77-82
    • /
    • 1999
  • 정현파 모델은 음성과 오디오 신호의 분석과 합성에 많이 활용되어 왔으며 최근 고음질 저비트율 오디오 부호화에 효율적인 방법의 하나로 대두되고 있다. 정현파 모델을 이용한 오디오 신호의 분석과 합성에서 중요한 단계 중의 하나는 순음의 검출이다. 본 논문은 정현파를 이용한 오디오 신호의 분석과 합성에 매스킹 효과와 매스킹 인덱스 그리고 JNDf(Just Noticeable Difference in Frequency) 등의 심리음향적 기준들을 활용하는 효율적인 방안을 제안하였다. 모의실험 결과, 심리음향적 기준을 사용하면 합성된 음질에 거의 영향을 주지 않으면서 합성에 사용되는 정현파의 개수를 현저하게 줄일 수 있었음을 알 수 있었다.

  • PDF

상황인식 이동성 예측 모델에서의 효율적인 포워딩 경로 산출 기법 (Efficient Forwarding Path Computing Method for Context-Awareness Mobility Prediction Model)

  • 정래진;오영준;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.93-95
    • /
    • 2014
  • 본 논문은 계층적 클러스터 구조에서, 상황인식 이동성 예측모델을 통해 예측된 이동성으로 효율적인 포워딩 경로를 산출하는 기법을 제안한다. 이동성으로 인하여 노드 간 연결이 쉽게 변화하는 환경에서 통신의 불안정성을 극복하기 위해, 제안하는 알고리즘은 상황인식 이동성 예측모델을 통해 얻은 클러스터의 예측된 속성정보를 활용한다. 예측정보를 통해 클러스터간의 연결성을 매트릭스의 형태로 정리하며, 마스킹 기법을 응용한 포워딩 경로 산출 기법을 통해 효율적인 경로를 도출한다. 모의실험 결과, 제안하는 알고리즘으로 클러스터의 이동성을 고려하여 노드 간의 연결이 오래 지속될 수 있는 포워딩 경로를 선택 후에 전송함으로써 지연시간이 줄어드는 결과가 기대된다.

  • PDF

하드웨어 특성에 기반한 모델기반 변형된 불루 노이즈 마스킹 (Modified Blue-Noise Masking Based on Hardware Characteristics)

  • 이채수;박양우;윤태진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.147-150
    • /
    • 2000
  • 본 논문에서는 기존의 중간조 처리 방법들의 단점을 개선하고 원영상의 색을 충실히 재현하기 위해 도트 패턴 데이터베이스를 사용한 모델 기반의 중간조처리 방법을 제안한다. 제안한 방법은 우수한 화질의 풀력 영상을 얻기 위해 BNM을 기반으로 도트 패턴을 생성한 후 원형 도트 중첩 모델과 하드웨어의 점이득을 적용하여 도트 패턴 데이터베이스를 생성한다. 도트 패턴 데이터베이스는 하나의 밝기값에 도트 패턴각각 하나씩 구성되므로 출력 영상에서 원영상 화소의 색을 충실히 재현할 수 있다. 이 과정에서 인간 시각특성을 적용하여 현재 화소의 색에 대해 국부적으로 인간 시각에 적합한 도트 패턴을 선택한다.

  • PDF