• 제목/요약/키워드: Automatic Masking

검색결과 25건 처리시간 0.023초

Improving Abstractive Summarization by Training Masked Out-of-Vocabulary Words

  • Lee, Tae-Seok;Lee, Hyun-Young;Kang, Seung-Shik
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.344-358
    • /
    • 2022
  • Text summarization is the task of producing a shorter version of a long document while accurately preserving the main contents of the original text. Abstractive summarization generates novel words and phrases using a language generation method through text transformation and prior-embedded word information. However, newly coined words or out-of-vocabulary words decrease the performance of automatic summarization because they are not pre-trained in the machine learning process. In this study, we demonstrated an improvement in summarization quality through the contextualized embedding of BERT with out-of-vocabulary masking. In addition, explicitly providing precise pointing and an optional copy instruction along with BERT embedding, we achieved an increased accuracy than the baseline model. The recall-based word-generation metric ROUGE-1 score was 55.11 and the word-order-based ROUGE-L score was 39.65.

Towards Low Complexity Model for Audio Event Detection

  • Saleem, Muhammad;Shah, Syed Muhammad Shehram;Saba, Erum;Pirzada, Nasrullah;Ahmed, Masood
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.175-182
    • /
    • 2022
  • In our daily life, we come across different types of information, for example in the format of multimedia and text. We all need different types of information for our common routines as watching/reading the news, listening to the radio, and watching different types of videos. However, sometimes we could run into problems when a certain type of information is required. For example, someone is listening to the radio and wants to listen to jazz, and unfortunately, all the radio channels play pop music mixed with advertisements. The listener gets stuck with pop music and gives up searching for jazz. So, the above example can be solved with an automatic audio classification system. Deep Learning (DL) models could make human life easy by using audio classifications, but it is expensive and difficult to deploy such models at edge devices like nano BLE sense raspberry pi, because these models require huge computational power like graphics processing unit (G.P.U), to solve the problem, we proposed DL model. In our proposed work, we had gone for a low complexity model for Audio Event Detection (AED), we extracted Mel-spectrograms of dimension 128×431×1 from audio signals and applied normalization. A total of 3 data augmentation methods were applied as follows: frequency masking, time masking, and mixup. In addition, we designed Convolutional Neural Network (CNN) with spatial dropout, batch normalization, and separable 2D inspired by VGGnet [1]. In addition, we reduced the model size by using model quantization of float16 to the trained model. Experiments were conducted on the updated dataset provided by the Detection and Classification of Acoustic Events and Scenes (DCASE) 2020 challenge. We confirm that our model achieved a val_loss of 0.33 and an accuracy of 90.34% within the 132.50KB model size.

Kompsat-5 SAR와 AIS 자료 통합분석 기반 운영레벨 선박탐지 모니터링 (Operational Ship Monitoring Based on Integrated Analysis of KOMPSAT-5 SAR and AIS Data)

  • 김상완;김동한;이윤경
    • 대한원격탐사학회지
    • /
    • 제34권2_2호
    • /
    • pp.327-338
    • /
    • 2018
  • 본 연구는 운영레벨에서의Kompsat-5 SAR (Synthetic Aperture Radar) 영상과AIS (Automatic Identification System) 자료를 이용한 선박탐지 모니터링 가능성을 검토하였다. 분석을 위해 신진항 서측연안과 제주항 북측연안에서 수집된 Kompsat-5 SLC 영상과 연안에서 수집된 AIS 자료를 사용하였다. Kompsat-5 영상의 선박탐지를 위해 HVAS (Human Visual Attention System) 알고리즘을 적용하였다. HVAS는 CFAR (Constant False Alarm Rate)에 비해 탐지속도와 탐지율 측면에서 뛰어나다는 장점을 가지고 있다. 통합 분석결과 소형선박을 제외하고 Kompsat-5 선박탐지 결과와 AIS는 전반적으로 일치하는 것으로 분석되었다. Kompsat-5 영상에서 탐지되었으나 AIS 자료에서 탐지되지 않은 선박은 육안 판독을 통해 AIS 자료의 부재로 인한 것으로 보인다. 한편 SAR 영상에서도 선박의 기포항적, 육지 masking을 위해 사용된 DEM 파일의 오차(또는 위성궤도 오차), 그리고 고스트 현상에 의한 오탐지가 발생하였다. 향후 SAR 영상 분석 알고리즘 개선과 신뢰성 있는 AIS 자료 확보를 통한 운영레벨에서의 선박탐지 모니터링 기술 개발은 국가해양영토 광역감시망 구축에 크기 기여할 것이다.

An Intelligent System for Recognition of Identifiers from Shipping Container Images using Fuzzy Binarization and Enhanced Hybrid Network

  • Kim, Kwang-Baek
    • 한국지능시스템학회논문지
    • /
    • 제14권3호
    • /
    • pp.349-356
    • /
    • 2004
  • The automatic recognition of transport containers using image processing is very hard because of the irregular size and position of identifiers, diverse colors of background and identifiers, and the impaired shapes of identifiers caused by container damages and the bent surface of container, etc. In this paper we propose and evaluate a novel recognition algorithm for container identifiers that effectively overcomes these difficulties and recognizes identifiers from container images captured in various environments. The proposed algorithm, first, extracts the area containing only the identifiers from container images by using CANNY masking and bi-directional histogram method. The extracted identifier area is binarized by the fuzzy binarization method newly proposed in this paper. Then a contour tracking method is applied to the binarized area in order to extract the container identifiers which are the target for recognition. In this paper we also propose and apply a novel ART2-based hybrid network for recognition of container identifiers. The results of experiment for performance evaluation on the real container images showed that the proposed algorithm performs better for extraction and recognition of container identifiers compared to conventional algorithms.

Recognition of Identifiers from Shipping Container Image by Using Fuzzy Binarization and ART2-based RBF Network

  • Kim, Kwang-baek;Kim, Young-ju
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.88-95
    • /
    • 2003
  • The automatic recognition of transport containers using image processing is very hard because of the irregular size and position of identifiers, diverse colors of background and identifiers, and the impaired shapes of identifiers caused by container damages and the bent surface of container, etc. We proposed and evaluated the novel recognition algorithm of container identifiers that overcomes effectively the hardness and recognizes identifiers from container images captured in the various environments. The proposed algorithm, first, extracts the area including only all identifiers from container images by using CANNY masking and bi-directional histogram method. The extracted identifier area is binarized by the fuzzy binarization method newly proposed in this paper and by applying contour tracking method to the binarized area, container identifiers which are targets of recognition are extracted. We proposed and applied the ART2-based RBF network for recognition of container identifiers. The results of experiment for performance evaluation on the real container images showed that the proposed algorithm has more improved performance in the extraction and recognition of container identifiers than the previous algorithms.

  • PDF

토지 피복 세분류를 위한 경지 정리 논 자동 추출 (Automatic Extraction of the Land Readjustment Paddy for High-level Land Cover Classification)

  • 염준호;김용일
    • 한국측량학회지
    • /
    • 제32권5호
    • /
    • pp.443-450
    • /
    • 2014
  • 최근 각종 공간정보에 대한 수요가 증가함에 따라 정부 및 지방 자치 단체에서 다양한 공간정보를 제작하여 공급하고 있다. 2000년 대분류 토지피복지도가 제작된 이래 2010년부터 토지 피복 세분류 지도가 작성되기 시작하였으나 현재 일부 지역에 대해서만 세분류 지도가 구축되어있는 상황이다. 또한 그 동안 토지 피복 분류 결과의 고도화를 위하여 다양한 연구들이 진행되어왔지만 대부분의 연구가 대분류 또는 중분류 수준에 그치고 있으며 토지 피복 세분류에 관한 연구는 매우 부족한 실정이다. 따라서 본 연구에서는 토지 피복 중분류의 논 항목을 세분류 갱신하기 위하여 경지 정리 논을 자동으로 추출하는 기법을 제안하였다. 농업 분야에 효과적인 활용이 가능한 RapidEye 위성영상을 이용하였으며 영상에 고주파 필터링을 적용하여 논의 경계 정보를 강조하고 Otsu 임계화를 통해 논 경계에 대한 이진 영상을 취득하였다. 토지 피복 지도와 영상 등록을 수행하여 논 토지 피복에 대한 마스킹을 수행하였으며 이를 통해 논 지역의 경계 정보를 선별하였다. 최종적으로 지역적인 허프 라인 추출을 통하여 끊어진 에지를 이어 논의 경계 정보를 선형으로 추출하고 시작점과 끝점이 유사한 선형을 연결하여 경지 정리 논의 경계 정보를 완성하였다. 연구 결과, 효과적으로 경지 정리 논의 경계를 추출할 수 있었으며 벡터 추출 시 논 토지 피복 세분류 갱신의 상당 부분을 자동화할 수 있음을 확인하였다.

CT 혈관 조영 영상에서 뼈 소거법 기반의 하지 혈관 자동 추출 (Automatic Lower Extremity Vessel Extraction based on Bone Elimination Technique in CT Angiography Images)

  • 김수경;홍헬렌
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.967-976
    • /
    • 2009
  • 본 논문에서는 CT 및 CT 혈관 조영 영상에서 강체 정합 및 뼈 소거법을 이용한 하지 혈관 자동 추출 방법을 제안한다. 첫째, 뼈의 부분적인 움직임을 반영하기 위하여 해부학 정보를 바탕으로 하지를 자동 구역화하고, 둘째, CT와 CTA 영상간 움직임을 산정하기 위하여 거리지도 기반의 강체 정합을 수행한다. 셋째, CTA 영상에서 복잡한 구조를 갖는 뼈를 제거하고 뼈에 인접한 혈관이 깎이는 것을 방지하기 위하여 뼈 소거법과 혈관 마스킹 기법을 제안한다. 넷째, 정합오차 및 연골 등의 잡음을 줄이기 위하여 혈관 추적 기반의 후 처리 과정을 통하여 보정한다. 제안 방법의 평가를 위해 육안 평가와 정확성 평가 그리고 수행시간을 측정하였다. 육안 평가를 위해 차감 기법, 정합 후 차감 기법, 제안 방법을 적용한 결과를 볼륨렌더링과 최대 강도 투영영상을 사용하여 비교하였다. 정확성 평가를 위해 CTA 영상과 차감 기반 기법 및 제안 방법을 적용한 결과의 밝기값 분포도를 분석하였다. 실험 결과 뼈는 제거되고 가는 혈관 및 다른 조직의 손실 없이 혈관이 정확하게 추출되었음을 볼 수 있었고, 13명의 환자 데이터 전채에 대한 전체 수행시간은 약 40포 정도로 측정되었다.

Automatic Detection Approach of Ship using RADARSAT-1 Synthetic Aperture Radar

  • Yang, Chan-Su
    • 해양환경안전학회지
    • /
    • 제14권2호
    • /
    • pp.163-168
    • /
    • 2008
  • 인공위성 원격탐사를 이용한 선박탐지는 주요 적용 분야 중 하나로, 광역의 환경 감시와 해상보안에 적용되고 있다. 이를 통하여 어장을 포함한 해상교통을 모니터링할 수 있으며, 기름유출 선박을 찾기도 한다. 본 연구에서는, RADARSAT의 합성개구레이더(SAR) 영상을 기반으로 개발한 자동선박탐지기법을 제시하고, 2004년 8월 6일에 얻어진 영상에 적용을 하여 현장 자료와의 비교를 실시하였다. 선박탐지알고리듬은 보정, 랜드마스킹, 필터링, 위치 등록 그리고 식별의 5단계로 구성된다. 울산항을 중심으로 이루어진 위성 촬영시점의 풍속은 최대 0.4m/s이었다. 전장이 68m 이상인 묘박지의 선박을 중심으로 한 선박 탐지 결과는 울산 항만교통정보시스템의 레이더정보와 잘 일치하였다. 바지선과 같은 소형선박의 경우, SAR에 의한 선박 탐지 능력이 육상에 설치된 레이더보다 더 높은 경우도 있었다. 또한, SAR 레이더 산란 단면적(RCS)을 이용하여 선박의 길이와 폭을 계산하였으나, 레이오버와 그림자 효과 때문에 실제 값보다 비교적 높게 추정되었다.

  • PDF

텍스트 요약 품질 향상을 위한 의미적 사전학습 방법론 (Semantic Pre-training Methodology for Improving Text Summarization Quality)

  • 전민규;김남규
    • 스마트미디어저널
    • /
    • 제12권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 최근 사용자에게 의미있는 정보만을 자동으로 간추리는 텍스트 자동 요약이 꾸준히 연구되고 있으며, 특히 인공신경망 모델인 트랜스포머를 활용한 텍스트 요약 연구가 주로 수행되고 있다. 다양한 연구 중 특히 문장 단위 마스킹을 통해 모델을 학습시키는 GSG 방식이 가장 주목을 받고 있지만, 전통적인 GSG는 문장의 의미가 아닌 토큰의 중복 정도에 기반을 두어 마스킹 대상 문장을 선정한다는 한계를 갖는다. 따라서 본 연구에서는 텍스트 요약의 품질을 향상시키기 위해, 문장의 의미를 고려하여 GSG의 마스킹 대상 문장을 선정하는 SbGSG(Semantic-based GSG) 방법론을 제안한다. 뉴스기사 370,000건과 요약문 및 레포트 21,600건을 사용하여 실험을 수행한 결과, ROUGE와 BERT Score 측면에서 제안 방법론인 SbGSG가 전통적인 GSG에 비해 우수한 성능을 보임을 확인하였다.

ART2 기반 RBF 네트워크와 얼굴 인증을 이용한 주민등록증 인식 (Recognition of Resident Registration Card using ART2-based RBF Network and face Verification)

  • 김광백;김영주
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2006
  • 우리나라의 주민등록증은 주소지, 주민등록번호, 얼굴사진, 지문 등 개인의 다양한 정보를 가진다. 현재의 플라스틱형 주민등록증은 위조 및 변조가 쉽고 그 수법이 날로 전문화 되어가고 있다. 따라서 육안으로 위조 및 변조 사실을 쉽게 확인하기가 어려워 사회적으로 문제를 일으키고 있다. 이에 본 논문에서는 개선된 ART2 기반 RBF 네트워크에 이용한 주민등록번호 인식과 얼굴 인증을 통한 주민등록증 자동 인식 방법을 제안한다. 제안된 방법은 주민등록증 영상으로부터 주민등록번호와 발행일을 추출하기 위하여 주민등록증 영상에 소벨 마스킹와 미디언 필터링을 적용한 후에 수평 스미어링을 적용하여 주민등록번호와 발행일 영역을 추출한다. 그리고 원영상에 대해 고주파 필터링을 적용하여 영상 전체를 이진화하고, 이진화된 영상에 CDM 마스크를 적용하여 주민등록번호와 발행일 코드를 복원한 다음, 검출된 각 영역에 대해 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 문자를 추출한다. 추출된 주민등록번호 등의 개별 문자를 인식하기 위해 개선된 ART2 기반 RBF 네트워크를 제안하고 인식에 적용한다. 제안된 ART2 기반 RBF 네트워크는 학습 성능을 개선하기 위하여 중간층과 출력층의 학습에 퍼지 제어 기법을 적용하여 학습률을 동적으로 조정한다. 얼굴 인증은 템플릿 매칭 알고리즘을 이용하여 얼굴 템플릿 데이터베이스를 구축하고 주민등록증에서 추출된 얼굴 영역과의 유사도를 측정하여 주민등록증 얼굴 영역의 위조여부를 판별한다. 제안된 주민등록증 인식 방법의 성능을 평가하기 위해 원본 주민등록증 영상에 대해 얼굴 영역 위조, 노이즈추가, 대비 증감, 밝기 증감 그리고 영상 흐리기 등의 변형된 영상들을 생성하여 실험한 결과, 제안된 방법이 주민등록번호 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다

  • PDF