• 제목/요약/키워드: Feature learning

검색결과 1,924건 처리시간 0.024초

A deep and multiscale network for pavement crack detection based on function-specific modules

  • Guolong Wang;Kelvin C.P. Wang;Allen A. Zhang;Guangwei Yang
    • Smart Structures and Systems
    • /
    • 제32권3호
    • /
    • pp.135-151
    • /
    • 2023
  • Using 3D asphalt pavement surface data, a deep and multiscale network named CrackNet-M is proposed in this paper for pixel-level crack detection for improvements in both accuracy and robustness. The CrackNet-M consists of four function-specific architectural modules: a central branch net (CBN), a crack map enhancement (CME) module, three pooling feature pyramids (PFP), and an output layer. The CBN maintains crack boundaries using no pooling reductions throughout all convolutional layers. The CME applies a pooling layer to enhance potential thin cracks for better continuity, consuming no data loss and attenuation when working jointly with CBN. The PFP modules implement direct down-sampling and pyramidal up-sampling with multiscale contexts specifically for the detection of thick cracks and exclusion of non-crack patterns. Finally, the output layer is optimized with a skip layer supervision technique proposed to further improve the network performance. Compared with traditional supervisions, the skip layer supervision brings about not only significant performance gains with respect to both accuracy and robustness but a faster convergence rate. CrackNet-M was trained on a total of 2,500 pixel-wise annotated 3D pavement images and finely scaled with another 200 images with full considerations on accuracy and efficiency. CrackNet-M can potentially achieve crack detection in real-time with a processing speed of 40 ms/image. The experimental results on 500 testing images demonstrate that CrackNet-M can effectively detect both thick and thin cracks from various pavement surfaces with a high level of Precision (94.28%), Recall (93.89%), and F-measure (94.04%). In addition, the proposed CrackNet-M compares favorably to other well-developed networks with respect to the detection of thin cracks as well as the removal of shoulder drop-offs.

원전 디지털 I&C 계통 고장예측을 위한 신뢰도 함수 추정 인공지능 모델 비교연구 (Comparative Study of AI Models for Reliability Function Estimation in NPP Digital I&C System Failure Prediction)

  • 이대영;이정훈;양승혁
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.1-10
    • /
    • 2023
  • 원전 계측제어계통은 정상운전 시 자가 진단기능의 유지보수를 위해 일정 주기로 건전성을 확인하고 있으며, 계획예방정비 기간 동안 기능 및 성능점검을 실시하여 필요한 경우 유지보수를 하고 있다. 하지만 원전의 정보를 계측하고 제어하는 계측제어계통에서도 선제적으로 고장을 진단하고 대처하여 사고전파를 방지할 수 있는 기술개발이 필요하다. 이에 본 논문에서는 계측제어 장비의 환경조건과 자가 진단 데이터를 활용한 신뢰도 함수 추정 방안을 연구하였으며, 고장데이터의 획득을 위해 계측제어 장비의 부품에 대한 Feature 별 확률분포를 가정하여 가상 고장데이터를 생산하였다. 이러한 고장데이터를 바탕으로 생존분석에서 활용되는 대표적인 인공지능 모델(DeepSurve, DeepHit)을 이용하여 신뢰도 함수를 추정하였고, 그와 동시에 전통적인 준모수적 방법론인 Cox 회귀모델을 통해 신뢰도 함수를 추정하여 환경조건과 진단 데이터를 바탕으로 한 잔여 수명 계산을 통해 적용 가능성을 확인하였다.

도시 스트리트뷰 영상을 이용한 딥러닝 기반 보행환경 평가 요소 분석 (Analysis of Deep Learning-Based Pedestrian Environment Assessment Factors Using Urban Street View Images)

  • 황지연;최철웅;남광우;이창우
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.45-52
    • /
    • 2023
  • 최근 일상생활 속 보행의 중요성이 강조되면서 보행권 보장 및 보행환경 조성을 위한 사업이 지역 곳곳에서 추진되고 있다. 선행 연구에서는 전주시 도로 이미지를 사용하여 보행환경 평가를 진행하고, 이미지 비교 쌍 데이터 세트를 구축하였다. 하지만 숫자로 표현된 데이터 세트는 보행환경 평가자들의 판단 기준을 일반화하거나 보행자가 선호하는 보행환경을 시각적으로 파악하기에 어려움이 존재한다. 따라서 본 연구는 웹 애플리케이션을 구축하여 데이터 시각화를 통해 보행환경 평가의 결과를 해석하는 방법을 제안한다. 의미론적 분할 결과를 활용하여 보행환경 평가자에게 영향을 미치는 보행환경 구성 요소를 분석한 결과, 보행자는 주로 'earth'와 'grass'가 많은 환경을 선호하지 않았고, 'signboard'와 'sidewalk'를 가진 환경을 선호하는 것으로 확인하였다. 제안된 연구는 향후 보행환경 평가의 참여자가 임의로 선택한 결과를 파악하고 분석할 수 있을 것으로 기대하며, 데이터에 대한 정제과정을 전처리로 수행함으로써 좀 더 향상된 정확도를 얻을 수 있을 것으로 판단한다.

An Ensemble Approach for Cyber Bullying Text messages and Images

  • Zarapala Sunitha Bai;Sreelatha Malempati
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.59-66
    • /
    • 2023
  • Text mining (TM) is most widely used to find patterns from various text documents. Cyber-bullying is the term that is used to abuse a person online or offline platform. Nowadays cyber-bullying becomes more dangerous to people who are using social networking sites (SNS). Cyber-bullying is of many types such as text messaging, morphed images, morphed videos, etc. It is a very difficult task to prevent this type of abuse of the person in online SNS. Finding accurate text mining patterns gives better results in detecting cyber-bullying on any platform. Cyber-bullying is developed with the online SNS to send defamatory statements or orally bully other persons or by using the online platform to abuse in front of SNS users. Deep Learning (DL) is one of the significant domains which are used to extract and learn the quality features dynamically from the low-level text inclusions. In this scenario, Convolutional neural networks (CNN) are used for training the text data, images, and videos. CNN is a very powerful approach to training on these types of data and achieved better text classification. In this paper, an Ensemble model is introduced with the integration of Term Frequency (TF)-Inverse document frequency (IDF) and Deep Neural Network (DNN) with advanced feature-extracting techniques to classify the bullying text, images, and videos. The proposed approach also focused on reducing the training time and memory usage which helps the classification improvement.

Deep learning-based anomaly detection in acceleration data of long-span cable-stayed bridges

  • Seungjun Lee;Jaebeom Lee;Minsun Kim;Sangmok Lee;Young-Joo Lee
    • Smart Structures and Systems
    • /
    • 제33권2호
    • /
    • pp.93-103
    • /
    • 2024
  • Despite the rapid development of sensors, structural health monitoring (SHM) still faces challenges in monitoring due to the degradation of devices and harsh environmental loads. These challenges can lead to measurement errors, missing data, or outliers, which can affect the accuracy and reliability of SHM systems. To address this problem, this study proposes a classification method that detects anomaly patterns in sensor data. The proposed classification method involves several steps. First, data scaling is conducted to adjust the scale of the raw data, which may have different magnitudes and ranges. This step ensures that the data is on the same scale, facilitating the comparison of data across different sensors. Next, informative features in the time and frequency domains are extracted and used as input for a deep neural network model. The model can effectively detect the most probable anomaly pattern, allowing for the timely identification of potential issues. To demonstrate the effectiveness of the proposed method, it was applied to actual data obtained from a long-span cable-stayed bridge in China. The results of the study have successfully verified the proposed method's applicability to practical SHM systems for civil infrastructures. The method has the potential to significantly enhance the safety and reliability of civil infrastructures by detecting potential issues and anomalies at an early stage.

제7차 가정과 교육과정에 따른 학교 인성교육 내용 체계화 방안 (The Systematization of Personality Education Contents in the 7th Curriculum for Home Economics)

  • 왕석순
    • 한국가정과교육학회지
    • /
    • 제16권2호
    • /
    • pp.13-26
    • /
    • 2004
  • 이 연구는 가정과교육에서 인성교육을 체계화시켜 강화할 수 있는 방안을 마련하기 위하여, 제7차 기술ㆍ가정교육과정의 가정과교육 영역에서 “인성교육의 목표와 내용”을 분석, 제시하되, 가정과 수업상황에서 효율적으로 활용할 수 있는 교수ㆍ학습 활동을 함께 개발하여 제시하고자 하였다. 그 결과, 제7차 기술ㆍ가정 교육과정의 가정과교육 영역의 모든 영역에서 인성교육이 구현될 수 있는 결과가 도출되었다. 특히 가정과교육에서는, 첫째, 평등 및 인권존중의 가치와 관련한, 평등 가족 형성을 위한 인성교육, 둘째, 환경보호와 관련한 다양한 가치를 인식하고 실천할 수 있는 인성교육, 셋째, 길리건(Gilligan)등의 주장하는 보살핌의 윤리에 관련된 덕목들-즉, 자선, 자비, 용서, 우애, 사랑, 희생, 양보, 대화, 타협 등의 가치들에 대한 인성교육을 실천할 수 있는 것으로 나타났다. 특히 이러한 보살핌의 가치들은 과거 전통적인 가정과 교육에서 비판되어 온 가족 이기주의적 보살핌의 가치를 벗어나 타인과 이웃, 공동체에 대한 보살핌의 윤리로 확대되고 있다. 한편, 다른 교과와는 차별적으로 가정과교육에서 수행되는 인성교육은, 이상에서 논의한 다양한 가치들을 가족원들과의 일상적인 매일의 생활에서 펼쳐지는 다양한 실제적인 역할 수행관계를 통하여 습득시킴으로써, 단순한 앎의 지식이나 감정으로서 머무는 것이 아닌 경험을 통한 실천적 행위로 발전시킬 수 있는 특성을 가진다. 이러한 특성은 도덕적 행위의 목표도달에 가정과교육이 매우 유효한 역할을 할 수 있는 교과임을 입증해 주는 결과이다. 이 연구의 결과는 학교교육에서 가정과교육이 타 교과와는 구별된 목표와 내용, 방법을 통해 인성교육을 효과적으로 수행할 수 있는 교과임을 입증해 주고 있는데, 이는 가정과교육이 학교교육에서 필수교과로서 자리매김 되는 중요한 당위성을 제공해준다. 추후연구는 가정과 교육 영역에서 수행될 수 있는 특성 있고 실천적인 인성함양프로그램(교수-학습 활동안)이 개발되어야 하고, 이러한 프로그램에 대한 실증적 자료가 축적되는 경험적 연구가 수행되어야 할 것이다.

  • PDF

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

웹 문서를 위한 개선된 문장경계인식 방법 (Improved Sentence Boundary Detection Method for Web Documents)

  • 이충희;장명길;서영훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.455-463
    • /
    • 2010
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반하여 개선한 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 종결어미를 대상으로 학습하여 문장경계 인식을 수행하였다. 또한 문장경계인식 성능을 최대화하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 문서별 성능 측정을 위해서 구두점이 주로 문장경계로 사용된 문어체 위주의 평가셋1(신문기사와 블로그 문서)과 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서 위주의 평가셋2(웹 사이트의 게시판 글)를 대상으로 성능을 측정하였다. 평가 척도로는 F-measure를 사용하였으며, 기존 연구와 동일하게 구두점만을 문장경계 대상으로 학습한 기본 모델을 만들어서 실험한 결과, 평가셋1에 대해서 96.5%의 성능을 보였지만, 평가셋2에 대해서는 56.7%로 매우 저조한 성능을 보였다. 제안하는 개선 방법은 기본 모델을 웹 문서의 특징을 반영시키도록 자질 및 엔진을 개선시켰고, 최종 모델을 평가셋2로 평가한 결과, 96.3%의 성능을 보여서 39.6%의 성능 향상이 있음을 확인하였다.