• 제목/요약/키워드: 전처리 과정

검색결과 2,009건 처리시간 0.027초

자연어 처리 및 기계학습을 활용한 제조업 현장의 품질 불량 예측 방법론 (A Method for Prediction of Quality Defects in Manufacturing Using Natural Language Processing and Machine Learning)

  • 노정민;김용성
    • Journal of Platform Technology
    • /
    • 제9권3호
    • /
    • pp.52-62
    • /
    • 2021
  • 제조업 현장에서 제작 공정 수행 전 품질 불량 위험 공정을 예측하여 사전품질관리를 수행하는 것은 매우 중요한 일이다. 하지만 기존 엔지니어의 역량에 의존하는 방법은 그 제작공정의 종류와 수가 다양할수록 인적, 물리적 한계에 부딪힌다. 특히 원자력 주요기기 제작과 같이 제작공정이 매우 광범위한 도메인 영역에서는 그 한계가 더욱 명확하다. 본 논문은 제조업 현장에서 자연어 처리 및 기계학습을 활용하여 품질 불량 위험 공정을 예측하는 방법을 제시하였다. 이를 위해 실제 원자력발전소에 설치되는 주기기를 제작하는 공장에서 6년 동안 수집된 제작 기록의 텍스트 데이터를 활용하였다. 텍스트 데이터의 전처리 단계에서는 도메인 지식이 잘 반영될 수 있도록 단어사전에 Mapping 하는 방식을 적용하였고, 문장 벡터화 과정에서는 N-gram, TF-IDF, SVD를 결합한 하이브리드 알고리즘을 구성하였다. 다음으로 품질 불량 위험 공정을 분류해내는 실험에서는 k-fold 교차 검증을 적용하고 Unigram에서 누적 Trigram까지 여러 케이스로 나누어 데이터셋에 대한 객관성을 확보하였다. 또한, 분류 알고리즘으로 나이브 베이즈(NB)와 서포트 벡터 머신(SVM)을 사용하여 유의미한 결과를 확보하였다. 실험결과 최대 accuracy와 F1-score가 각각 0.7685와 0.8641로서 상당히 유효한 수준으로 나타났다. 또한, 수행해본 적이 없는 새로운 공정을 예측하여 현장 엔지니어들의 투표와의 비교를 통해서 실제 현장에 자연스럽게 적용할 수 있음을 보여주었다.

황부산물의 콘크리트 원료 활용 가능성 평가 (Evaluation of Concrete Materials for Desulfurization Process By-products)

  • 박혜옥;권기운;이경호;김문정;이우원;류돈식;이종규
    • 유기물자원화
    • /
    • 제28권4호
    • /
    • pp.15-22
    • /
    • 2020
  • 매립지에서 발생하는 매립가스 내 포함된 황화수소는 연소과정에서 산소와 결합하여 황산화물을 발생시키고 대기 중의 수분과 결합하여 산성비가 되는 등 다양한 환경 문제를 일으킴에 따라 별도의 전처리 시설이 필수적이다. 매립가스의 탈황을 위해 탄산칼슘(CaCO3) 생성 반응에 따른 침전물 생성 처리, 흡착제를 통한 처리 등 다양한 물리화학적인 방법을 적용하고 있으나, 폐수 등 2차 폐기물의 발생되는 문제가 있다. 이러한 단점을 보완하기 위한 방법으로 생물학적 처리 공정을 이용해 원소황(S°)으로 슬러지 형태인 황부산물로 생성시켜 처리하는 공법이 사용되고 있다. 본 연구에서는 매립가스 내 황화수소의 생물학적 처리 부산물을 활용하기 위한 기술의 기초연구로서 황부산물을 활용하여 콘크리트 혼화재로 사용하고 첨가량에 따른 강도 보조 효과를 알아보기 위한 실험을 수행하였다. 황부산물 혼합 콘크리트 강도 분석 결과, 황부산물의 혼합은 콘크리트 강도에 영향을 미치며, 10% 혼합시 가장 높은 강도 값을 보이는 것으로 나타났다. 특히, 황부산물 10% 혼합시 포졸란 반응과 CaSO4의 형성 등에 의해 결합 강도를 증가시키는 것으로 판단된다.

HPLC-PDA를 이용한 가공식품 중 보존료 9종 동시분석 (Simultaneous determination of 9 preservatives in processed foods using high-performance liquid chromatography with photo diode array detector)

  • 이도연;김민희;안장혁
    • 분석과학
    • /
    • 제33권6호
    • /
    • pp.233-239
    • /
    • 2020
  • 본 연구에서는 식품첨가물 중 보존료로 사용되는 데히드로초산(DHA), 소브산(SA), 안식향산(BA), 파라옥시안식향산메틸(MP) 및 파라옥시안식향산에틸(EP)과 사용이 금지된 파라옥시안식향산프로필(PP), 파라옥시안식향산부틸(BP) 및 그 이성체(IPP, IBP) 9종에 대한 동시분석법 시료 전처리 과정에서 단백질과 지질을 효과적이고 간편하게 제거하기 위해 카레즈 시액을 침전제로 사용하는 분석 방법에 대하여 연구하였다. 시료 중에 함유된 단백질과 지질 등 간섭저해물질들을 간편하게 제거한 시험용액 중의 보존료 9종에 대하여 HPLC 분리분석시에 효과적인 선택성을 도출할 수 있었다. 확립된 보존료 9종 동시분석법의 직선성은 0.999 이상의 우수한 직선성을 나타내었으며, 검출한계는 0.09~0.12 mg/L의 범위를 나타내었고, 정량한계는 0.28~0.37 mg/L의 범위를 나타내었다. 절임식품류, 치즈류, 식육가공품류, 음료류, 소스류 및 유화식품에 회수율 시험을 한 결과, DHA는 90.9~107.7 %, SA는 85.4~113.7 %, BA는 90.7~111.6 %, MP는 84.5~111.2%, EP는 81.3~110.9 %, IPP는 82.5~102.2 %, PP는 81.1~110.0 %, IBP는 80.9~109.0 % 그리고 BP는 82.4~110.3 %의 회수율을 나타내었다. 본 연구에서 개발된 동시분석법을 활용하여 다양한 가공식품에 대한 적용 가능성을 확인할 수 있었다.

태토 성분조합을 통한 도자기용 흙의 물성조절 및 특성변화 (Control of physical properties and characteristics of soil through combination of ingredients of clay)

  • 김두현;이해순;김지혜;한민수
    • 박물관보존과학
    • /
    • 제25권
    • /
    • pp.35-50
    • /
    • 2021
  • 본 연구는 매곡토의 기본적인 특성과 점토물질 첨가에 따른 물리화학적 특성 변화를 분석하여 도자기 제작에 활용할 수 있는 흙에 대한 과학적 특성 정보를 제시하고자 하였다. 매곡토는 자갈과 굵은모래, 가는모래가 전체의 73%를 차지하여 수비과정을 거쳐야 태토로 사용이 가능하였으며, 수비 후에는 세사와 점토가 전체의 95%로 증가하였으나 가소성과 점력이 부족하여 분청토를 추가하여야 했다. 매곡토와 분청토를 7:3 비율로 혼합하였을 때는 점력이 증가하고, 소성 후에도 적당한 도자기 태토의 조직 특성을 보였으며, 흡수율이 0.40으로 감소하여 태토로써의 기능이 개선되었다. 따라서, 주변 흙으로 도자기를 제작하고자 할 때에는 수비와 같은 물리적 전처리를 거친 후 소성 시 기물로써 형태를 유지할 수 있도록 특정 성분이 포함되어 있는 점토 물질을 추가한다면, 본래 흙의 특성을 개선할 수 있다.

평택지역 감정노동자 보호를 위한 현황분석 (Current status analysis for the protection of emotional workers in Pyeongtaek area)

  • 정혜정;정수현
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.55-60
    • /
    • 2021
  • 본 연구는 평택시의 지원을 받아 평택시 감정노동자 보호에 대한 내용을 연구하기 위한 기초 자료를 마련하기 위해서 감정노동자 직업군으로 분류되는 상담사 104명을 중심으로 설문조사를 실시했다. 104명의 감정노동자를 중심으로 한 설문조사 결과를 통해서 감정노동자의 어려움에 대한 기초 연구 자료를 마련할 수 있으며 현재 각 지자체에서 관심을 가지고 있는 감정노동자를 위한 보호 방법을 찾을 수 있다. 감정노동자 실태조사를 위해서 평택시 내 상담사를 중심으로 표본을 선출하고 선출된 표본을 중심으로 설문조사를 실시한 결과 감정노동자는 본인의 인권에 대한 권리를 찾지 못하고 직장내에서도 보호 받지 못하고 있다는 것을 알 수 있었다. 현재 감정노동자를 보호하기 위한 법안이 발표되고 있으나 보호받지 못하고 있어 제도개선이 필요하다는 것을 확인했다. 본 연구는 회수된 설문지 중 전처리 과정을 통해 유의한 104개를 중심으로 SPSS, R을 이용해서 분석했으며 평택시에서 제도적인 장치를 마련할 수 있는 규정이 필요하다는 것을 확인했다. 앞으로 감정노동자 직업군에 해당하는 표본을 더 선출해서 감정노동자에 대한 보호 장치 마련이 필요하다고 판단된다.

마우스 뇌의 구조적 연결성 분석을 위한 분석 방법 (Analytical Methods for the Analysis of Structural Connectivity in the Mouse Brain)

  • 임상진;백현만
    • 한국방사선학회논문지
    • /
    • 제15권4호
    • /
    • pp.507-518
    • /
    • 2021
  • 자기공명영상(MRI)은 뇌의 구조적 및 기능적 연구에서 핵심 기술로 필요성이 증가하고 있다. Tractography 분석을 이용하는 뇌지도(Connectome)는 MRI를 통해 뇌의 구조적 연결성을 확인하고 연결성의 변동성을 이용해 질병 병리학에 대한 이해를 높이는 방법으로 인간을 대상으로 활발한 연구가 진행되고 있다. 하지만 마우스 같은 작은 동물의 경우 분석 방법의 표준화가 부족하고 영상에 대한 정확한 전처리 전략 및 아틀라스 기반 신경 정보학에 대한 과학적 합의가 없다. 또한, 인간의 뇌에 비해 마우스의 뇌는 매우 작기 때문에 높은 해상도를 갖는 영상을 획득하는 것에도 어려움이 있다. 연구에서는 구조적 영상과 확산 텐서 영상을 이용해 구조 영역 세분화를 포함한 구조적 연결성 분석을 가능하게 하고 마우스 뇌 데이터를 처리하는 Allen Mouse Brain Atlas 기반 영상 데이터 분석 파이프라인을 제시한다. 각 분석 방법은 마우스 뇌 영상 데이터의 분석을 가능하게 하고 이미 인간 영상데이터로 검증된 소프트웨어를 이용해 신뢰성을 가질 수 있게 하였다. 또한, 연구에서 제시되는 파이프라인은 복잡한 분석 과정과 다양한 기능들 중 마우스 Tractography에 필요한 기능들을 정리하여 사용자가 효율적으로 데이터 처리를 하는데 최적화되었다.

변화 주목 기반 차량 흠집 탐지 시스템 (Change Attention-based Vehicle Scratch Detection System)

  • 이은성;이동준;박건희;이우주;심동규;오승준
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.228-239
    • /
    • 2022
  • 본 논문에서는 카셰어링 서비스(car sharing service)에서 차량 상태 무인 검수를 위한 흠집 탐지 딥 러닝 모델을 제안한다. 기존의 차량 상태 검수 시스템은 대여 전, 후 사진에서 각각 흠집을 탐지하는 딥 러닝 모델과 탐지된 두 흠집 영상을 수작업으로 대조하여 새롭게 발생한 흠집을 탐색하는 두 단계로 구성되어 있다. 따라서 수동작업이 필요한 두 단계 모델을 한 단계로 줄이는 무인 흠집 탐지 모델을 위성영상에서 변화를 탐지하는 딥 러닝 모델에 전이 학습을 적용하여 구축한다. 그리고 광택 처리된 자동차 표면의 휘도가 비등방성이고 비전문가인 이용자가 일반 카메라로 촬영하기 때문에 정반사(specular reflection)가 흠집 탐지 성능에 크게 영향을 미친다. 따라서 정반사광으로 발생하는 오탐지를 감소시키기 위하여 정반사광 성분을 제거하는 전처리 과정을 적용한다. 이용자가 휴대폰 카메라로 촬영한 데이터에 대해 제안하는 시스템은 주관적인 측면과 정밀도(precision), 재현율(recall), F1, Kappa 척도면에서 각각 67.90%, 74.56%, 71.08%, 70.18%로서 높은 일치도를 보인다.

빅데이터를 활용한 건축물 화재위험도 평가 지표 결정 (Determination of Fire Risk Assessment Indicators for Building using Big Data)

  • 주홍준;최윤정;옥치열;안재홍
    • 한국건축시공학회지
    • /
    • 제22권3호
    • /
    • pp.281-291
    • /
    • 2022
  • 본 연구에서는 빅데이터를 활용하여 건축물의 화재위험도 평가에 필요한 지표를 결정하였다. 건축물에서 화재위험도에 영향을 미치는 원인은 대부분 건축물만을 고려한 지표로 고착화되어 있기 때문에 제한적이고 주관적인 평가가 수행되어왔다. 따라서, 빅데이터를 활용하여 다양한 내·외부 지표를 고려한다면 건축물의 화재위험도 저감을 위한 효과적인 대책을 도모할 수 있다. 지표 결정에 필요한 데이터를 수집하기 위해 먼저 질의어를 선정하고, 웹 크롤링 기법을 이용하여 비정형 데이터 형식의 전문 문헌을 수집하였다. 문헌 내 단어를 수집하기 위해 사용자 용어사전 등록, 중복 문헌 및 불용어 제거의 전처리 과정을 수행하였으며, 선행 연구를 검토하여 단어를 4개의 요소로 분류하고 각 요소에서 위험도와 관련된 대표 키워드를 선정하였다. 그리고 대표 키워드의 연관검색어 분석을 통해 파생되는 위험도 관련 지표를 수집하였다. 지표의 선정 기준에 따라 수집된 지표를 검토한 결과, 20개의 건축물 화재위험도 지표를 결정할 수 있었다. 본 연구 방법론은 건축물 화재위험의 저감 대책 수립을 위한 빅데이터 분석의 적용 가능성을 나타내며, 결정된 지표는 건축물 화재위험도 평가를 위한 참고자료로 사용될 수 있을 것이다.

텍스트마이닝 기법을 이용한 한국 사회의 혐오 양상 분석 (Analyzing the Phenomena of Hate in Korea by Text Mining Techniques)

  • 김혜진
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.431-453
    • /
    • 2022
  • 혐오는 타인에 대한 배타성이 집단적으로 표출된 것으로, 잘못된 대중적 인식을 통하여 양산되고 재생산된다. 이 연구는 우리사회에서 언급되고 있는 '혐오' 양상을 거시적으로 탐색하고자 1990년부터 2020년까지 발행된 뉴스데이터 17,867건을 대상으로 텍스트마이닝 기법을 활용하여 키워드 네트워크와 군집 분석을 수행하였다. 그리고 단어를 추출하기 전에 먼저 기사를 문장으로 분리하는 전처리 과정을 거쳐 '혐오', '편견', '차별'이라는 단어를 포함하고 있는 문장 총 52,520개를 추출하여 분석에 활용함으로써 '혐오'라는 단어와 인접한 단어들로 구성된 키워드 네트워크를 구축하였다. 수집한 뉴스데이터의 단어 동시출현빈도 분석 결과, 우리 사회에서 혐오와 관련되어 가장 빈번하게 등장하는 대상은 여성, 인종, 성소수자 등이며, 관련된 이슈는 이들 집단과 관련된 법과 범죄 등이었다. 키워드 네트워크 군집 분석 결과, 성별(41.4%), 소수자(28.7%), 인종·민족(15.1%), 선택적·이해관계적(8.5%), 정치·이념(5.7%), 환경·생존적(0.3%) 혐오 등 총 6개의 혐오 군집들이 발견되었다. 논의에서는 군집 분석 결과 구체적으로 드러나지 않은 혐오의 표적(대상)을 모두 추출하여 분석하였다.

안드로이드 정적 분석을 활용한 개인정보 처리방침의 신뢰성 분석 (Reliability Analysis of Privacy Policies Using Android Static Analysis)

  • 정윤교
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권1호
    • /
    • pp.17-24
    • /
    • 2023
  • 모바일 앱은 사용자의 편의를 위해 개인정보에 접근할 수 있는 권한을 자주 요청한다. 하지만 이에 따라 모바일 앱을 이용하는 동안 허용되지 않은 개인정보가 유출되는 문제가 많이 발생했다. 이러한 문제를 해결하기 위해 구글 앱스토어에 등록된 앱은 개인정보 처리방침에 사용자의 개인정보를 앱에서 어떻게 활용하는지 명시하도록 했다. 하지만 앱이 수행하는 개인정보 수집 및 처리 과정이 개인정보 처리방침에 정확히 공개되어 있는지 확인하기 어려우며, 모바일 앱 사용자가 앱이 접근할 수 있는 개인정보에 대해 알기 위해서는 개인정보 처리방침에 의존해야만 한다. 본 연구에서는 개인정보 처리방침과 모바일 앱을 분석하여 개인정보 처리방침의 신뢰성을 확인하는 시스템을 제시한다. 먼저 개인정보 처리방침의 텍스트를 추출 및 분석하여 모바일 앱이 어떤 개인정보를 이용할 수 있다고 공개하는지 확인한다. 이후 안드로이드 정적 분석을 통해 앱이 접근할 수 있는 개인정보 분류를 확인하고, 두 결과를 비교하여 개인정보 처리방침을 신뢰할 수 있는지 분석한다. 실험을 위해 구글 앱스토어에 등록된 약 13,000개 안드로이드 앱의 패키지 파일과 부가정보를 수집한 뒤 분석할 수 있는 앱을 선정하기 위해 4가지 조건에 따라 전처리를 진행했다. 선정한 앱을 대상으로 텍스트 분석과 모바일 앱 분석을 진행하고, 이를 비교하여 모바일 앱은 개인정보 처리방침에 공개한 것보다 더욱 많은 개인정보에 접근할 수 있음을 증명한다.