• 제목/요약/키워드: Data Pre-processing

검색결과 810건 처리시간 0.026초

인공지능 기반 질소산화물 배출량 예측을 위한 연구모형 개발 (Development of Prediction Model for Nitrogen Oxides Emission Using Artificial Intelligence)

  • 조하늬;박지수;윤용주
    • Korean Chemical Engineering Research
    • /
    • 제58권4호
    • /
    • pp.588-595
    • /
    • 2020
  • 지속적으로 강화되는 환경오염 물질 배출 규제로 인해, 질소 산화물(NOx)의 배출량 예측 및 관리는 산업 현장에서 많은 관심을 받고 있다. 본 연구에서는 인공지능 기반 질소산화물 배출량 예측모델 개발을 위한 연구모형을 제안하였다. 제안된 연구모형은 데이터의 전처리 과정부터 인공지능 모델의 학습 및 평가까지 모두 포함하고 있으며, 시계열 특성을 가지는 NOx 배출량을 예측하기 위하여 순환 신경망 중 하나인 Long Short-Term Memory (LSTM) 모델을 활용하였다. 또한 의사결정나무 기법을 활용하여 LSTM의 time window를 모델 학습 이전에 선정하는 방법을 채택하였다. 본 연구에서 제안된 연구모형의 NOx 배출량 예측 모델은 가열로에서 확보한 조업 데이터로 학습되었으며, 최적 모델은 hyper-parameter를 조절하여 개발되었다. 개발된 LSTM 모델은 학습 데이터 및 평가 데이터에 대하여 모두 93% 이상의 NOx 배출량 예측 정확도를 나타내었다. 본 연구에 제안된 연구모형은 시계열 특성을 가지는 다양한 대기오염 물질의 배출량 예측모델 개발에 응용될 수 있을 것으로 기대된다.

지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구 (Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression)

  • 김화환
    • 한국지역지리학회지
    • /
    • 제22권1호
    • /
    • pp.251-266
    • /
    • 2016
  • 데시메트릭 매핑은 행정구역 단위로 집계된 인구자료를 행정구역 내부의 공간적 변이에 따라 재집계하여 고해상도의 인구분포 자료를 작성하는 가장 보편적인 기법이다. 본 연구에서는 데시메트릭 매핑을 이용한 인구분포 추정의 장단점을 검토하고, 그 개선방안으로서 지리가중회귀모형을 이용한 다변량 데시메트릭 매핑 기법을 제안하였다. 기존의 지표피복 데이터와 인구센서스 자료를 기반으로 지리가중회귀모형을 적용하여 각 집계단위별로 지표피복 유형과 인구밀도의 상관관계를 분석하고, 모형에서 산출된 회귀계수를 이용해 하위 공간구획의 인구 총수를 산정하였다. 그 결과 지리가중회귀모형 기반 다변량 데시메트릭 매핑 기법을 이용했을 때, 면적가중 보간법, 이진 데시메트릭 매핑, 피크노필렉틱 보간법, 최소자승회귀모형 기반 데시메트릭 매핑 기법 등 다른 지능형 보간법에 비해 정확한 인구분포 추정이 가능하다는 것을 확인하였다. 이는 지리가중회귀모형을 통해서 인구센서스 집계 단위별로 상이한 구역 내 공간적 이질성이 인구분포 추정에 적절히 반영되었기 때문인 것으로 평가할 수 있다.

  • PDF

데이터웨어하우스에서 유전자 알고리즘을 이용한 구체화된 뷰 선택 기법 (A Genetic Algorithm for Materialized View Selection in Data Warehouses)

  • 이민수
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.325-338
    • /
    • 2004
  • 데이터 웨어하우스는 복잡한 질의 및 분석을 위해서 다양한 종류의 여러 정보 출처들로부터 정보를 모아서 저장한다. 일반적으로 웨어하우스에는 자주 실행되는 질의들을 미리 계산해서 구체화된 뷰의 형태로 저장한다. 웨어하우스를 설계할 때 가장 중요한 일들 중의 하나는 웨어하우스에서 유지될 구체화된 뷰의 선택이다. 이것은 뷰들의 유지를 위해 제한된 시간이 주어졌을 때, 모든 질의들에 대한 총 질의 응답 시간을 최소화하는 방법으로 일련의 뷰들을 선택하는 것이다(유지-비용 뷰 선택 문제). 본 논문에서는 최적에 가까운 일련의 뷰들을 계산하기 위해 유전자 알고리즘을 사용하여 유지-비용 뷰 선택 문제에 대한 효율적인 해결책을 제안한다. 특히 OR 뷰 그래프들의 관점에서의 유지-비용 뷰 선택 문제를 다룬다. 본 논문의 접근방식은 휴리스틱 방법을 사용한 기존의 탐색-기반 접근 방식들에 비해서, 시간 복잡도에서 큰 향상을 보여준다. 본 논문의 알고리즘은 최적의 질의 비용에 비해 10%이내의 추가비용만을 갖는 해결책을 제시하면서도 실행시간 측면에서는 매우 향상된 선형 증가만을 보인다. 본 논문의 알고리즘에 대한 프로토타입을 구현하였으며 이것을 사용하여 논문에서 제안하는 접근방식의 분석을 수행하였다.

연속류도로 단기 적체 교통량 개념 기반 돌발상황 자동감지 알고리즘 개발 (Development of an AIDA(Automatic Incident Detection Algorithm) for Uninterrupted Flow Based on the Concept of Short-term Displaced Flow)

  • 이규순;신치현
    • 한국ITS학회 논문지
    • /
    • 제15권2호
    • /
    • pp.13-23
    • /
    • 2016
  • 기존의 많은 돌발상황 자동감지 알고리즘은 복잡한 구조와 계산 과정, 수많은 매개변수, 그리고 필터링/평활화 같은 선 작업 때문에 지속적인 유지관리가 사실상 중단된 상태이고 오보율 또한 높아 많은 교통관리센터로부터 기피 대상이 되고 있는 등 돌발상황감지의 주력 수단으로서 자동 알고리즘의 지위가 위태해진 현실은 매우 우려할만하다. 본 연구에서는 상대 점유율과 속도 항을 활용하여 적체 교통량이라는 신 개념을 도입, 구조가 아주 간단하면서도 검측 원시자료의 보정이 거의 필요 없는 DiFI(Displaced Flow Index) 기반의 돌발상황 자동감지알고리즘을 개발하였다. DiFI 알고리즘의 성능평가는 2003년도 내부순환로 검지기자료를 활용하여 검증을 수행하였으며, 2011년도 경부고속도로 검지기 자료를 수집 정리하여 이식성 검사를 이행하였다. 성능평가는 검지율, 오보율, 평균검지시간, 기타 CR, CI, PI를 사용하였는데 100%의 검지율과 2.99%의 낮은 오보율, 1분을 약간 초과하는 평균검지시간을 보였다. 이는 SAO는 물론 국내 현장에 가장 많이 접목된 APID 및 DELOS 등과 비교해서도 모든 면에서 우월한 성능을 보이는 것이었다.

차량 궤적 데이터를 활용한 도심부 간선도로의 돌발상황 검지 (Incident Detection for Urban Arterial Road by Adopting Car Navigation Data)

  • 김태욱;배상훈;정희진
    • 한국ITS학회 논문지
    • /
    • 제13권4호
    • /
    • pp.1-11
    • /
    • 2014
  • 도로상에서 발생하는 교통 혼잡비용은 지역 간 도로 보다는 도심부 내에서 비중 있게 발생하며, 이는 전체 혼잡비용의 약 63.39%를 차지하고 있다. 따라서, 교통혼잡비용의 절감을 위해서는 도심부의 교통 혼잡을 해소하는 것이 중요하다. 도심부의 교통 혼잡은 반복정체와 비반복정체로 구분되며, 비반복 정체를 신속하고 정확하게 검지하는 것이 교통혼잡의 해소에 있어 무엇보다 중요하다. 그러나 돌발상황 검지에 관한 연구는 대부분 연속류를 대상으로 수행되어 왔다. 도심부 단속류 도로의 경우, 신호 교차로 주정차 차량 등 다양한 변수가 존재하기 때문에 연속류에 적용되는 돌발상황 검지 알고리즘을 수정없이 적용하기에 무리가 있다. 따라서 본 연구에서는 도심부 단속류 도로를 대상으로 수집된 GPS 기반의 차량궤적 데이터에 인공신경망을 적용하여 돌발상황검지 모형을 구축하였다. 제안된 모형의 정확도 검증 결과, 돌발상황 검지율 46.15%, 오보율 25.00%가 도출되었다. 이러한 결과는 단속류를 대상으로 하는 초기 연구 결과로서 의미가 있다. 또한 내비게이션 장치와 같은 차량 궤적 데이터만을 활용하여 비반복정체를 검지 할 수 있는 가능성을 제시 했다는 것에 의미를 찾을 수 있을 것이다.

기계학습 모델을 이용한 노인보행과 비노인보행의 구별 방법에 관한 연구 (A Study on the Method of Differentiating Between Elderly Walking and Non-Senior Walking Using Machine Learning Models)

  • 김가영;정수환;엄수현;장성원;이소연;최상일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권9호
    • /
    • pp.251-260
    • /
    • 2021
  • 보행 분석은 인간의 걸음걸이를 분석하여 보행과 관련된 여러 다양한 정보를 얻기 위한 연구 분야 중 하나로써 의료 분야뿐만 아니라 기계공학, 전자공학 및 컴퓨터공학 등 다양한 학문 분야에서 오랫동안 연구되고 있다. 보행 분석을 통해 걸음걸이에 문제가 있는지를 파악하려는 노력이 꾸준히 이어져 왔다. 본 논문에서는 이러한 보행 이상을 알아보기 위한 전 단계로써 보행 데이터를 활용하여 동일 실험 참가자에 대해 노인 체험복착용 전후의 걸음걸이를 기계학습 모델에 적용하여 학습시킴으로써 노인 체험복 착용 여부를 구별할 수 있는지를 연구하였다. 총 45명의 실험 참가들을 대상으로 노인 체험복 착용 전과 후 각각의 보행 데이터를 수집하였고, 총 6개의 기계학습 모델을 이용하여 보행 데이터를 학습시켰다. 신경망 모델을 활용하여 노인 체험복 착용 여부를 판별한 결과 약 99%의 높은 정확도를 보였다. 본 연구에서 시사하는 것은 기계학습을 활용하여 보행의 이상 유무를 판단할 수 있는 가능성을 모색했다는 데 있다.

k-NN을 활용한 터보팬 엔진의 잔여 유효 수명 예측 모델 제안 (A Proposal of Remaining Useful Life Prediction Model for Turbofan Engine based on k-Nearest Neighbor)

  • 김정태;서양우;이승상;김소정;김용근
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.611-620
    • /
    • 2021
  • 정비 산업은 사후정비, 예방정비를 거쳐, 상태기반 정비를 중심으로 진행되고 있다. 상태기반 정비는 장비의 상태를 파악하여, 최적 시점에서의 정비를 수행한다. 최적의 정비 시점을 찾기 위해서는 장비의 상태, 즉 잔여 유효 수명을 정확하게 파악하는 것이 중요하다. 이에, 본 논문은 시뮬레이션 데이터(C-MAPSS)를 사용한 터보팬 엔진의 잔여 유효수명(RUL, Remaining Useful Life) 예측 모델을 제시한다. 모델링을 위해 C-MAPSS(Commercial Modular Aero-Propulsion System Simulation) 데이터를 전처리, 변환, 예측하는 과정을 거쳤다. RUL 임계값 설정, 이동평균필터 및 표준화를 통해 데이터 전처리를 수행하였고, 주성분 분석(Principal Component Analysis)과 k-NN(k-Nearest Neighbor)을 활용하여 잔여 유효 수명을 예측하였다. 최적의 성능을 도출하기 위해, 5겹 교차검증기법을 통해 최적의 주성분 개수 및 k-NN의 근접 데이터 개수를 결정하였다. 또한, 사전 예측의 유용성, 사후 예측의 부적합성을 고려한 스코어링 함수(Scoring Function)를 통해 예측 결과를 분석하였다. 마지막으로, 현재까지 제시되어온 뉴럴 네트워크 기반의 알고리즘과 예측 성능 비교 및 분석을 통해 k-NN 활용 모델의 유용성을 검증하였다.

비정형 패션 이미지 검색을 위한 MASK R-CNN 선형처리 기반 CNN 분류 학습모델 구현 (Implementation of CNN-based Classification Training Model for Unstructured Fashion Image Retrieval using Preprocessing with MASK R-CNN)

  • 조승아;이하영;장혜림;김규리;이현지;손봉기;이재호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.13-23
    • /
    • 2022
  • 본 논문에서는 패션 분야의 비정형 데이터 검색을 위한 패션 아이템별 세부 컨포넌트 이미지 분류 알고리즘을 제안한다. 코로나-19 환경으로 인하여 최근 AI 기반 쇼핑몰이 증가하는 추세이다. 하지만 기존의 키워드 검색과 사용자 서핑 행위 기반 개인 맞춤형 스타일 추천으로는 정확한 비정형 데이터 검색에는 한계가 있다. 본 연구는 다양한 온라인 쇼핑 사이트에서 크롤링한 이미지를 사용하여 Mask R-CNN을 활용한 전처리를 진행한 후, CNN을 통해 패션 아이템별 컴포넌트에 대한 분류를 진행하였다. 셔츠의 카라 및 패턴과 청바지의 핏, 워싱 및 컬러에 대한 분류를 진행하였으며, 다양한 전이학습 모델을 비교 분석한 후 가장 높은 정확도가 나온 Densenet121모델을 사용하여 셔츠의 카라는 93.28%, 셔츠의 패턴은 98.10%의 정확도를 도달하였으며, 청바지의 핏은 Notched, Spread, Straight 3가지의 클래스의 경우 91.73%, Regular 핏을 추가한 4가지의 클래스의 경우 81.59%, 청바지의 색상은 93.91%, 청바지의 Washing은 91.20%, 청바지의 Demgae는 92.96%의 정확도를 도출하였다.

교사의 수업전문성에 관한 교사와 학생의 인식 차이 (Differences of Teachers and Students' Perceptions on Teaching Skills)

  • 이옥화
    • 한국교육논총
    • /
    • 제43권1호
    • /
    • pp.125-152
    • /
    • 2022
  • 본 연구의 목적은 교사의 수업전문성에 관한 교사와 학생의 인식에 어떤 차이가 있는지 분석하는 것이다. 교사의 교실수업을 이해하기 위하여 교사의 수업관찰과 학생 설문은 흔히 사용되는 방법이다. 그러나 학생과 교사의 인식이 다른 경우 수업교사는 결과 해석에 혼란스럽다. 본 연구에서는 수업의 대상인 학생들의 수업전문성에 관한 인식은 학생 배경에 따라 어떻게 나타나는지, 교사의 인식과 학생참여에의 예측력은 어떻게 다른지 비교해 보았다. ICALT의 수업관찰도구와 학생 설문지(MTQ)를 사용하였다. 이 두 도구는 교사의 수업전문성에 관한 6영역 및 학생참여 영역 등 총 7개 영역 구조로 구성되어 있기 때문에 결과를 비교할 수 있다. 2016년도 대전 충북 충남 지역 소재 중학교에서 수업관찰 전문교사가 106개의 수업을 관찰하였고, 이 수업에 참여한 2866명의 학생이 설문에 응하였다. 연구 결과 학생들의 수업에 관한 인식은 대체로 높았으나 학생의 배경변인별로 다른 성향을 보였다. 학생들의 인식은 주요교과목을 배울 때, 또 학년이 낮을수록 수업전문성을 더 높게 인지하는 경향을 보였다. 남학생들은 수업기술의 난이도가 높은 영역에서 수업전문성을 더 높게 인식하였다. 학생의 학생참여에의 예측력은 수업기술의 난이도가 높은 영역에서 교사의 예측력보다 높았다. 향후 예비교사와 교사를 위해 학생설문자료를 어떻게 연수에 적용할 수 있는지 추후 연구가 필요하다.

노이즈에 강인한 음악 시작점 검출 알고리즘 (The Noise Robust Algorithm to Detect the Starting Point of Music for Content Based Music Retrieval System)

  • 김정수;성보경;구광효;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.95-104
    • /
    • 2009
  • 본 논문에서는 노이즈에 강인한 음악 시작점 검출 알고리즘을 제안한다. 음악의 시작점 검출은 음악을 이용한 신호처리 시스템에 있어서 일관되지 않은 입력데이터를 통한 계산낭비, 비교검색 등의 문제 해결을 위해 필요한 것이다. 특히 신호처리를 이용한 내용기반 음악검색 시스템에서 시간의 순서로 데이터를 비교하는 시간순차적 검색방법에서는 더욱 필요시 된다. 시간순차적 검색 방법은 시간의 순서로 단순 비교를 수행하기 때문에 검색의 속도가 빠르다는 장점이 있는 반면 비교하는 데이터의 시작 시간이 동일해야 하는 단점이 있다. 하지만 디지털화된 음악은 비트레이트 변환에 의한 시작 시간의 동일함을 보장할 수 없다. 따라서 본 논문에서는 검색의 전처리 단계에서 음악의 시작점을 검출함으로써 시간순차적 검색 방법을 적용하여 고속의 검색을 수행하면서도 인식률이 낮아지지 않게 하였다. 시작점 검출은 소리를 검출할 수 있는 최소 파형모형을 이용하였으며 노이즈에 강인하기 위하여 묵음에 존재하는 노이즈는 스킵핑을 하였다. 제안한 알고리즘은 실험을 통해 시작점 검출을 미적용한 결과보다 약 38% 성능이 향상됨을 확인하였으며 노이즈에 강인함을 검증하였다.