• 제목/요약/키워드: statistical learning

검색결과 1,288건 처리시간 0.031초

음향 장면 분류를 위한 경량화 모형 연구 (Light weight architecture for acoustic scene classification)

  • 임소영;곽일엽
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.979-993
    • /
    • 2021
  • 음향 장면 분류는 오디오 파일이 녹음된 환경이 어디인지 분류하는 문제이다. 이는 음향 장면 분류와 관련한 대회인 DCASE 대회에서 꾸준하게 연구되었던 분야이다. 실제 응용 분야에 음향 장면 분류 문제를 적용할 때, 모델의 복잡도를 고려하여야 한다. 특히 경량 기기에 적용하기 위해서는 경량 딥러닝 모델이 필요하다. 우리는 경량 기술이 적용된 여러 모델을 비교하였다. 먼저 log mel-spectrogram, deltas, delta-deltas 피쳐를 사용한 합성곱 신경망(CNN) 기반의 기본 모델을 제안하였다. 그리고 원래의 합성곱 층을 depthwise separable convolution block, linear bottleneck inverted residual block과 같은 효율적인 합성곱 블록으로 대체하고, 각 모델에 대하여 Quantization를 적용하여 경량 모델을 제안하였다. 경량화 기술을 고려한 모델은 기본 모델에 대비하여 성능이 비슷하거나 조금 낮은 성능을 보였지만, 모델 사이즈는 503KB에서 42.76KB로 작아진 것을 확인하였다.

치과위생사의 안전한 법적 업무범위 확보를 위한 연구 (A study on the dental hygienists' legal scope of clinical practice)

  • 정주희;문소정;배성숙;김선경;노희진
    • 한국치위생학회지
    • /
    • 제19권2호
    • /
    • pp.207-219
    • /
    • 2019
  • Objectives: This study investigates the dental hygienist's main duties in clinical dental practice and examine whether dental hygienists can safely perform each duty by referring to the educational contents of dental hygiene departments and national examinations of dental hygienists. Methods: A questionnaire on the main duties of dental hygienists was administered to 477 clinical dental hygienists working at dental clinics and hospitals, general dental hospitals, and university dental hospitals in Seoul, Gyeonggi-do, and Incheon. We divide the dental hygienists' clinical dental hygiene practice and clinical dental assist and analyze the legal scope of practice, university educational contents, and national examination contents. Statistical analysis was performed through frequency analysis, and multi-frequency data were analyzed using Excel 2013. Results: All 48 items (except 2 items of 29 dental hygiene practice and 21 assist practice items) surveyed were covered in the National Examination for Dental Hygienists and included in the Dental Hygiene Education Learning Objective. The multi-frequency clinical dental practice of eight items of clinical dental hygiene practice and two assist practice items were within the legal scope of the dental hygienist's role. Conclusions: Further discussions are needed to redefine the legal scope of the role of the dental hygienist.

'Mendel(1865)의 연구에서 발견한 수학적 연결고리'를 이용한 통합 수업 자료 개발에 관한 연구 (A study on the development of integrated class data using the mathematical linkage found in the study of Mendel (1865))

  • 이동근
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제58권3호
    • /
    • pp.383-401
    • /
    • 2019
  • 고등학교의 통합 교육에서는 각 교과 간의 공통 개념이나 아이디어를 중심 내용으로 다루어야 하기 때문에, 본 연구는 이미 학습한 과학적 개념인 'Mendel의 유전 법칙'을 이용하여 수학을 중심으로 한 통합 수업이 진행될 수 있도록 자료를 개발하고, 개발된 자료에 대하여 CVR 검증을 통하여 전문가 타당성을 확인한 연구이다. 선행연구에 의하면 중학교에서 학습한 과학 개념 중에서 수학과 연계가 비교적 적은 것으로 알려진 내용 중 Mendel의 유전 법칙을 대상으로 하여 연구를 진행하였다. 수학과 다른 과목을 통합한 수업에서는 두 과목 사이의 공통 연결고리가 풍부할수록 수업효과가 좋기 때문에, 본 연구에서는 확률 영역 이외에도 통계 영역의 개념까지 포함하여 조사를 진행하였으며, 이에 근거하여 1차시(100분) 수업에 해당하는 수업 자료를 개발할 수 있었다.

에어비앤비(Airbnb) 웹 로그 데이터를 이용한 고객 행동 예측 (Consumer behavior prediction using Airbnb web log data)

  • 안효인;최유리;오래은;송종우
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.391-404
    • /
    • 2019
  • 그동안의 고객 행동에 대한 예측은 주로 고객이 가지는 고정적인 특성을 이용해왔다. 최근에는 점차 고객들의 활동이 오프라인에서 온라인으로 이동하면서 각 고객의 웹 로그를 추적하는 일이 가능해졌다. 그러나 방대한 양의 웹 로그 데이터를 수집할 수 있게 된 반면, 이에 대한 연구는 로그 데이터를 정리하거나 기술적인 특성만을 설명하는 것에 그쳤다. 본 연구에서는 웹사이트 Kaggle에서 제공하는 Airbnb 고객들의 성별, 연령 등의 기본 정보 및 웹 로그가 포함된 데이터셋을 이용하여 첫 숙소 예약까지 걸리는 개인의 의사 결정 시간을 예측하였다. Lasso, SVM, Random Forest, XGBoost 등 다양한 방법론을 활용하여 최적의 모형을 찾고, 웹 로그 데이터의 유무에 따른 예측 오차를 비교하여 웹 로그의 효용성을 확인하였다. 결과적으로 오분류율이 약 20%로 낮은 랜덤 포레스트 분류모형을 최적모형으로 선택하였다. 또한, 웹 로그 데이터를 이용하여 고객 개개인의 행동을 예측한 결과 사용하지 않은 경우와 비교해 예측의 정확도가 최대 두 배 더 높아진 것을 확인할 수 있었다.

인공신경망 알고리즘을 활용한 가뭄 취약지역 분석 (Analysis of Drought Vulnerable Areas using Neural-Network Algorithm)

  • 신정훈;김준경;염민교;김진평
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.329-340
    • /
    • 2021
  • 연구목적: 본 연구는 인공신경망 라이브러리 기술을 이용하여, 기상 데이터 변화 예측을 통한 한반도 가뭄 취약지역 분석을 목적으로 하였다. 연구방법: 연구지역 중 북한 지역의 다양한 기상데이터의 확보가 힘든 특수성을 고려하여 연구지역의 월별 누적강수량 데이터를 활용하였으며, 통계프로그램 R을 이용하여 인공신경망 알고리즘을 통한 기상데이터 추정을 수행하였다. 연구결과: 본 논문에서 진행한 연구 결과, 실제 데이터와 예측 데이터 간의 상관계수 값은 인공신경망 알고리즘을 활용한 결과가 회귀분석 결과보다 평균 0.043879 더 높은 것으로 확인되었다. 결론: 연구의 결과는 가뭄 대응을 위한 재난대응 기초 연구 자료로 활용 가능할 것으로 기대한다.

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.

원격대학원생 학습만족도 분석: J대학 사례를 중심으로 (Analysis on the Satisfaction of the Cyber Graduate Student: Focusing on J University Case)

  • 이정열
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.515-522
    • /
    • 2021
  • 이 연구에서는 원격대학원생의 만족도가 성, 학기, 전공에 따라 차이가 있는가를 알아보기 위해 J대학 원격대학원생 186명을 대상으로 설문조사와 심층면담을 하였는데, 그 결과는 다음과 같다. 첫째, 원격대학원생의 성별 만족도는 교수자, 오프라인 활동, 수업평가에서 남녀 간에 통계적 유의차가 있는 것으로 나타났으며, 이들 모두 남성이 여성에 비해 유의하게 높은 것으로 나타났다. 둘째, 원격대학원생의 학기별 만족도는 교육과정, LMS, 강의 콘텐츠 질, 오프라인 활동에서 유의미한 차이가 있는 것으로 나타났으며, 수업연한이 올라갈수록 높아지는 경향을 보였다. 셋째, 원격대학원생의 전공별 만족도는 LMS와 수업내용을 제외한 나머지 요인들에서 유의미한 차이가 있는 것으로 밝혀졌으며, 교육행정이 가장 높은 것으로 나타났다. 이 연구의 결과는 원격대학원의 교육과정, LMS 구축, 강의 콘텐츠 개발·제작 등 학생 중심 교육에 절대적으로 필요한 요소들을 개선하는 데 기초자료로 활용할 수 있을 것으로 기대된다.

산업현장에서의 선택적 소음 제거를 위한 환경 사운드 분류 기술 (Environmental Sound Classification for Selective Noise Cancellation in Industrial Sites)

  • 최현국;김상민;박호종
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.845-853
    • /
    • 2020
  • 본 논문에서는 산업현장에서의 선택적 소음 제거를 위한 환경 사운드 분류 기술을 제안한다. 산업현장에서의 소음은 작업자의 청력 손실의 주요 원인이 되며, 소음 문제를 해결하기 위한 소음 제거 기술이 널리 연구되고 있다. 그러나 기존 소음 제거 기술은 모든 소리를 구분 없이 차단하는 문제를 가지며, 모든 소음에 공통된 제거 방법을 적용하여 각 소음에 최적화된 소음 제거 성능을 보장할 수 없다. 이러한 문제를 해결하기 위해 사운드 종류에 따라 선택적 동작을 하는 소음 제거가 필요하고, 본 논문에서는 이를 위해 딥 러닝 기반의 환경 사운드 분류 기술을 제안한다. 제안 방법은 기존 오디오 특성인 멜-스펙트로그램의 한계를 극복하기 위해 새로운 특성으로서 멜-스펙트로그램 기반의 시간 변화 특성과 통계적 주파수 특성을 사용하며, 합성곱 신경망을 이용하여 특성을 모델링 한다. 제안하는 분류기를 사용하여 3가지 소음과 2가지 비소음으로 구성된 총 5가지 클래스로 사운드를 분류하였고, 제안하는 오디오 특성을 사용하여 기존 멜-스펙트로그램 특성을 사용할 때에 비하여 분류 정확도가 6.6% 포인트 향상되는 것을 확인하였다.

초기 청소년들(Tweens)의 정보요구와 유튜브(YouTube)에서의 정보추구행태 (Tweens' Information Needs and Information Practices on YouTube)

  • 김지현;구정화
    • 한국도서관정보학회지
    • /
    • 제52권2호
    • /
    • pp.275-301
    • /
    • 2021
  • 본 연구는 초기 청소년들이 일상에서 가장 선호하는 정보원이자 정보검색 도구로 사용되고 있는 유튜브(YouTube) 모바일 동영상 플랫폼상에서의 정보이용행태를 분석하는 것을 목적으로 한다. 초기 청소년들의 일상생활 속에서의 고민 즉 정보요구는 무엇이며 이 정보요구를 만족시키기 위해 어떤 정보원을 어떻게 사용하고 있는지 살펴보고 유튜브 매체를 이용할 때의 정보요구와 이용행태를 분석하였다. 이를 위해 전국의 초기 청소년(12~14세)을 대상으로 설문조사를 통하여 데이터를 수집후 통계분석하여 각 인구학적 특성별로 정보이용행태에 어떤 차이를 보이는지를 분석하였다. 분석결과, 초기 청소년들은 유튜브를 이들의 일상정보요구를 만족시키는 중요 정보원으로 인식하고 있으며 특히 여가정보를 찾기 위해 가장 빈번히 그리고 적극적으로 이용하고 있었다. 또한, 초기 청소년들은 찾기 쉽고 간단하며 편리하기 때문에, 그리고 쉬운 동영상 정보가 많기 때문에 유튜브에서 정보를 주로 탐색하는 것으로 나타났다. 본 연구에서 밝혀낸 연구결과를 바탕으로 시사점을 도출하고, 학교 및 공공도서관으로 대표되는 정보기관들에서 초기 청소년들을 위한 정보서비스를 기획할 때 참고해야 할 요소들을 제언하였다.

Smart Factory Big Data를 활용한 공정 이상 탐지 프로세스 적용 사례 연구 (A case study on the application of process abnormal detection process using big data in smart factory)

  • 남현우
    • 응용통계연구
    • /
    • 제34권1호
    • /
    • pp.99-114
    • /
    • 2021
  • 반도체 제조 산업에서는 Big Data에 기초한 Smart Factory 도입과 적용이 가시화되면서 생산 공정의 각 단계에서 수집 가능한 다양한 센서(sensor) 데이터를 활용하여 공정 이상 탐지 및 최종 수율 예측 등에 다양한 분석 방법을 시도하고 있다. 현재 반도체 공정은 원료인 잉곳(ingot)에서 패키징(packaging) 작업 이전의 웨이퍼(wafer) 생산까지 500 600개 이상의 세부 공정과 이와 연계된 수천 개의 계측 공정으로 구성된다. 개별 계측 공정 내의 실제 계측 비율은 대상 제품 대비 0.1%에서 최대 5%를 넘지 못하고 계측 시점별로 일정하게 유지할 수 없다. 이러한 이유로 공정 각 단계의 정상 상태를 간접적으로 판단할 수 있는 장비 센서(sensor) 데이터를 활용하여 관리 여부를 판단하고자 하는 노력이 계속되고 있다. 본 연구에서는 장비 센서 데이터 기반의 공정 이상 탐지 프로세스를 정의하고 현재 적용 되고 있는 기술 통계량 기반 진단 방법의 단점을 보완하기 위해 FDA(Functional Data Analysis)방법을 활용하였다. 실제 현장 사례 데이터에 머신러닝을 이용하여 이상 탐지 정확도 비교를 통해 효과성을 검증하였다.