• 제목/요약/키워드: Learning rate

검색결과 2,140건 처리시간 0.027초

감성 분석을 위한 FinBERT 미세 조정: 데이터 세트와 하이퍼파라미터의 효과성 탐구 (FinBERT Fine-Tuning for Sentiment Analysis: Exploring the Effectiveness of Datasets and Hyperparameters)

  • 김재헌;정희도;장백철
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.127-135
    • /
    • 2023
  • 본 논문에서는 금융 뉴스 데이터로 추가적인 사전 학습이 진행된 BERT 기반 모델인 FinBERT 모델을 사용하여 금융 영역에서 감성 분석 시 학습시킬 데이터와 그에 맞는 하이퍼파라미터를 찾는 방법을 소개한다. 우리의 목표는 다양한 데이터 세트를 활용하고 하이퍼파라미터를 미세 조정하여 정확한 감성 분석을 위해 FinBERT 모델을 가장 잘 활용하는 방법에 대한 포괄적인 가이드를 제공하는 것이다. 이 연구에서는 제안된 FinBERT 모델 미세 조정 접근법의 아키텍처와 워크플로우를 개괄적으로 설명하고, 감성 분석 태스크를 위한 다양한 데이터 세트와 하이퍼파라미터의 성능을 강조한다. 또한, 감성 라벨링 작업에 GPT-3를 사용함으로써 GPT-3가 적절한 라벨러 역할을 하는지에 대한 신뢰성을 검증한다. 결과적으로 미세 조정된 FinBERT 모델이 다양한 데이터 세트에서 우수한 성능을 발휘 한다는 것을 보여주었고, 각 데이터 세트에 대해 전반적으로 우수한 성능을 보이는 학습률 5e-5와 배치 크기 64의 최적의 조합을 찾았다. 또 일반 도메인의 뉴스보다 일반 도메인의 트위터 데이터 세트에서 성능이 크게 향상됨을 기반으로 금융 뉴스 데이터만으로만 추가적으로 학습시키는 FinBERT 모델에 대한 의구심을 제시한다. 이를 통해 FinBERT 모델에 대한 최적의 접근 방식을 결정하는 복잡한 프로세스를 간소화하고 금융 분야 감성 분석 모델을 위한 추가적인 학습 데이터 세트와 미세 조정 시 하이퍼파라미터 선정에 대한 가이드라인을 제시한다.

대구시 공공도서관 현황 분석 및 정책과제 제안 (Analysis of the Current Status and Proposals for Policy Tasks of Public Libraries in Daegu City)

  • 윤희윤;오선경
    • 한국도서관정보학회지
    • /
    • 제54권2호
    • /
    • pp.43-65
    • /
    • 2023
  • 모든 공공도서관은 지역주민의 지적 및 독서 활동을 위한 지식정보서비스, 문화향유 및 평생학습 기회를 제공하는 프로그램 서비스, 공동체 발전에 기여할 제3의 공간과 시설을 제공하는데 목적이 있다. 이를 위해서는 충실한 인프라 구축을 전제로 사회적 요구가 적시에 반영되어야 한다. 이에 본 연구는 대구시 공공도서관을 대상으로 공인통계에 근거하여 핵심지표 중심의 현황을 분석한 후 설문조사와 연계하여 보완 또는 주력해야 할 정책적 과제를 제안하였다. 그 결과, 전국 대비 대구시의 핵심지표는 제3의 대도시에 부합하지 않을 정도로 취약할 뿐만 아니라 기초자치단체별 편차도 상당히 심하였다. 그리고 대구 시민은 일상생활에서 공공도서관을 중시한 반면에 교통 불편, 필요한 자료 및 희망 프로그램 부족, 각종 규제의 순으로 불만족률이 높았다. 따라서 대구시는 자료구입비 증액과 신간 장서개발 강화, 전문사서 확충, 기초자치단 체별 서비스 격차해소를 위한 공공도서관 건립 확대, 접근편의성 제고, 이용 저해요인 개선 등에 주력해야 한다. 그 외에 2024년 대구도서관 건립·운영을 계기로 공공도서관 운영시스템 구축, 다른 지식문화기관과의 상생협력을 통한 외연 확장 등을 통해 대구시 공공도서관을 발전시키고 시민을 위한 지식문화서비스를 강화해야 한다.

취약계층 어린이를 위한 책 배달, 책 읽어주기 프로그램의 효과에 관한 연구 - 경기도 A시 도서관 사례를 중심으로 - (A Study on the Effectiveness of the Book Delivery and Reading Program for Vulnerable Children: Focusing on the Case of Library A in Gyeonggi-do)

  • 공정자;조미아;이부미
    • 한국도서관정보학회지
    • /
    • 제54권2호
    • /
    • pp.131-154
    • /
    • 2023
  • 본 연구는 경기도 A시 도서관 사례를 중심으로 취약계층 어린이를 대상으로 시행한 찾아가는 독서프로그램의 효과를 분석하였다. A시 도서관은 방문교사를 활용하여 어린이의 수준과 흥미에 맞는 책을 비대면으로 책만 배달하거나, 대면으로 책을 읽어주고 책 배달을 함께 하였다. 2022년 프로그램 참여자는 103가정 158명으로 이 중 책 배달은 67가정 103명, 책 읽어주기는 36가정 55명이다. 취약계층 어린이와 양육자를 대상으로 사업 시작과 종료 시기에 독서 효과 측정지표를 설문으로 조사하여 비교 분석하였고, 방문교사와 인터뷰를 하였다. 분석결과 책 배달과 책 읽어주기 중 어린이의 수준과 흥미를 파악하고 상호작용이 큰 책 읽어주기의 효과가 높았다. 연령상으로 독서경험을 쉽게 습득할 수 있는 유아가 초등학생보다 독서 효과가 더 좋았다. 계속 참여집단보다 신규 참여집단을 대상으로 한 프로그램이 약간 더 효과적이었다. 이외에 프로그램 시행 후 독서 흥미, 독서 태도, 독서환경, 독서 상호작용, 자아존중감, 사회성, 언어능력, 독서능력, 자기주도적 학습능력, 도서관 이용률 등에서 향상되었다.

인공신경망과 중규모기상수치예보를 이용한 강수확률예측 (Predicting Probability of Precipitation Using Artificial Neural Network and Mesoscale Numerical Weather Prediction)

  • 강부식;이봉기
    • 대한토목학회논문집
    • /
    • 제28권5B호
    • /
    • pp.485-493
    • /
    • 2008
  • 한반도 영역을 대상으로 RDAPS모형의 수치예보자료, AWS의 관측강수, 상층기상관측(upper-air sounding)의 관측자료를 이용하여 권역별 강수발생확률을 예측할 수 있는 인공신경망 모형을 제시하였다. 사용된 자료의 기간은 2001년 7, 8월과 2002년 6월로 홍수기를 대상으로 하였다. 500/750/1000 hPa에서의 지위고도, 500-1000 hPa에서의 층후(thickness), 500 hPa에서의 X와 Y방향 바람성분, 750 hPa에서의 X와 Y방향 바람성분, 표면풍속, 500/750 hPa/표면에서의 온도, 평균해면기압, 3시간 누적 강수, AWS관측소에서 관측된 RDAPS모형 실행전의 6시간과 12시간동안의 누적강수, 가강수량, 상대습도등을 신경망의 예측인자로 사용하였다. 신경망의 구조는 3층 MLP(Multi Layer Perceptron)로 구성하여 역전파알고리즘(Back-propagation)을 학습방법으로 사용하였다. 신경망예측결과 한반도전체에 대한 예측성과의 개선은 H가 6.8%상승하였고, 특히 TS와 POD는 각각 99.2%와 148.1% 상승함으로서 강수예측에 대한 신경망모형이 효과적인 도구가 될 수 있음을 확인하였다. KSS 역시 92.8% 개선됨으로서 RDAPS 예측에 비하여 뚜렷이 개선된 결과를 보여주고 있다.

랜섬웨어 공격탐지를 위한 신뢰성 있는 동적 허니팟 파일 생성 시스템 구현 (Implementation of reliable dynamic honeypot file creation system for ransomware attack detection)

  • 국경완;류연승;신삼범
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.27-36
    • /
    • 2023
  • 최근 몇 년 동안 랜섬웨어 공격이 사회 공학, 스피어피싱, 심지어 기계 학습과 같은 전술을 사용하여 특정 개인이나 조직을 대상으로 하는 공격의 정교함과 더불어 더욱 조직화 되고 전문화되고 있으며 일부는 비즈니스 모델로 운영되고 있다. 이를 효과적으로 대응하기 위해 심각한 피해를 입히기 전에 공격을 감지하고 예방할 수 있는 다양한 연구와 솔루션들이 개발되어 운영되고 있다. 특히, 허니팟은 조기 경고 및 고급 보안 감시 도구 역할 뿐만 아니라, IT 시스템 및 네트워크에 대한 공격 위험을 최소화하는 데 사용할 수 있으나, 랜섬웨어가 미끼파일에 우선적으로 접근하지 않은 경우나, 완전히 우회한 경우에는 효과적인 랜섬웨어 대응이 제한되는 단점이 있다. 본 논문에서는 이러한 허니팟을 사용자 환경에 최적화하여 신뢰성 있는 실시간 동적 허니팟 파일을 생성, 공격자가 허니팟을 우회할 가능성을 최소화함으로써 공격자가 허니팟 파일이라는 것을 인지하지 못하도록 하여 탐지율을 높일 수 있도록 하였다. 이를 위해 동적 허니팟 생성을 위한 기본 데이터수집 모델 등 4개의 모델을 설계하고 (기본 데이터 수집 모델 / 사용자 정의 모델 / 표본 통계모델 / 경험치 축적 모델) 구현하여 유효성을 검증하였다.

노인생활시설 사회복지사들의 직무 및 조직특성과 직무만족도의 관계에서 전문직업적 정체성의 매개효과 (Mediating Effect of Professional Identity on the Relationship between Job- and Organization- related Factors and Job Satisfaction among Social Workers in Senior Welfare Facilities)

  • 차명진;제석봉
    • 한국노년학
    • /
    • 제29권2호
    • /
    • pp.669-682
    • /
    • 2009
  • 본 연구는 노인생활시설 사회복지사들의 직무 및 조직특성과 직무만족도의 관계에 있어서 전문직업적 정체성의 매개효과를 보고자 하였다. 연구를 위해 대구시 전체 노인생활시설 24개소에 근무하는 사회복지사 180명을 대상으로 자료를 수집하였다. 매개효과 검증을 위한 통계적 분석은 위계적 회귀분석 (Window SPSS 12.0)을 이용하였다. 연구 결과, 직무 및 조직특성, 전문직업적 정체성, 직무만족에 대한 대상자들의 인식은 직무만족(3.28±.63)이 가장 높았으며 전문직업적 정체성(3.23±.50), 직무특성(3.17±.49), 조직특성(3.17±.58)의 순으로 나타났다. 그리고 직무특성(β=.699, p<.001)과 조직특성(β=.871, p<.001)은 직무만족에 유의적인 영향을 미치는 변수로 확인되었다. 뿐만 아니라 전문직업적 정체성을 매개변수로 사용한 경우 직무만족에 대한 직무특성(β=.543, p<.001)과 조직특성(β=.773, p<.001)의 영향력이 감소되어 전문직업적 정체성의 부분적 매개효과를 확인할 수 있었다.

Adverse Effects on EEGs and Bio-Signals Coupling on Improving Machine Learning-Based Classification Performances

  • SuJin Bak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.133-153
    • /
    • 2023
  • 본 논문에서 우리는 뇌 신호 측정 기술 중 하나인 뇌전도를 활용한 새로운 접근방식을 제안한다. 전통적으로 연구자들은 감정 상태의 분류성능을 향상시키기 위해 뇌전도 신호와 생체신호를 결합해왔다. 우리의 목표는 뇌전도와 결합된 생체신호의 상호작용 효과를 탐구하고, 뇌전도+생체신호의 조합이 뇌전도 단독사용 또는 임의로 생성된 의사 무작위 신호와 결합한 경우에 비해 감정 상태의 분류 정확도를 향상시킬 수 있는지를 확인한다. 네 가지 특징추출 방법을 사용하여 두 개의 공개 데이터셋에서 얻은 데이터 기반의 뇌전도, 뇌전도+생체신호, 뇌전도+생체신호+무작위신호, 및 뇌전도+무작위신호의 네 가지 조합을 조사했다. 감정 상태 (작업 대 휴식 상태)는 서포트 벡터 머신과 장단기 기억망 분류기를 사용하여 분류했다. 우리의 결과는 가장 높은 정확도를 가진 서포트 벡터 머신과 고속 퓨리에 변환을 사용할 때 뇌전도+생체신호의 평균 오류율이 뇌전도+무작위신호와 뇌전도 단독 신호만을 사용한 경우에 비해 각각 4.7% 및 6.5% 높았음을 보여주었다. 우리는 또한 다양한 무작위 신호를 결합하여 뇌전도+생체신호의 오류율을 철저하게 분석했다. 뇌전도+생체신호+무작위신호의 오류율 패턴은 초기에는 깊은 이중 감소 현상으로 인해 감소하다가 차원의 저주로 인해 증가하는 V자 모양을 나타냈다. 결과적으로, 우리의 연구 결과는 뇌파와 생체신호의 결합이 항상 유망한 분류성능을 보장할 수 없음을 시사한다.

Predicting blast-induced ground vibrations at limestone quarry from artificial neural network optimized by randomized and grid search cross-validation, and comparative analyses with blast vibration predictor models

  • Salman Ihsan;Shahab Saqib;Hafiz Muhammad Awais Rashid;Fawad S. Niazi;Mohsin Usman Qureshi
    • Geomechanics and Engineering
    • /
    • 제35권2호
    • /
    • pp.121-133
    • /
    • 2023
  • The demand for cement and limestone crushed materials has increased many folds due to the tremendous increase in construction activities in Pakistan during the past few decades. The number of cement production industries has increased correspondingly, and so the rock-blasting operations at the limestone quarry sites. However, the safety procedures warranted at these sites for the blast-induced ground vibrations (BIGV) have not been adequately developed and/or implemented. Proper prediction and monitoring of BIGV are necessary to ensure the safety of structures in the vicinity of these quarry sites. In this paper, an attempt has been made to predict BIGV using artificial neural network (ANN) at three selected limestone quarries of Pakistan. The ANN has been developed in Python using Keras with sequential model and dense layers. The hyper parameters and neurons in each of the activation layers has been optimized using randomized and grid search method. The input parameters for the model include distance, a maximum charge per delay (MCPD), depth of hole, burden, spacing, and number of blast holes, whereas, peak particle velocity (PPV) is taken as the only output parameter. A total of 110 blast vibrations datasets were recorded from three different limestone quarries. The dataset has been divided into 85% for neural network training, and 15% for testing of the network. A five-layer ANN is trained with Rectified Linear Unit (ReLU) activation function, Adam optimization algorithm with a learning rate of 0.001, and batch size of 32 with the topology of 6-32-32-256-1. The blast datasets were utilized to compare the performance of ANN, multivariate regression analysis (MVRA), and empirical predictors. The performance was evaluated using the coefficient of determination (R2), mean absolute error (MAE), mean squared error (MSE), mean absolute percentage error (MAPE), and root mean squared error (RMSE)for predicted and measured PPV. To determine the relative influence of each parameter on the PPV, sensitivity analyses were performed for all input parameters. The analyses reveal that ANN performs superior than MVRA and other empirical predictors, andthat83% PPV is affected by distance and MCPD while hole depth, number of blast holes, burden and spacing contribute for the remaining 17%. This research provides valuable insights into improving safety measures and ensuring the structural integrity of buildings near limestone quarry sites.

MEC 산업용 IoT 환경에서 경매 이론과 강화 학습 기반의 하이브리드 오프로딩 기법 (Hybrid Offloading Technique Based on Auction Theory and Reinforcement Learning in MEC Industrial IoT Environment)

  • 배현지;김승욱
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권9호
    • /
    • pp.263-272
    • /
    • 2023
  • 산업용 IoT는 대규모 연결을 통해 데이터 수집, 교환, 분석과 함께 산업 분야의 생산 효율성 개선에 중요한 요소이다. 그러나 최근 산업용 IoT의 확산으로 인해 트래픽이 폭발적으로 증가함에 따라 트래픽을 효율적으로 처리해줄 할당 기법이 필요하다. 본 논문에서는 산업용 IoT 환경에서 성공적인 태스크 처리율을 높이기 위한 2단계 태스크 오프로딩 결정 기법을 제안한다. 또한, 컴퓨팅 집약적인 태스크를 셀룰러 링크를 통해 이동 엣지 컴퓨팅(Mobile Edge Computing: MEC) 서버로 오프로드 하거나 D2D(Device to Device) 링크를 통해 근처의 산업용 IoT 장치로 오프로드 할 수 있는 하이브리드 오프로딩(Hybrid-offloading) 시스템을 고려한다. 먼저 1단계는 태스크 오프로딩에 참여하는 기기들이 이기적으로 행동하여 태스크 처리율 향상에 어려움을 주는 것을 방지하기 위해 인센티브 메커니즘을 설계한다. 메커니즘 디자인 중 McAfee's 메커니즘을 사용하여 태스크를 처리해주는 기기들의 이기적인 행동을 제어하고 전체 시스템 처리율을 높일 수 있도록 한다. 그 후 2단계에서는 산업용 IoT 장치의 불규칙한 움직임을 고려하여 비정상성(Non-stationary) 환경에서 멀티 암드 밴딧(Multi-Armed Bandit: MAB) 기반 태스크 오프로딩 결정 기법을 제안한다. 실험 결과로 제안된 기법이 기존의 다른 기법에 비해 전체 시스템 처리율, 통신 실패율, 후회 측면에서 더 나은 성능을 달성할 수 있음을 보인다.

터널 구조물 안전점검을 위한 이미지 데이터 취득 및 데이터 구조화 방법 (Image-Data-Acquisition and Data-Structuring Methods for Tunnel Structure Safety Inspection)

  • 성현석;고준섭
    • 한국지반공학회논문집
    • /
    • 제40권1호
    • /
    • pp.15-28
    • /
    • 2024
  • 본 연구에서는 터널 구조물 내부 이미지 데이터를 취득하는 방법과 이미지 데이터의 구조화를 위한 방법을 제안하였다. 터널 구조물 내부 이미지 데이터 취득 조건을 개선함으로써 AREA TYPE의 터널 스캐닝에서 고화질의 이미지 데이터를 얻을 수 있다. 데이터 취득 조건을 개선하기 위해 터널 상부에 터널의 길이 방향 레일을 설치하고 설치된 레일을 이동하며 터널 구조물 전체의 이미지 데이터를 취득할 수 있도록 설계하였다. 본 연구는 거리 20m, 해상도 3840×2160 및 해상도 720×480의 조건에서 0.5mm 균열 모사선을 식별하였다. 또한 취득된 이미지 데이터를 이미지 타일 단위로 관리하기 위한 이미지 데이터 구조화 방법을 제안하였다. 터널의 이미지 데이터 구조화를 위해 적용인자 (취득 이미지의 해상도와 터널의 크기)를 관계식에 대입하여 터널의 이미지 데이터를 구조화할 수 있다. 실험을 통해 터널 길이 1,000m, 폭 20m 터널의 이미지 데이터는 해상도와 정밀도에 따라 최소중첩률 0.02%에서 8.36% 구해지며 로컬좌표계의 크기는 (14×15)에서 (36×34)로 나타났다.