• 제목/요약/키워드: administration information dataset

검색결과 83건 처리시간 0.022초

데이터셋 유형 분류를 통한 클래스 불균형 해소 방법 및 분류 알고리즘 추천 (Class Imbalance Resolution Method and Classification Algorithm Suggesting Based on Dataset Type Segmentation)

  • 김정훈;곽기영
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.23-43
    • /
    • 2022
  • AI(Artificial Intelligence)를 다양한 산업에서 접목하기 위해 알고리즘 선택에 대한 관심이 증가하고 있다. 알고리즘 선택은 대부분 데이터 과학자의 경험에 의해 결정되는 경우가 많다. 하지만 경험이 부족한 데이터 과학자의 경우 데이터셋 특성 기반의 메타학습(meta learning) 을 통해 알고리즘을 선택한다. 기존의 알고리즘 추천은 선정 과정이 블랙박스이기 때문에 어떠한 근거에 의해 도출되는지 알 수 없었다. 이에 따라 본 연구에서는 k-평균 군집분석을 활용하여 데이터셋 특성에 따라 유형을 나누고 적합한 분류 알고리즘과 클래스 불균형 해소 방법을 탐색한다. 본 연구 결과 네 가지 유형을 도출하였으며 데이터셋 유형에 따라 적합한 클래스 불균형 해소 방법과 분류 알고리즘을 추천하였다.

자료변환 기반 특징과 다중 분류자를 이용한 다중시기 SAR자료의 분류 (Classification of Multi-temporal SAR Data by Using Data Transform Based Features and Multiple Classifiers)

  • 유희영;박노욱;홍석영;이경도;김예슬
    • 대한원격탐사학회지
    • /
    • 제31권3호
    • /
    • pp.205-214
    • /
    • 2015
  • 이 연구에서는 자료변환기법을 이용해 추출된 여러 특징과 다양한 분류방법론을 결합하여 다중시기 SAR 자료를 위한 새로운 토지피복 분류기법을 제안하였다. 먼저, 다중시기 SAR 자료로부터 원본자료와는 다른 새로운 정보를 추출하기 위해 주성분분석과 3차원 웨이블렛 변환을 이용한 자료변환을 수행하였다. 그리고 나서 최대우도법 분류자, 신경망, support vector machine을 포함한 세 가지 다른 분류자를 변환된 특징자료들과 원본 후방산란계수 자료를 포함한 세가지 자료에 적용하여 다양한 초기 분류 결과를 얻도록 한다. 이후 다수결규칙을 통해 모든 초기결과를 결합하여 최종 분류 결과를 생성하게 된다. 다중시기 ENVISAT ASAR 자료를 이용한 사례연구에서 모든 초기 결과는 사용한 특징자료와 분류자의 종류에 따라 매우 다양한 분류정확도를 보였다. 이러한 9개의 초기 분류 결과를 결합한 최종 분류 결과는 가장 높은 분류 정확도를 보여주고 있는데, 이는 각 초기 분류 결과가 토지피복을 결정하기 위한 상호 보완적인 정보를 제공하기 때문이다. 이 연구에서의 분류정확도 향상은 주로 자료변환을 통해 얻어진 각기 다른 특징자료와 다른 분류자를 결합에 의한 다양성 확보에서 기인한다. 그러므로 이 연구에서 제안한 토지피복 분류방법론은 다중시기 SAR자료의 분류에 효과적으로 적용가능하며, 또한 다중센서 원격탐사 자료융합으로 확장이 가능하다.

대통령 전자기록물의 이관방식 변천과 개선방안 연구 19대 문재인 정부 대통령 전자기록물을 중심으로 (A Study of the Transition Process in Presidential Electronic Records Transfer and Improvement Measures : Focused on the Electronic Records of the 19th President Moon Jae-in's Administration)

  • 윤정훈
    • 기록학연구
    • /
    • 제75호
    • /
    • pp.41-89
    • /
    • 2023
  • 2007년 「대통령기록물법」 제정 이후, 16대 노무현 정부의 대통령 전자기록물 이관 사례는 공공기록물 관리에 있어 첨병으로써의 역할과 새로운 전자기록물 관리의 테스트 베드로써의 역할을 수행했었다. 19대 문재인 정부의 대통령 전자기록물을 이관할 때에는 16대 때의 전자기록물 이관방식을 계승하되, 몇 가지 혁신적인 시도가 있었다. 대통령기록관은 처음으로 대통령자문기관의 전자문서를 장기보존패키지로 변환한 후 온라인으로 이관 받았고, 데이터의 특성을 고려하여 대통령 기록물생산기관의 행정정보 데이터세트를 SIARD 규격으로 이관을 받았다. 그리고 대통령기록관은 웹사이트를 OVF 형태로 시범적으로 이관 받았으며, 소셜미디어를 API를 통해 직접 수집하였다. 이와 같이 이 연구는 16대 노무현 정부 때부터 19대 문재인 정부 때까지 대통령 전자기록물 이관방식과 관련한 변천과정을 조사하였다. 그리고 19대 문재인 정부의 대통령 전자기록물 유형별 이관방식을 중심으로 주요성과 및 문제점을 분석하여 향후 개선방안을 제시하였다.

HS 코드 분류를 위한 CNN 기반의 추천 모델 개발 (CNN-based Recommendation Model for Classifying HS Code)

  • 이동주;김건우;최근호
    • 경영과정보연구
    • /
    • 제39권3호
    • /
    • pp.1-16
    • /
    • 2020
  • 현재 운영되고 있는 관세신고납부제도는 납세의무자가 세액 산정을 스스로하고 그 세액을 본인 책임으로 납부하도록 하는 제도이다. 다시 말해, 관세법상 신고 납부제도는 납세액을 정확히 계산해서 납부할 의무와 책임이 온전히 납세의무자에게 무한정으로 부과하는 것을 원칙으로 하고 있다. 따라서, 만일 납세의무자가 그 의무와 책임을 제대로 행하지 못했을 경우에는 부족한 만큼의 세액 추징과 그에 대한 제제로 가산세를 부과하고 있다. 이러한 이유로 세액 산정의 기본이 되는 품목분류는 관세평가와 함께 가장 어려운 부분이며 잘못 분류하게 되면 기업에게도 큰 리스크가 될 수도 있다. 이러한 이유로 관세전문가인 관세사에게 상당한 수수료를 지불하면서 수입신고를 위탁하여 처리하고 있는 실정이다. 이에 본 연구에서는 수입신고 시 신고하려는 품목이 어떤 것인지 HS 코드 분류를 하여 수입신고 시 기재해야 할 HS 코드를 추천해 주는데 목적이 있다. HS 코드 분류를 위해 관세청 품목분류 결정 사례를 바탕으로 사례에 첨부된 이미지를 활용하여 HS 코드 분류를 하였다. 이미지 분류를 위해 이미지 인식에 많이 사용되는 딥러닝 알고리즘인 CNN을 사용하였는데, 세부적으로 CNN 모델 중 VggNet(Vgg16, Vgg19), ResNet50, Inception-V3 모델을 사용하였다. 분류 정확도를 높이기 위해 3개의 dataset을 만들어 실험을 진행하였다. Dataset 1은 HS 코드 이미지가 가장 많은 5종을 선정하였고 Dataset 2와 Dataset 3은 HS 코드 2단위 중 가장 데이터 샘플의 수가 많은 87류를 대상으로 하였으며, 이 중 샘플 수가 많은 5종으로 분류 범위를 좁혀 분석하였다. 이 중 dataset 3로 학습시켜 HS 코드 분류를 수행하였을 때 Vgg16 모델에서 분류 정확도가 73.12%로 가장 높았다. 본 연구는 HS 코드 이미지를 이용해 딥러닝에 기반한 HS 코드 분류를 최초로 시도하였다는 점에서 의의가 있다. 또한, 수출입 업무를 하고 있는 기업이나 개인사업자들이 본 연구에서 제안한 모델을 참조하여 활용할 수 있다면 수출입 신고 시 HS 코드 작성에 도움될 것으로 기대된다.

건물의 단기부하 예측을 위한 기상예측 모델 개발 (Development of Weather Forecast Models for a Short-term Building Load Prediction)

  • 전병기;이경호;김의종
    • 한국태양에너지학회 논문집
    • /
    • 제38권1호
    • /
    • pp.1-11
    • /
    • 2018
  • In this work, we propose weather prediction models to estimate hourly outdoor temperatures and solar irradiance in the next day using forecasting information. Hourly weather data predicted by the proposed models are useful for setting system operating strategies for the next day. The outside temperature prediction model considers 3-hourly temperatures forecasted by Korea Meteorological Administration. Hourly data are obtained by a simple interpolation scheme. The solar irradiance prediction is achieved by constructing a dataset with the observed cloudiness and correspondent solar irradiance during the last two weeks and then by matching the forecasted cloud factor for the next day with the solar irradiance values in the dataset. To verify the usefulness of the weather prediction models in predicting a short-term building load, the predicted data are inputted to a TRNSYS building model, and results are compared with a reference case. Results show that the test case can meet the acceptance error level defined by the ASHRAE guideline showing 8.8% in CVRMSE in spite of some inaccurate predictions for hourly weather data.

국내 건설기업의 효율성 및 생산성 분석 (An Analysis of the Efficiency and Productivity of Domestic Construction Companies)

  • 주수민;이수철;홍종의
    • Journal of Information Technology Applications and Management
    • /
    • 제27권1호
    • /
    • pp.1-13
    • /
    • 2020
  • This study aims to measure the efficiency and productivity change of 30 domestic construction companies from 2010 to 2018 using data envelopment analysis(DEA) and Malmquist productivity index (MI). In particular, we used the number of employees, capital stock, and non-current assets as input variables, and sales and net income as ouput variables for the analysis. The dataset used for the analysis of efficiency and productivity changes is the employee profile and financial statements for the companies from 2010 to 2018. We found that the MI of the 30 companies is greater than one since 2013. This is because many years of TEC (Technical Efficiency Change) is greater than 1, which means that the productivity index increases as the TEC increases. In addition, the MI value was less than 1, which lowered the productivity of construction firms in 2018. The results of the study may help decision makers to find effective future management plans by analyzing the internal and external factors.

WRF-UCM (Urban Canopy Model)을 이용한 서울 지역의 도시기상 예보 평가 (Evaluation of Urban Weather Forecast Using WRF-UCM (Urban Canopy Model) Over Seoul)

  • 변재영;최영진;서범근
    • 대기
    • /
    • 제20권1호
    • /
    • pp.13-26
    • /
    • 2010
  • The Urban Canopy Model (UCM) implemented in WRF model is applied to improve urban meteorological forecast for fine-scale (about 1-km horizontal grid spacing) simulations over the city of Seoul. The results of the surface air temperature and wind speed predicted by WRF-UCM model is compared with those of the standard WRF model. The 2-m air temperature and wind speed of the standard WRF are found to be lower than observation, while the nocturnal urban canopy temperature from the WRF-UCM is superior to the surface air temperature from the standard WRF. Although urban canopy temperature (TC) is found to be lower at industrial sites, TC in high-intensity residential areas compares better with surface observation than 2-m temperature. 10-m wind speed is overestimated in urban area, while urban canopy wind (UC) is weaker than observation by the drag effect of the building. The coupled WRF-UCM represents the increase of urban heat from urban effects such as anthropogenic heat and buildings, etc. The study indicates that the WRF-UCM contributes for the improvement of urban weather forecast such nocturnal heat island, especially when an accurate urban information dataset is provided.

강원도 지역 가임기 여성의 분만서비스 접근성 분석 (The Spatial Accessibility of Women in Childbearing Age for Delivery Services in Gangwon-do)

  • 최소영;이광수
    • 보건행정학회지
    • /
    • 제27권3호
    • /
    • pp.229-240
    • /
    • 2017
  • Background: This study purposed to analyze the spatial accessibility of women in childbearing age to the healthcare organizations (HCOs) providing delivery services in Gangwon-do. Methods: Network analysis was applied to assess the spatial accessibility based on the travel time and road travel distance. Travel time and travel distance were measured between the location of HCOs and the centroid of the smallest administrative areas, eup, myeon, and dong in Gangwon-do. Korean Transport Database Center provided road network GIS (Geographic Information System) Database in 2015 and it was used to build the network dataset. Two types of network analysis, service area analysis and origin-destination (OD)-cost matrix analysis, applied to the created network dataset. Service area analysis defined all-accessible areas that are within a specified time, and OD-cost matrix analysis measured the least-cost paths from the HCOs to the centroids. The visualization of the number of the HCOs and the number of women in childbearing age on the Ganwon-do map and network analysis were performed with ArcGIS ver. 10.0 (ESRI, Redlands, CA, USA). Results: Twenty HCOs were providing delivery services in Gangwon-do in 2016. Over 50% of the women in childbearing age were aged more than 35 years. Service area analysis found that 89.56% of Gangwon-do area took less than 60 minutes to reach any types of HCOs. For tertiary hospitals, about 74.37% of Gangwon-do area took more than 60 minutes. Except Wonju-si and Hoengseong-gun, other regions took more than 60 minutes to reach the tertiary hospital. Especially, Goseong-gun, Donghae-si, Samcheok-si, Sokcho-si, Yanggu-gun, Cheorwon-gun, and Taebaek-si took more than 100 minutes to the tertiary hospital. Conclusion: This study provided that the accessibility toward the tertiary hospital was limited and it may cause problems in high-risk delivery patients such as over 35 years. Health policy makers will need to handle the obstetric accessibility issues in Gangwon-do.

An Operations Model for Home Energy Management System Considering an Energy Storage System and Consumer Utility in a Smart Grid

  • Juhyeon Kang;Yongma Moon
    • Asia pacific journal of information systems
    • /
    • 제27권2호
    • /
    • pp.99-125
    • /
    • 2017
  • In this study, we propose an operations model to automate a home energy management system (HEMS) that utilizes an energy storage system (ESS) in consideration of consumer utility. Most previous studies focused on the system for the profits obtained from trading charged energy using large-scale ESS. By contrast, the present study focuses on constructing a home-level energy management system that considers consumer's utility over energy consumption. Depending on personal preference, some residential consumers may prefer consuming additional energy to earn increased profits through price arbitrage and vice versa. However, the current system could not yet reflect on this aspect. Thus, we develop an operations model for HEMS that could automatically control energy consumption while considering the level of consumer's preference and the economic benefits of using an ESS. The results of simulations using a dataset of the Korean market show that an operations policy of charging and discharging can be changed depending on consumer's utility. The impact of this policy is not ignorable. Moreover, the technical specifications of ESS, such as self-discharge rate and round-trip efficiency, can affect the operations policy and automation of HEMS.

지리정보시스템을 이용한 국가 위암검진서비스 제공 의료기관에 대한 공간적 접근성 평가 - 강원도 지역을 중심으로 - (Assessment on the Spatial Accessibility of Medical Institutions Providing National Gastric Cancer Screening Service using a geographic information system - Focused on the Area of Gangwon-do -)

  • 박영용;박주현;박유현;이광수
    • 보건의료산업학회지
    • /
    • 제13권1호
    • /
    • pp.15-30
    • /
    • 2019
  • Objectives: This study aimed to analyze people's accessibility to medical institutions providing national gastric cancer screening services in Gangwon-do using a geographic information system(GIS). Methods: To assess the spatial accessibility, network analysis was applied. Two types of network analysis-Service area analysis and origin-destination cost matrix(OD-cost matrix)-were applied to create network dataset. Results: The results of the analysis of the service area revealed that it took more than 60 minutes each to reach tertiary hospitals and general hospitals from 74.4% and 9.6% of Gangwon-do areas, respectively. Similarly, it took more than 60 minutes each to reach hospitals and clinics from 4.2% and 3.4% of Gangwon-do areas, respectively. The results of the OD-cost revealed that there were large regional variations in distance and time taken to reach the medical institutions. Conclusions: there were regional variations of spatial accessibility between Si and Gun in Gangwon-do.