• 제목/요약/키워드: unstructured format

검색결과 37건 처리시간 0.036초

기상 특보 발표가 기상청 콜센터 상담 건수에 미치는 영향 분석 (The Impact of Severe Weather Announcement on the Korea Meteorological Administration Call Center Counseling Demand)

  • 지영미;박태영;이영섭
    • 대기
    • /
    • 제27권4호
    • /
    • pp.377-384
    • /
    • 2017
  • The effective management of call centers under special circumstances is critical to improve customer satisfaction. In order to effectively respond to call center counseling demand, this paper aims to identify factors having the greatest impact on the number of Korea Meteorological Administration (KMA) call center counseling. To do so, we propose to combine call center data with severe weather announcement data and investigate how the severe weather announcement affects the number of KMA call center counseling. A time lag analysis is conducted and it is found that the severe weather announcement takes about an hour to be reflected in the number of KMA call center counseling. Based on the result of the time lag analysis, we conduct a comparative analysis according to time and season using the data collected from 1 January 2012, to 29 June 2016. The results show that the number of KMA call center counseling increases at lunchtime and decreases during nighttime, and the average rate of change in call center counseling demand tends to be larger under the severe weather announcement. For the comparative analysis according to the season, there are significant differences in the effect of severe weather announcement on the number of KMA call center counseling in spring, fall and winter.

CAD 형상 데이터를 이용한 물체 표면 삼각형 격자의 자동 생성 기법 (AUTOMATED TRIANGULAR SURFACE GRID GENERATION ON CAD SURFACE DATA)

  • 이봉주;김병수
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2007년도 춘계 학술대회논문집
    • /
    • pp.103-107
    • /
    • 2007
  • Computational Fluid Dynamics (CFD in short) approach is now playing an important role in the engineering process recently. Generating proper grid system for the region of interest in time is prerequisite for the efficient numerical calculation of flow physics using CFD approach. Grid generation is, however, usually considered as a major obstacle for a routine and successful application of numerical approaches in the engineering process. CFD approach based on the unstructured grid system is gaining popularity due to its simplicity and efficiency for generating grid system compared to the structured grid approaches. In this paper an automated triangular surface grid generation using CAD surface data is proposed According to the present method, the CAD surface data imported in the STL format is processed to identify feature edges defining the topology and geometry of the surface shape first. When the feature edges are identified, node points along the edges are distributed. The initial fronts which connect those feature edge nodes are constructed and then they are advanced along the CAD surface data inward until the surface is fully covered by triangular surface grid cells using Advancing Front Method. It is found that this approach can be implemented in an automated way successfully saving man-hours and reducing human-errors in generating triangular surface grid system.

  • PDF

NoSQL 기반 클라우드 사용자 행동 탐지 시스템 설계 (NoSQL-based User Behavior Detection System in Cloud Computing Environment)

  • 안광민;이봉환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.804-807
    • /
    • 2012
  • 클라우드 서비스는 모든 자원을 서비스 제공자가 제공하고 다수의 사용자가 공유하기 때문에 서비스 제공자가 사용자의 정보를 더욱 안전하게 보호해야만 한다. 본 논문에서는 모바일 클라우드 서비스의 보안을 강화하기 위해 NoSQL 기반의 비정상 탐지 시스템을 제안한다. 다양한 보안장비에서 발생시키는 보안 로그와 클라우드 노드에서 발생시키는 데이터는 대량의 데이터가 형식이 모두 다른 비정형 데이터이기 때문에 기존의 통합보안 관리 시스템에서 사용하는 관계형 데이터베이스를 사용하여서는 실시간 처리가 어렵다. 제안하는 시스템은 분산처리 환경에서 실시간 처리 및 확장성을 제공하기 때문에 클라우드 환경에서 새롭게 대두되는 보안 문제를 해결할 수 있다.

  • PDF

${\cdot}$양방 협진 전자의무기록 시스템 구축을 위한 통합 데이터베이스 구축 (An Implementation of Intefrated Database for Electronic Medical Record System in East-West Medical Collabration)

  • 안요찬;오상봉
    • Journal of Information Technology Applications and Management
    • /
    • 제12권2호
    • /
    • pp.129-143
    • /
    • 2005
  • In recent years, two major streams in medical information systems are:1) system integration among OCS(Order Communication System), EMR(Electronic Medical Record), PACS(Picture Archiving and Communication System), and ERP(Enterprise Resource Planning) and 2) system integration through medical collaboration between East and West medical service providers. One of the characteristics which differentiate the Korean medical industry from the western medical industry is the East-West medical collaboration. In many respects there are many differences between East and West medical treatment. Although East and West medical treatment have developed from different medical philosophies and standards, we assume that the better medical care can be provided by integrating their medical procedures effectively. The two possible approaches to the integration of East and West medical information systems are suggested in this paper:One is loosely coupled model and the other is tightly coupled model. EMR improves the quality of medical record which reflects the quality of clinical practice. It provides more efficient and convenient way of input, retrieval, storage, communication and management of medical data. We abstracted the standard medical procedures from the two medical procedures performed in Daejeon Oriental Hospital and Hehwa Clinic at Daejeon University and also abstracted database schema by analyzing the characteristics of information needed in East-West medical collaboration. Our EMR is composed of two types of data:one is structured data and the other is unstructured data, which are formalized by SOAP(Subjective, Objective, Assessment, Plan) format. Currently the integrated system is implemented and operated successfully for six months.

  • PDF

텍스트 마이닝 기법을 활용한 우리나라 산업재해의 원인분석 (Text-mining based Cause Analysis of Accidents at Workplaces in Korea)

  • 최기흥
    • 한국안전학회지
    • /
    • 제37권3호
    • /
    • pp.9-15
    • /
    • 2022
  • The analysis of the causes of accidents in workplaces where machines and tools are used is essential to improve the effectiveness and efficiency of safety prevention policies in places of employment in Korea. The causes of workplace accidents are not fully understood mainly due to difficulties in analyzing available descriptive information. This study focuses on the automated accident cause analysis in workplaces based on the accident abstracts found in industrial accident reports written in an unstructured descriptive format. The method proposed in this paper is based on text data mining and uses the keyword search function of Excel software to automate the analysis. The analysis results indicate that the primary reason for the frequency of accidents is related to technical aspects at a stage in which dangerous situations occur in the workplace. Accidents due to managerial causes are typically observed when danger exists in the workplace; however, managerial actions play a more important role in reducing accident severity. A small company tends to use unsafe machines and devices, leading to further accidents due to technical causes, whereas managerial causes are more conspicuous as the company grows. To preclude the occurrence of accidents due to inadequate knowledge, the implementation of safety management and the provision of safety education to elderly workers at the early stage of their employment are particularly important for small companies with less than 100 workers.

전문 설비의 이상신호 처리를 위한 저비용 관제 시스템 구축 (An Architecture for Managing Faulty Sensing Data on Low Cost Sensing Devices over Manufacturing Equipments)

  • 채유나;김창규;고하람;김웅섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.113-120
    • /
    • 2018
  • 본 연구에서는 공장 내부의 설비의 동작의 이상 유무를 저가의 센서를 사용하여 모니터링하고 이를 확인할 수 있도록 하는 시스템을 구현하였다. 저가의 센서들은 저렴한 비용으로 넓은 장소에 다량의 기기들에 설치할 수 있다는 장점을 가지지만 센서의 오작동 및 센서의 정확성 문제로 정확한 감시와 확인이 어려워진다는 단점을 가진다. 따라서 저가의 센서를 사용하게 되면 생산설비에서 발생하는 데이터로부터 이상 값을 구분하여 이상상황에 대한 센서의 오작동인지 또는 설비의 고장인지 여부를 판단하고 이를 알람을 통해 확인할 수 있는 모니터링 시스템이 필수로 구축되어야 한다. 본 연구에서 우리는 저가의 센서들에서 감지된 정상 범위를 벗어나는 데이터 값에서 센서의 오작동과 설비의 고장여부를 구분할 수 있는 시스템을 구현하였으며 이를 위해 우리는 가중이동 평균법과 푸리에 변환 기반 신호 검증 시스템을 혼합한 시스템을 설계 구현하였다. 이를 통해 설비에서 정상범위를 벗어나는 값들이 감지되는 경우 이들을 기기의 이상과 센서의 이상 상황으로 구분할 수 있도록 하였으며 실험결과 전체 이상 신호 값 중에 1/3에 해당하는 부분을 센서의 이상 상황으로 분류 정상처리하고 있음을 확인할 수 있었다. 또한 우리는 모니터링 시스템의 구축 비용 절감을 위해 정보를 무선통신으로 전송하도록 하였으며 작동 센싱 정보들을 비정형 데이터로 구현 처리하도록 하여 다수의 센서에서 수집된 대규모의 정보들을 효율적으로 처리할 수 있도록 하였다.

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

불균형 정형 데이터를 위한 SMOTE와 변형 CycleGAN 기반 하이브리드 오버샘플링 기법 (A Hybrid Oversampling Technique for Imbalanced Structured Data based on SMOTE and Adapted CycleGAN)

  • 노정담;최병구
    • 경영정보학연구
    • /
    • 제24권4호
    • /
    • pp.97-118
    • /
    • 2022
  • 이미지와 같은 비정형 데이터의 불균형 클래스 문제 해결에 있어 생산적 적대 신경망(generative adversarial network)에 기반한 오버샘플링 기법의 우수성이 알려짐에 따라 다양한 연구들이 이를 정형 데이터의 불균형 문제 해결에도 적용하기 시작하였다. 그러나 이러한 연구들은 데이터의 형태를 비정형 데이터 구조로 변경함으로써 정형 데이터의 특징을 정확하게 반영하지 못한다는 점이 문제로 지적되고 있다. 본 연구에서는 이를 해결하기 위해 순환 생산적 적대 신경망(cycle GAN)을 정형 데이터의 구조에 맞게 재구성하고 이를 SMOTE(synthetic minority oversampling technique) 기법과 결합한 하이브리드 오버샘플링 기법을 제안하였다. 특히 기존 연구와 달리 생산적 적대 신경망을 구성함에 있어 1차원 합성곱 신경망(1D-convolutional neural network)을 사용함으로써 기존 연구의 한계를 극복하고자 하였다. 본 연구에서 제안한 기법의 성능 비교를 위해 불균형 정형 데이터를 기반으로 오버샘플링을 진행하고 그 결과를 SMOTE, ADASYN(adaptive synthetic sampling) 등과 같은 기존 기법과 비교하였다. 비교 결과 차원이 많을수록, 불균형 정도가 심할수록 제안된 모형이 우수한 성능을 보이는 것으로 나타났다. 본 연구는 기존 연구와 달리 정형 데이터의 구조를 유지하면서 소수 클래스의 특징을 반영한 오버샘플링을 통해 분류의 성능을 향상시켰다는 점에서 의의가 있다.

LRM 노멘을 수용하기 위한 전거제어시 고려사항에 관한 연구 (A Study on Considerations in the Authority Control to Accommodate LRM Nomen)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제52권1호
    • /
    • pp.109-128
    • /
    • 2021
  • 본고에서는 LRM 노멘 개체를 수용하기 위한 전거제어시 고려사항을 모색하고자 문헌연구, RDA 규칙분석, 국내 목록 전문가 의견조사를 실시하였다. 그 결과 전거제어를 위해 노멘의 속성 요소, 목록기술, MARC 전거포맷 측면에서 고려사항을 제안하였다. 첫째, 노멘의 속성으로 LRM 노멘의 유형, 스킴, 이용대상자, 이용맥락, 참고정보원, 언어, 문자, 문자변환과 RDA에서 추가한 식별상태, 주기, 구분불가한 이름지시자의 기술을 가능한 상세히 기술해야 한다. 둘째, 노멘의 속성요소 및 관계요소를 기술하기 위해 목록규칙인 RDA에 제시된 대로 비구조화, 구조화, 식별자, IRI로 기술하며, 이중 구조화된 기술을 위해서는 어휘인코딩스킴(VES), 스트링인코딩스킴(SES)이 작성되어야 한다. 또한, 전거형접근점에 대한 구조 및 우선 이름/표제에 대한 목록 규칙도 마련되어야 한다. 셋째, LRM 노멘을 반영할 수 있도록 MARC 21 전거포맷을 마련하기 위해 Maxwell의 확장(안)을 바탕으로 추가 확장 방안을 제안하였다. (1) 노멘 마다 속성이 입력될 수 있도록 4XX, 5XX에 속성이 기술되어야 하며, 1XX, 5XX와 4XX에 기술될 노멘의 속성을 구분하였다. (2) 노멘 속성으로 유형, 언어, 문자, 문자변환, 이용맥락, 유효기간을 기술하기 위해서는 MARC 21내에 표시기호 및 식별기호가 추가되어야 한다. 이에 368, 381, 377의 식별기호 확장과 이용맥락과 유효기간을 기술하기 위한 표시기호를 추가할 것을 제안하였다. 본고에서 제안한 LRM 노멘을 위한 전거제어시 고려사항은 국내에서 LRM을 반영한 전거제어 방안을 마련하는 기반이 될 것이다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.