• Title/Summary/Keyword: 데이터 분석론

Search Result 1,383, Processing Time 0.033 seconds

A study on XML based methodology of data mapping for SCADA System (SCADA 시스템에서 XML 기반의 데이터 매핑 방법론 연구)

  • Ju, Seung-Hwan;Lee, Jae-Kyoung;Park, Joon-Young;Lee, Jun-Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.711-713
    • /
    • 2013
  • 본 연구의 목적은 SCADA 시스템을 이용하여 전력, 발전설비, 송유시설, 가스처리, 도로교통, 폐수처리 등 사회인프라 구조물에 대한 능동적 재난관리 및 방지 방법론을 개발하는 것이다. SCADA 시스템은 원격으로 제어기능을 수행하고, 운영 성능 분석 및 보고하기 위한 컴퓨팅 시스템이다. 여러 제작사의 이기종 설비 시스템들을 단일 SCADA 시스템에서 관리하기 위해서는 이기종간의 데이터 호환과 정보 수집의 일반화가 필요하며, 본 연구에서는 이를 XML 기반의 데이터 통신을 통해 해결하고자 하였다. 본 연구에서는 해상풍력발전 설비의 이기종간 데이터 일반화를 목표로 하였고, 나아가 발전 설비 외에도 이기종 단말의 데이터 동기화가 필요한 경우에 XML을 이용한 이기종 단말의 데이터 수집 방법론을 활용할 수 있을 것이다.

A Transcriptome Analysis Tool using RNA-Seq Data (RNA-Seq 데이터를 이용한 전사체 분석 도구)

  • Kong, Jin-Hwa;Shin, Jae-Moon;Won, Jung-Im;Lee, Un-Joo;Yoon, Jee-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.113-115
    • /
    • 2012
  • 전사체(transcriptome) 분석이란 주어진 조건 하에서 현재 세포 내에 발현된 모든 트랜스크립트의 종류와 양을 밝히는 것을 의미하며, 분석 결과는 질병 관련성/유전적 요인 규명 등의 연구에 직접 활용한다. 우리는 선행 연구에서 RNA-Seq 데이터를 이용하여 선택 스플라이싱 과정에 의하여 생성되는 모든 트랜스크립트의 유형을 분류/추출하는 새로운 방법론을 제안한 바 있다. 그 후속 연구로서 본 연구에서는 시간/공간 효율적인 알고리즘 구현을 위한 최적화 방법론을 제안하고, 실용화를 위한 전사체 분석 도구 개발에 대하여 논한다. 개발된 전사체 분석 도구에서는 기존의 분석 도구와 달리 RNA-Seq 데이터의 단계적 분석 결과를 시각적 뷰어를 통하여 검색 가능하며, 이들 기능은 복잡한 전사체 분석 결과의 이해와 타당성 검증에 활용한다.

An Integrated Method of Iterative and Incremental Requirement Analysis for Large-Scale Systems (시스템 요구사항 분석을 위한 순환적-점진적 복합 분석방법)

  • Park, Jisung;Lee, Jaeho
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.4
    • /
    • pp.193-202
    • /
    • 2017
  • Development of Intelligent Systems involves effective integration of large-scaled knowledge processing and understanding, human-machine interaction, and intelligent services. Especially, in our project for development of a self-growing knowledge-based system with inference methodologies utilizing the big data technology, we are building a platform called WiseKB as the central knowledge base for storing massive amount of knowledge and enabling question-answering by inferences. WiseKB thus requires an effective methodology to analyze diverse requirements convoluted with the integration of various components of knowledge representation, resource management, knowledge storing, complex hybrid inference, and knowledge learning, In this paper, we propose an integrated requirement analysis method that blends the traditional sequential method and the iterative-incremental method to achieve an efficient requirement analysis for large-scale systems.

Prompt Tuning For Korean Aspect-Based Sentiment Analysis (프롬프트 튜닝기법을 적용한 한국어 속성기반 감정분석)

  • Bong-Su Kim;Hyun-Kyu Jeon;Seung-Ho Choi;Ji-Yoon Kim;Jung-Hoon Jang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.50-55
    • /
    • 2023
  • 속성 기반 감정 분석은 텍스트 내에서 감정과 해당 감정이 특정 속성, 예를 들어 제품의 특성이나 서비스의 특징에 어떻게 연결되는지를 분석하는 태스크이다. 본 논문에서는 속성 기반 감정 분석 데이터를 사용한 다중 작업-토큰 레이블링 문제에 프롬프트 튜닝 기법을 적용하기 위한 포괄적인 방법론을 소개한다. 이러한 방법론에는 토큰 레이블링 문제를 시퀀스 레이블링 문제로 일반화하기 위한 감정 표현 영역 검출 파이프라인이 포함된다. 또한 분리된 시퀀스들을 속성과 감정에 대해 분류 하기 위한 템플릿을 선정하고, 데이터셋 특성에 맞는 레이블 워드를 확장하는 방법을 제안함으써 모델의 성능을 최적화한다. 최종적으로, 퓨샷 세팅에서의 속성 기반 감정 분석 태스크에 대한 몇 가지 실험 결과와 분석을 제공한다. 구축된 데이터와 베이스라인 모델은 AIHUB(www.aihub.or.kr)에 공개되어 있다.

  • PDF

An Analysis of Named Entity Recognition System using MLM-based Language Transfer Learning (MLM 기반 언어 간 전이학습을 이용한 개체명 인식 방법론 분석)

  • Junyoung Son;Gyeongmin Kim;Jinsung Kim;Yuna Hur;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.284-288
    • /
    • 2022
  • 최근 다양한 언어모델의 구축 및 발전으로 개체명 인식 시스템의 성능은 최고 수준에 도달했다. 하지만 이와 관련된 대부분의 연구는 데이터가 충분한 언어에 대해서만 다루기 때문에, 양질의 지도학습 데이터의 존재를 가정한다. 대부분의 언어에서는 개체 유형에 대한 언어의 잠재적 특성을 충분히 학습할 수 있는 지도학습 데이터가 부족하기 때문에, 종종 자원 부족의 어려움에 직면한다. 본 논문에서는 Masked language modeling 기반 언어 간 전이학습을 이용한 개체명 인식 방법론에 대한 분석을 수행한다. 이를 위해 전이를 수행하는 소스 언어는 고자원 언어로 가정하며, 전이를 받는 타겟 언어는 저자원 언어로 가정한다. 본 논문에서는 언어모델의 토큰 사전에 언어 독립적인 가상의 자질인 개체 유형에 대한 프롬프트 토큰을 추가하고 이를 소스 언어로 학습한 뒤, 타겟 언어로 전이하는 상황에서 제안하는 방법론에 대한 평가를 수행한다. 실험 결과, 제안하는 방법론은 일반적인 미세조정 방법론보다 높은 성능을 보였으며, 한국어에서 가장 큰 영향을 받은 타겟 언어는 네덜란드어, 한국어로 전이할 때 가장 큰 영향을 준 소스 언어는 중국어인 결과를 보였다.

  • PDF

Development a Web-based Medical Information System on Linux (리눅스 체계의 웹기반 의료정보 시스템 개발)

  • Kwon, Soo-Yong;Joo, Kyung-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.241-244
    • /
    • 2007
  • 최근 개발되어지는 많은 어플리케이션 프로그램들은 전 세계 어디서든 접근할 수 있도록 웹 어플리케이션 프로그램으로 개발되어지고 있으며, 개발된 프로그램들은 효율적인 유지, 보수, 및 추후 발생되는 요구사항에 따르는 기능추가를 위해 객체지향적 개발 방법론을 사용하여야 한다. 또한 안정된 웹어플리케이션과 데이터들의 처리 및 동작을 위해서 서버로서의 기능은 Microsoft사의 Windows 체계가 아닌 Unix 기반의 운영체제를 사용하여 각 데이터들을 관계를 고려한 관계형 데이터베이스로서 처리해야 할 것이다. 따라서 본 논문에서는 Unix 계열 서버 운영체제인 Linux에서 객체지향 설계 방법론인 UML을 통한 웹 어플리케이션 분석 설계와 관계형 데이터베이스 설계 방법론인 E-R 데이터 베이스 설계를 통한 시스템 분석 설계를 것을 제시한다.

The Role of Clients in Software Projects with Agile Methods (애자일 방법론을 사용한 소프트웨어 프로젝트에서의 사용자 역할 분석)

  • Kim, Vladimir;Cho, Wooje;Jung, Yoonhyuk
    • Journal of Intelligence and Information Systems
    • /
    • v.25 no.3
    • /
    • pp.141-160
    • /
    • 2019
  • Agile methodologies in software development, including the development of artificial intelligence software, have been widespread over the past several years. In spite of the popularity of agile methodologies in practice, there is a lack of empirical evidence to identify determinants of success of software projects in which agile methods are used. To understand the role of clients in software project where agile methods are used, we examine the effect of client-side factors, including lack of user involvement, unrealistic client expectations, and constant changes of requirements on project success from practitioners' perspective. Survey methods are used in this study. Data were collected by means of online survey to IT professionals who have experience with software development methodologies, and ordered logit regression is used to analyze the survey data. Results of our study imply the following managerial findings. First, user involvement is critical to project success to take advantage of agile methods. Second, it is interesting that, with an agile method, constant changes of client's requirements is not a negative factor but a positive factor of project success. Third, unrealistic client expectations do negatively affect project success even with agile methods.

A Development on a Predictive Model for Buying Unemployment Insurance Program Based on Public Data (공공데이터 기반 고용보험 가입 예측 모델 개발 연구)

  • Cho, Minsu;Kim, Dohyeon;Song, Minseok;Kim, Kwangyong;Jeong, Chungsik;Kim, Kidae
    • The Journal of Bigdata
    • /
    • v.2 no.2
    • /
    • pp.17-31
    • /
    • 2017
  • With the development of the big data environment, public institutions also have been providing big data infrastructures. Public data is one of the typical examples, and numerous applications using public data have been provided. One of the cases is related to the employment insurance. All employers have to make contracts for the employment insurance for all employees to protect the rights. However, there are abundant cases where employers avoid to buy insurances. To overcome these challenges, a data-driven approach is needed; however, there are lacks of methodologies to integrate, manage, and analyze the public data. In this paper, we propose a methodology to build a predictive model for identifying whether employers have made the contracts of employment insurance based on public data. The methodology includes collection, integration, pre-processing, analysis of data and generating prediction models based on process mining and data mining techniques. Also, we verify the methodology with case studies.

  • PDF

A Study on the Process management Methodology of Spatial Database Standard Construction (공간데이터 표준구축공정의 관리방법론 연구)

  • Choi, Byoung-Gil;No, Young-Woo
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.27 no.3
    • /
    • pp.331-345
    • /
    • 2009
  • This study aims to standardize the work classification system in spatial data. Up to now, a systematic standard for constructing process and quality management has not yet been established in Korea, thus, it is possible for the national budget to be wasted. The regulations related to constructing spatial data are also obscure, and absurd for feasible application to reality, which results in a lack of reliability of the quality of spatial data. This study was conducted by investigating and analyzing regulations related to spatial data quality and various literature, including studies on spatial data quality conducted by the NGII. And also, the study was conducted by investigating and analyzing the constructing processes and working methods of major firms that have experience in constructing a GIS for a local governing body. Based on the analyzed data, we standardized work classification and management methodology for control point surveying using GPS, leveling, aerial photographing, digital mapping, topographic mapping, digital elevation modeling, aerial photographic DB construction, digital orthophotomap.