• Title/Summary/Keyword: 학술정보통계시스템

Search Result 562, Processing Time 0.048 seconds

Classification of Statistical Error Types Through Analysis of Wind and Flood Damage History Data (풍수해 피해이력 자료 분석을 통한 통계적 오류유형 분류)

  • Kim, Ku-Yoon;Lee, Mi-Ran;Lee, Jun-Woo
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2022.10a
    • /
    • pp.135-136
    • /
    • 2022
  • 최근 기후변화의 영향으로 태풍 및 국지성 집중호우 등 자연재해 발생빈도가 증가함에 따라 풍수해로 인한 인명피해와 재산피해가 증가하고 있다. 국내에서는 재해연보를 통해 자연재난 피해이력 통계정보를 제공하고 있으며, 당해연도 자연재해상황을 기간별, 시도별, 수계별, 월별, 원인별 총괄통계와 인명피해, 시설피해와 관련된 피해면적, 피해액, 복구액 등 세부내용으로 구성하여 정보를 제공하고 있다. 행정안전부는 국가재난정보시스템을 통해 취합된 지자체 피해이력 통계자료를 입력하고 있는데 입력하는 과정에서 누락, 오기 등의 오류가 발생할 가능성이 있다. 경제적 손실이 증가하고 있는 풍수해 재난이 발생하게 될 경우 피해비용 집계, 피해액 산정 등 정확한 자료로서 구축되지 않으면 연구 및 분석을 수행하기 위한 통계자료로서 활용될 수 없다. 이러한 문제점을 개선하기 위해서 본 연구에서는 1985년부터 2018년까지 재해연보에 대해서 기간별-시군구별 자료분석을 통해 피해이력 데이터 오류 유형에 대해 분류하였다.

  • PDF

S-QUEST와 태아발육제한증 (IUGR) 조기진단시스템 개발

  • Cha, Gyeong-Jun;Park, Mun-Il;Choe, Hang-Seok;Sin, Yeong-Jae
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.171-176
    • /
    • 2003
  • 방대한 양의 데이터에서 의사결정에 필요한 정보를 발견하는 일련의 과정을 데이터 마이닝 (data mining)이라고 하는데, 본 연구에서는 생물정보학 (bioinofmatics)의 한분야로서 의학분야의 통계적 의사결정 시스템을 제공하는 의사결정나무 (decision tree) 알고리즘 중 QUEST를 S-PLUS로 구현하고(이하 S-QUEST) 발육제한(Intrauterine Growth Restriction; IUGR) 데이터를 분석하였다.

  • PDF

A Homonym Disambiguation System Based on Statistical Model Using Sense Category and Distance Weights (의미범주 및 거리 가중치를 고려한 통계기반 동형이의어 분별 시스템)

  • Kim, Jun-Su;Kim, Chang-Hwan;Lee, Wang-Woo;Lee, Soo-Dong;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.487-493
    • /
    • 2001
  • 본 논문에서는 Bayes 정리를 적용한 통계기반 동형이의어 분별 시스템에 대한 외부실험 결과를 분석하여, 정확률 향상을 위한 의미범주 가중치 및 인접 어절에 대한 거리 가중치 모델을 제시한다. 의미 분별된 사전 뜻풀이말 코퍼스(120만 어절)에서 구축된 의미정보를 이용한 통계기반 동형이의어 분별 시스템을 사전 뜻풀이말 문장에 출현하는 동형이의어 의미 분별에 적용한 결과 상위 고빈도 200개의 동형이의어에 대해 평균 98.32% 정확률을 보였다. 내부 실험에 사용된 200개의 동형이의어 중 49개(체언 31개, 용언 18개)를 선별하여 이들 동형이의어를 포함하고 있는 50,703개의 문장을 세종계획 품사 부착 코퍼스(350만 어절)에서 추출하여 외부 실험을 하였다. 분별하고자 하는 동형이의어의 앞/뒤 5어절에 대해 의미범주 및 거리 가중치를 부여한 실험 결과 기존 통계기반 분별 모델 보다 2.93% 정확률이 향상되었다.

  • PDF

Design and Implementation of Trading Analysis System based on Multi-Dimensional Modeling (다차원 모델링 기반의 거래분석 시스템 설계 및 구현)

  • Lee, Sung-Wun;Choi, Jin-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.423-426
    • /
    • 2008
  • 한국증권선물거래소의 유가증권 매매체결시스템은 안정적이고 신속한 데이터 처리에 초점을 둔 시스템이다. 인터넷과 HTS(Home Trading System)의 대중화로 인해 대량의 데이터로부터 적시에 정보를 추출하고 분석하고자 하는 요구가 증가하고 있다. 그러나 현재의 통계정보시스템은 이와 같은 요구를 수용하기 어려우며 개발자의 별도 노력이 요구된다. 또한 목표성능에 대한 요구가 매우 높아짐에 따라 시스템 및 어플리케이션의 증설과 개선작업이 빈번하지만 그 효과를 예측하기 어려우며 정량화 된 근거자료의 부재로 의사결정을 지연시킨다. 따라서 이와 같은 요구사항들을 해결하기 위해 기존의 통계정보시스템을 활용하고 추가적인 데이터들을 다양한 차원에서 분석 가능하도록 웨어하우스 데이터베이스를 구축하며 성능예측을 위한 요소들을 추출하고 데이터마이닝을 수행하여 의사결정에 도움을 줄 수 있는 다차원 모델링 기반의 거래분석 시스템을 제안한다. 거래분석 시스템의 구축으로 사용자는 웹상에서 적시에 다차원 분석보고서를 생성할 수 있다. 또한 관리자는 외부적 환경변화에 따른 향후 시스템 성능 감소를 예측할 수 있으며 내부적 요인을 제어하여 이를 상쇄할 수 있는 방안을 찾을 수 있게 된다.

Changes of the School Information Management Systems: SIMS(CS) versus NEIS (학교정보관리시스템의 변화 : SIMS(CS)와 NEIS의 비교)

  • 김창용;배재학
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.571-573
    • /
    • 2003
  • 초.중등학교에서는 교육행정업무의 효율성을 위하여 학교정보관리시스템을 활용하고 있다. 본 논문에서는 새로 도입한 교육행정정보시스템(NEIS)과 기존의 종합정보관리시스템(SIMS, CS)의 변화된 기능을 파악해보고, NEIS의 효율성과 현장 적합성을 가능해보고자 하였다. 그 결과, 학적관리, 성적관리, 각종 교육통계 및 보고업무, 대민 서비스 등의 개선된 기능이 있는 반면, 보건관리, 교수학습 지원, 그룹웨어 기능의 지원이 미흡하였다.

  • PDF

Korean Word Spacing System Using Syllable N-Gram and Word Statistic Information (음절 N-Gram과 어절 통계 정보를 이용한 한국어 띄어쓰기 시스템)

  • Choi, Sung-Ja;Kang, Mi-Young;Heo, Hee-Keun;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.47-53
    • /
    • 2003
  • 본 논문은 정제된 대용량 말뭉치로부터 얻은 음절 n-gram과 어절 통계를 이용한 한국어 자동 띄어쓰기 시스템을 제안한다. 한 문장 내에서 최적의 띄어쓰기 위치는 Viterbi 알고리즘에 의해 결정된다. 통계 기반 연구에 고유한 문제인 데이터 부족 문제, 학습 말뭉치 의존 문제를 개선하기 위하여 말뭉치를 확장하고 실험을 통해 얻은 매개변수를 사용하고 최장 일치 Viable Prefix를 찾아 어절 목록에 추가한다. 본 연구에 사용된 학습 말뭉치는 33,641,511어절로 구성되어 있으며 구어와 문어를 두루 포함한다.

  • PDF

Design and Implementation of Web-Based Mail Statistics System (웹 기반의 메일 통계 분석 시스템 설계 및 개발)

  • Lee, Sang-Do;Kim, Kwang-Hyuk;Lee, Sang-Young;Kim, Tae-Hyung;Jang, Bum-Hwan;Chung, Tai-Myung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1089-1092
    • /
    • 2002
  • 인터넷의 급속한 성장으로 인하여 메일을 이용하는 사용자가 급격히 증가하고있다. 따라서 메일 서버를 운영하는 관리자는 메일 분석에 대한 전문적인 로그 분석 도구들을 점차 요구하게 되었다. 현재 시중에 샌드메일 로그 분석에 관한 여러 구현된 상용 제품들이 있으나 단순한 통계 정보만을 제공하거나 특정 제품에만 맞도록 구현되었다. 이 논문에서는 시스템 로그 파일만을 분석하여 메일에 대한 상세한 통계 정보를 제공하는 웹 기반의 메일 분석 도구의 전체 설계 구조 및 구현 결과에 대해서 살펴보고자 한다.

  • PDF

Patch Model-Based Epidemic Simulation System (패치 모델 기반의 전염병 시뮬레이션 시스템)

  • Choi, Hoon;Park, Dong-In
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1465-1468
    • /
    • 2010
  • 지난 몇 년 동안 전염병 확산을 분석하기 위해 InfluSim 을 기반으로 한 시뮬레이션 모델에 대한 연구가 진행되어 왔다. InfluSim 은 국내 각 지역의 인구 통계학적 특성과 인구 이동 등을 고려하지 않는 한계점이 있다. 이러한 이유로 InfluSim 에 의한 시뮬레이션 결과로부터 전염병 확산에 대한 방역 대책을 마련하는 것은 부적절한 측면이 있다. 이러한 문제점을 극복하기 위해, 우리는 패치 모델을 개발하였다. 패치 모델은 전국을 16 개 권역으로 나누어 각 지역의 인구 통계학적인 특성을 고려하고, 각 지역 간의 인구 이동을 고려한다. 패치 모델은 InfluSim 모델을 기반으로 하고, 16 개 지역의 인구 통계학적 특성 및 지역 간의 인구 이동량을 네트워크 모델로 보완하였다. 본 논문은 패치 모델 기반의 시뮬레이션 시스템에 대해 서술한다.

A study on the method of acquiring IO statistical information for each user task of the KISTI-5 supercomputer (슈퍼컴퓨터 5호기 사용자의 작업별 IO 통계정보 획득 방안에 대한 연구)

  • Kwon, Min-Woo;Yoon, JunWeon;Hong, TaeYoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.6-8
    • /
    • 2021
  • 슈퍼컴퓨터 5호기 누리온은 8,437대의 계산노드와 33.88PB 규모의 병렬스토리지가 100Gbps의 Omni-Path(OPA) 인터커넥트로 연결되어 있는 초대형 클러스터 시스템이다. 누리온의 계산자원은 PBS 작업스케줄러를 통해 관리되고 있고 병렬 스토리지는 DDN사의 Exascaler Monitoring System(ESMON)을 통해 influxDB에 read/write IO 통계 데이터를 수집하고 있다. 본 논문에서는 PBS의 과금 데이터와 ESMON influxDB의 IO 통계 데이터를 활용하여 사용자의 작업별 IO 통계 정보를 생성하는 방안에 대하여 소개한다.

Web-based Corpus Information Retrieval System (웹기반 말뭉치 정보 검색 시스템)

  • Lee, Jeong-Ho;Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2008.11a
    • /
    • pp.260-263
    • /
    • 2008
  • 본 논문은 대용량의 한글어 말뭉치를 이용하여 언어학적 통계정보를 자동으로 검색할 수 있는 웹기반 언어정보 검색 시스템을 제안하고 구현하였다. 구현한 시스템을 통해 형태소, 품사, 어절 정보를 자동으로 획득할 수 있었다. 본 시스템은 언어학적 지식이 부족한 비전문가도 말뭉치 검색을 효율적으로 수행할 수 있으며, 웹기반으로 구현되었기 때문에 시스템 접근의 용의성에 의의가 있다.

  • PDF