• Title/Summary/Keyword: 통계 처리

Search Result 3,103, Processing Time 0.03 seconds

Sensor Data Collection Mobile Application and Classification Using R (모바일센서 데이터 수집 응용과 R을 사용한 분류)

  • Yim, Jaegeol;Woo, Jin-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.155-158
    • /
    • 2012
  • 본 논문에서는 스마트폰에 장착된 여러 가지 센서들의 센서 값을 수집하는 안드로이드 애플리케이션을 소개하고, 실제로 수집한 데이터를 분석한다. 분석을 위하여 일반적인 통계 분석 도구인 R을 사용한다. 분석 결과 어떤 센서 (Azimuth를 비롯한 orientation 센서) 값은 실용성이 있는 수준으로 정확하다는 것을 알 수 있었으나 또 다른 센서는 (밝기 센서 등) 잡음이 매우 심함을 보인다.

A Study on the SLA Operation for SCM of Information Technology Service (IT서비스의 SCM을 위한 SLA운영에 관한 연구)

  • Park, Jong Myoung;Cho, Sung Kat
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.439-440
    • /
    • 2009
  • 본 연구는 IT서비스관리체계의 기술수준과 IT서비스 관리 프로세스 성숙도 정도가 IT 아웃소싱 성과에 미치는 영향을 통계적으로 유의한 분석을 통해 객관적인 결과를 제시함으로써 기업에 IT 서비스의 SCM에 대한 의식 수준 강화와 IT서비스 관리 프로세스의 중요성을 인식 시켜 주고, 이것이 고객만족과 SLA의 성과에 영향을 주고 있음을 시사하고 있다.

DoS Attack Defense Using SDN and Honeypot (SDN 과 Honeypot 을 활용한 DoS 공격 차단 기법)

  • Mun, Sungsik;Kim, Mihui
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.397-400
    • /
    • 2020
  • SDN(Software Defined Networking)은 효율적인 방법과 저렴한 비용으로 네트워크를 직접 프로그램 하여 즉각적인 제어를 할 수 있다. 본 논문에서는 SDN 의 특성을 활용, SDN 구성요소인 컨트롤러와 스위치를 활용하여 공격 정보를 수집하고 이를 기반으로 공격을 탐지하는 위협 레벨 관리 모듈, 공격 탐지 모듈, 패킷 통계 모듈 등을 설계하여 프로그래밍하고 허니팟을 적용하여 서비스 거부(DoS, Denial of Services)공격을 차단하는 방법을 제시한다.

A System on Establishing a Favored Location Measurement based on Personal Geopositioning Data (개인의 위치에 기반하는 장소 방문 선호도를 추출하는 시스템에 관한 연구)

  • Song, Ha Yoon;Kim, Do-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.895-898
    • /
    • 2021
  • DB로부터 위치 데이터를 추출해오면, location visiting measure를 통해 한 개인의 장소 방문 선호도를 측정한다. 이 과정에서 위치 데이터 클러스터링 및 개인의 이동성 파악을 위한 6가지 조치를 한다. 위치 데이터 분석 결과로 얻은 이동성 통계는 LBS(Location Based System)를 포함한 다양한 분야에 적용될 수 있다. 연구의 최종 목표는 새로운 위치 데이터의 수집에 따른 방문 선호도 변화를 적용할 수 있도록 하는 location visiting measure의 자동화 시스템을 구축하는 것이다.

Exploring Regional Decline Risk Areas and Factors Using Topic Modeling and Cluster Analysis (토픽모델링과 군집분석을 통한 지방 소멸 위험지역과 요인의 탐색)

  • Ji-Min Kim;Heeryon Cho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.349-350
    • /
    • 2023
  • 우리나라는 지속적인 저출산과 고령화로 인해 지방 소멸 위험지역이 점차 늘어나고 있다. 본 연구는 지방 소멸과 관련된 다양한 요인을 '인구 소멸'이라는 키워드를 포함하는 신문 기사에 대한 토픽모델링을 통해 발견하고, 추출된 토픽과 관련된 공공 데이터를 수집하여 비슷한 특징을 가지는 지역을 묶는 군집분석을 수행한다. 그리고 지방소멸위험지수로 분류된 소멸 위험지역과 군집분석 결과를 비교한다.

A Homonym Disambiguation System Based on Statistical Model Using Sense Category and Distance Weights (의미범주 및 거리 가중치를 고려한 통계기반 동형이의어 분별 시스템)

  • Kim, Jun-Su;Kim, Chang-Hwan;Lee, Wang-Woo;Lee, Soo-Dong;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.487-493
    • /
    • 2001
  • 본 논문에서는 Bayes 정리를 적용한 통계기반 동형이의어 분별 시스템에 대한 외부실험 결과를 분석하여, 정확률 향상을 위한 의미범주 가중치 및 인접 어절에 대한 거리 가중치 모델을 제시한다. 의미 분별된 사전 뜻풀이말 코퍼스(120만 어절)에서 구축된 의미정보를 이용한 통계기반 동형이의어 분별 시스템을 사전 뜻풀이말 문장에 출현하는 동형이의어 의미 분별에 적용한 결과 상위 고빈도 200개의 동형이의어에 대해 평균 98.32% 정확률을 보였다. 내부 실험에 사용된 200개의 동형이의어 중 49개(체언 31개, 용언 18개)를 선별하여 이들 동형이의어를 포함하고 있는 50,703개의 문장을 세종계획 품사 부착 코퍼스(350만 어절)에서 추출하여 외부 실험을 하였다. 분별하고자 하는 동형이의어의 앞/뒤 5어절에 대해 의미범주 및 거리 가중치를 부여한 실험 결과 기존 통계기반 분별 모델 보다 2.93% 정확률이 향상되었다.

  • PDF

Statistical disclosure control for public microdata: present and future (마이크로데이터 공표를 위한 통계적 노출제어 방법론 고찰)

  • Park, Min-Jeong;Kim, Hang J.
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.6
    • /
    • pp.1041-1059
    • /
    • 2016
  • The increasing demand from researchers and policy makers for microdata has also increased related privacy and security concerns. During the past two decades, a large volume of literature on statistical disclosure control (SDC) has been published in international journals. This review paper introduces relatively recent SDC approaches to the communities of Korean statisticians and statistical agencies. In addition to the traditional masking techniques (such as microaggregation and noise addition), we introduce an online analytic system, differential privacy, and synthetic data. For each approach, the application example (with pros and cons, as well as methodology) is highlighted, so that the paper can assist statical agencies that seek a practical SDC approach.

Development of Non-point Source Pollutant Reclassification System Using GIS (GIS를 이용한 유역별 비점오염원 통계자료 재분류 시스템 구축)

  • Jeong, Han-Seok;Cho, Young-Kyoung;Park, Seung-Woo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.2008-2012
    • /
    • 2007
  • 통계청 등의 기관에 구축되어있는 기본적인 비점오염원 자료들은 행정구역별로 나뉘어져 있지만 실제수계에 도달하는 부하량 산정을 위해서는 유역별로 구분을 다시 해야만 하는 번거로움이 있다. 따라서 본 연구에서는 반복되는 비점오염원 자료의 전처리 과정의 번거로움을 피하기 위하여 지리정보체계(Geographical Infomation System; GIS)와 VBA(Visual Basic for Application)를 이용하여 통계자료의 전처리 과정을 한 번에 처리할 수 있는 시스템을 구축하였다. 본 시스템은 선택한 유역도와 행정구역도를 중첩하여 유역 내 최소행정구역의 점유율을 반영한 통계자료를 사용자 친화적으로 재분류하는 시스템이다. 본 시스템의 적용성 확인을 위하여 새만금유역 내 주상천유역을 대상으로 연구를 실시하였으며, 새만금유역에 포함되는 전라북도 최소행정구역의 토지이용 통계자료만을 기본 데이터로 활용하였다. 본 연구에서 구축된 시스템은 오염부하량 산정에 있어 요구되는 기본적인 데이터를 얻는 것에 있어서 기존의 장시간에 걸친 단순 반복작업을 대신하는 효율적인 시스템이며, ArcGIS에 대한 이해가 부족한 사용자의 경우에도 간단한 시스템조작만으로도 필요한 데이터를 구축할 수 있어 사용자에게 편리함을 제공한다. 향후 본 시스템을 이용하여 비점오염부하량 산정시스템을 개발할 수 있고, 기상자료 등과 같은 수문모형으로의 적용도 가능할 것으로 기대된다.

  • PDF

Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word (어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상)

  • Park, Hee-Geun;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.134-139
    • /
    • 2007
  • 품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.

  • PDF

Segmenting Korean Nominal Compounds with an Unknown Morpheme Using Back-off Statistics (백오프 통계정보를 이용한 미등록어 포함 복합명사의 분해)

  • Park, Jae-Han;Kim, Myoung-Sun;Rho, Dae-Wook;Ra, Dong-Yul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.65-72
    • /
    • 2004
  • 본 논문에서는 백오프 통계 정보를 이용하여 일반적인 복합명사 뿐만 아니라 외래어 미등록어를 포함한 복합명사도 잘 분해하는 방법을 제안한다. 본 시스템은 입력으로 형태소분석기가 내주는 많은 분석 후보들을 받는다. 단음절 명사를 포함한 분석 후보도 포함되므로 입력 분석 후보의 수는 대단히 많게 된다. 본 모듈의 주요 작업은 이 중에서 가장 좋은 분석후보를 선택하는 것이 된다. 미등록어가 포함된 경우 이에 부합되는 분석 후보를 잘 선택하는 시스템의 개발을 목표로 한다. 이를 위해서 본 시스템에서 사용하는 주요 정보는 단어간 어휘 바이그램 통계정보이다. 또한 외래어 미등록어의 인식 정확성을 높이기 위해 음절 바이그램 정보도 이용한다. 통계정보는 대량의 품사 태깅 말뭉치에서 추출하였다. 데이터 부족 문제를 해소하기 위해서 우리는 백오프(back-off) 평탄화(smoothing) 기법을 이용하였다. 미등록어가 포함된 복합명사의 분석 후보의 수를 줄이기 위한 기술도 연구하였다.

  • PDF