• 제목/요약/키워드: 비 데이터

검색결과 10,476건 처리시간 0.039초

GMS 에서의 공간 연관 규칙 탐사 시스템의 설계 및 구현 (Design and Implementation of Spatial Association Rule in GMS)

  • 안찬민;이주홍;전석주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.105-108
    • /
    • 2005
  • 본 논문에서는 지리정보 시스템인 GMS 를 기반으로 한 공간 연관 규칙의 구현과 설계 방법을 제안한다. GMS 에는 비공간 데이터와 공간 데이터가 테이블로 구분되어 저장되어 있다. 이를 이용하여 비공간 데이터 집합에서 관련된 데이터 집합을 추출한 후 그에 해당되는 공간 데이터를 이용하여 공간 연관 정보를 찾아내서 연관 규칙을 발견하는 방법에 대입하여 공간 연관 규칙을 발견한다.

  • PDF

멀티미디어 서버 버퍼의 효율적인 사용에 의한 시스템의 성능개선 (An Improvement of System Performance by Usage Efficient Buffer in Multimedia Server)

  • 강신각;이대식;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.75-77
    • /
    • 1999
  • 멀티미디어 데이터를 제공하는 서버 시스템에 동시에 여러 사용자가 요청을 해 왔을 때 데이터의 특성을 고려해서 적당한 지연시간을 줌으로 해서 시스템의 버퍼를 효율적으로 사용하게 하여 시스템의 성능을 향상시킨다. 다양한 데이터를 제공함에 있어서 시간에 따른 버퍼의 사용량의 변화를 보면 멀티미디어 데이터가 아닌 일반 데이터의 경우와 다르게 비효율적인 면을 볼 수 있다. 이 비효율적인 면을 시간과 버퍼의 크기를 서로 교환함으로서 버퍼의 사용량을 27%정도 줄이는 모델을 제시한다.

  • PDF

잠재 고객 예측을 위한 능동 학습 기법 (Active Learning for Prediction of Potential Customers)

  • 박상욱;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.96-98
    • /
    • 2000
  • 본 논문에서는 상거래 환경에서 구매자와 비구매자들에 대한 데이터를 학습한 후, 잠재고객들 중에서 구매 확률이 높은 사람을 예측하는 문제에 효율적으로 접근하기 위해 능동적인 데이터 선택 기법을 이용한다. 실험 데이터는 ColL Challenge 2000에서 얻은 데이터로서, 구매자들의 정보보다 비구매자들의 정보가 더 많기 때문에 상당히 균형이 맞지 않는다. 따라서 모든 데이터를 한꺼번에 학습하는 경우에 성능이 좋지 않다. 본 논문에서는 이러한 불균형 분포를 갖는 실제적인 문제에 있어서 성능이 좋지 않다. 본 논문에서는 이러한 불균형 분포를 갖는 실제적인 문제에 있어서 RBF 기반의 신경망을 가지고 능동 학습을 함으로써 기존의 뱃치학습 보다 예측의 정확도를 향상시킬 수 있음을 보인다.

  • PDF

ETL 상에서 처리속도 향상을 위한 빅데이터 처리 시스템 제안 (Suggestion of BigData Processing System for Enhanced Data Processing on ETL)

  • 이정빈;박석천;길기범;천승태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.170-171
    • /
    • 2015
  • 최근 디지털 정보량의 기하급수적인 증가에 따라 대규모 데이터인 빅데이터가 등장하였다. 빅데이터는 데이터가 실시간으로 매우 빠르게 생성되며 다양한 형태의 데이터를 가지며 이 데이터를 수집, 처리, 분석을 통해 새로운 지식을 창출한다. 그러나 기존의 ETL(Exact/Transform/Load) 연구에서 이러한 빅데이터를 처리 하는데 성능 저하가 발생되고 있으며 비정형 데이터를 관리할 수 없다. 따라서 본 논문에서는 기존의 ETL 처리의 한계를 극복하기 위해서 하둡을 이용하여 ETL 상에서 처리 속도를 높이고 비정형 데이터를 처리할 수 있는 빅데이터 처리 시스템을 제안하고자 한다.

모바일환경에서 실시간 데이타서비스를 위한 스케줄링 정책 (Streaming Service Scheduling Scheme in Mobile Networks)

  • 민승현;김명준;방기천
    • 디지털콘텐츠학회 논문지
    • /
    • 제3권1호
    • /
    • pp.47-57
    • /
    • 2002
  • 최근, 정보 통신 기술의 발전에 따라 무선 통신망에서 음성, 데이터, 정지화면, 동영상 및 다양한 멀티미디어 데이터를 추구하고 있다. 효율적인 실시간 멀티미디어 데이터 전송을 위해서는 실시간 데이터의 지연 한계를 보장하고 비실시간 멀티미디어 데이터의 데이터 손실을 최소화해야 한다. 무선 ATM은 유선 ATM을 기본으로 하고 있지만 무선 환경에서의 다양한 서비스에 대한 힘든 전송률과 품질에 따른 문제점들이 수반된다. 그 결과, 무선 통신 환경에서 각각의 트래픽 종류에 따른 품질 서비스(QoS)를 보장하는 방법을 찾는 것이 중요하다. 이 논문에서는 무선 ATM망에서 실시간 멀티미디어 데이터 서비스 전송을 위한 스케줄링 방법으로 개선된 TCRM 스케줄링 알고리즘을 제시한다. 무선 환경에 따라 Uplink와 Downlink시 각각 다른 방법으로 실시간 멀티미디어 데이터 전송 스케줄링 정책을 적용하며 실시간 데이터와 비실시간 데이터의 QoS의 요구사항을 보장하고 불충분한 무선 자원을 공유분배를 위한 공평성 문제를 다룬다. 또한 VC(Virtual Control)를 BS(Base Station)에 두어 예약버퍼와 임의의 전송속도 pk를 사용하여 TCRM의 단점인 비실시간 데이터에 대한 비효율성 문제를 해결한다.

  • PDF

공간 레이어에서 상접한 공간 객체의 무결성 지원을 위한 능동적인 공간연산 트리거의 설계 (A Design of Active Spatial-Operation-Trigger for supporting the Integrity of Meet-Spatial-Objects in a Spatial Layer)

  • 안준순;김재홍;정보흥;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.933-936
    • /
    • 2001
  • 공간데이터베이스 시스템에서 데이터베이스의 일관성 유지를 위해 의미적 무결성을 지원해야 한다. 예를 들어, 실세계의 구경계 레이어에서 공간 객체인 구는 주위의 구들과 항상 접해 있어야만 하는 상접 (Meet)한 성질과 두개 이상의 다른 구가 동일한 이름을 가질 수 없는 성질을 가진다. 이 성질은 실세계에서 묵시적으로 인지되는 개념이다. 따라서 공간객체의 갱신으로 인해 레이어에 대한 묵시적인 개념이 위배될 경우 무결성 유지가 필요하다. 본 논문에서는 이 레이어에 대한 공간 객체의 무결성을 유지하기 위한 능동적 공간 연산 트리거를 제안한다. 제안한 기법은 레이어에 대한 무결성 제약조건이 위배될 때 수행되며, 동일 레이어에 대한 공간과 비공간 데이터 트리거로 나누어 수행되고, 다른 레이어에 대한 비공간 데이터 트리거를 수행하는 기법이다. 동일한 레이어에 대한 능동적 공간 연산 트리거는 공간객체인 공간 비공간 데이터에 대한 각각 또는 모두에 대한 갱신인지를 구분하여 공간 데이터에 대한 트리거 수행단계와 비공간 데이터에 대한 트리거의 수행단계로 나누어 수행 전략를 결정하여 수행되고, 마지막으로 다른 레이어에 대한 비공간 데이터에 대한 트리거를 수행한다. 능동적 공간 연산 트리거는 상접성을 유지해야 하는 공간 객체들의 의미적 무결성을 위해 각각의 공간과 비공간 데이터에 대하여 3 단계 수행으로 공간 객체에 대한 의미적 무결성 유지와 자동 보정으로 사용자 편의성을 제공한다.

  • PDF

장비점검 일지의 비정형 데이터분석을 통한 고장 대응 효율화 사례 연구 (Unstructured Data Analysis using Equipment Check Ledger: A Case Study in Telecom Domain)

  • 주연진;김유신;정승렬
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.127-135
    • /
    • 2020
  • 비정형 데이터의 수집, 분석 그리고 활용에 대한 필요성이 대두되고 있지만 여전히 비정형 데이터를 효과적으로 활용하지 못하고 있는 실정이다. 본 연구에서는 국내 유수 이동통신 기업의 통신 시설장비 점검 시스템에 기록된 비정형데이터를 분석하여 장비고장 대응과 예방에 적극 활용할 수 있는 기반을 만들고자 하였고, 약 220만 건의 작업일지 데이터를 텍스트 마이닝을 통해 구조화/정형화 하였다. 이를 위해 장비 고장과 관련된 4가지 분석 프레임, 고장인지, 고장원인, 고장대상, 조치결과를 구성하였고 분석 결과로는 크게 3가지의 효율화 방안과 관련한 인사이트를 얻을 수 있었다. 첫 번째로는 신속한 조치를 통한 시간 단축을 도모하고, 두 번째로는 고장장비 Unit 수요를 예측하고, 마지막으로 현장 출동의 최소화를 지원할 수 있을 것으로 기대되었다. 결론적으로, 본 사례연구는 통신시설 장비 고장 대응을 위해 데이터 분석 대상을 정형 데이터뿐만 아니라 장비일지라는 비정형 빅데이터로도 범위를 확장했으며, 이를 분석에 활용하기 위해 처음으로 텍스트 마이닝을 시도를 했다는데 의의를 가진다. 또한 N사는 정형 데이터 뿐 만아니라 년 80만 건씩 축적되던 비정형 데이터의 활용 가치를 확인할 수 있던 기회를 가졌으며, 향후 비정형 데이터의 활용 방안에 대한 발전방향 그리고 추후의 정형 데이터와의 연계 분석 방안 등에 대한 가이드를 확보할 수 있었다.

LSTM과 Bi-LSTM을 사용한 비주기성 시계열 데이터 예측 성능 비교 분석 (Comparative Analysis of Prediction Performance of Aperiodic Time Series Data using LSTM and Bi-LSTM)

  • 이주형;홍준기
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.217-224
    • /
    • 2022
  • 온라인 쇼핑의 대중화로 인해 많은 의류 상품이 온라인 쇼핑을 통해 소비된다. 의류 상품은 다른 상품과 달리 판매량이 일정하지 않고 날씨의 변화에 따라 판매량이 변화하는 특징이 있다. 따라서 의류 상품의 머신 러닝을 적용한 효율적인 재고 관리 시스템에 대한 연구는 매우 중요하다. 본 논문에서는 의류 업체 'A'로부터 실제 의류 상품 판매량 데이터를 수집하고 판매량 데이터와 같은 시계열 데이터의 예측에 많이 활용되는 LSTM(Long Short-Term Memory)과 Bidirectional-LSTM(Bi-LSTM)의 학습에 사용하여 LSTM과 Bi-LSTM의 판매량 예측 효율을 비교 분석하였다. 시뮬레이션 결과를 통해 LSTM 기술 대비 Bi-LSTM은 시뮬레이션 시간은 더 많이 소요되지만 의류 상품 판매량 데이터와 같은 비주기성 시계열 데이터의 예측 정확도가 동일하다는 것을 확인하였다.

라이브 포렌식을 통한 디지털 증거 수집 구현 (Implementation of Digital Evidence Collection through Live Forensics)

  • 이원희;이지훈;안채혁;우수민;신상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.188-189
    • /
    • 2023
  • 본 연구는 사용자가 USB에 내장된 스크립트를 실행하여 실시간으로 활성 및 비활성 데이터를 수집하는 라이브 포렌식 도구의 개발에 관한 것이다. 이 도구는 컴퓨터에 USB를 삽입하고 특정 스크립트를 실행하여 중요한 디지털 증거물을 추출하고 분석하는 기능을 제공한다. 도구는 Linux와 Windows 운영 체제용 32비트 및 64비트 버전으로 제작되었으며, 대량의 데이터 처리 시간과 저장 공간 문제를 해결하여 필요한 특정 데이터만 신속하게 추출할 수 있는 효율적인 방법을 제공한다. 이 도구는 활성 데이터와 비활성 데이터를 수집하며, 활성 데이터에는 레지스터, 네트워크 정보, 프로세스 정보, 사용자 정보 등이 포함되며, 비활성 데이터에는 메타데이터, 시스템 설정 정보, 로그 파일 등이 포함된다. 이 연구에서는 라이브 포렌식 도구의 사용 방법과 수집된 결과, 데이터 분석 방법, 그로 인한 보안 이점에 대해 다루고 있다.

분할 선형 회귀 분선을 통한 IIoT의 빠른 비정상 데이터 탐지 (Fast Detection of Abnormal Data in IIoT with Segmented Linear Regression)

  • 이태호;김민우;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.101-102
    • /
    • 2019
  • 산업용 IoT (IIoT)는 최근들어 제조 시스템의 중요한 구성 요소로 간주된다. IIoT를 통해 시설에서 감지된 데이터를 수집하여 작동 조건을 적절하게 분석하고 처리한다. 여기서 비정상적인 데이터는 전체 시스템의 안전성 및 생산성을 위해 신속하게 탐지되어야한다. 기존 임계 값 기반 방법은 임계 값 미만의 유휴 오류 또는 비정상적인 동작을 감지 할 수 없으므로 IIoT에 적합하지 않다. 본 논문에서는 예측 구간과 우선 순위기반 스케줄링을 이용한 분할 선형 회귀 분석을 기반으로 비정상적인 데이터를 검출하는 새로운 방법을 제안한다. 시뮬레이션 결과 제안한 기법은 비정상적인 데이터 검출 속도에서 임계치, 일반 선형 회귀 또는 FCFS 정책을 사용하는 기존의 기법보다 우수함을 알 수 있었다.

  • PDF