• Title/Summary/Keyword: 데이터 평균기법

Search Result 954, Processing Time 0.046 seconds

Hot Data Identification based on Naive Bayes Classifier (나이브 베이즈 분류 기반의 핫 데이터 구분 기법)

  • Lee, Hyerim;Yun, Yibin;Park, Dongchul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.721-723
    • /
    • 2022
  • 최근 낸드 플래시 메모리 기반의 Solid State Drive(SSD)가 기존 Hard Disk Drive(HDD)를 대신하여 개인용과 산업용으로도 널리 쓰이고 있다. 핫 데이터 구분 기법은 이러한 SSD 의 성능과 수명에 중요한 역할을 하는 Garbage Collection(GC)과 Wear Leveling(WL) 기술의 기반이 된다. 본 논문에서는 핫 데이터를 예측하기 위한 나이브 베이즈 분류 기반의 새로운 핫 데이터 구분 기법을 제안한다. 제안 기법은 워크로드 액세스 패턴의 학습 단계인 초기 단계와 실제 운영 단계를 통해 다시 액세스 될 확률이 높은 데이터를 그렇지 않은 데이터와 효과적으로 구분한다. 다양한 실제 trace 기반 실험을 통해 본 제안 기법이 기존 대표적인 기법보다 평균 19.3% 높은 성능을 확인했다.

An Energy Awareness Congestion Control scheme based on Genetic Algorithms in Wireless Sensor Networks (유전자 알고리즘 기반의 에너지 인식 트래픽 분산 기법)

  • Kim, MiKyoung;Park, JunHo;Seong, DongOok;Yoo, JaeSoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.979-982
    • /
    • 2010
  • 최근 한정된 에너지를 기반으로 동작하는 센서 네트워크 환경에서 에너지를 효율적으로 사용하기 위한 많은 연구가 이루어지고 있다. 대표적인 연구로써 이벤트 발생 여부에 따른 노드의 가변 센싱 및 전송 기법의 경우, 특정 노드에서 네트워크 혼잡을 야기하여 전송 패킷의 손실 및 전송 모듈의 과다 사용으로 인한 네트워크의 수명이 감소하게 된다. 이를 해결하기 위해, 유전자 알고리즘을 기반으로 네트워크 패킷을 주변 노드로 분산시키는 TARP 가 제안되었다. 하지만 TARP 의 경우, 유전자 알고리즘의 핵심 단계인 적합도 평가에서 사용되는 적합도 함수에 인접 노드의 평균 데이터 전송량 및 데이터 분산만을 고려하여 트래픽을 분산하기 때문에, 전체 네트워크 수명에 대한 추가적인 고려가 필요하다. 이를 해결하기 위해 본 논문에서는 유전자 알고리즘 기반의 에너지 인식 트래픽 분산 기법을 제안한다. 제안하는 기법은 적합도 평가에서 잔여 에너지량 및 단일 노드의 데이터 전송량을 추가적으로 고려함으로써, 보다 효율적인 트래픽 분산을 수행하여 네트워크 수명을 증가시킨다. 제안하는 기법의 우수성을 보이기 위해 시뮬레이션을 통해 기존의 트래픽 분산 기법(TARP)과 제안하는 기법과의 성능을 비교하였다. 그 결과 기존 기법에 비해 평균 27% 이상의 네트워크 수명의 향상을 보였다.

intrusion detection using training data with intrusion instances (침입 사례를 포함하는 훈련 데이터를 이용한 침입 탐지)

  • 이재흥;박용수;이영기;조유근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.383-385
    • /
    • 2003
  • 침입 탐지 시스템에 이상 탐지 기법(anormal detection)을 적용할 때 정상적인 시스템호출 순서에 대한 훈련이 필요하다. 이 때 발생하는 가장 큰 문제점중 하나는 침입 없는 훈련 데이터의 확보이다. 훈련 데이터에 침입이 있으면 이 침입을 정상으로 간주해서 이후에 같은 침입이 일어나도 이를 탐지해 내지 못하기 때문이다. 하지만, 침입 없는 훈련 데이터를 얻는 것은 매우 어렵다. 본 논문에서는 훈련 데이터에 침입이 포함되어 있더라도 효과적으로 침입을 탐지할 수 있는 시스템 호출 기반 침입 탐지 기법을 제안한다. 제안 기법은 훈련 데이터에 침입이 존재할 경우 침입 부분에서 빈도가 매우 적은 데이터들이 연속적으로 나타나는 성질을 이용한다. 이를 위해 훈련 데이터를 일정 개수씩 블록으로 묶은 뒤 평균 빈도를 계산해서 그 값이 임계치보다 작은 경우 이를 침입 데이터로 간주하여 훈련 데이터에서 제외하는 방법을 사용하였다. 실험 결과 블록 크기를 적절하게 잡았을 경우 기존의 Eskin 기법보다 향상된 결과를 얻을 수 있었다.

  • PDF

Subnet Selection Scheme based on probability to enhance process speed of Big Data (빅 데이터의 처리속도 향상을 위한 확률기반 서브넷 선택 기법)

  • Jeong, Yoon-Su;Kim, Yong-Tae;Park, Gil-Cheol
    • Journal of Digital Convergence
    • /
    • v.13 no.9
    • /
    • pp.201-208
    • /
    • 2015
  • With services such as SNS and facebook, Big Data popularize the use of small size such as micro blogs are increasing. However, the problem of accuracy and computational cost of the search result of big data of a small size is unresolved. In this paper, we propose a subnet selection techniques based probability to improve the browsing speed of the small size of the text information from big data environments, such as micro-blogs. The proposed method is to configure the subnets to give to the attribute information of the data increased the probability data search speed. In addition, the proposed method improves the accessibility of the data by processing a pair of the connection information between the probability of the data constituting the subnet to easily access the distributed data. Experimental results showed the proposed method is 6.8% higher detection rates than CELF algorithm, the average processing time was reduced by 8.2%.

A High-efficiency Data Compression Scheme in Wireless Multimedia Sensor Networks (무선 멀티미디어 센서 네트워크에서 고효율 데이터 압축 기법)

  • Park, Junho;Ryu, Eunkyung;Son, Ingook;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.9-10
    • /
    • 2013
  • 최근 무선 센서 네트워크는 멀티미디어 센서 노드에서 비디오나 이미지와 같은 멀티미디어 데이터 수집을 바탕으로 고품질의 모니터링을 수행한다. 그러나 멀티미디어 데이터는 크기가 매우 크므로 데이터 전송 과정에서 특정 노드에 과도한 에너지 소모를 야기하여 전체 네트워크 수명이 감소하는 문제점이 있다. 이러한 점을 고려하여, 본 논문에서는 무선 멀티미디어 센서 네트워크에서 고효율 데이터 압축 기법을 제안한다. 제안하는 기법에서는 멀티미디어 데이터의 특성을 고려한 낮은 순위 비트 데이터 삭제 기반의 1단계 압축 및 중국인의 나머지 정리 기반의 2단계 압축으로 구성된 다중 압축을 수행함으로써 데이터 크기를 감소시킨다. 성능평가 결과, 기존 압축 기법에 비해 데이터 전송률이 평균 약 56% 감소하였다.

  • PDF

An Approach to Automatically Generating Infobox for Wikipedia in Cross-languages through Translation and Webgraph (번역과 웹그래프를 활용한 언어 간 위키피디아 인포박스 자동생성 기법)

  • Kim, Eun-Kyung;Choi, DongHyun;Go, Eun-Bi;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.9-15
    • /
    • 2011
  • 여러 언어로 작성되는 위키피디아의 경우 언어 간에 등록되어 있는 정보의 양과 내용이 달라 언어 간 정보를 상호 추출하고 서로 통합하는 연구에 대한 관심이 증가하고 있다. 특히, 위키피디아의 요약본으로써 의미가 있는 인포박스는 위키피디아 아티클에 존재하는 구조화된 정보 중 가장 근간이 되는 정보로, 본 논문에서는 위키피디아에 존재하는 인포박스를 1)소스 언어 자원으로부터 획득하여 타겟 언어로 번역하고, 2)번역된 결과물과 웹그래프를 이용하여 타겟 언어 데이터에서 획득하는 정보와 결합하는 과정을 통해 자동으로 인포박스를 생성하는 기법에 대하여 설명한다. 웹그래프는 위키피디아에 존재하는 링크 구조를 통해 서로 다른 두 용어간의 관련도를 측정하여 인포박스에 추가될 내용을 파악하는데 사용한다. 본 논문의 기법은 언어 간 인포박스를 생성하는 측면에서, 영어 인포박스 데이터를 입력으로 하여 한국어 인포박스 데이터를 생성하는 방식으로 진행하였다. 평가를 위하여 기존 한국어에 실제 존재하는 인포박스 데이터와 비교 실험하는 방식을 사용하여 평균적으로 40%의 정확률과 83%의 재현율을 나타내었다. 하지만, 기존 한국어에 존재하는 인포박스 데이터의 내용이 인포박스에 포함될 완전한 데이터를 모두 포함했다고 볼 수 없으므로 본 논문에서 제안하는 수행한 실험의 정확률이 상대적으로 낮게 나온 것으로 분석되었다. 실제 사람이 수작업으로 새롭게 생성된 인포박스 데이터의 적합성을 판별한 경우 평균 76%의 정확률과 91%의 재현율을 나타내었다.

  • PDF

A Study on Efficient Management of RAID Level 5 Cache in OLTP Environment under Linux Operating System (리눅스 운영체제하의 OLTP환경에서 RAID 레벨 5의 효율적인 캐쉬 운영 방안에 대한 연구)

  • 송자영;장태무
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.3-5
    • /
    • 2000
  • RAID 레벨 5는 쓰기 시에 패리티 갱신을 위한 4번의 디스크 접근으로 인하여 OLTP와 같이 상대적으로 빈번한 디스크 접근을 가지고 데이터 크기가 작으며 쓰기의 횟수가 많은 작업환경에서 성능이 떨어지게 된다. 데이터와 패리티에 대한 캐싱은 OLTP환경에서의 쓰기에 대한 문제를 해결하기 위한 기법이다. 본 논문에서는 리눅스 운영체제의 파일 데이터 구조에 변화를 주고, 커널에서 얻어진 정보를 디스크 캐쉬의 운영에 이용한다. 스트라입 크기(G)를 가지는 RAID 레벌 5에서 패리티 캐쉬의 크기가 전체 캐쉬 크기의 1/G 이하 일 경우 데이터 패리티 캐쉬 크기 변화에 영향을 받지 않고 캐쉬의 그룹 단위 운영과 그에 따른 패리티의 미리 읽기를 가능하게 하여 패리티에 대한 추가적인 읽기를 최소화하는 기법을 제안한다. 본 논문의 실험 결과는 초당 디스크에 도착하는 평균 디스크 접근 요구 개수에 변화를 주어 시뮬레이션 방법으로 입증하였으며, OLTP 환경에서 데이터와 패리티 캐쉬를 독립적으로 운영하는 일반적인 캐쉬 운영 방법에 비해 평균 응답시간을 단축시킬 수 있음을 알 수 있다.

  • PDF

A Study on Improvement To The Key Parameter For High Real Capacity Of Lossless Data Hiding (무손실 데이터 은닉의 삽입 용량 증진을 위한 키 파라미터 개선 기법)

  • Jeong, Hee;Kang, Ji-Hong;Choe, Yoon-Sik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.219-221
    • /
    • 2012
  • 본 논문은 무손실 데이터 은닉 기법중 주변 화소의 통계적 특성을 이용하여 어떠한 추가적인 맵 정보 없이 키 파라미터로써 원본 영상과 삽입한 데이터를 정확히 분리해 내는 기법이다. 오버/언더 플로우에 더 강한 데이터 은닉을 위해, 데이터 삽입에 대한 변수로 작용할 수 있는 주변 화소값들의 범위 뿐만 아니라 주변 화소값들의 표준 편차와 평균값을 모두 키 파라미터의 인자로 사용하여 화소값이 낮은, 즉 영상의 밝기가 어두운 부분에 더 많은 데이터를 삽입할 수 있는 기법을 제안하였고, 실험을 통하여 기존 기법 대비 평균 2배 이상의 삽입 용량이 증진된 것을 확인하였다.

  • PDF

A Hybrid Index Allocation Scheme Considering both Energy Efficiency and Data Access Frequencies in Mobile Broadcast Environments (브로드캐스트환경에서 에너지효율과 데이터접근빈도를 동시에 고려한 하이브리드 인덱스배 치기법)

  • Park JieHyun;Park KwangJin;Kang Sang-Won;Kim Jongwan;Im SeokJin;Hwang Chong-Sun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.46-48
    • /
    • 2005
  • 이동 컴퓨팅 환경에서 다수의 이동 클라이언트들에게 데이터를 전달할 때는 클라이언트들의 동시 데이터 접근을 지원하는 브로드캐스트 기법을 사용하면 무선 채널 대역폭의 협소함과 클라이언트 측의 에너지 제약과 같은 단점을 해결할 수 있다. 기존 기법들은 클라이언트의 데이터에 대한 접근빈도(access frequencies)와 클라이언트의 에너지 효율(energy efficiency)을 동시에 고려하지 않았다. 따라서 원하는 데이터가 올 때까지 계속해서 채널을 들어야 함으로 인해 에너지 소비를 많이 하거나, 데이터를 얻을 때까지 추가한 많은 양의 정보에 따른 지연이 발생하는 단점이 있다. 본 논문에서는 클라이언트의 에너지 절약을 위한 tuning time을 최소화하고 실제 데이터를 얻을 때까지 소요되는 access time의 효율을 높이기 위해 데이터의 접근빈도와 에너지 효율을 동시에 고려하는 HIDAF: Hybrid Index considering Data Access Frequencies 기법을 제한한다. 제안하는 기법은 트리기반 기법과 해싱기반 기법을 함께 적용하여 구성한 인덱스를 브로드캐스트 주기에 배치한다. HIDAF 기법은 데이터 접근빈도를 고려한 트리기반 인덱스를 배치함으로써 데이터를 얻기 위한 클라이언트들의 평균 access time을 줄일 수 있고, 이러한 인덱스에 해싱기반 기법을 추가함으로써 클라이언트의 에너지 효율을 최소화하는 새로운 브로드캐스팅 기법이다. HIDAF 기법은 브로드캐스트 추기에 데이터의 접근빈도를 고려한 인덱스를 교차로 추가하여 핫 데이터에 대한 클라이언트들의 access time을 줄임으로써 전체 사용자에 대한 평균 access time을 최소화하는 동시에 클라이언트들의 제한된 에너지 소비를 최소화하는데 목적이 있다. 제안기법에 대한 평가는 수학적 분석을 통해 HIDAF 기법과 기존의 브로드캐스트 기법의 성능을 비교 분석한다.하였으나 사료효율은 증진시켰으며, 후자(사양, 사료)와의 상호작용은 나타나지 않았다. 이상의 결과는 거세비육돈에서 1) androgen과 estrogen은 공히 자발적인 사료섭취와 등지방 침적을 억제하고 IGF-I 분비를 증가시키며, 2) 성선스테로이드호르몬의 이 같은 성장에 미치는 효과의 일부는 IGF-I을 통해 매개될 수도 있을을 시사한다. 약 $70 {\~} 90\%$의 phenoxyethanol이 유상에 존재하였다. 또한, 미생물에 대한 항균력도 phenoxyethanol이 수상에 많이 존재할수록 증가하는 경향을 나타내었다. 따라서, 제형 내 oil tomposition을 변화시킴으로써 phenoxyethanol의 사용량을 줄일 수 있을 뿐만 아니라, 피부 투과를 감소시켜 보다 피부 자극이 적은 저자극 방부시스템 개발이 가능하리라 보여 진다. 첨가하여 제조한 curd yoghurt는 저장성과 관능적인 면에서 우수한 상품적 가치가 인정되는 새로운 기능성 신제품의 개발에 기여할 수 있을 것으로 사료되었다. 여자의 경우 0.8이상이 되어서 심혈관계 질환의 위험 범위에 속하는 수준이었다. 삼두근의 두겹 두께는 남녀 각각 $20.2\pm8.58cm,\;22.2\pm4.40mm$으로 남녀간에 유의한 차이는 없었다. 조사대상자의 식습관 상태는 전체 대상자의 $84.4\%$가 대부분이 하루 세끼 식사를 규칙적으로 하고 있었으며 식사속도는 허겁지겁 빨리 섭취하는 경우가 남자는 $31.0\%$, 여자는 $21.4\%$로 나타났고 이들을 제외한 나머지 사람들은 보통 속도 혹은 충분한 시간을 가지고 식사를 하였다. 평소 식사량은 조금 적게 혹은 적당하게 섭취하는 사람이 대부분이었으며 남자가 여자보다는 배부르게 먹는 경 향이 유의적으로 높았다(p<0.05). 식사는 혼자 하는 경우가 남자

  • PDF

Fault Tolerant Data Aggregation for Reliable Data Gathering in Wireless Sensor Networks (무선센서네트워크에서 신뢰성있는 데이터수집을 위한 고장감내형 데이터 병합 기법)

  • Baek, Jang-Woon;Nam, Young-Jin;Jung, Seung-Wan;Seo, Dae-Wha
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.35 no.9B
    • /
    • pp.1295-1304
    • /
    • 2010
  • This paper proposes a fault-tolerant data aggregation which provides energy efficient and reliable data collection in wireless sensor networks. The traditional aggregation scheme does not provide the countermeasure to packet loss or the countermeasure scheme requires a large amount of energy. The proposed scheme applies caching and re-transmission based on the track topology to the adaptive timeout scheduling. The proposed scheme uses a single-path routing based on the traditional tree topology at normal, which reduces the dissipated energy in sensor nodes without any countermeasure against packet loss. The proposed scheme, however, retransmits the lost packet using track topology under event occurrences in order to fulfill more accurate data aggregation. Extensive simulation work under various workloads has revealed that the proposed scheme decrease by 8% in terms of the dissipated energy and enhances data accuracy 41% when the potential of event occurrence exists as compared with TAG data aggregation. And the proposed scheme decrease by 53% in terms of the dissipated energy and shows a similar performance in data accuracy when the potential of event occurrence exists as compared with PERLA data aggregation.