• 제목/요약/키워드: FWIS

검색결과 4건 처리시간 0.021초

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.

농업기상활용 정보기술 현황 (State of Information Technology and Its Application in Agricultural Meteorology)

  • Byong-Lyol Lee;Dong-Il Lee
    • 한국농림기상학회지
    • /
    • 제6권2호
    • /
    • pp.118-126
    • /
    • 2004
  • 그리드는 고성능컴퓨팅을 위한 슈퍼인터넷이라는 신 IT기술로, 슈퍼컴, 저장매체, 첨단장비 및 협업환경 등 첨단 자원의 전 세계에 걸친 가상집합체라 할 수 있다. 그리드는 CPU, 저장시스템, 통신시스템, 실시간자료원과 장비는 물론 공동협력 등 지역적, 기관간 분산되어 있는 전산자원을 한 곳에 모을 수 있을 것으로 기대된다. 그리드라는 말은 90년대 중반 첨단 과학 및 공학기술을 위한 분산전산하부구조로서 제안된 용어이다. 전산그리드는 사용자가 다수의 고성능/고정밀 자원을 접속/통합할 수 있도록 지원하는 하부구조를 의미하며, 보다 공적으로는 그리드는 개인, 기관 및 자원의 동적 집합체간 가상기구로서, 유연하고, 안전하며 조정이 가능한 자원공유를 위한 하부구조라 정의되고 있다. 이와 같이 그리드는 미래 농업기상서비스에 적합한 차세대 인터넷기술로 매우 유망한 IT기술인 것이다. 그리드는 특히 전산자원 부족이 심각한 개도국의 농업기상서비스 개선을 위해 필수적인 고성능 컴퓨터자원, 고용량 가상저장매체, 효율적인 실시간 자료교환을 위한 자원 공유에 크게 기여할 수 있을 것이다. 여기서는 WMO 차세대 기상정보시스템(FWIS) 일환으로 기존 아시아 농업기상정보망과 연계된 CAgM-Grid의 설립을 제안 추진하고 있다.

지역농업기상지원을 위한 정보화기술 전망 및 활용 (Prospect of Information Technology and Its Application to Regional Agricultural Meteorology)

  • Lee, Byong-Lyol
    • 한국농림기상학회:학술대회논문집
    • /
    • 한국농림기상학회 2003년도 춘계 학술발표논문집
    • /
    • pp.189-201
    • /
    • 2003
  • Grid is a new Information Technology (IT) concept of "super Internet" for high-performance computing: worldwide collections of high-end resources - such as supercomputers, storage, advanced instruments and immerse environments. The Grid is expected to bring together geographically and organizationally dispersed computational resources, such as CPUs, storage systems, communication systems, real-time data sources and instruments, and human collaborators. The term "the Grid" was coined in the mid l990s to denote a proposed distributed computing infrastructure for advanced science and engineering. The term computational Grids refers to infrastructures aimed at allowing users to access and/or aggregate potentially large numbers of powerful and sophisticated resources. More formally, Grids are defined as infrastructure allowing flexible, secure, and coordinated resource sharing among dynamic collections of individuals, institutions and resources referred to as virtual Organizations. GRID is an emerging IT as a kind of next generation Internet technology which will fit very well with Agrometeorological services in the future. I believe that it would contribute to the resource sharing in AgroMeteorology by providing super computing power, virtual storage, and efficient data exchanges, especially for developing countries that are suffering from the lack of resources for their agmet services at national level. Thus, the establishment of CAgM-GRID based on existing RAMINSII is proposed as a part of FWIS of WMO.part of FWIS of WMO.

  • PDF

3차원 해저면 탄성파 탐사 자료에 대한 2차원/3차원 음향 전파형역산 비교 (Comparison of the 2D/3D Acoustic Full-waveform Inversions of 3D Ocean-bottom Seismic Data)

  • 노희찬;박세은;지형근;김석한;이향월;오주원
    • 지구물리와물리탐사
    • /
    • 제25권4호
    • /
    • pp.203-213
    • /
    • 2022
  • 탄성파 탐사 자료의 영상화를 통해 지층의 구조를 파악하기 위해서는 지하 매질의 탄성파 속도 정보가 필수적이다. 지하 매질의 속도를 추정하기 위해 전파형역산(Full waveform inversion) 기술이 주목을 받고 있지만 3차원 전파형역산은 방대한 컴퓨터 자원과 계산 시간이 요구된다. 본 연구에서는 3차원 음향 전파형역산과 2차원 음향 전파형역산의 계산 성능과 정확성을 비교하고, 회절각 필터링 기술을 이용한 주파수영역 2차원 전파형역산을 통해 2차원 근사의 한계점을 일부 보완할 수 있음을 확인한다. 큰 반사각도의 성분만을 이용하는 회절각 필터링 기술을 적용하여, 3차원 탐사자료를 통해 2차원으로 근사할 때 문제가 될 수 있는 2차원 단면을 벗어난 지역으로부터의 반사파의 영향을 줄이고, 3차원 전파형역산과 구조보정에 필요한 장파장 속도구조를 구축할 수 있을 것으로 기대한다.