• 제목/요약/키워드: 데이터 집계

검색결과 215건 처리시간 0.031초

통행시간 산정 및 예측을 위한 최적 집계시간간격 결정에 관한 연구 (Determining Optimal Aggregation Interval Size for Travel Time Estimation and Forecasting with Statistical Models)

  • Park, Dong-Joo
    • 대한교통학회지
    • /
    • 제18권3호
    • /
    • pp.55-76
    • /
    • 2000
  • 실시간 통행시간관련자료의 집계시간간격은 보다 신뢰성있는 통행시간정보제공과 교통정보센터의 효율적인 운영을 위해 매우 중요한 요소이다. 그러나 대부분의 기존 VDS 및 TCS교통정보 데이터는 통계학적·공학적 차원에서의 합리적인 연구나 검증없이 경험적 간격으로 집계되고 있다. 본 연구의 목적은 링크 및 교통축(Corridor) 통행시간 산정 및 예측시의 최적 집계 시간간격을 결정할 수 있는 통계학적 모형을 개발하고 실제 도로망에서 수집되는 통행시간자료에 적용하는 것이다 첫째로, 본 연구는 링크 및 교통축 통행시간 산정 및 예측으로 인한 오차를 계량화하는 통계학적 모형을 제시하고, 제시된 모형의 의미를 교통류이론 측면과 통행시간정보 이용자측면에서 살펴보았다. 둘째로, 미국 Texas, Houston의 도시고속도로에서 AVI시스템을 통해 수집된 통행시간자료를 제시된 모형에 적용하였다. 적용결과 링크통행시간 산정을 위한 최적 집계시간간격보다 링크통행시간예측을 위한 최적 집계시간간격이 큰 것으로 나타났으며, 교통축 통행시간 산정 및 예측을 위한 최적 집계시간간격은 교통축을 구성하는 링크간의 상관관계 (Correlation)에 큰 영향을 받는 것으로 분석되었다.

  • PDF

센서 네트워크 환경에서 가상 식별자를 이용한 에너지 효율적인 다중 경로 데이터 라우팅 기법 (An Energy-Efficient Multiple Path Data Routing Scheme Using Virtual Label in Sensor Network)

  • 박준호;여명호;성동욱;권현호;이현정;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제11권7호
    • /
    • pp.70-79
    • /
    • 2011
  • 결함이 발생하는 센서 네트워크 환경에서 데이터 전송의 신뢰도와 집계질의의 정확도를 보장하기 위해 각 센서 노드들에 유일한 비트 식별자를 할당하고, 이를 이용한 다중 경로 라우팅 기법이 제안되었다. 하지만 기존 다중 경로 라우팅 기법은 네트워크 토폴로지 변경 시 발생하는 노드 식별자의 재할당에 따른 높은 갱신비용이 발생한다. 본 논문에서는 데이터의 중복 집계를 방지하는 동시에 식별자 갱신 비용을 줄이는 새로운 라우팅 기법을 제안한다. 제안하는 기법의 우수성을 보이기 위해 시뮬레이션을 통해 기존 기법과 성능을 비교평가 하였다. 그 결과, 제안하는 기법은 네트워크 결함에 따른 복구에 필요한 데이터 전송량을 평균 95% 감소시켰고 단위 질의당 데이터 전송량을 최대 22% 감소시켰다.

데이터 웨어하우스에서 계층화 구조를 이용한 시간 데이터의 지원 (Supporting temporal data using the layered architecture in a Data Warehouse)

  • 신영옥;백두권;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.389-391
    • /
    • 1998
  • 데이터 웨어하우스에서는 시간에 따라 변화되는 데이터를 관리함으로써 좀더 정확하게 요약화된 정보를 제공할 수 있다. 거의 모든 데이터 웨어하우스는 원시 데이터로 관계형 데이터베이스를 사용하지만, 관계형 데이터베이스는 시간 데이터에 대해 실제적인 지원을 하지 않는다. 그러므로 시간 변이 데이터에 대한 정확한 정보를 얻기가 어렵다. 본 논문에서는 이러한 시간 변이 데이터의 지원이 가능한 시간지원 데이터 웨어하우스를 설계하고자 한다. 이를 위해, 기존의 데이터 웨어하우스에서 원시 데이터로 사용하는 관계형 데이터베이스에 시간지원질의 처리 계층을 결합하는 방법을 보이고, 시간지원 데이터의 간격 시간에 대한 요약화 방법으로 시간지원 집계 트리 전략을 소개한다.

OLAP 데이터 큐브에서의 추론통제 프로세스 설계 (Design of an Inference Control Process in OLAP Data Cubes)

  • 이덕성;최인수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.183-193
    • /
    • 2009
  • OLAP 데이터 큐브와 SDB(통계 데이터베이스) 모두 다차원 데이터 무리를 대상으로 하고, 이 데이터 무리의 모든 차원 별로 통계적인 요약처리를 한다는 데에는 공통점이 있으나 그 형성과정은 아주 다르다. SDB는 여러 베이스 데이터를 이용하여 자신이 쓸 베이스 데이터를 만들고 있으나 OLAP 데이터 큐브에서는 베이스 데이터 자체가 직접적으로 사용된다. 다시 말하면 SDB의 베이스 데이터는 머크로 데이터인데 반해 OLAP 데이터 큐브에서의 핵심 큐보이드 데이터는 마이크로 데이터라는 뜻이다. OLAP 데이터 큐브에 측정값을 입주시키는 데에 베이스 테이블을 사용한다. 구체적으로 핵심 큐보이드의 각 셀에 마이크로 데이터를 입주시키는 데에 베이스 테이블의 각 레코드를 사용한다. 그런데 OLAP 데이터 큐브에서는 마이크로 데이터가 사용되는 경우가 태반이기 때문에 베이스 테이블에서의 어떤 레코드는 존재하지 않게 되는 상황이 생길 수도 있게 된다. 그리고 이렇게 되면 핵심 큐보이드의 어떤 셀은 공백으로 남게 되는 것이다. Wang 등은 OLAP 데이터 큐브로부터 기밀 누설을 막을 수 있는 방법을 제안하였는데, 이 방법은 집계함수의 종류에 관계없이 적용시킬 수 있다고 주장하고 있다. 그러나 큐보이드의 어떤 셀 하나라도 공백으로 되어있는 경우는 집계함수의 종류에 관계없이 적용시킬 수 있다는 Wang의 주장이 틀리게 된다는 것을 본 연구에서는 밝히고 있다. 본 연구에서는 Wang의 오류를 없앤 OLAP 데이터 큐브에서의 새로운 추론통제 프로세스를 설계하는 데에 목적을 두고 있다.

영상변화판별 알고리즘을 이용한 NC 가공시간 집계 (Collection of NC Machining Time using Scene Change Detection Algorithm)

  • 고기훈;김보현;최병규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.793-796
    • /
    • 2005
  • 금형공장의 생산 일정관리에 있어서 실제 가공작업에 대한 실적데이터의 집계는 매우 중요하지만, 이러한 작업상황을 기록하는 것에 대해서 현장 작업자는 비협조적이고 반감을 갖고 있는 실정이다. 현장에서는 작업자의 개입없이 CNC 장비의 컨트롤러와의 직접적인 인터페이스를 통해서 신호를 추출하고 자동으로 작업상황을 파악할 수 있는 시스템을 구축하려고 시도하고 있지만, 컨트롤러 메이커마다 다르게 적용해야 하고 많은 비용을 요구한다. 이러한 이유로 본 연구에서는 저가의 PC 카메라를 장비에 설치하여 가공상황에 대한 동영상을 수집하고 영상처리 알고리즘을 적용하여 가공시간을 집계하는 방법을 제안한다. 제안된 방법은 CNC 컨트롤러에 독립적으로 운용되며 저렴하게 시스템을 구축할 수 있는 장점이 있다. 본 연구에서는 무인가공과 유인가공 상황에 시범적으로 적용 및 운영함으로써 시스템의 활용가능성을 살펴보았다.

  • PDF

MOLAP 시스템을 위한 다차원 저장구조의 설계기법 (A Design Method of Storage Structures for MOLAP Systems)

  • 이종학;이성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.130-132
    • /
    • 2005
  • 다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상까지 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.

  • PDF

데이터 웨어하우스의 다차원 온라인 분석처리 시스템을 위한 저장구조의 물리적 설계기법 (A Physical Design Method of Storage Structures for MOLAP Systems of Data Warehouse)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.297-312
    • /
    • 2005
  • 데이터 웨어하우스의 다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 먼저, 균일분포를 갖는 데이터에 대해서 집계 연산처리 성능이 다차원 파일구조상의 질의 영역의 모양과 다차원 파일구조의 도메인 공간을 이루는 페이지 영역의 모양 사이의 유사성에 따라 크게 영향 받음을 보이고, 이러한 특성을 이용하여 다차원 파일구조를 설계함으로써 다차원 온라인 분석처리의 성능을 향상시킨다. 그리고 편중된 분포에 대해서는 질의 영역별로 가중치를 부여한 정규화된 질의 영역의 모양을 이용함으로써 데이터의 분포에 따른 영향을 설계에 반영한다. 또한 본 논문에서는 실험을 통하여 이론적으로 제안한 MOLAP 저장구조의 물리적 설계기법이 실제 환경에서 정확히 동작함을 보인다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상으로 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.

  • PDF

Market Research - 전국 커피자판기 설치 현황, 베일을 벗다

  • 한국자동판매기공업협회
    • 벤딩인더스트리
    • /
    • 제10권2호
    • /
    • pp.27-29
    • /
    • 2010
  • "전국에 설치되어 운영 중인 커피자판기가 몇 대가되나요?" 협회로 이런 문의를 하는 전화들이 가끔씩 걸려 온다. 이렇게 외부에서는 실질적으로 자판기 운영대수를 궁금해 하는 경우가 많다. 하지만 협회에서 내는 통계는 매년 생산량기준으로 집계가 되기 때문에 이런 궁금증을 흡족하게 풀어주지 못했다. 실제 운영 중인 커피자판기의 추정대수 정도만을 이야기 할 수 있었지, 객관적인 데이터를 제공하지 못해 왔다. 이 같은 현상은 전국에 산재해 있는 커피자판기들의 대수를 합산하여 통계를 내는 시스템을 구축하기가 힘들기 때문이다. 국내의 경우 전문 운영업자들의 수도 무척 많은 데다가, 거미줄처럼 연계된 개인 운영자까지 포함을 하면 통계 대상이 엄청 광범위해 진다. 따라서 이들을 대상으로 통계 데이터를 합산하는 일은 거의 불가능에 가깝다. 캔음료자판기의 경우는 그래도 대형 음료업체의 수량 데이터를 제공받으면 객관적인 집계가 가능한 점과는 차이가 있다. 이런 탓에 국내는 커피자판기 운영 통계에 대한 갈증이 컸다. 전국에 몇 대 커피자판기가 운영되는지 지역별 분포는 어떻게 되는지 알고자 하는 수요는 많았지만 정보공급자는 없었다. 이러한 현실에서 금호 '마켓 리서치'에서는 운영 통계에 대한 정보갈증을 해소시키는 데이터를 공개한다. 이번에 공개하는 자료는 전국에 영업 신고된 식품자판기의 전체 통계이다. 본지에서 이미 지난 2009년 여름호에 '서울시 영업신고된 식품자판기 운영 현황'을 분석한 기사를 게재하여 큰 반향을 일으킨바 있다. 하지만 이번에 공개되는 데이터는 전국을 대상으로 해 정보가치가 더 크다. 과연 전국에는 몇 대의 식품자판기가 설치되어 있고, 지역별 어떠한 분포와 특징을 나타내고 있는지를 살펴보기로 하자.

  • PDF

시간지원 데이터 모델 및 집계함수에 관한 연구 (A Study on Temporal Data Models and Aggregate Functions)

  • 이인홍;문홍진;조동영;이완권;조현준
    • 한국정보처리학회논문지
    • /
    • 제4권12호
    • /
    • pp.2947-2959
    • /
    • 1997
  • 시간지원 데이터 모텔은 시간 의미를 데이터 모델에 추가하여 시간에 따라 변화된 정보를 처리할 수 있는 데이터 모델이다. 시간지원 데이터 모델은 실세계에서 사건이 발생한 시간인 유효시간을 지원하는 데이터 모델과 데이터가 수록된 시간을 지원하는 거래시간 데이터 모델 그리고 거래시간과 유효시간을 모두 지원하는 이원시간 데이터 모델이 있다. 대부분의 시간지원 데이터 모델은 관계형 모델을 확장하여 시간지원 데이터를 처리할 수 있도록 설계된다. 시간지원 데이터 모델의 두부류는 시간을 결합하는 단위에 따라 튜플 타임 스탬프와 속성 타임 스탬프의 두 가지 형식이 있다. 본 논문에서는 기존의 데이터 모델에서 시간추가를 위한 기본적인 시간 개념과 시간지원 데이터 모델을 위한 고려사항을 설명하고 시간지원 데이터 모텔을 지원시간에 따라 비교하였다. 또한 유효시간이 지원되는 시간 지원 집계에 적합한 데이터 모델을 제안하고 그 성능을 분석 하였다.

  • PDF

지식 표현 방식을 이용한 근사 질의응답 기법 (An Approximate Query Answering Method using a Knowledge Representation Approach)

  • 이선영;이종연
    • 한국산학기술학회논문지
    • /
    • 제12권8호
    • /
    • pp.3689-3696
    • /
    • 2011
  • 의사결정 지원시스템에서 작업자들은 대량의 데이터 집계 연산을 요구하며, 데이터에 대한 정확한 응답보다는 경향 분석에 더 많은 관심을 가진다. 그러므로 정확한 응답보다 빠른 근사 질의응답을 제공하는 것이 필요하며 그것을 실현하기 위한 근사질의 응답 기법의 연구가 필요하다. 따라서 본 논문에서는 기존 연구들의 단점을 보안하고 근사 응답의 정확성을 향상시킬 수 있는 Fuzzy C-Means (FCM) 클러스터링 기반 Adaptive Neuro-Fuzzy Inference System (ANFIS)을 이용한 근사 질의응답 기법을 제안한다. FCM-ANFIS을 이용한 근사 질의응답 기법은 다차원 데이터의 지식 표현 모델을 생성함으로써 거대한 다차원 데이터 큐브에 직접적인 접근 없이 집계 질의 수행이 가능하다. 비교실험을 통하여 제안된 기법이 기존의 NMF 기법보다 근사 질의응답의 정확성이 향상되었음을 확인한다.