• Title/Summary/Keyword: 집계 분석

Search Result 379, Processing Time 0.031 seconds

Data Mining Technology for Application in Humanistic Computing (인문전산학 활용을 위한 데이터마이닝기법)

  • Kwak, Ho-Hyung;Bang, Hye-Ja
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.593-596
    • /
    • 2005
  • 데이터마이닝은 대량의 실제 데이터로부터 이전에 잘 알려지지는 않았지만 묵시적이고 잠재적으로 유용한 정보를 추출하는 작업으로, 본 논문은 최근 인문학 정보 자료가 전산화되고 있는 가운데 대량의 정보와 특정 체계를 갖춘 ‘조선왕조실록’ 전산자료를 분석하고 기존의 단순한 정보 검색이 아닌 데이터마이닝 기법을 적용한 상세하고 예측가능 한 정보자료 추출법을 제시한다. 먼저 텍스트화 되어 있는 컨텐츠를 형태소분석기법을 사용하여 색인어를 추출하고 집계를 낸다. 질의어와 유관한 색인어의 군집정도와 출현시점을 분석하는데, 사용된 마이닝 기법은 연관규칙분석과 클러스터링 분석기법이다. 최종 결과치는 기존의 인문학연구 결과물과 비교하여 그 정확도를 분석해 보인다.

  • PDF

한국과 미국의 이자율 스왑시장에서의 정보 전달

  • Im, Sang-Gyu
    • The Korean Journal of Financial Studies
    • /
    • v.13 no.1
    • /
    • pp.111-131
    • /
    • 2007
  • 본 연구에서는 한국과 미국 두 국가에 있어 이자율 스왑시장간의 정보전달 메커니즘에 대해 분석하였다. 이를 위하여 데이터로 2003년 초부터 2006년 말까지 4년간 Bloomberg에서 집계된 3년물, 5년물, 10년물 이자율 스왑금리를 사용하였으며, 메커니즘의 동태 분석은 VAR 모형을 사용하였다. 분석 결과, 그랜저 인과관계 검정, 충격반응함수 분석 및 분산분해 분석 모두 결과적으로 미국 이자율 스왑시장의 정보가 국내 이자율 스왑시장에 상당한 영향력을 가진다는 사실을 알 수 있었다. 또한 이러한 미국 시장의 국내 시장으로의 정보의 전이 현상은 3년물, 5년물, 10년물 이자율 스왑에 같이 나타나는 현상으로 스왑계약 기간에 상관없음이 관측되었다. 한편, 충격반응함수 분석 결과, 미국의 이자율 스왑시장의 충격은 국내 이자율 스왑시장에 다음 날 바로 유의한 영향을 주는 것으로 나타났으며 그 충격은 2일간 지속되었다. 반면 국내 이자율 스왑시장의 정보는 미국 시장에 별 영향력을 발휘하지 못했다.

  • PDF

A Storage Scheme of Health Data Stream for Multidimensional Analysis (건강 스트림 데이터의 다차원적 분석을 위한 저장 구조)

  • Shin, Hea-Won;Lim, Yoon-Sun;Kim, Myung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.81-84
    • /
    • 2005
  • 유비쿼터스 의료 기술이 본격화되면서 센서 네트워크를 통해 환자의 건강 관련 데이터 스트림을 수집하여 위험상황을 탐지하고 지속적인 건강 상태를 모니터링할 수 있게 되었다. 그러나 방대한 양의 스트림 데이터로부터 의미 있는 데이터를 효과적으로 찾아내기 위해서는 실시간으로 데이터의 갱신과 집계 연산이 가능해야 하고 데이터의 압축이 효율적으로 처리 될 수 있는 다차원 저장구조가 필요하다. 기존의 다차원 데이터 분석 도구인 OLAP 큐브 저장구조는 실시간 업데이트가 힘들고, 스트림 데이터 저장 구조인 DSMS들은 다차원 데이터 분석이 용이하지 않다. 이에 본 연구에서는 건강 스트림 데이터의 특징과 질의를 분석하고, 이러한 스트림 데이터에 적합한 저장구조의 요건을 제시하였다. 또한 점진적 갱신이 가능하고, 대용량 데이터를 시간 차원으로 압축, 삭제하기 용이하며 실시간에 분석 데이터 구축이 가능한 저장구조를 제안하고 그 효율성을 보였다.

  • PDF

A Study on Relationship Analysis Between Safety Performance and Business Performance (기업의 안전성과와 경영성과의 관계분석에 관한 연구)

  • 권희봉;이창호
    • Proceedings of the Safety Management and Science Conference
    • /
    • 2001.11a
    • /
    • pp.187-191
    • /
    • 2001
  • 본 논문의 목적은 안전성과와 경영성과의 영향관계를 체계적으로 설명할 수 있는 모형을 개발하고, 근로자수 300인 이상인 기업 43개와 300인 미만인 30개 기업을 구분해서 개발한 모형을 실증적으로 분석함으로써 모델의 타당성을 분석하는데 있다. 안전성과에 대한 변수는 노동부산하의 한국산업안전공단에서 집계한 재해자 수와 근로손실일 수를 선정하였으며, 경영성과에 대한 자료는 (주)한국신용정보와 (주)매일경제에서 출간하는 상장기업분석자료를 근거로 하여 1인당매출액을 선정하고 조절변수로 사용된 노무비, 경비, 부채비율, 수출비중을 업계평균에 비해 상대적으로 높고 낮은 정도를 높은 기업은 1, 낮은 기업은 0의 값을 지정하여 실증분석을 실시하였다. 이를 통하여 기업의 특성요인들에 따라 안전성과가 경영성과에 미치는 영향이 다르다는 본 연구의 이론적 모델은 근로자 수가 300인 이상인 국내 대기업의 경우에는 그 타당성을 지닌다고 볼 수 있었다.

  • PDF

Prioritization of Flood Restoration Projects by Administrative Districts (행정구역별 치수사업의 우선순위 결정)

  • Kang, Seongkyu;Choi, Si Jung;Lee, Dong Ryul
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.470-470
    • /
    • 2018
  • 본 연구는 2014년 부산지역에서 발생한 집중호우에 따른 피해상황을 읍 면 동 단위의 행정구역에 대해 조사하고, 각 행정구역별 수해복구사업의 우선순위를 결정 할 수 있는 방법을 모색하는 것을 목표로 한다. 피해현황은 인명피해(사망, 이재민 수), 건물 및 선박, 농경지 침수에 의한 피해, 공공시설물에 대한 피해를 조사하였다. 또한 피해 요인별 피해액을 집계하여 수해복구사업의 평가기준으로 이용하였다. 사업의 경제성은 B/C분석 결과를 통해 반영하였다. 각 행정구역에 대한 우선순위는 다기준분석 중 PROMETHEE, ELECTRE 방법으로 분석하였고 표준화 방식은 T-Score방식을, 가중치는 엔트로피 방식으로 결정하여 분석에 반영하였다. 본 연구에서는 실제 발생한 호우에 대한 피해복구사업에 적용하여 검증을 시도하였으나, 향후 치수사업의 다양한 대안을 선정하고 우선순위를 결정하여 실제 도시개발 및 정비 사업 등으로 분야를 확장할 수 있을 것으로 기대한다.

  • PDF

Development of Structured/Unstructured data-based Industry Evaluation Information Analysis and Visualization Service (정형/비정형 데이터 기반 산업 평가 정보 분석 및 시각화 서비스 구현)

  • Kim, Kyungwon;Chung, Seunggyeong;Cho, Daekeun;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.177-179
    • /
    • 2018
  • 기존 산업평가 방법은 산업별로 분류된 기업의 재무, 비재무 관련 정형 데이터를 기반으로 통계적 기법을 이용하여 각 산업을 평가하고 있다. 이러한 정형 데이터 기반의 산업 평가 방법은 산업별 재무 정보의 집계 및 통계에 오랜 시간이 소요된다. 따라서, 현재 시장 상황을 반영하기 어려운 현실이다. 최근에는 빠르게 변화하는 산업 환경을 반영하기 위해 뉴스 기사와 같은 비정형 데이터를 통해 산업 트랜드를 분석하기 위한 연구가 이루어 지고 있다. 이에, 본 논문에서는 실시간으로 변화하는 산업 트렌드를 반영하여 적시에 산업 분석 정보를 제공하기 위해 정형/비정형 데이터 기반의 산업평가 정보 분석 엔진을 구현하고, 산업별로 분석된 산업평가 정보를 활용하여 사용자가 직관적인 판단을 할 수 있도록 산업평가 정보 시각화 서비스를 제안한다.

  • PDF

A Web-Dashboard Application for Resource Management (자원관리를 위한 동적 웹대시보드 애플리케이션)

  • Shin, B.S.
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.642-644
    • /
    • 2022
  • In this paper, we propose a dynamic Web-Dashboard application so that resource information can be accessed anytime, anywhere, and management efficiency improvement analysis through big data analysis using various progressive analysis functions. It provides visualization and analytics to provide rich analytical insights to track resource location, predict repurchase duration, or find cost savings and efficiencies.

  • PDF

Estimation of Representative Area-Level Concentrations of Particulate Matter(PM10) in Seoul, Korea (미세먼지(PM10)의 지역적 대푯값 산정 방법에 관한 연구 - 서울특별시를 대상으로)

  • SONG, In-Sang;KIM, Sun-Young
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.19 no.4
    • /
    • pp.118-129
    • /
    • 2016
  • Many epidemiological studies, relying on administrative air pollution monitoring data, have reported the association between particulate matter ($PM_{10}$) air pollution and human health. These monitoring data were collected at a limited number of fixed sites, whereas government-generated health data are aggregated at the area level. To link these two data types for assessing health effects, it is necessary to estimate area-level concentrations of $PM_{10}$. In this study, we estimated district (Gu)-level $PM_{10}$ concentrations using a previously developed pointwise exposure prediction model for $PM_{10}$ and three types of point locations in Seoul, Korea. These points included 16,230 centroids of the largest census output residential areas, 422 community service centers, and 610 centroids on the 1km grid. After creating three types of points, we predicted $PM_{10}$ annual average concentrations at all locations and calculated Gu averages of predicted $PM_{10}$ concentrations as representative Gu-estimates. Then, we compared estimates to each other and to measurements. Prediction-based Gu-level estimates showed higher correlations with measurement-based estimates as prediction locations became more population representative ($R^2=0.06-0.59$). Among the three estimates, grid-based estimates gave lowest correlations compared to the other two(0.35-0.47). This study provides an approach for estimating area-level air pollution concentrations and assesses air pollution health effects using national-scale administrative health data.

Development of BIM Templates for Vest-Pocket Park Landscape Design (소공원의 조경설계를 위한 BIM 템플릿 개발)

  • Seo, Young-hoon;Kim, Dong-pil;Moon, Ho-Gyeong
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.44 no.1
    • /
    • pp.40-50
    • /
    • 2016
  • A BIM, which is being applied actively to the construction and civil construction industries, is a technology that can maximize efficiency of various sectors from initial planning and design, construction, and maintenance, to demolition; however, it is in the introductory phase in the field of domestic landscaping. In order to introduce and promote BIM in the field of landscape design, this study developed a prototype of a library and template and analyzed the performance of trial application. For the development of a prototype, annotations and types were analyzed from floor plans of existing small parks, and components of landscape template were deduced. Based on this, play facilities, pergola, and benches were madeintofamily and templates, making automatic design possible. In addition, annotations and tags that are often used in landscape design were made, and a 3D view was materialized through visibility/graphic reassignment. As for tables and quantities, boundary stone table, mounding table, summary sheet of quantities, table of contents, and summary sheet of packaging quantities were grouped and connected with floor plans; regarding landscaping trees, classification criteria and name of trees that are suitable for domestic situations were applied. A landscape template was created to enable the library file format(rfa) that can be mounted on a building with BIM programs. As for problems that arose after the trial application of the prepared template, some CAD files could not be imported; also, while writing tables, the basis of calculation could not be made automatically. Regarding this, it is thought that functions of a BIM program and template need improvement.

A Comparative Study Between Food-Borne Outbreaks Two or More Persons and Individual Cases by Using Statistics of Japan (일본의 식중독 현황 통계 분석으로 살펴본 1인 식중독과 집단 식중독 비교)

  • Lee, Jong-Kyung
    • Journal of Food Hygiene and Safety
    • /
    • v.26 no.3
    • /
    • pp.248-253
    • /
    • 2011
  • KFDA compiles the statistical data of food poisoning outbreaks two or more persons since 2002 in Korea and release them to the public on the web. There is a gap of outbreak number between the real situation and the reports. To reduce the gap, addition of sporadic individual case of food poisoning may be one of the solution method. The statistical data of Japan where food consumption pattern is similar to Korea, were used in this study to compare the ratio and the pattern between the outbreak cases two or more persons and individual cases. By doing so, the data of Japan regarding to outbreak cases two or more persons will be comparable to that of Korea. The data of 2002 and 2003 in Japan showed that sporadic individual cases were 43.3% in the total food poisoning cases. The individual cases occurred highly in unknown places (90-92.3%) and home (6.2-8.5%) whileas the outbreaks two or more persons occurred mostly in the place of restaurants (46.6-50.l%) and inns (9.2-9.8%). The food-borne pathogens attributed to the individual cases were C. jejuni (51.9%), Salmonella spp. (35.3%), and V. parahaemolyticus (9.8%) while those to the outbreak cases two or more persons were norovirus (31.3%), Salmonella spp. (20.8%), C. jejuni (15.5%) in Japan. The data of 2002-2009 between Korea and Japan showed the outbreak case report rate was 1:1.5 based on the total population number.