• 제목/요약/키워드: Data combination

검색결과 3,505건 처리시간 0.028초

빅데이터 활용에 영향을 미치는 개인정보 규제요인과 데이터 결합요인의 탐색 (An Exploration on Personal Information Regulation Factors and Data Combination Factors Affecting Big Data Utilization)

  • 김상광;김선경
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.287-304
    • /
    • 2020
  • 그동안 데이터 개방, 기술수용이론 등 빅데이터 활용의 영향요인에 대한 법·정책적 연구는 다수 있었으나, 제약선 역할을 하는 개인정보 규제요인 또는 데이터 결합요인이 빅데이터 활용에 미치는 영향에 대한 실증연구는 거의 없었다. 이에 본 연구는 델파이 분석(Delphi Analysis)을 통해 빅데이터 활성화에 부정적(-) 관계를 보이는 개인정보 규제요인과 긍정적(+) 효과를 보이는 데이터 결합요인이 무엇으로 구성되는지 요인의 우선순위를 시론적으로 탐색하였다. 델파이 분석결과, 개인정보 규제요인은 가명정보 등 활용제도 도입, 개인정보 비식별화 근거 명확성, 데이터 결합규정 명확성, 개인정보 정의 명확성, 개인정보 동의 용이성, 개인정보 감독기구 통합, 개인정보 법률간 정합성, 법령위반시 적정 처벌강도, EU GDPR 비교시 적정 과징금 순으로 상위요인이 조사되었다. 다음으로 데이터 결합요인은 결합 비식별성, 결합데이터 표준화, 결합 책임성, 결합기관 유형, 경합경험, 결합 기술가치 순으로 조사되었다. 이러한 연구결과는 빅데이터 활성화를 위해 개인정보 규제와 데이터 결합정책 설계 시 어느 구성요인을 우선적으로 제도개선 해야 하는지 시사점을 제공한다.

개인정보 규제요인과 빅데이터 활용간의 관계에서 가명정보 결합의 매개효과 및 조절효과 (The Mediating Effect and Moderating Effect of Pseudonymized Information Combination in the Relationship Between Regulation Factors of Personal Information and Big Data Utilization)

  • 김상광
    • 정보화정책
    • /
    • 제27권3호
    • /
    • pp.82-111
    • /
    • 2020
  • 최근 빅데이터 활용의 영향요인으로 개인정보 규제요인과 가명정보 결합이 핵심 정책수단으로 등장하고 있다. 본 연구는 개인정보 규제요인과 빅데이터 활용의 관계에서 제3의 변수로서 가명정보 결합의 매개효과 및 조절효과를 실증분석하였다. 분석결과, 첫째, 개인정보 규제요인 중 개인정보 정의, 개인정보 동의, 법령위반 처벌강도 요인이, 그리고 가명정보 결합요인 중 결합 비식별성, 결합 가명정보 표준화, 결합 책임성이 빅데이터의 활용에 정(+)의 유의한 관계를 보였다. 둘째, 가명정보 결합 요인 중 결합 비식별성, 결합 가명정보 표준화, 결합 책임성이 개인정보 규제요인과 빅데이터 활용과의 관계에서 정(+)의 매개효과를 보였다. 셋째, 개인정보 규제요인과 빅데이터 활용과의 관계에서 가명정보 결합기관 유형인 자유형, 중개형, 지정형의 순서에 따라 조절효과가 다를 것이라는 가설은 기각되었다. 이상의 분석결과를 기반으로 개인정보 보호와 빅데이터 활용이 조화를 이루는 '착한규제'의 정책대안을 제시하였다.

유전자 알고리즘을 활용한 데이터 불균형 해소 기법의 조합적 활용

  • 장영식;김종우;허준
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.309-320
    • /
    • 2007
  • The data imbalance problem which can be uncounted in data mining classification problems typically means that there are more or less instances in a class than those in other classes. It causes low prediction accuracy of the minority class because classifiers tend to assign instances to major classes and ignore the minor class to reduce overall misclassification rate. In order to solve the data imbalance problem, there has been proposed a number of techniques based on resampling with replacement, adjusting decision thresholds, and adjusting the cost of the different classes. In this paper, we study the feasibility of the combination usage of the techniques previously proposed to deal with the data imbalance problem, and suggest a combination method using genetic algorithm to find the optimal combination ratio of the techniques. To improve the prediction accuracy of a minority class, we determine the combination ratio based on the F-value of the minority class as the fitness function of genetic algorithm. To compare the performance with those of single techniques and the matrix-style combination of random percentage, we performed experiments using four public datasets which has been generally used to compare the performance of methods for the data imbalance problem. From the results of experiments, we can find the usefulness of the proposed method.

  • PDF

결합전문기관의 역할 확대를 위한 개선방안 (Improvement Plan to Expand the Role of Expert Data Combination Agency)

  • 김기범;권헌영
    • 정보보호학회논문지
    • /
    • 제33권1호
    • /
    • pp.99-116
    • /
    • 2023
  • 데이터, AI 등 정보기술 기반의 초연결 사회인 4차 산업혁명 시대의 데이터 중요성이 증가하고 있으며 이에 발맞추어 정부도 데이터경제 활성화를 위한 법률 제정 및 개정이 활발히 진행되고 있으나 규제 법률인 개인정보보법과 데이터 활성화 법률(데이터기반행정 활성화에 관한 법률, 데이터 산업진흥 및 이용촉진에 관한 기본법, 산업디지털 전환 촉진법) 간 충돌 가능성, 결합전문기관 유형별 입장차, 데이터전문기관과 결합전문기관의 수행 범위 등 데이터산업 활성화의 발목을 잡거나 잘못된 방향 설정 등의 문제를 예방하고 개선할 필요가 있다. 이에 결합전문기관의 역할 및 현황, 활용 사례를 분석하고 현장의견을 청취하여 데이터경제 활성화를 위한 결합전문기관 역할 확대 방안과 개선방안을 도출하여 소개하고자 합니다.

Geoid Determination in South Korea from a Combination of Terrestrial and Airborne Gravity Anomaly Data

  • Jekeli, Christopher;Yang, Hyo Jin;Kwon, Jay Hyoun
    • 한국측량학회지
    • /
    • 제31권6_2호
    • /
    • pp.567-576
    • /
    • 2013
  • The determination of the geoid in South Korea is a national imperative for the modernization of height datums, specifically the orthometric height and the dynamic height, that are used to monitor hydrological systems and environments with accuracy and easy revision, if necessary. The geometric heights above a reference ellipsoid, routinely obtained by GPS, lead immediately to vertical control with respect to the geoid for hydrological purposes if the geoid height above the ellipsoid is known accurately. The geoid height is determined from gravimetric data, traditionally ground data, but in recent times also from airborne data. This paper illustrates the basic concepts for combining these two types of data and gives a preliminary performance assessment of either set or their combination for the determination of the geoid in South Korea. It is shown that the most critical aspect of the combination is the gravitational effect of the topographic masses above the geoid, which, if not properly taken into account, introduces a significant bias of about 8 mgal in the gravity anomalies, and which can lead to geoid height bias errors of up to 10 cm. It is further confirmed and concluded that achieving better than 5 cm precision in geoid heights from gravimetry remains a challenge that can be surmounted only with the proper combination of terrestrial and airborne data, thus realizing higher data resolution over most of South Korea than currently available solely from the airborne data.

Improvement of Land Cover / Land Use Classification by Combination of Optical and Microwave Remote Sensing Data

  • Duong, Nguyen Dinh
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.426-428
    • /
    • 2003
  • Optical and microwave remote sensing data have been widely used in land cover and land use classification. Thanks to the spectral absorption characteristics of ground object in visible and near infrared region, optical data enables to extract different land cover types according to their material composition like water body, vegetation cover or bare land. On the other hand, microwave sensor receives backscatter radiance which contains information on surface roughness, object density and their 3-D structure that are very important complementary information to interpret land use and land cover. Separate use of these data have brought many successful results in practice. However, the accuracy of the land use / land cover established by this methodology still has some problems. One of the way to improve accuracy of the land use / land cover classification is just combination of both optical and microwave data in analysis. In this paper for the research, the author used LANDSAT TM scene 127/45 acquired on October 21, 1992, JERS-1 SAR scene 119/265 acquired on October 27, 1992 and aerial photographs taken on October 21, 1992. The study area has been selected in Hanoi City and surrounding area, Vietnam. This is a flat agricultural area with various land use types as water rice, secondary crops like maize, cassava, vegetables cultivation as cucumber, tomato etc. mixed with human settlement and some manufacture facilities as brick and ceramic factories. The use of only optical or microwave data could result in misclassification among some land use features as settlement and vegetables cultivation using frame stages. By combination of multitemporal JERS-1 SAR and TM data these errors have been eliminated so that accuracy of the final land use / land cover map has been improved. The paper describes a methodology for data combination and presents results achieved by the proposed approach.

  • PDF

Comparative Analysis of Surface Heat Fluxes in the East Asian Marginal Seas and Its Acquired Combination Data

  • Sim, Jung-Eun;Shin, Hong-Ryeol;Hirose, Naoki
    • 한국지구과학회지
    • /
    • 제39권1호
    • /
    • pp.1-22
    • /
    • 2018
  • Eight different data sets are examined in order to gain insight into the surface heat flux traits of the East Asian marginal seas. In the case of solar radiation of the East Sea (Japan Sea), Coordinated Ocean-ice Reference Experiments ver. 2 (CORE2) and the Objectively Analyzed Air-Sea Fluxes (OAFlux) are similar to the observed data at meteorological stations. A combination is sought by averaging these as well as the Climate Forecast System Reanalysis (CFSR) and the National Centers for Environmental Prediction (NCEP)-1 data to acquire more accurate surface heat flux for the East Asian marginal seas. According to the Combination Data, the annual averages of net heat flux of the East Sea, Yellow Sea, and East China Sea are -61.84, -22.42, and $-97.54Wm^{-2}$, respectively. The Kuroshio area to the south of Japan and the southern East Sea were found to have the largest upward annual mean net heat flux during winter, at -460- -300 and at $-370--300Wm^{-2}$, respectively. The long-term fluctuation (1984-2004) of the net heat flux shows a trend of increasing transport of heat from the ocean into the atmosphere throughout the study area.

Comparative study of data selection in data integration for 3D building reconstruction

  • Nakagawa, Masafumi;Shibasaki, Ryosuke
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.1393-1395
    • /
    • 2003
  • In this research, we presented a data integration, which integrates ultra high resolution images and complementary data for 3D building reconstruction. In our method, as the ultra high resolution image, Three Line Sensor (TLS) images are used in combination with 2D digital maps, DSMs and both of them. Reconstructed 3D buildings, correctness rate and the accuracy of results were presented. As a result, optimized combination scheme of data sets , sensors and methods was proposed.

  • PDF

유전자 알고리즘을 활용한 데이터 불균형 해소 기법의 조합적 활용 (Combined Application of Data Imbalance Reduction Techniques Using Genetic Algorithm)

  • 장영식;김종우;허준
    • 지능정보연구
    • /
    • 제14권3호
    • /
    • pp.133-154
    • /
    • 2008
  • 데이터 마이닝 분류 문제에서 발생하는 데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극히 많거나 작은 경우를 말한다. 이러한 불균형 문제를 해결하기 위해 표본추출과 오분류 비용에 근거한 여러 가지 기법들이 제시되었으며, 이들 간의 성능 비교에 대한 연구들도 이루어졌다. 본 논문에서는 기존에 제시된 불균형 문제 해소기법들의 조합적 활용에 대한 타당성에 대해 살펴보고 유전자 알고리즘을 통해 그 결합 비율을 결정하여 더 좋은 성과를 낼 수 있는지에 대해 살펴보도록 한다. 소수 범주에 대한 정확성을 높이기 위해 소수 범주에 대한 F-value에 기초하여 기법들의 결합비율을 결정하고 기존 단일 기법들의 성과와 임의의 비율에 의한 격자표 형태의 결합 성과를 비교하여 결합적 활용의 타당성을 살펴본다. 이를 실증적으로 검토하기 위해서, 일반적으로 데이터 불균형 문제를 해결하기 위해 많이 사용되는 4개의 공개 데이터 집합을 이용하여 타당성 분석을 수행하였다. 분석 결과, 전체적으로 단일 기법들의 결합적 활용이 데이터 불균형 해소에 유용한 것으로 나타났다.

  • PDF

PSS Evaluation Based on Vague Assessment Big Data: Hybrid Model of Multi-Weight Combination and Improved TOPSIS by Relative Entropy

  • Lianhui Li
    • Journal of Information Processing Systems
    • /
    • 제20권3호
    • /
    • pp.285-295
    • /
    • 2024
  • Driven by the vague assessment big data, a product service system (PSS) evaluation method is developed based on a hybrid model of multi-weight combination and improved TOPSIS by relative entropy. The index values of PSS alternatives are solved by the integration of the stakeholders' vague assessment comments presented in the form of trapezoidal fuzzy numbers. Multi-weight combination method is proposed for index weight solving of PSS evaluation decision-making. An improved TOPSIS by relative entropy (RE) is presented to overcome the shortcomings of traditional TOPSIS and related modified TOPSIS and then PSS alternatives are evaluated. A PSS evaluation case in a printer company is given to test and verify the proposed model. The RE closeness of seven PSS alternatives are 0.3940, 0.5147, 0.7913, 0.3719, 0.2403, 0.4959, and 0.6332 and the one with the highest RE closeness is selected as the best alternative. The results of comparison examples show that the presented model can compensate for the shortcomings of existing traditional methods.