• Title/Summary/Keyword: 이산자료

Search Result 240, Processing Time 0.03 seconds

A Study on the Interpolation Characteristics of the Scattered Geographic Data according to the Gridding methods (격자화 기법에 따른 이산지형정보의 보간특성 연구)

  • Lee, Yong-Chang
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.4 no.2 s.8
    • /
    • pp.173-180
    • /
    • 1996
  • In a grid based data transformation, the different gridding methods provide different interpretations of scattered data because each method calculate grid node values using a different weighted mathematical algorithms. Therefore, it is necessary to review the interpolated characteristics of some gridding methods according to search distance, search area and search options before determing the best method with a data set. For this, in this paper, six different gridding methods with the same search conditions are applied to a scattered data obtained from sterro-plotter. The interpolated characteristics of the scattered geographic data considered through comparison of coincidence between the data point and the grid node being interpolated. And also, shows the real application of gridding methods through calculating volumes and creating cross sections.

  • PDF

Retrieval of Nitrogen Dioxide Column Density from Ground-based Pandora Measurement using the Differential Optical Absorption Spectroscopy Method (차등흡수분광기술을 이용한 지상기반 Pandora 관측으로부터의 대기 중 이산화질소 칼럼농도 산출)

  • Yang, Jiwon;Hong, Hyunkee;Choi, Wonei;Park, Junsung;Kim, Daewon;Kang, Hyeongwoo;Lee, Hanlim;Kim, Joon
    • Korean Journal of Remote Sensing
    • /
    • v.33 no.6_1
    • /
    • pp.981-992
    • /
    • 2017
  • We, for the first time, retrieved tropospheric nitrogen dioxide ($Trop.NO_2$) vertical column density (VCD) from ground-based instrument, Pandora, using the optical density fitting based on Differential Optical Absorption Spectroscopy (DOAS)in Seoul for the period from May 2014 to December 2014. The $Trop.NO_2$ VCDs retrieved from Pandora were compared with those obtained from Ozone Monitoring Instrument (OMI). A correlation coefficient (R) between those retrieved from Pandora and those obtained from OMI is 0.55. To compare with surface $NO_2$ VMRs obtained from in-situ, Trop. $NO_2$ VCDs retrieved from Pandora and those obtained from OMI are converted into $NO_2$ VMRs in boundary layer (BLH $NO_2$ VMRs) using data measured from Atmospheric Infrared Sounder (AIRS). Surface $NO_2$ VMRs obtained from in-situ range from 5.5 ppbv to 61.5 ppbv. BLH $NO_2$ VMRs retrieved from Pandora and OMI range from 2.1 ppbv to 44.2 ppbv and from 0.9 ppbv to 11.6 ppbv, respectively. The range of BLH $NO_2$ VMRs retrieved from OMI is narrower than that of BLH $NO_2$ VMRs retrieved from Pandora and surface $NO_2$ VMRs obtained from in-situ. There is a batter correlation between surface $NO_2$ VMRs obtained from in-situ and BLH $NO_2$ VMRs retrieved from Pandora (R= 0.50)than the correlation between surface $NO_2$ VMRs obtained from in-situ and BLH $NO_2$ VMRs retrieved from OMI (R = 0.36). This poor correlation is thought to be due to the lower near-surface sensitivity of the satellite-based instrument (OMI) than Pandora, the ground-based instrument.

Investigation of SO2 effect on OMI-TOMS and OMI-DOAS O3 in volcanic areas with OMI satellite data (OMI 위성자료를 이용한 화산지역 고농도 이산화황 환경에서의 TOMS 오존과 DOAS 오존의 비교연구)

  • Choi, Wonei;Hong, Hyunkee;Park, Junsung;Kim, Daewon;Yeo, Jaeho;Lee, Hanlim
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.6
    • /
    • pp.599-608
    • /
    • 2015
  • In this present study, we quantified the $SO_2$ effect on $O_3$ retrieval from the Ozone Monitoring Instrument (OMI) measurement. The difference between OMI-Total Ozone Mapping Spectrometer (TOMS) and OMI-Differential Optical Absorption Spectrometer (DOAS) total $O_3$ is calculated in high $SO_2$ volcanic plume on several volcanic eruptions (Anatahan, La Cumbre, Sierra Negra, and Piton) from 2005 through 2008. There is a certain correlation ($R{\geq}0.5$) between the difference and $OMI-SO_2$ in volcanic plumes and the significant difference close to 100 DU. The high $SO_2$ condition found to affect TOMS $O_3$ retrieval significantly due to a strong $SO_2$ absorption at the TOMS $O_3$ retrieval wavelengths. Besides, we calculated the difference against various $SO_2$ levels. There is the considerable difference (average = 32.9 DU; standard deviation = 13.5 DU) in the high $OMI-SO_2$ condition ($OMI-SO_2{\geq}7.0DU$). We also found that the rate of change in the difference per 1.0 DU change in middle troposphere (TRM) and upper troposphere and stratosphere (STL) $SO_2$ columns are 3.9 DU and 4.9 DU, respectively.

R명령어들의 속도 평가

  • Lee, Jin-A;Heo, Mun-Yeol
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.301-305
    • /
    • 2003
  • 최근에 R은 여러 분야에서 많이 사용되고 있다. 특히 모의실험(simulation)이나 통계학 관련 연구에 많이 사용되고 있다. 모의실험을 하는 경우에는 많은 반복으로 인해 R 프로그램의 수행 속도가 매우 중요하다. 또한 데이터마이닝 분야에서도 R을 많이 사용하고 있다. 우리는 데이터 마이닝에서 데이터의 전처리 과정 중 Fayyad & Irani 방법을 사용하여 연속형 변수를 이산화하는 실험을 하였으며, 이를 위해 R을 사용하였다. 이 프로그램은 재귀 함수를 이용하고 이런 과정에서 빈도표 작성, information계산, 빈도표의 분할, 정지 규칙 등의 여러 함수를 사용하게 되어있다. 우리가 작성한 R 로드를 사용하여 UCI DB의 Iono 자료를 (속성이 35개, 사례수가 약 1000개정도) 이산화 하였을 때 7초 이상의 상당한 시간이 소요된다. 반면에 JAVA로 만들어진 Weka에서 똑같은 Fayyad & Irani 방법을 수행했을 때 위와 같은 큰 자료를 이산화하는 속도가 매우 빨라 수행시간은 거의 무시할 만하였다. 이런 차이점을 보고 R 프로그램의 수행 속도를 늘이는 방법을 찾게 되었다. 이 본 발표에서는 R 코드 중 시간이 많이 소요되는 것들을 몇 가지 선정하고 이들을 더 효율적으로 만들 수 있는 코드를 작성하여 이들 코드의 수행속도를 비교하였다. 또한 몇 가지 명령에 대해서는SAS와도 비교하였다.

  • PDF

Discretization of Continuous-Valued Attributes for Classification Learning (분류학습을 위한 연속 애트리뷰트의 이산화 방법에 관한 연구)

  • Lee, Chang-Hwan
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.6
    • /
    • pp.1541-1549
    • /
    • 1997
  • Many classification algorithms require that training examples contain only discrete values. In order to use these algorithms when some attributes have continuous numeric values, the numeric attributes must be converted into discrete ones. This paper describes a new way of discretizing numeric values using information theory. Our method is context-sensitive in the sense that it takes into account the value of the target attribute. The amount of information each interval gives to the target attribute is measured using Hellinger divergence, and the interval boundaries are decided so that each interval contains as equal amount of information as possible. In order to compare our discretization method with some current discretization methods, several popular classification data sets are selected for experiment. We use back propagation algorithm and ID3 as classification tools to compare the accuracy of our discretization method with that of other methods.

  • PDF

The performance of Bayesian network classifiers for predicting discrete data (이산형 자료 예측을 위한 베이지안 네트워크 분류분석기의 성능 비교)

  • Park, Hyeonjae;Hwang, Beom Seuk
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.3
    • /
    • pp.309-320
    • /
    • 2020
  • Bayesian networks, also known as directed acyclic graphs (DAG), are used in many areas of medicine, meteorology, and genetics because relationships between variables can be modeled with graphs and probabilities. In particular, Bayesian network classifiers, which are used to predict discrete data, have recently become a new method of data mining. Bayesian networks can be grouped into different models that depend on structured learning methods. In this study, Bayesian network models are learned with various properties of structure learning. The models are compared to the simplest method, the naïve Bayes model. Classification results are compared by applying learned models to various real data. This study also compares the relationships between variables in the data through graphs that appear in each model.

Multi-dimension Categorical Data with Bayesian Network (베이지안 네트워크를 이용한 다차원 범주형 분석)

  • Kim, Yong-Chul
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.11 no.2
    • /
    • pp.169-174
    • /
    • 2018
  • In general, the methods of the analysis of variance(ANOVA) for the continuous data and the chi-square test for the discrete data are used for statistical analysis of the effect and the association. In multidimensional data, analysis of hierarchical structure is required and statistical linear model is adopted. The structure of the linear model requires the normality of the data. A multidimensional categorical data analysis methods are used for causal relations, interactions, and correlation analysis. In this paper, Bayesian network model using probability distribution is proposed to reduce analysis procedure and analyze interactions and causal relationships in categorical data analysis.

A Case Study on Chlorine Dioxide Usage at a Conventional Water Treatment Plant (기존 정수장 이산화염소 시범도입 사례연구)

  • Lee, Song-Hee;Lee, Byung-Doo;Kim, Jin-Keun;Seog, Kwon-Soo;Lee, Joung-Taek
    • Journal of Korean Society of Environmental Engineers
    • /
    • v.27 no.1
    • /
    • pp.115-119
    • /
    • 2005
  • As the regulations on DBPs are tightened, many water treatment plants (WTPs) in Korea have already introduced or will introduce enhanced coagulation, alternative disinfectants and advanced treatments such as ozonization and granular activated carbon to improve drinking water qualify. After a phenol leakage accident at the Nakdong-River in 1991, 26 WIPs in Korea introduced carbon dioxide generators, but there has been no accumulation of significant operating data. This research summarizes things that should be considered for the introduction of carbon dioxide disinfection process to WTPs based on one year operation data from A WTP that has had high concentration of DBP during a specific period in the summer. The removal efficiency of DBP was $30{\sim}40%$, but those of 2-MIB, Geosmin were less than 10%. The generation rate of $ClO_2$ by-products such as chlorite and chlorate were $70{\sim}100%$ of input dosage, but the ratios increased over time. At the same time, strong chlorine odors may be produced in the distribution system when $ClO_2$ was used with $Cl_2$ as a result of reaction between the chlorite and residual chlorine.

Telephone Speech Recognition Using Laboratory Environment Speech Data (실험실 환경 음성을 이용한 전화음성 인식에 관한 연구)

  • 윤상호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.391-394
    • /
    • 1994
  • 본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.

  • PDF

Development of a Vehicle Classification Algorithm Using an Micro-Cell Detector on a Freeway (자석식 검지기를 이용한 차종인식 알고리즘 개발)

  • 김수희;조형기;이철기;오영태
    • Proceedings of the KOR-KST Conference
    • /
    • 1998.10b
    • /
    • pp.149-149
    • /
    • 1998
  • 차종구분의 필요성은 교통공학 및 계획분야에서 교통패턴을 파악할 필요가 있으며 도로의 포장설계와 같은 구조적 측면, 교통관련자료구축 등에서도 중요하다. 현재 국내에서 운영중에 있는 각종검지기 체계들은 외국에서 개발한 체계로서 여러 가지 다양한 센서를 복합구성하여 차종을 구분하는 고가의 장비들이다. 이에 대한 국내의 연구사례는 극히 드물다고 볼 수 있다. 지금까지 주를 이룬 국내 연구사례를 보면 루프검지기를 이용한 차종구분이 주를 이루고 있다. 현재 루프검지기의 대체검지기(영상검지기, 자석검지기)개발이 활발히 진행되고 있으며 본 연구에서 이용되는 검지기는 자석검지기로서 루프검지기에 비하여 설치가 간단하고 파손의 우려가 적으며 유지관리 및 보수가 손쉽고 비용면에서도 저렴하다는 것이 장점이라 하겠다. 이에 최근에 개발되어진 단일 자석검지기를 이용한 실시간 차종인식 알고리즘을 개발하고, 현장실험을 통한 현장 적용성을 검토한다. 고속도로에 설치되어 있는 자석검지기를 이용하여 자료를 수집하며 분석에 이용되는 자료는 개별차량에 대하여 자속밀도의 변화를 주파수값으로 변환한 Digital Data값이다. 그 수치를 토대로 각 차량의 점유시간을 파악하여 각 차량의 점유시간동안 파형의 특징을 추출하여 각 특징들을 기초로 하여 각 차량이 나타내는 고유의 파형을 식별하는 패턴인식 방법으로 접근한다. 본 연구에서는 검지기 매설장소의 유한성 및 연구대상 도로의 특성으로 인하여 다양한 차종의 자료수집이 용이하지 못하여 시험가능한 자료수가 많은 차종을 대상으로 분석한다. 차종인식 알고리즘상의 차종분류는 건설교통부 차종분류기준에 따라 우선 구분이 확실한 차종으로 나눈후 단계적으로 세부적 차종분류로 접근한다.의 영향들을 고려함으로써 가로망 설계 과정에서 가로망의 상반된 역할인 이동성과 접근성의 비교가 가능한 보다 현실적인 가로망 설계 모형을 구축하고자 한다. 지금까지 소개된 가로망 설계모형들은 용량변화에 대한 설계변수의 형태에 따라 이산적 가로망 설계 모형과 연속적 가로망 설계모형으로 나뉘어지게 된다. 본 논문의 경우, 계산속도의 향상 측면에서는 연속적 가로망 설계 모형을 도입할 수 있지만, 이때 요구되는 도로용량이 이산적인 변수(차선 수)로 결정되어야만 신호제어 변수를 결정할 수 있기 때문에, 이산적 가로망 설계 모형이 사용된다. 하지만, 이산적 설계모형의 경우 조합최적화 문제이므로 정확한 최적해를 구하기 위해서는 상당한 시간이 소요되며, 경우에 따라서는 국부 최적해에 빠지게 된다. 이러한 문제를 극복하기 위해, 우선 이상적 모형의 근사화, 혹은 조합최적화문제를 위해 개발된 Simulated Annealing기법의 적용, 연속적 모형의 변수를 이산화하는 방법 등 다양한 모형들을 고려해 본 뒤, 적절한 모형을 적용할 것이다. 가로망 설계 모형에서 신호제어를 고려하기 위해서는 주어진 가로망에 대한 통행 배정과정에서 고려되는 통행시간을 링크통행시간과 교차로 지체시간을 동시에 고려해야 하는데, 이러한 문제의 해결을 위해서 최근 활발히 논의되고 있는 교차로에서의 신호제어에 대응하는 통행배정 모형을 도입하여 고려하고자 한다. 이를 위해서 지금까지 연구되어온 Global Solution Approach와 Iterative Approach를 비교, 검토한 뒤 모형에 보다 알맞은 방법을 선택한다. 차량의 교차로 통행을 고려하는 performance function의 경우 비신호 교차로와 신호교차로에 대

  • PDF