• Title/Summary/Keyword: 타겟 예측

Search Result 70, Processing Time 0.03 seconds

Application of DNA microarry : Comparative functional genomic approach

  • Chu In-Sun
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2006.02a
    • /
    • pp.109-114
    • /
    • 2006
  • 최근 Human 지놈 프로젝트를 포함한 다양한 종의 지놈 프로젝트가 수행되고 수많은 지놈정보가 생산되고 있으며 이를 해석하고 서로 연관성를 찾기 위한 다양한 연구가 진행되고 있다. 즉 최신 생명공학과 관련된 연구방향이 DNA의 구조적 해석에서 기능 해석과 유전자들의 상호연관성을 규명하는 방향으로 변화하고 있으며 이를 위한 강력한 도구로서 DNA microarray (DNA chip)는 방대한 양의 지놈 정보를 이용하여 단시간에 대량으로 고속처리하여 효율적으로 유전자 기능을 분석할 수 있는 주목받고 있는 방법이다. DNA microarray 실험과 분석에 있어 데이터분석, 재현성, 종간의 비교, 확인실험 및 비용 등의 문제가 있지만 유전자발현양상 데이터로부터 정확한 환자의 예후를 예측할 수 있는 비교적 적은 유전자 그룹의 진단마커를 찾거나, 하나의 유전자가 아니라 mouse 전체 지놈의 유전자발현 패턴을 인간의 암을 위시한 각종 질병 연구를 위한 발현 신호나 변화 등을 발견하여 신약개발 등에 활용하고자 하는 시도가 활발히 진행되고 있다. 서로 다른 종간에 비슷한 phenotype의 유전자발현도 진화적으로 보존되었다는 전제 하에서 지놈 sequence의 비교연구가 가능하고 DNA microarray 발현 데이터에 근거하여 독립적으로 각 종간의 유전자발현패턴을 비교함으로써 난치병 등을 새롭게 분류할 수 있다. 즉, 암세포 등에서 유전자발현 양상은 유전학적, 환경적 alteration들이 잘 반영되어 있다고 간주하고, 이러한 양상을 바탕으로 인간의 암을 위시한 다양한 질병 연구를 위한 최적의 mouse 모델을 찾을 수 있고, 이는 결국 새로운 치료 방법 개발이나 맞춤의학 실현에 중요한 역할을 할 것으로 기대된다. 특히 pathway 타겟으로 하는 치료를 위해서는 Human-mouse 비교를 통한 발현 신호를 찾는 것이 진단에서는 매우 유용한 방법이다. 이를 위한 고성능의 분석방법이나 시스템의 개발이 중요하게 된다.. 관류의 정도와 조영증강정도를 중심으로 관류 MR 영상소견과 조직학적 소견을 관련지어 분석하였다. 결과: 조영증강 T1강조MR영상에서 환상조영증강을 보이는 다형성 교보세포종 2예에서는 변연부 외륜이 고관류를, 중심부의 괴사부위는 저관류로 나타났다. 저등급 교종은 경계가 불분명한 저관류부위로 보였다. 뇌농양 2예는 변연부 외륜이 경도의 고관류를, 중심부는 저관류로 나타났다. 뇌수막종은 미만성의 균일한 중등도 혹은 고도의 고관류로 보였으며, 임파종과 배아종은 경계가 명확한 저관류부위로 나타났다. 신경세포종은 종괴\ulcorner 일부에 중등도 혹은 고도의 고관류부위가 관찰되었고, 전이암은 다수병변중 일부에서 중등도의 고관류를 보였다. 방사선괴사는 저관류부위내에 국소적 고관류부위를 보였다. 결론: 관류 MR영상은 뇌종양의 관류상태를 비교적 잘 반영하며, 조직학적 특성을 예측하는데에 도움을 주 수 있을 것으로 기대된다. 뇌종야에서의 관류MR영상의 분명한 역할을 규명하기 위해서는 앞으로 더 많은 임상적 연구가 필요할 것으로 생각된다.조증 환자의 자극성 전타액내 lactobacilli양은 peroxidase system을 함유한 세치제를 사용한 군에서 대조군에 비해 상대적으로 낮게 나타났으나(p = 0.067) 통계학적 유의성은 없었다.같은 예에서 찾아 볼 수 있다. 첫째, 발음상으로 동사의 변화형에서 "porte[$p{\jmath}rte$](들다: 현재형), porte[$p{\jmath}rte$](과거분사형), porta[$p{\jmath}rte$](단순과거형)"등이 대립되며, 이휘 "Porto[$p{\jmath}rte$](포르토)"와도 대립된다. 둘째, 어휘적 대립 "le haut[$l{\partial}o$](위)/l'eau[lo](물)"와 형태론적 대립 "le[$l{\partial}$](정관사, 남성단수)/l

  • PDF

멕시코 로얄 은광산 잠재성 평가

  • Heo, Cheol-Ho;Kim, Ui-Jun
    • 한국지구과학회:학술대회논문집
    • /
    • 2010.04a
    • /
    • pp.108-109
    • /
    • 2010
  • IMPACT Silver 주식회사는 Zacualpan 프로젝트의 Royal Mines(이하 로얄 광산)을 인수했다. $124.5\;km^2$에 해당하는 지역의 소유권은 두 개의 멕시코 사기업으로부터 가행중인 광산의 채굴권 구입과 운영 중인 기반시설의 임대를 조건으로 한다. 프로젝트 지역은 멕시코시티로부터 남서방향으로 100 km와 Taxco Silver 광산으로부터 북서방향으로 25 km 떨어진 지점에 위치한다. 기반시설은 비포장 도로, 충분한 전력과 물의 공급 및 숙련공들을 갖추어 우수한 평가를 받고 있다. 소유권은 멕시코인의 개인소유 하에서 무한한 매장량 혹은 자원량을 갖고 운영된 채광과 가공시설을 인수하는 것이다. 소유권 지역을 대상으로 한 IMPACT Silver사의 주 탐사목적은 이미 알려진 광화대의 확장을 위한 잠재성 평가와 다른 지역에서 신규 광상의 유망지역을 발견하는 것이다. Zacualpan 프로젝트의 로얄 광산은 남동 Guerrero terrane의 북부에 위치한다. Teloloapan subterrane은 주로 저변성 녹색편암상으로 구성된 쥬라기 후기에서 백악기 초기의 화산성 퇴적층으로 구성된다. 대부분의 유망지역은 Lower Villa de Ayala층의 중성 내지 염기성 화산성 쇄설암을 모암으로 한다. 다상의 변성작용은 지역 전반에 걸쳐 나타나고, Zacualpan 광산지역에서 수반되는 광화작용을 규제한다. Zacualpan 광산지역은 Sierra Madre del Sur로 알려진 유망 광화대에 해당한다. 이 지역은 화산성 괴상 황화광상과 천열수 맥상광상이 우세하다. 대부분의 천열수 광화작용은 3.2-3.8억 년 전 마그마의 생성이 활발한 판구조 체제 동안 발생하였다. 역사적으로 가장 주요한 지역은 Lipton Vein이다. 현재 Zacualpan 지구에서 채광량은 은 200-500 g/t 정도로 보고되고 있다. 일부 지역은 고품위 은 광화작용(은 1,000 g/t 이상)을 수반하고 있으며, 이는 탐사의 주 타겟이 되고 있다. Zacualpan에서 은 광화작용은 은이 부화된 중유황 천열수 맥상광상으로 상당히 유명하다. Fresnillo, Pachuca 및 Taxco 광산을 포함한 멕시코 소유의 대규모의 잘 알려진 광산들이 이에 해당한다. 이러한 광산들은 부산물로서 금, 아연, 연이 생산된다. 이러한 광상들은 맥상과 각력상 및 산점상 또는 망상세맥의 형태로 산출된다. 광화작용은 석영과 탄산염 맥 내에 주로 황철석과 다양한 섬아연석, 방연석, 은 혹은 금 광물들을 수반한다. 경제성을 갖는 광화작용의 수직적인 연장은 평균적으로 대략 300 m이고, 멕시코 중부에 위치한 Fresnillo의 광화작용은 100 m에서 960 m의 연장을 갖는 것으로 알려져 있다. 아주 오랫동안 Zacualpan에서 광산관계자의 관측과 IMPACT Silver에서 최근 작업의 결과를 토대로, Zacualpan 광산지역의 탐사모델은 새로운 광상의 탐사를 위한 가이드로서 개발되었다. Zacualpan 광산지역에서 가장 높은 경제성을 갖는 광화작용은 북서와 남북방향의 맥 구조를 따라 수반된다. 이러한 맥 구조들은 종종 이 지역을 가로질러 수 km까지 추적되지만, 경제성을 갖는 광화작용은 맥 구조를 따라서 구조적으로 유리한 지역에서 부광대를 형성한다. 부광대를 형성하기 위한 가장 유리한 구조적 지역은 북서와 남북방향으로 발달한 맥 구조들이 교차하는 지역이다. 지난 30년간 채광된 주요 부광대는 폭이 2-6 m 이고 수평연장은 30-150 m 그리고 수직연장은 230-300 m에 이른다. 가장 높은 생산량을 보이는 부광대는 남북방향의 이차 맥들이 Guadalupe 광산의 Lipton 맥을 가로지르는 지역에서 발달한다. 남동쪽으로 현재 Compadres 광산의 Silver Shoot No. 1으로부터 고품위 은을 생산하는 지역은 북서방향의 San Agustin 맥이 북향의 Cometa Navideno 맥에 의해 절단되는 지역에서 산출한다. 모암은 광화작용을 규제하는 또 다른 중요한 요소이다. 광산지역에서 경제성을 갖는 모든 광화작용은 중성 내지 염기성 화산암 특히 안산암과 관련 모암에 배태된다. 부광대가 셰일 혹은 편암으로 전이되는 지역에서, 맥들은 소규모의 세맥으로 나뉘어 진다. Zacualpan의 전형적인 천열수 광상에서 부광대는 상부로 가면서 은의 함량이 증가하고, 하부로 가면서 연 아연의 함량이 증가하는 수직적 대상을 보인다. 금의 함량 변화는 보다 예측이 어려우나 상당히 중요하다. Zacualpan 광산지역의 탐사모델에 사용된 토양 채취, 정밀지도제작, 트렌치 및 시추탐광은 현재 IMPACT Silver사가 이 지역을 대상으로 한 가장 효율적인 탐사방법으로 입증되었다. Zacualpan 프로젝트의 로얄 광산은 하루 500 톤을 제련하는 기반시설과 수반된 채굴권을 갖는 가행 광산들을 포함한다. 현재 IMPACT Silver사는 두 곳의 타겟 지역에서 정밀지도제작, 토양 및 암석 채취, 12공 총 1866 m의 시추탐광에 의한 사전조사로 구성된 4 단계 탐사를 수행했다. 암석 1,953개, 토양 1,631 개, 389 개의 시추코어 시료가 채집되고 분석되었다. 이러한 작업은 추가탐사를 요구하는 수많은 유망 광화대를 규명했다. Compadres 광산에서 현재 가행중인 지하갱 시료는 레벨 1에서 0.9 m의 폭을 갖는 광체에서 은 680 g/t과 금 0.3 g/t, 레벨 3에서 1.67 m의 폭을 갖는 광체에서 은 12,591 g/t과 금 12.07 g/t의 품위를 갖는 것으로 나타났다. 레벨 1에서 3까지 2-3 m의 폭과 30-40 m 연장으로 채광되었다. 시추탐광은 고품위를 갖는 몇몇의 중첩된 맥을 발견했다. Compadres 광산에서 남동방향으로 200 m지점에 위치한 Soledad 지역에서 5 개의 시추공으로부터 동일 맥 시스템이 발견되었고, 고품위 부광대의 상부로 간주되는 몇몇 중요 지점이 발견되었다. 초기 단계의 탐사는 유망 시추탐광 지역인 중간정도 내지 고품위 유망 광화대를 규명했다.

  • PDF

An Improved Vehicle Tracking Scheme Combining Range-based and Range-free Localization in Intersection Environment (교차로 환경에서 Range-based와 Range-free 위치측정기법을 혼합한 개선된 차량위치추적기법)

  • Park, Jae-Bok;Koh, Kwang-Shin;Cho, Gi-Hwan
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.48 no.2
    • /
    • pp.106-116
    • /
    • 2011
  • USN(Ubiquitous Sensor Network) environment permits us to access whatever information we want, whenever we want. The technologies to provide a basement to these environments premise an accurate location establishment. Especially, ITS(Intelligent Transportation Systems) is easily constructed by applying USN technology. Localization can be categorized as either Range-based or Range-free. Range-based is known to be not suitable for the localization based on sensor network, because of the irregularity of radio propagation and the additional device requirement. The other side, Range-free is much appropriated for the resource constrained sensor network because it can actively locate by means of the communication radio. But, generally the location accuracy of Range-free is low. Especially, it is very low in a low-density environment. So, these two methods have both merits and demerits. Therefore, it requires a new method to be able to improve tracking accuracy by combining the two methods. This paper proposes the tracking scheme based on range-hybrid, which can markedly enhance tracking accuracy by effectively using the information of surrounding nodes and the RSSI(Received Signal Strength Indication) that does not require additional hardware. Additionally, we present a method, which can improve the accuracy of vehicle tracking by adopting the prediction mechanism. Simulation results show that our method outperforms other methods in the transportation simulation environment.

Comparative Modeling of Human Tyrosinase - an Important Target for Developing Skin Whitening Agents (피부 미백제의 타겟 단백질인 인간 티로시나제의 3차원 구조 상동 모델링)

  • Choi, Jongkeun;Suh, Joo Won
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.13 no.11
    • /
    • pp.5350-5355
    • /
    • 2012
  • Human tyrosinase (hTyr) catalyzes the first and rate limiting step in the biosynthesis of a skin color determinant, melanin. Although a number of cosmetic companies have tried to develop hTyr inhibitors for several decades, absence of 3D structure of hTyr make it impossible to design or screen inhibitors by structure-based approach. Therefore, we built a 3D structure by comparative modeling technique based on the crystal structure of tyrosinase from Bacillus megaterium to provide structural information and to search new hit compounds from database. Our model revealed that two copper atoms of active site located deep inside and were coordinated with six strictly conserved histidine residues coming from four-helix-bundle. Substrate binding site had narrow funnel like shape and its entrance was wide and exposed to solvent. In addition, hTyr-tyrosine and hTyr-kojic acid, a well-known inhibitor, complexes were modeled with the guide of solvent accessible surface generated by in-house software. Our model demonstrated that only phenol group or its analogs could fill the binding site near the nuclear copper center, because inside of binding site had narrow shape relatively. In conclusion, the results of this study may provide helpful information for designing and screening new anti-melanogenic agents.

Electrical properties of CuInSe2 thin films formed by selenization of RF sputtered Cu-In-Se2 precursors for solar cell applications (Cu-In-Se2 전구체의 Selenization에 의해 형성된 CuInSe2 박막의 태양전지 응용을 위한 전기적 특성평가)

  • Jeong, Chaehwan;Park, Chanyoung;Kim, Jinhyeok;Lee, Suk Ho
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2010.06a
    • /
    • pp.79-79
    • /
    • 2010
  • 다른 물질에 비해 많은 우수한 특성을 가지고 있는 CuInSe2(CIS)박막 태양전지는 많은 연구자들에 의해 개발되어 오고 있다. CIS의 대표적인 장점으로는 직접천이형 밴드갭, 높은 흡수계수, 열 안정화상태 및 p형으로의 전도성물질의 가능성 등 다양하다. 또한 간단한 구조를 이용하여 유리같은 싼 기판을 이용하기 때문에 저가형 태양전지로서 많은 각광을 받고 있다. CIGS태양전지는 CIS의 In 사이트에 Ga을 도핑함으로서 만들어지는데 밴드갭은 약 1.4eV이다. CIS박막을 만드는 많은 방법이 존재하나 구성원소로부터 최적화된 조성을 찾을수 있는 방법이 가장 중요한 요소 중의 하나로 인식되고 있으며, 이런점에서 증발법 및 스퍼터링법 등 같은 진공방식이 비진공방식에 비해 훨씬 간편하게 조성비를 맞출수 있다. 그 중에 스퍼터링법은 대면적 박막태양전지로의 가능성으로 비출어 볼때 산업화를 위한 좋은 후보군이 될 수 있다. Selenization을 하기전에 Cu-In-Se의 전구체 조합은 여러개의 타겟으로부터 동시 스퍼터링법이나 다층 전구체법을 사용하여 준비되는데 어떤 방법이 되던지 Se의 부가적인 공급은 불가피하다. 지금까지 많은 관련 연구의 대부분인 구조적, 조성비적 그리고 광학적인 특성평가에 집중되어 오고 있는데, 전기적특성평가의 경우는 면저항, 비저항 같은 간단한 결과 위주로 보고되어 오고 있다. 또한 캐리어농도와 이동도에 대한 보고가 있음에도 불구하고 이해되기에는 충분치 못한 면이 많다.본 발표에서는 태양전지 제조 전단계로서 소다라임유리기판(SLG)위에 Mo의 유무에 따라 CIS박막의 전기적인 특성 변화에 대한 내용을 담고 있다. 소다라임유리($2cm{\times}2cm$)를 기판으로 사용하여 아세톤-에탄올 용액에 초음파세척을 수행하고, Mo 후면전극을 DC 스퍼터링방식을 이용하여 증착을 한다. SLG와 Mo이 코팅된 SLG를 각각 RF 스퍼터 챔버에 이송한 후 수증기 제거를 위해 약 10분간 예열을 한다. 샘플에 대한 전기적특성은 Hall효과 측정장치에 의해 측정이 되며 전기전도도, 캐리어농도, 이동도 및 전도형에 대한 정보가 각각의 변수에 따라 조사된돠. 부가적으로 구조적, 조성비적인 특성을 SEM,XRD 및 EDX를 통해 조사를 하여 전기적 특성에 따른 관계성을 검토한다. SLG와 Mo가 코팅된 SLG위의 CIS박막은 전기적으로 약간 다른 특성을 보일 것으로 예측되며, 이러한 기대를 바탕으로 조성비가 이상적인 화학양론에 근접할 때 p형으로서 제시될 수 있다는 것을 보여줄 것이다.

  • PDF

A Study on Measuring Vehicle Length Using Laser Rangefinder (레이저 거리계를 이용한 차량 전장 측정 방법에 관한 연구)

  • Ryu, In-Hwan;Kwon, Jang-Woo;Lee, Sang-Min
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.15 no.1
    • /
    • pp.66-76
    • /
    • 2016
  • Determination of type of a vehicle is being used in various areas such as collecting tolls, collecting statistical traffic data and traffic prognosis. Because most of the vehicle type classification systems depend on vehicle length indirectly or directly, highly reliable automatic vehicle length measurement system is crucial for them. This study makes use of a pencil beam laser rangemeter and devises a mechanical device which rotates the laser rangemeter. The implemented system measures the range between a point and the laser rangemeter then indicates it as a spherical coordinate. We obtain several silhouettes of cross section of the vehicle, the rate of change of the silhouettes, signs of the rates then squares the rates to apply cell averaging constant false alarm rate (CA-CFAR) technique to find out where the border is between the vehicle and the background. Using the border and trigonometry, we calculated the length of the vehicle and confirmed that the calculated vehicle length is about 94% of actual length.

Rainfall Intensity Estimation Using Geostationary Satellite Data Based on Machine Learning: A Case Study in the Korean Peninsula in Summer (정지 궤도 기상 위성을 이용한 기계 학습 기반 강우 강도 추정: 한반도 여름철을 대상으로)

  • Shin, Yeji;Han, Daehyeon;Im, Jungho
    • Korean Journal of Remote Sensing
    • /
    • v.37 no.5_3
    • /
    • pp.1405-1423
    • /
    • 2021
  • Precipitation is one of the main factors that affect water and energy cycles, and its estimation plays a very important role in securing water resources and timely responding to water disasters. Satellite-based quantitative precipitation estimation (QPE) has the advantage of covering large areas at high spatiotemporal resolution. In this study, machine learning-based rainfall intensity models were developed using Himawari-8 Advanced Himawari Imager (AHI) water vapor channel (6.7 ㎛), infrared channel (10.8 ㎛), and weather radar Column Max (CMAX) composite data based on random forest (RF). The target variables were weather radar reflectivity (dBZ) and rainfall intensity (mm/hr) converted by the Z-R relationship. The results showed that the model which learned CMAX reflectivity produced the Critical Success Index (CSI) of 0.34 and the Mean-Absolute-Error (MAE) of 4.82 mm/hr. When compared to the GeoKompsat-2 and Precipitation Estimation from Remotely Sensed Information Using Artificial Neural Networks (PERSIANN)-Cloud Classification System (CCS) rainfall intensity products, the accuracies improved by 21.73% and 10.81% for CSI, and 31.33% and 23.49% for MAE, respectively. The spatial distribution of the estimated rainfall intensity was much more similar to the radar data than the existing products.

Network pharmacology-based prediction of efficacy and mechanism of Chongmyunggongjin-dan acting on Alzheimer's disease (네트워크 약리학을 기반으로한 총명공진단(聰明供辰丹) 구성성분과 알츠하이머 타겟 유전자의 효능 및 작용기전 예측)

  • Bitna Kweon;Sumin Ryu;Dong-Uk Kim;Jin-Young Oh;Mi-Kyung Jang;Sung-Joo Park;Gi-Sang Bae
    • The Journal of Korean Medicine
    • /
    • v.44 no.2
    • /
    • pp.106-118
    • /
    • 2023
  • Objectives: Network pharmacology is a method of constructing and analyzing a drug-compound-target network to predict potential efficacy and mechanisms related to drug targets. In that large-scale analysis can be performed in a short time, it is considered a suitable tool to explore the function and role of herbal medicine. Thus, we investigated the potential functions and pathways of Chongmyunggongjin-dan (CMGJD) on Alzheimer's disease (AD) via network pharmacology analysis. Methods: Using public databases and PubChem database, compounds of CMGJD and their target genes were collected. The putative target genes of CMGJD and known target genes of AD were compared and found the correlation. Then, the network was constructed using Cytoscape 3.9.1. and functional enrichment analysis was conducted based on the Gene Ontology (GO) Biological process and Kyoto Encyclopedia of Genes and Genomes (KEGG) Pathways to predict the mechanisms. Results: The result showed that total 104 compounds and 1157 related genes were gathered from CMGJD. The network consisted of 1157nodes and 10034 edges. 859 genes were interacted with AD gene set, suggesting that the effects of CMGJD are closely related to AD. Target genes of CMGJD are considerably associated with various pathways including 'Positive regulation of chemokine production', 'Cellular response to toxic substance', 'Arachidonic acid metabolic process', 'PI3K-Akt signaling pathway', 'Metabolic pathways', 'IL-17 signaling pathway' and 'Neuroactive ligand-receptor interaction'. Conclusion: Through a network pharmacological method, CMGJD was predicted to have high relevance with AD by regulating inflammation. This study could be used as a basis for effects of CMGJD on AD.

Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models (위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정)

  • Choi, Hyunyoung;Kang, Yoojin;Im, Jungho;Shin, Minso;Park, Seohui;Kim, Sang-Min
    • Korean Journal of Remote Sensing
    • /
    • v.36 no.5_3
    • /
    • pp.1053-1066
    • /
    • 2020
  • Sulfur dioxide (SO2) is primarily released through industrial, residential, and transportation activities, and creates secondary air pollutants through chemical reactions in the atmosphere. Long-term exposure to SO2 can result in a negative effect on the human body causing respiratory or cardiovascular disease, which makes the effective and continuous monitoring of SO2 crucial. In South Korea, SO2 monitoring at ground stations has been performed, but this does not provide spatially continuous information of SO2 concentrations. Thus, this research estimated spatially continuous ground-level SO2 concentrations at 1 km resolution over South Korea through the synergistic use of satellite data and numerical models. A stacking ensemble approach, fusing multiple machine learning algorithms at two levels (i.e., base and meta), was adopted for ground-level SO2 estimation using data from January 2015 to April 2019. Random forest and extreme gradient boosting were used as based models and multiple linear regression was adopted for the meta-model. The cross-validation results showed that the meta-model produced the improved performance by 25% compared to the base models, resulting in the correlation coefficient of 0.48 and root-mean-square-error of 0.0032 ppm. In addition, the temporal transferability of the approach was evaluated for one-year data which were not used in the model development. The spatial distribution of ground-level SO2 concentrations based on the proposed model agreed with the general seasonality of SO2 and the temporal patterns of emission sources.

Identifying sources of heavy metal contamination in stream sediments using machine learning classifiers (기계학습 분류모델을 이용한 하천퇴적물의 중금속 오염원 식별)

  • Min Jeong Ban;Sangwook Shin;Dong Hoon Lee;Jeong-Gyu Kim;Hosik Lee;Young Kim;Jeong-Hun Park;ShunHwa Lee;Seon-Young Kim;Joo-Hyon Kang
    • Journal of Wetlands Research
    • /
    • v.25 no.4
    • /
    • pp.306-314
    • /
    • 2023
  • Stream sediments are an important component of water quality management because they are receptors of various pollutants such as heavy metals and organic matters emitted from upland sources and can be secondary pollution sources, adversely affecting water environment. To effectively manage the stream sediments, identification of primary sources of sediment contamination and source-associated control strategies will be required. We evaluated the performance of machine learning models in identifying primary sources of sediment contamination based on the physico-chemical properties of stream sediments. A total of 356 stream sediment data sets of 18 quality parameters including 10 heavy metal species(Cd, Cu, Pb, Ni, As, Zn, Cr, Hg, Li, and Al), 3 soil parameters(clay, silt, and sand fractions), and 5 water quality parameters(water content, loss on ignition, total organic carbon, total nitrogen, and total phosphorous) were collected near abandoned metal mines and industrial complexes across the four major river basins in Korea. Two machine learning algorithms, linear discriminant analysis (LDA) and support vector machine (SVM) classifiers were used to classify the sediments into four cases of different combinations of the sampling period and locations (i.e., mine in dry season, mine in wet season, industrial complex in dry season, and industrial complex in wet season). Both models showed good performance in the classification, with SVM outperformed LDA; the accuracy values of LDA and SVM were 79.5% and 88.1%, respectively. An SVM ensemble model was used for multi-label classification of the multiple contamination sources inlcuding landuses in the upland areas within 1 km radius from the sampling sites. The results showed that the multi-label classifier was comparable performance with sinlgle-label SVM in classifying mines and industrial complexes, but was less accurate in classifying dominant land uses (50~60%). The poor performance of the multi-label SVM is likely due to the overfitting caused by small data sets compared to the complexity of the model. A larger data set might increase the performance of the machine learning models in identifying contamination sources.