• 제목/요약/키워드: Log-Structure

검색결과 353건 처리시간 0.035초

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

cis-$[Co(en)_2ClNO_2]^+$ 착이온의 가용매 분해반응에 미치는 용매의 영향과 그 반응 메카니즘 (Solvent Effects on the Solvolysis of cis-$[Co(en)_2ClNO_2]^+$ Ion and Its Mechanism)

  • 정종재;박영호
    • 대한화학회지
    • /
    • 제30권1호
    • /
    • pp.3-8
    • /
    • 1986
  • 물-글리세롤, 물-에틸렌 글리콜, 물-이소프로필 알코올 및 물-t-부틸 알코올의 2성분 혼합용매 중에서 cis-$[Co(en)_2ClNO_2]^+$착이온의 가용매 분해반응을 분광광도법으로 연구하였다. 용매의 극성이 커짐에 따라 반응속도도 커지는 경향이 있었으며 반응속도의 대수값과 $\frac{D-1}{2D+1}$값을 도시한 결과 비직선적인 관계를 나타내는 것으로 보아서 용매의 수소결합이나 분산력등의 비정전기적인 상호작용이 지배적으로 작용함을 알 수 있었다. log k와 Grundwald-Winstein의 Y값을 도시한 직선의 기울기와 Kivinen식에서 구한 전이상태에 관여하는 물분자의 수 n값으로부터 실험에 사용한 착물의 가용매 분해반응은 Id메카니즘으로 진행됨을 알았다. 한편 자유에너지 사이클의 결과는 초기상태에서 보다 전이상태에서 용매구조의 효과가 더 큼을 알 수 있었다.

  • PDF

탄산화에 노출된 철근콘크리트 구조물의 로그 및 정규 수명분포를 고려한 보수비용 해석 (Repair Cost Analysis for RC Structure Exposed to Carbonation Considering Log and Normal Distributions of Life Time)

  • 우상인;권성준
    • 한국건설순환자원학회논문집
    • /
    • 제6권3호
    • /
    • pp.153-159
    • /
    • 2018
  • 지하구조물에 주로 발생하는 탄산화는 콘크리트 내부의 공극수의 pH감소에 따라 부식을 유발할 수 있으므로 많은 연구가 진행되고 있다. 그러나 이산화탄소로부터 표면을 보호하는 간단한 표면 보수방법을 통하여 구조물의 내구수명의 연장이 가능하다. 기존의 결정론적 유지관리 기법과는 다르게, 확률론적 유지관리 기법에서는 내구수명의 변동성이 고려될 수 있으나 정규분포만 다루고 있다. 본 연구에서는 정규분포 이외에 로그분포를 고려할 수 있는 수명-확률분포를 유도하였으며, 이를 기초로 다양한 수명-확률분포 함수를 고려한 보수비 산정기법을 제안하였다. 제안된 기법은 초기의 내구수명 분포 또는 보수재를 통하여 연장된 내구수명 분포가 정규 또는 로그분포를 가질 경우 목표내구수명의 연장에 따라 확률론적 기법을 통하여 보수비를 평가할 수 있다. 보수를 통한 내구수명이 로그분포를 가질 경우 효과적으로 보수비를 감소시킬 수 있으며, 장기 실험 또는 실태조사를 통하여 내구수명 분포가 정의될 수 있다면 더욱 합리적인 유지관리 계획을 수립할 수 있을 것으로 판단된다.

Merging Algorithm for Relaxed Min-Max Heaps Relaxed min-max 힙에 대한 병합 알고리즙

  • 민용식
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.73-82
    • /
    • 1995
  • 본 논문은 relaxed min-max heap을 병합시키기 위하여 이용된 새로운 자료구조인 개선된 relaxed min-max-pair 힙으로서, 두개의 relaxed min-max 힙 즉, 크기가 n인 relaxed min-max nheap과 크기가 k인 relaxed min-max kheap으로 구성된 우선 순위 큐를 병합시키기 위한 순차적 알고리즘을 제시하고자 한다. 본 논문에서 제시된 방법은 [8]에 제시된 방법에서 relaxed min-max 힙을 병합시키기 위해서 이용된 blossomed tree와 lazying 방법을 제거하여도 병합이 되는 새로운 기법을 제시하였다. 결과적으로 본 논문에서 제세된 방법은 두개의 relaxed min-max 힙의 크기가 서로 다른 경우로서, 이때 크기 $k{\leq}{\lfloor}log(size(nheap)){\rfloor}$인 경우, 시간 복잡도가 O(log(log(n/k))*log(k)) 이고 공간복잡도가 O(n+k)임을 볼수가 있다.

  • PDF

Count-Min HyperLogLog : 네트워크 빅데이터를 위한 카디널리티 추정 알고리즘 (Count-Min HyperLogLog : Cardinality Estimation Algorithm for Big Network Data)

  • 강신정;양대헌
    • 정보보호학회논문지
    • /
    • 제33권3호
    • /
    • pp.427-435
    • /
    • 2023
  • 카디널리티 추정은 실생활의 많은 곳에서 사용되며, 큰 범위의 데이터를 처리하는 데 근본적 문제이다. 인터넷이 빅데이터의 시대로 넘어가며 데이터의 크기는 점점 커지고 있지만, 작은 온칩 캐시 메모리만을 이용하여 카디널리티 추정이 이뤄진다. 메모리를 효율적으로 사용하기 위해서, 지금까지 많은 방법이 제안되었다. 그러나, 이러한 알고리즘에서는 estimator 간의 노이즈 발생으로 인해 정확도가 떨어지는 일이 발생한다. 이 논문에서는 노이즈를 최소화하는데 중점을 뒀다. 우리는 여러 개의 데이터 구조를 제안하여 각 estimator가 데이터 구조 수만큼의 추정값을 가지고, 이 중 가장 작은 값을 선택하여 노이즈를 최소화한다. 실험을 통해 이 방법이 이전의 가장 좋은 방법과 비교했을 때, 플로우당 1 bit와 같은 작은 메모리를 사용하면서 더 좋은 성능을 보이는 것을 확인했다.

산화란탄-산화카드뮴계의 혼합 결함구조 및 Hole 전도도 (Mixed Defect Structure and Hole Conductivity of the System Lanthanum Sesquioxide-Cadmium Oxide)

  • 김규홍;김돈;최재시
    • 대한화학회지
    • /
    • 제31권3호
    • /
    • pp.225-230
    • /
    • 1987
  • 0.8mol%의 CdO가 도프된 $CdO-La_2O_3$계의 전기전도도를 $10^{-7}{\sim}10^{-1}atm$의 산소분압하에서 측정하였다. 일정한 산소분압하에서 log ${\sigma}$ vs. 1/T도시는 직선관계를 보여주었고 직선의 기울기에서 구한 활성화에너지는 0.97eV이다. $500{\sim}900^{\circ}C$영역에서 log ${\sigma}$vs. log $PO_2$의 도시결과는 직선 관계를 나타내었으며 전기전도도의 산소분압 의존성은 ${\sigma}\;{\alpha}\;PO_2^{1/4}$이다. $CdO-La_2O_3$계의 결함구조는 ${V_{La}}^{'''}$V\"{o}$의 혼합형으로 사료되며, 전기전도도의 온도의존성과 산소분압의존성으로부터 혼합형의 결함구조 반응식을 유도하였으며, $CdO-La_2O_3$계의 전기전도 메카니즘을 결함구조반응식으로부터 규명하였다.

  • PDF

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링 (XML-based Modeling for Semantic Retrieval of Syslog Data)

  • 이석준;신동천;박세권
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.147-156
    • /
    • 2006
  • 이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

Improving Lookup Time Complexity of Compressed Suffix Arrays using Multi-ary Wavelet Tree

  • Wu, Zheng;Na, Joong-Chae;Kim, Min-Hwan;Kim, Dong-Kyue
    • Journal of Computing Science and Engineering
    • /
    • 제3권1호
    • /
    • pp.1-4
    • /
    • 2009
  • In a given text T of size n, we need to search for the information that we are interested. In order to support fast searching, an index must be constructed by preprocessing the text. Suffix array is a kind of index data structure. The compressed suffix array (CSA) is one of the compressed indices based on the regularity of the suffix array, and can be compressed to the $k^{th}$ order empirical entropy. In this paper we improve the lookup time complexity of the compressed suffix array by using the multi-ary wavelet tree at the cost of more space. In our implementation, the lookup time complexity of the compressed suffix array is O(${\log}_{\sigma}^{\varepsilon/(1-{\varepsilon})}\;n\;{\log}_r\;\sigma$), and the space of the compressed suffix array is ${\varepsilon}^{-1}\;nH_k(T)+O(n\;{\log}\;{\log}\;n/{\log}^{\varepsilon}_{\sigma}\;n)$ bits, where a is the size of alphabet, $H_k$ is the kth order empirical entropy r is the branching factor of the multi-ary wavelet tree such that $2{\leq}r{\leq}\sqrt{n}$ and $r{\leq}O({\log}^{1-{\varepsilon}}_{\sigma}\;n)$ and 0 < $\varepsilon$ < 1/2 is a constant.

국산 침엽수 원목의 경급구분 기준에 관한 연구 (A study on log diameter classes of Korean softwood log)

  • 박정환;김광모;엄창득;정두진
    • Journal of the Korean Wood Science and Technology
    • /
    • 제41권4호
    • /
    • pp.337-345
    • /
    • 2013
  • 국산 원목의 유통체계 개선을 위해서는 원목 품질을 신뢰할 수 있는 있는 등급체계가 정착되어야 한다. 원목시장의 현실과 괴리된 원목규격의 개선을 위해 국내에서 생산되는 원목 현황과 원목이 사용되는 시장에 대한 분석이 필요하다. 이를 위해 2010년과 2011년에 국내 5개 지방산림청에서 생산 매각한 천만 본 이상의 원목자료를 수집하여 각 수종별로 경급과 재장을 분석하였다. 이를 바탕으로 원목규격의 경급과 재장구분 기준에 대한 개선방안을 모색하고자 하였다. 본 연구 주요결과를 요약하면 다음과 같다. 국산 침엽수 원목의 경급은 100~160 mm 범위의 소경재가 대부분을 차지하여 현행 원목규격의 재종구분이 현실에 비해 다소 과도하게 설정되었음을 확인할 수 있었다. 원목의 경급분포는 수종별로 서로 상이한 분포특성을 보여 수종별로 차별화된 경급기준의 필요성이 제기되었다. 국내에서 생산되는 원목의 재장이 수종마다 서로 상이하고, 제재용으로 선호되는 재장을 적극적으로 생산하지 못하는 문제점을 반영하여 재장에 관한 기준이 원목규격에 포함될 필요가 있다는 점을 확인하였다. 이러한 결과를 바탕으로 3개 수종군, 6개 재종의 새로운 침엽수 원목 구분체계를 제안하였으며, 각 등급에 적합한 지름 및 재장기준을 제시하였다.

단백질 시퀀스와 가중치 스트링에 대한 탐색 알고리즘 (Searching Algorithms for Protein Sequences and Weighted Strings)

  • 김성권
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권8호
    • /
    • pp.456-462
    • /
    • 2002
  • 단백질 시퀀스처럼 가중치를 가지는 스트링에 대한 탐색 알고리즘을 개발한다. ${\sum}$를 알파벳이라 하고 모든 $a{\in}{\sum}$에 대해서 무게 ${\mu}(a)$가 주어진다고 하자. 스트링 $A=a_1a_2…a_n\; 에서 (단, 모든 ai{\in}{\sum})$, 서브스트링 $A(i.j)=a_ia_{i+1}…a_j$로 정의하면, 이것의 무게는 ${\in}(A(i.j))={\in}(a_i)+{\in}(a_i+1)+…+{\in}(a_j)$가 된다. 다루고자하는 문제는 스트링 A를 사전 처리하여 탐색 자료구조를 만드는데, 이 자료구조는 나중에 질문 무게 M이 주어진 경우, $M={\in}(A(i,j))$인 서브스트링 A(i,j)가 있는가 라는 질문에 응답하는데 사용된다. 본 논문에서는 기존의 결과를 향상시키는 알고리즘을 제시한다. 기존의 알고리즘의 경우 O(n) 만큼의 메모리를 사용하는 탐색 자료구조를 이용하여 $0(\frac{nlog\;logn}{log\; n})$ 시간에 질문응답을 하였으나, 본 논문의 알고리즘은 질문 응답시간은 그대로 유지하면서 메모리만 $0(\frac{n}{log\; n})$으로 줄인다.