• 제목/요약/키워드: Tree-search

검색결과 630건 처리시간 0.032초

화학 데이타베이스에서 부분구조 검색을 위한 인덱스 구조 (An Index Structure for Substructure Searching In Chemical Databases)

  • 이환구;차재혁
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.641-649
    • /
    • 2004
  • 약물의 화학적 구조와 그 약물의 약리작용간의 연관성은, 'Medicinal Chemistry' 분야에서 활발히 연구된다. 이는 화학구조를 기반으로 하여 신약을 설계하려는 시도로서, 약학자는 신약 개발 시 만들고자 하는 약물과 비슷한 화학구조를 가지고 있는 기존 약물들에는 어떠한 것들이 있는지 조사하며, 특정 화학구조가 어떤 약물들에서 나타나는지 신속히 검색하기를 원한다. 이처럼 어떤 화차구조에서, 특정한 부분구조가 존재하는지를 검사하는 것을 부분구조검색(Substructure Searching)이라 하며, 이는 그래프 이론에서 NP-complete인 동형성 판정(Subgraph Isomorphism) 문제로 귀결된다. 검색 시간을 단축시키고자 여러 다른 전근방법들이 연구되었는데, 1990년대에는 구조에 대한 인덱스를 미리 만들어 RDBMS에 저장한 후, 검색시 이론 이용하여 성능을 높이는 방법으로 미국 특허를 획득한 RS3 시스템(http://www.acelrys.com/rs3)이 현재 상용화되어 쓰이고 있다. 본 논문에서는 RS3 시스템의 문제점을 규명하고, 이의 개선방안으로서 새로운 인덱스를 제안한다 RS3 시스템은 각 원자를 중심으로 다른 원자와의 구조를 문자연로 표현하고, 부분구조검색 쿼리를 부분문자열 검색을 실행함으로써 수행하는데, 이의 화학구조를 기술하는 인덱스에는 동일 원자, 동릴 결합에 대한 정렬이 불가능하여 재현율(Recall)과 정도(Precision)가 낮다. 이론 개선하기 위하여 본 논문에서는 2차원의 화학구조를 나누어 1차원의 구조 단편으로 만들고 이를 문자열로 기술하는 방안을 제시하며 구체적인 방법으로 한 인자를 중심으로 최소비용신장트리를 구성한 다음 레벨별로 경로를 나누어 기술하는 방안을 제안하며, 이와 같은 방법의 새로운 인덱스로 재현율과 정도가 급격히 향상됨을 보인다.

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.

대전 주택가 산책로 진드기의 인수공통전염병 병원체 감염실태 조사 (Isolation and identification of tick-borne pathogens in hard ticks collected in Daejeon)

  • 한소영;성선혜;서진우;김종호;이석주;유상식
    • 한국동물위생학회지
    • /
    • 제44권2호
    • /
    • pp.93-102
    • /
    • 2021
  • In this study, a total of 9,449 hard ticks were collected once a month from April to October 2020 from a neighborhood park in Daejeon by flagging & dragging method and CO2 manned trap method. The collected ticks were classified according to the Yamagutsi search table using a stereoscopic microscope and molecular biological analysis of four pathogens (SFTSV, Anaplasma spp., Ehrlichia spp., Borrellia spp.). As a result of the study, Haemaphysalis longicornis were collected the most in all areas of the five boroughs at a rate of 82 to 96 percent, while adults were collected the most in May to July, nymphs were collected the most in April to June, and larvae from August to October at a rate of 78 percent to 98 percent. In pathogens, three cases of SFTSV were detected, showing a minimum infection rate (MIR) of 0.46%, while Anaplasma spp. and Ehrlichia spp. were detected one each, with 0.15% and Borrelia spp. with a minimum infection rate of 0.46%. The detected SFTSV showed 99.9% homogeneity with the KF781490 detected in Cheongwon-gun, Chungbuk Province, Anaplasma spp. showed 99.0% homogeneity with JN990105 detected in China, and Erhlichia spp. showed 98.9% genetic similarity with U96436 separated from the U.S. In this study, the distribution status and pathogen infection rate of the hard ticks in the Daejeon area are analyzed and provided as basic data for the prevention of the hard tick-borne infectious disease.

스택-포인터 네트워크와 부분 트리 정보를 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing Using Stack-Pointer Networks and Subtree Information)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.235-242
    • /
    • 2021
  • 본 연구에서는 포인터 네트워크 모델을 의존 구문 분석에 맞게 확장한 스택-포인터 네트워크 모델을 이용하여 한국어 의존 구문 분석기를 구현한다. 스택-포인터 네트워크 모델 기반 의존 구문 분석기는 인코더-디코더로 구성되어 있으며 다른 의존 구문 분석기와 달리 내부 스택을 갖고 있어 루트부터 시작하는 하향식 구문 분석이 가능하다. 디코더의 각 단계에서는 의존소를 찾기 위해 부모 노드뿐만 아니라 이미 파생된 트리 구조에서 조부모와 형제 노드를 참조할 수 있다. 기존 연구에서는 단순하게 해당 노드들의 합을 계산하여 입력으로 사용하였고, 형제 노드의 경우에는 가장 최근에 방문했던 것만을 사용할 수 있었다. 본 연구에서는 그래프 어텐션 네트워크를 도입하여 이미 파생된 부분 트리를 표현하고 이를 스택-포인터 네트워크의 입력으로 사용하도록 구문 분석기를 수정한다. 세종 코퍼스와 모두의 코퍼스를 대상을 실험한 결과 레이어 2의 그래프 어텐션 네트워크를 이용하여 부분 트리를 표현했을 때 특히 문장 단위의 구문 분석 정확도에서 많은 성능 향상을 확인할 수 있었다.

지하정보 변화객체 탐지 및 추출 연구 (A Study on Updated Object Detection and Extraction of Underground Information)

  • 김광수;이형섭;김주완
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제16권2호
    • /
    • pp.99-107
    • /
    • 2020
  • 지하공간통합지도는 지하안전관리를 위해 구축되고 있으며, 주기적으로 갱신되고 있다. 통합지도 갱신은 기존에 저장된 모든 객체를 삭제하고 새로 입력된 객체들을 저장하는 절차로 진행된다. 그러나, 이 과정에 변경되지 않은 객체들도 저장, 삭제, 저장이 반복되면서 갱신 시간을 지연하는 문제가 발생한다. 본 연구에서는 통합지도 갱신 시간을 단축하기 위해 갱신된 객체와 갱신되지 않은 객체를 분리하여, 갱신된 객체만 지하공간통합지도에 반영하는 기술과 이 기술을 구현한 시스템을 설명한다. 갱신된 객체는 객체의 중심점을 이용한 객체 비교 방법을 사용하였으며, 검색 속도를 향상시키기 위해 쿼드트리를 사용하였다. 갱신된 객체의 유형은 객체의 형상을 이용한 추가와 삭제, 속성을 이용한 변경으로 구분하였다. 제안된 시스템은 갱신 객체 탐지, 추출, 변환, 저장 및 이력 관리 모듈로 구성되어 있다. 이 시스템은 실험에 사용한 데이터를 기준으로 기존 방법보다 약 4배 정도 빠르게 통합지도를 갱신할 수 있는 장점이 있으며, 지상시설물과 지하시설물에 모두 적용할 수 있는 장점도 있다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

정약용의 중용: 장악을 통한 도덕적 행위의 습관화 (Jeong Yak-Yong's Zhong-yong: The Habit of Moral Behavior Through Grasp)

  • 고명문;모아영
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권8호
    • /
    • pp.793-803
    • /
    • 2018
  • 공자가 '중용'을 언급하고 자사가 「중용」을 저술한 이래로, 특히 주희가 『소대예기』의 한 편목이었던 「중용」을 사서 중의 하나로 편집하고 재해석한 이래로 중용은 도덕의 극치로 인정되었을 뿐만 아니라 유학사상의 중요한 범주로 간주되었다. 이 논문의 목적은 '장악'과 '도덕적 행위', 그리고 '습관'이라는 세 개념을 중심으로 정약용이 어떻게 주희의 중용해석을 비판했는지를 검토하고, 더 나아가 정약용의 중용해석과 그것의 특징을 밝히는 데 있다. 주희는 중용의 중을 양단의 중간과 미발의 본연지성으로 해석하고, 용을 평상지리로 해석하여 중용을 지나치거나 미치지 못함이 없는 절대적 이치로 보았다. 따라서 주희의 중용은 사람이 구체적으로 당면한 도덕적 문제 상황에 대한 장악과 노력이 들어있지 않는 절대적 중용이라고 할 수 있다. 반면 정약용은 중을 신독하는 군자가 각고의 노력을 통해 유지하는 집중의 공부 상태와 상황에 대한 장악으로 이해하고, 용을 사람의 도덕적 행위를 꾸준히 하려는 의미가 들어있는 '항상' 혹은 '경상'으로 이해하여 중용을 장악을 통한 도덕적 행위의 습관화로 이해한다.

이수식 TBM 데이터와 랜덤포레스트를 이용한 일축압축강도 분류 예측에 관한 연구 (A Study on the Prediction of Uniaxial Compressive Strength Classification Using Slurry TBM Data and Random Forest)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.547-560
    • /
    • 2023
  • 최근 국내외에서 기계학습 기법으로 TBM 굴진 데이터와 지반데이터를 분석하는 지반 분류예측 연구가 증가하고 있다. 본 연구에서는 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 의사결정트리 기반 랜덤포레스트 모델을 3곳의 이수식 TBM 현장에서 획득한 기계 데이터와 지반 데이터에 적용하여 일축압축강도에 대한 다중 분류예측 연구를 하였다. 일축압축강도의 다중 분류 예측을 위해서 학습과 테스트 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 의사 결정 트리를 기반으로 한 랜덤 포레스트를 사용하여 일축압축강도 분류 학습을 수행한 결과, 다중 분류 예측 모델의 정확도는 학습 세트와 테스트 세트에서 각각 0.983 및 0.982로 모두 높게 나타났다. 다만, 클래스 간 데이터 분포의 불균형으로 인하여 클래스 4에서는 재현율이 낮게 평가되었다. 다양한 현장에서 획득한 일축압축강도의 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

Hpall-Mspl Methylation Microarray를 이용한 비소세포폐암의 DNA Methylation Marker 발굴 (Identification of DNA Methylation Markers for NSCLC Using Hpall-Mspl Methylation Microarray)

  • 권미혜;이고은;권선중;최유진;나문준;조현민;김영진;설혜정;조영준;손지웅
    • Tuberculosis and Respiratory Diseases
    • /
    • 제65권6호
    • /
    • pp.495-503
    • /
    • 2008
  • 연구배경: 유전자의 후생적인 변화(epigenetic alteration)는 악성종양의 병인론에 있어서 유전자 변이와 동등한 위치를 점하고 있다. 특히 종양억제 유전자의 전사 촉진(promoter) 부위에 발생하는 비정상적인 메칠화(methylation)는 유전자의 발현을 침묵화(silencing)하고, 결과적으로 유전자의 기능 소실을 일으키게 된다. 저자들은 CpG island와 HpaII site를 가지고 있으며 암화 과정에 관여할 것으로 생각되는 유전자에 대하여 HpaII-MspI methylation microarray를 이용하여 새로운 종양억제 유전자를 발굴하고자 하였다. 방 법: 2005년 건양대학교 병원에서 수술한 비 소세포성 폐암 환자 10명에서 폐암조직과 상응하는 암 주변의 정상조직을 얻었으며, HpaII-MspI methylation microarray (Methyl-Scan DNA chip$^{(R)}$, Genomic tree, Inc, South Korea)를 이용하여 21개의 유전자에 대하여 DNA methylation profile을 분석하였다. 각각의 유전자에서 메칠화된 정도를 두 그룹에서 비교하였고, 정상 대조군으로 두 명의 젊고 건강한 기흉 환자에서 수술한 폐 조직에 대하여 methylation profile을 분석하였다. 결 과: 21개의 대상 유전자 중 10개의 유전자에서 폐암조직, 폐암 주변 정상 조직, 대조군에서 모두 공통적으로 과메칠화 되었고, 나머지 11개의 유전자 중 APC, AR, RAR-b, HTR1B, EPHA3, CFTR의 6개의 유전자에서 대조군에서 메칠화가 없으며, 폐암조직에서 폐암 주변 정상 조직에 비하여 더 빈번하게 과메칠화 되었다. 결 론: HTR1B, EPHA3, CFTR은 비소세포 폐암에서 후생적 변화로 발생하는 새로운 종양억제 유전자의 후보 유전자로서의 가능성이 있을 것으로 생각한다.

캄보디아 앙코르 유적에서 식생정비 사업의 양상과 특징에 관한 고찰 - 프레아 칸 사원·반테이 스레이 사원·타 프롬 사원을 중심으로 - (A Study on the Aspects and Characteristics of the Vegetation Maintenance Project at the Historic Site of Angkor, Cambodia -with the Focus on Preah Khan, Banteay Srei, and Ta Prohm Temples-)

  • 이재용;김영모
    • 헤리티지:역사와 과학
    • /
    • 제51권1호
    • /
    • pp.32-47
    • /
    • 2018
  • 본 연구는 공적개발원조(Official Development Assistance, ODA)의 일환으로 캄보디아 앙코르 유적에서 수행된 식생정비 사업의 사례를 통해 사업의 변화 양상과 특징 그리고 향후 ODA 사업을 추진하기 위한 정책 및 전략 수립에 주는 함의를 도출하고자 하였다. 그 내용은 다음과 같다. 첫째, 앙코르 유적에 있어서 식생은 단순한 식물(보다 구체적으로는 '수목')의 개념을 넘어 유산의 개념으로 확장되었다. 즉, 유산은 건축물뿐만 아니라 유적의 공간을 형성하는 식생과 그 주변 환경을 포함한다. 둘째, 유산으로서 식생의 가치 확대는 건축과 식생의 '공존(coexistence)'관계를 기반으로 한 보존 원칙을 정립하는데 기여하였고, 식생이 유적의 보존을 위한 '필수적' 대상으로 인식되게 하였다. 셋째, 사원의 주변 환경을 포함하는 식생정비의 범위 확대는 식생의 생육환경뿐만 아니라 이용자의 관람환경을 개선하기 위한 '통합적'이고 '적극적인' 정비방안을 마련하는 계기가 되었다. 이러한 변화는 향후 정비사업의 수행 시 사원을 포함한 주변 지역까지 종합적으로 다루어져야 함을 의미한다. 넷째, ODA 사업의 수행에 있어서 유네스코 산하 '앙코르 유적 보호를 위한 국제적 협력 감시기구(International Coordinating Committee for the Safeguarding and Development of the Historic Site of Angkor, ICC-Angkor)'의 역할은 기존에 선행된 사업의 문제점 검토와 해결책 모색에서 현재 진행 중인 사업의 기술적 자문과 감독으로 변화되었다. 이는 공여국이 현지 사정에 알맞은 ODA 사업을 수행하기 위해서는 ICC-Angkor와의 점진적이고 단계적인 협의 도출 과정의 중요성을 시사한다.