• 제목/요약/키워드: rule extraction

검색결과 199건 처리시간 0.02초

국가R&D보고서 기재항목에 관한 연구 (Standard Items for National R&D Reports)

  • 이강산다정;황혜경
    • 한국도서관정보학회지
    • /
    • 제51권4호
    • /
    • pp.211-230
    • /
    • 2020
  • 본 연구는 국가연구개발사업 성과로 발생한 최종보고서 기재항목 기준을 마련하여 데이터베이스 품질 향상과 관리 효율성 제고에 기여하고자 한다. 이를 위하여 과학기술정보통신부의 49개 산하기관에서 제출한 최종보고서를 수집하고 기관별 샘플을 선정하였다. 과학기술기본법 시행규칙의 최종보고서·요약서 서식과 대조하여 구성요소와 기재항목을 정립하고, 국가연구개발정보표준과 연계현황을 분석하여 최종보고서의 고유항목을 도출하였다. 기재항목은 중요도에 따라서 주요, 선택으로 구분하고 기재항목의 기입 위치를 제안하였다. 이와 같이 최종보고서 기재항목의 표준화가 진행되면, 데이터베이스 구축 시 메타데이터 추출 자동화와 보고서 메타데이터의 품질 향상을 기대해볼 수 있다.

재가노인 사례관리의 욕구사정 정확도 향상을 위한 욕구추출 알고리즘 개발 - 데이터 마이닝 분석기법을 활용하여 - (Development of Needs Extraction Algorithm Fitting for Individuals in Care Management for the Elderly in Home)

  • 김영숙;정국인;박소라
    • 한국사회복지학
    • /
    • 제60권1호
    • /
    • pp.187-209
    • /
    • 2008
  • 본 연구자들은 재가노인의 사례관리 과정에서 가장 핵심적인 요소가 되는 욕구 중심의 통합적 사정을 위한 28개의 욕구가 포함된 사정도구를 개발하였으며, 그 후속 연구로 개발된 욕구사정도구를 활용해 전국 노인복지관 협회 산하 120개 기관의 재가 노인 676명의 사정 데이터를 수집하고 데이터마이닝의 의사결정 나무분석 기법을 활용하여 욕구에 적합한 사회복지 서비스를 제공하기 위한 욕구추출 알고리즘을 개발하였다. 본 연구를 통해 재가노인의 욕구 28개에 대한 욕구추출 알고리즘은 <표3>에 요약하였다. 욕구 8번 "외출 시 도움을 원한다."의 의사결정모형을 예로 들면, 호소 23번을 주요 변인으로 외부이동 도움을 요청할 경우 80.3%와 요청하지 않을 경우 11.4%로 구분되었다. 이용자가 외부 이동에 대한 호소가 있고, 수발자가 있는 경우 87.9%로 욕구가 증가하였지만, 수발자가 없는 이용자의 경우 47.4%로 감소하였다. 노인이 외부이동 지원에 대한 요청과 수발자가 있으며, 청소하기의 완전도움이 필요한 경우, 외부이동 도움에 대한 욕구는 94.2%로 나타났다. 그러나 이용자가 외부이동의 도움을 요청하지 않더라도, ADL의 목욕하기에 완전도움으로 응답한 경우 외출도움의 욕구는 11.4%에서 80.0%로 급격히 증가하는 것을 확인할 수 있다. 그러나 ADL 목욕하기의 기능이 부분도움 또는 완전자립의 경우 외출도움이 필요하다고 분류될 가능성은 7.7%로 낮게 나타났다. 위와 같은 의사결정모형은 최대 나무 깊이는 5수준을 정지규칙으로 하여, 부모마디와 자식마디의 사례 수를 각각 50과 25로 지정하였다. 이를 통해 "외출 시 도움을 원한다"라는 욕구의 경우 182.13%의 효과적인 의사결정을 하고 있다. 본 연구의 결과로 제시한 알고리즘은 재가노인의 욕구를 추출함에 있어서 체계적이고 과학적인 기초자료로 활용될 수 있다.

  • PDF

사회연결망 분석을 활용한 연관규칙 확장기법 (Extension Method of Association Rules Using Social Network Analysis)

  • 이동원
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.111-126
    • /
    • 2017
  • 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 상품 탐색 시간을 줄여주며 판매자의 매출 증대에 크게 기여한다. 이는 주문과 같은 거래의 빈도를 기반으로 생성되므로, 통계적으로 판매 확률이 높은 상품을 효과적으로 선별할 수 있다. 하지만, 판매 가능성이 높은 경우라도 신상품처럼 판매 초기에 거래 건수가 충분하지 않은 상품은 추천에서 누락될 수 있다. 연관 추천에서 누락된 상품은 이로 인해 노출 기회를 잃게 되고, 이는 거래 건수 감소로 이어져, 또 다시 추천 기회를 잃는 악순환을 겪을 수도 한다. 따라서, 충분한 거래 건수가 쌓이기 전까지 초기 매출은 일정 기간 동안 정체되는 현상을 보이는데, 의류 등과 같이 유행에 민감하거나 계절 변화에 영향을 많이 받는 상품은 이로 인해 매출에 큰 타격을 입을 수도 있다. 본 연구는 이와 같이 거래 초기의 낮은 거래 빈도로 인해 잘 드러나지 않는 상품 간의 잠재적인 연관성을 찾아 추천 기회를 확보할 수 있도록 연관 규칙을 확장하기 위한 목적으로 수행되었다. 두 상품 간에 직접적인 연관성이 나타나지 않더라도 다른 상품을 매개로 두 상품 간의 잠재적 연관성을 예측할 수 있을 것이며, 이런 연관성은 주문에서 나타나는 상품 간 상호작용으로 표현될 수 있으므로, 사회연결망 분석을 활용한 분석을 시도하였다. 사회연결망 분석기법을 통해 각 상품의 속성과 두 상품 간 경로의 특성을 추출하고 회귀분석을 실시하여, 두 상품 간 경로의 최단 거리 및 경로의 개수, 각 상품이 얼마나 많은 상품과 연관성을 갖는지, 두 상품의 분류 카테고리가 어느 정도 일치하는지가 두 상품 간의 잠재적 연관성에 미친다는 것을 확인하였다. 모형의 성능을 평가하기 위해, 일정 기간의 주문 데이터로부터 연결망을 구성하고, 이후 10일 간 생성될 상품 간 연관성을 예측하는 실험을 진행하였다. 실험 결과는 모형을 적용하지 않는 경우보다 제안 모형을 활용할 때 훨씬 많은 연관성을 찾을 수 있음을 보여준다.

워드문서 콘텐츠의 사용자 XML 콘텐츠로의 변환 및 저장 시스템 개발 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.555-559
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 워드 문서를 대상으로 사용자가 작성한 구조적인 규칙과 XML 기반 워드 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)워드문서의 원시 XML문서로의 변환방법, 2)XML 기반 구조적인 규칙 작성과 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 워드문서의 변환을 위해서 독립적으로 동작하는 OCX 기반의 워드문서 변환 데몬(daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 구조적인 문서로 생성하거나 DB에 저장할 수 있다. 개발한 시스템(PPE)은 워드 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 처리를 하거나 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리 시스템과 성과정보시스템에 시범 적용하였다.

  • PDF

그룹 기여 방법을 이용한 ε-caprolactam 유도체와 이산화탄소의 상거동 예측에 관한 연구 (Prediction of Phase Behavior of ε-caprolactam Derivatives and Carbon Dioxide using a Group Contribution Method)

  • 권소영;배원;이경원;김화용
    • 청정기술
    • /
    • 제11권3호
    • /
    • pp.117-122
    • /
    • 2005
  • N-vinyl caprolactam (NVCL)은 초임계 분산 중합에 사용될 수 있는 비닐 아마이드 계열의 단량체이다. 이때 NVCL을 초임계 이산화탄소 상에서 분산 중합하기 위해서는 중합 초기 단계에 단량체가 $CO_2$에 모두 용해되어야 한다. 또한 최종 고분자로부터 미반응 단량체를 제거하기 위해서 중합 용매인 $CO_2$와 단량체 NVCL의 상거동 자료가 필수적이다. 하지만 단량체의 순수 물성은 측정 시 중합의 가능성이 있기 때문에 실험적인 제약이 있다. 본 연구에서는 이러한 단량체인 NVCL과 이와 유사한 작용기를 갖고 있는 N-methyl caprolactam (NMCL)의 순수 물성을 보다 정확하게 얻기 위하여 기존에 알려져 있는 그룹기여 방법을 수정하였다. 이때 유사한 구조를 갖는 ${\varepsilon}$-caprolactam을 바탕으로 새롭게 그룹 기여값을 얻고, 이를 NVCL, NMCL에 적용하였다. 또한 새롭게 수정된 순수 물성을 바탕으로 $CO_2$ + N-vinyl caprolactam과 N-methyl caprolactam 계에 대해 Peng-Robinson EOS와 van der Waals 1-fluid mixing rule을 이용하여 계산하고 실험값과 비교하였다.

  • PDF

잠재성 혈우병 환아에서의 편도 적출후 심한출혈의 1치험례 (A Masked Hemophilia B, Severe Bleeding after Tonsillectomy and Adenoidectomy)

  • 박영서;김기헌;김선무;이종무
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1972년도 춘계종합 학술대회 초록집
    • /
    • pp.17.1-17
    • /
    • 1972
  • 편도적출은 우리 이비인후과 임상에서 평소에 다반사로 행해지는 수술의 하나이라 하겠다. 수술술기의 개량, 마취의 발달과 더불어 각종 항생제의 발견등은 편도 적출술에 따르는 여러 가지 합병증을 감소시켰지만, 이중 수술중 또는 수술후에 왕왕 당하는 출혈문제는 가장 흔한 합병증의 하나이며 술자에게는 골치거리의 하나이기도 하여 아직껏 국내외에서 그 보고가 끊어지지 않고 있다. 특히 본증례에서와 같이 본태성 질환으로 인한 출혈의 해결에 있어서는 더욱 복잡곤란한 문제가 많을 것으로 생각된다. 혈우병은 1950년대에 이르러 각 Factor가 발견되어 현재는 혈우병 A.B.C.로 나뉘고 있다. 본증례는 11세의 남아로서 편도 척출술전에는 혈우병의 유무가 인지 못되었던 예로서 수술후 수술창에서 계속되는 출혈로 혈액응고장애를 가진 질환이라고 생각되어 여러 가지 검사결과 P.T.C의 결여로 오는 혈우병 B란 진단을 얻었기에 교훈적이고 귀중한 체험을 얻었다고 생각되어 보고하는 바이다. 환자는 수차의 수혈과 비인강탐폰 등의 방법으로 겨우 지혈되어 수술 20일만에 수술창이 치유되어 퇴원하였다.

  • PDF

Coreference Resolution을 위한 3인칭 대명사의 선행사 결정 규칙 (Antecedent Decision Rules of Personal Pronouns for Coreference Resolution)

  • 강승식;윤보현;우종우
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.227-232
    • /
    • 2004
  • 정보 검색 시스템에서 문서의 내용을 대표하는 용어를 추출하거나 정보 추출 및 텍스트 마이닝에서 특정 정보만을 추출하려면 고유명사에 대한 대용어 문제가 해결되어야 한다. 대용어 해소 문제는 인칭 명사에 대한 대명사의 선행사 결정 문제가 대표적이다. 본 논문에서는 한국어에서 문서의 내용을 보다 정확히 분석하기 위해 3인칭 대명사 “그/그녀/그들/그녀들”의 선행사를 결정하는 방법을 제안한다. 일반적으로 3인칭 대명사의 선행사는 현재 문장 또는 이전 문장의 주어인 경우가 많고, 또한 3인칭 대명사가 2회 이상 반복되는 경우가 자주 발생한다. 이러한 특성을 이용하여 현재 문장과 이전 문장에 출현한 인칭 명사들 중에서 선행사로 사용되는 경우를 조사하여 선행사 결정 규칙을 발견하였다. 이 경험 규칙은 3인칭 대명사의 격에 따라 조금씩 달라지기 때문에 대명사의 격에 따라 주격, 목적격, 소유격으로 구분하여 기술하였다. 제안한 방법의 타당성을 검증하기 위하여 신문 기사의 정치 관련 문서에서 대명사의 격에 따라 100개씩 총 300개의 실험 대상을 선정하였으며, 실험 결과로 3인칭 대명사의 선행사 결정 정확도는 재현율이 79.0%, 정확률이 86.8%로 나타났다.

직관적퍼지 DEMATEL&ISM법 기반 선박의 전주기를 고려한 선박관리산업의 경쟁력 강화 원인요인 도출 (Extraction of Cause Factors to Enhance the Competition of Ship Management Industry Considering Ship's Lifecycle based an Intuitionistic Fuzzy DEMATEL&ISM)

  • 장운재
    • 해양환경안전학회지
    • /
    • 제27권2호
    • /
    • pp.228-237
    • /
    • 2021
  • 최근 부산시는 선박관리산업의 관심을 증대시키고, 경쟁력을 강화 및 지원하기 위한 조례를 제정하였다. 본 연구는 직관적퍼지 DEMATEL&ISM법을 이용하여 선박관리산업 경쟁력 강화의 원인요인을 도출하는데 있다. 이를 위해 먼저 선박관리산업발전법에 명시된 내용을 기반으로 8개의 요인을 추출한다. 두번째는 직관적 퍼지수를 표준퍼지수를 이용하여 크리습 수로 변환한다. 세번째는 DEMATEL법을 이용하여 영향관계를 분석하고 ISM법을 이용하여 요인에 대해 우선순위를 결정한다. 영향관계 분석결과 원인요인은 기술적 선박관리 역량 제고, 육상관리인력 전문성 제고, 한국선원인력 자질향상으로 나타났다. ISM법에 의한 우선순위는 한국선원 자질향상, 육상관리인력 전문성 제고, 기술적 선박관리 역량제고, 상업적 선박관리 역량 제고, 종합정보시스템구축 = 선원 근로조건 및 고용환경 개선 = 금융 등 지원 = 외국인 선원 공급 강화 등의 순으로 나타났다. 따라서 전체 영역에서 원인요인이며 우선순위가 높은 상위 3개의 요인에 대해 우선적인 정책추진이 필요하다.

Active Phytochemicals of Indian Spices Target Leading Proteins Involved in Breast Cancer: An in Silico Study

  • Ashok Kumar Krishnakumar;Jayanthi Malaiyandi;Pavatharani Muralidharan;Arvind Rehalia;Anami Ahuja;Vidhya Duraisamy;Usha Agrawal;Anjani Kumar Singh;Himanshu Narayan, Singh;Vishnu Swarup
    • 대한화학회지
    • /
    • 제68권3호
    • /
    • pp.151-159
    • /
    • 2024
  • Indian spices are well known for their numerous health benefits, flavour, taste, and colour. Recent Advancements in chemical technology have led to better extraction and identification of bioactive molecules (phytochemicals) from spices. The therapeutic effects of spices against diabetes, cardiac problems, and various cancers has been well established. The present in silico study aims to investigate the binding affinity of 29 phytochemicals from 11 Indian spices with two prominent proteins, BCL3 and CXCL10 involved in invasiveness and bone metastasis of breast cancer. The three-dimensional structures of 29 phytochemicals were extracted from PubChem database. Protein Data Bank was used to retrieve the 3D structures of BCL3 and CXCL10 proteins. The drug-likeness and other properties of compounds were analysed by ADME and Lipinski rule of five (RO5). All computational simulations were carried out using Autodock 4.0 on Windows platform. The proteins were set to be rigid and compounds were kept free to rotate. In-silico study demonstrated a strong complex formation (positive binding constants and negative binding energy ΔG) between all phytochemicals and target proteins. However, piperine and sesamolin demonstrated high binding constants with BCL3 (50.681 × 103 mol-1, 137.76 × 103 mol-1) and CXCL10 (98.71 × 103 mol-1, 861.7 × 103 mol-1), respectively. The potential of these two phytochemicals as a drug candidate was highlighted by their binding energy of -6.5 kcal mol-1, -7.1 kcal mol-1 with BCL3 and -6.9 kcal mol-1, -8.2 kcal mol-1 with CXCL10, respectively coupled with their favourable drug likeliness and pharmacokinetics properties. These findings underscore the potential of piperine and sesamolin as drug candidates for inhibiting invasiveness and regulating breast cancer metastasis. However, further validation through in vitro and in vivo studies is necessary to confirm the in silico results and evaluate their clinical potential.