• 제목/요약/키워드: Sequence characteristics

검색결과 1,892건 처리시간 0.022초

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

한국(韓國)의 주요(主要) 모암(母岩)에서 발달(發達)된 토양점토광물(土壤粘土鑛物)의 특성(特性)과 생성학적(生成學的) 연구(硏究) IV. 토양점토광물(土壤粘土鑛物)의 분포(分布) 및 생성(生成) (Genesis and Characteristics of the Soil Clay Minerals Derived from Major Parent Rocks in Korea IV. Genesis and Distribution of the Soil Clay Minerals)

  • 엄명호;임형식;김태순
    • 한국토양비료학회지
    • /
    • 제25권3호
    • /
    • pp.202-212
    • /
    • 1992
  • 화강암(花崗岩), 화강편마암(花崗片麻岩), 석회암(石灰岩), 혈암(頁岩), 현무암등(玄武岩等) 우리나라의 주요(主要) 모암(母岩)에서 발달(發達)된 토양(土壤)을 대상(對象)으로 점토광물(粘土鑛物)의 생성과정(生成過程)을 구명(究明)하기 위하여 모암(母岩)의 조암광물(造岩鑛物)과 토양(土壤)으로 부터 분리(分離)한 모래와 미사(微砂)의 1차광물(次鑛物) 분포(分布)와 광물학적(鑛物學的) 특성변화(特性變化)를 보고(報告)한 바 있다. 본보(本報)에서는 점토(粘土)에 대한 화학조성(化學組成), 광물(鑛物)의 분리동정(分離同定) 및 특성변화(特性變化)를 기(旣) 보고(報告)된 성적(成績)과 관련(關聯)시켜 고찰(考察)함으로써 각 토양점토광물(土壤粘土鑛物)의 풍화생성과정(風化生成過程)을 모암(母岩)의 조암광물(造岩鑛物)로 부터 종합적(綜合的)으로 구명(究明)코자 하였으며, 아울러 점토광물(粘土鑛物)의 정량화(定量化)를 시도(試圖)하였던 바 그 결과를 요약(要約)하면 다음과 같다. 1. 점토(粘土)의 양(陽)이온치환용량(置換容量)은 vermiculite, chlorite 또는 illite 함량(含量)이 많을 수록 크며, vermiculite 함량(含量)이 많은 점토(粘土)라도 수산화물(水酸化物)의 층간침입(層間侵入) 정도(程度)가 크면 양(陽)이온치환용량(置換容量)은 적어지는 경향(傾向)이었다. 2. 화강암(花崗岩)과 화강편마암(花崗片摩岩)의 장석류(長石類)는 kaolin광물(鑛物)로 대부분 풍화(風化)되었고, 이밖의 운모광물(雲母鑛物), 연이석(緣泥石), 각섬석(角閃石), 휘석(輝石)으로 부터 생성(生成)된 illite, chlorite, vermiculite는 풍화중간(風化中間)에 illite/vermiculite와 illite/chlorite, 그리고 chlorite/vermiculite의 혼층단계(混層段階)를 거치게 되고 최종적(最終的)으로 kaolin광물(鑛物)로 풍화(風化)되는 것으로 판단(判斷)되며 vermiculite에 수산화물질(水酸化物質)의 층간침입정도(層間侵入程度)는 표토(表土)로 갈수록 증대(增大)되는 경향(傾向)이었다. 3. 석회암(石灰岩) 토양(土壤)의 점토(粘土)에는 smectite가 상당량(相當量) 함유(含有)되었으며, 이는 Mg농도(濃度)가 높은 토양용액(土壤溶液)으로 부터 직접(直接) 침전(沈澱)되어 생성(生成)되었거나, 운모(雲母) 또는 chlorite에서 유래(由來)된 vermiculite의 변성작용(變成作用)에 의해 생성(生成)되는 것으로 해석(解釋)되었다. 4. 혈암(頁岩) 토양(土壤)의 점토(粘土)에 다량(多量) 존재(存在)하는 illite는 주로 풍화(風化)에 저항성(抵抗性)이 큰 미립자(微粒子)의 함수백운모(含水白雲母)로 유래(由來)되는 것으로 보이며, 토양(土壤)의 발달정도(發達程度)에 따라 함수백운모(含水白雲母)${\rightarrow}$illite/vermiculite 풍화단계(風化段階)(대구통(大邱統))와 풍화(風化)가 더욱 진전(進展)된 함수백운모(含水白雲母)${\rightarrow}$illite/vermiculite${\rightarrow}$vermiculite${\rightarrow}$kaolin의 풍화단계(風化段階)(부여통(扶餘統))로 구분(區分)되었다. 5. 현무암(玄武岩)의 사장석(斜長石)은 주로 kaolin광물(鑛物)로 풍화(風化)되고, 휘석(輝石)은 휘석(輝石)${\rightarrow}$chlorite${\rightarrow}$chlorite/vermiculite${\rightarrow}$kaolin의 과정(過程)을 밟지만 illite와 illite/vermiculite의 존재(存在)로 보아 휘석(輝石)${\rightarrow}$chlorite${\rightarrow}$illite의 풍화과정(風化過程)도 인정(認定)되었다. 6. 열분석(熱分析)(DTA, TG)에 의한 점토광물(粘土鑛物)의 정량결과(定量結果), vermiculite 함량(含量)은 석회암(石灰岩) 장성통(長城統)에서 21.7%로 가장 많았고, 혈암(頁岩)의 부여통(扶餘統)은 9.2%, 대구통(大邱統)은 5.4%로 적었으며, 나머지 토양(土壤)은 8.8%~28.3% 함유(含有)하고 있었다. Kaolin 광물(鑛物)의 함량(含量)은 화강편마암(花崗片麻岩)의 아산통(雅山統)에서 32.7%, 현무암(玄武岩)의 구엄통(舊嚴統)에서 32.0%로 많았고 석회암(石灰岩)의 평안통(平安統) 14.9%, 장성통(長城統) 9.4%로 적었으며, 혈암(頁岩)의 대구통(大邱統)에서 8.9%로 가장 적었다. 이밖의 토양(土壤)에서의 kaolin 함량(含量)은 20.0%~28.6%이었다. Gibbsite함량(含量)은 화강암(花崗岩)의 월정통(月精統)에서 3.9%, 차항통(車項統)에서 2.3%, 화강편마암(花崗片麻岩)의 아산통(雅山統)에서 1.4%, 청산통(靑山統)에서 4.5%, 그리고 현무암(玄武岩)의 장성통(長城統)에서 3.6%이었다.

  • PDF