• 제목/요약/키워드: 집합론

검색결과 279건 처리시간 0.026초

Bidirectional GRU-GRU CRF 기반 참고문헌 메타데이터 인식 (Bidirectional GRU-GRU CRF based Citation Metadata Recognition)

  • 김선우;지선영;설재욱;정희석;최성필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.461-464
    • /
    • 2018
  • 최근 학술문헌이 급격하게 증가함에 따라, 학술문헌간의 연결성 및 메타데이터 추출 등의 핵심 자원으로서 활용할 수 있는 참고문헌에 대한 활용 연구가 진행되고 있다. 본 연구에서는 국내 학술지의 참고문헌이 가진 각 메타데이터를 자동적으로 인식하여 추출할 수 있는 참고문헌 메타데이터 인식에 대하여, 연속적 레이블링 방법론을 기반으로 접근한다. 심층학습 기술 중 연속적 레이블링에 우수한 성능을 보이고 있는 Bidirectional GRU-GRU CRF 모델을 기반으로 참고문헌 메타데이터 인식에 적용하였으며, 2010년 이후의 10종의 학술지내의 144,786건의 논문을 활용하여 추출한 169,668건의 참고문헌을 가공하여 실험하였다. 실험 결과, 실험집합에 대하여 F1 점수 97.21%의 우수한 성능을 보였다.

  • PDF

제약 조건 만족과 불확실한 지식의 처리 (Constraint Satisfaction and Uncertain Knowledge)

  • 신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제6권2호
    • /
    • pp.17-27
    • /
    • 1995
  • 제약 조건 만족의 관점에서 불확실한 지식을 표현하고 처리하는 방법을 제안하였다. 등식이나 부등식은 만족되어야 할 제약 조건들이며, 제약 조건들은 수리 논리식으로 표현될 수 있는데 이들은 주어진 수리 논리식들의 집합에 대한 만족성을 계산하는 제약 조건 해결 프로그램에 의해 답을 얻을 수 있다. 불확실성을 포함한 규칙 기반 시스템들은 확률론의 초보적인 내용을 응용하여 표현되는데, 이 경우 제약 조건 해결 프로그램으로 효율적인 결과를 얻을 수 있다.

  • PDF

방사성 폐기물관리에 모호집합론적 접근법의 적용 (Use of Fuzzy Set Theoretical Approach in Radioactive Waste Management)

  • 문주현;김성호
    • 한국에너지공학회:학술대회논문집
    • /
    • 한국에너지공학회 1998년도 추계 학술발표회 논문집
    • /
    • pp.64-68
    • /
    • 1998
  • This paper discusses the potential application of fuzzy set theory to the decision-making in the area of radioactive waste management. the approach proposed in this study is based on the concepts of fuzzy set theory and the hierarchical structure analysis. The linguistic variables and fuzzy numbers are used to aggregate the decision maker's subjective assessments of the decision criteria and of the decision alternatives with respect to these criteria. For each alternative, the fuzzy appropriateness index is evaluated to obtain the final score. Using total integral value method, one of methods for ranking fuzzy numbers, the fuzzy appropriateness indices are ranked. As a case problem, selection of the most suitable option for spent fuel storage is illustrated.

  • PDF

객체-관계형 데이터베이스 기반의 XML 응용을 위한, UML을 이용한 통합 설계 모델링 (A Unified Design Modeling using UML for XML Applications based on ORDB)

  • 방승윤;주경수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.28-30
    • /
    • 2002
  • B2B 전자상거래와 같이 XML을 이용한 정보교환이 확산되고 있으며 이에 따라 상호 교환되는 정보에 대하여 체계적이며 안정적인 저장관리가 요구되고 있다. 이를 위해 XML 응용과 데이터베이스 연계를 위한 다양한 연구가 관계형 데이터베이스를 중심으로 수행되었다. 그러나 계층구조를 갖는 XML 데이터를 2차원 테이블의 집합인 관계형 정보로 표현하는 관계형 데이터베이스로의 저장에는 본질적인 한계가 있어, 계층구조를 지원하는 ORDB로의 저장이 요망된다. 따라서 계층구조를 갖는 XML 데이터를 ORDB로 저장하기 위한 모델링 방안이 요구된다. 본 논문에서는 UML을 이용한, ORDB 기반의 XML 응용을 우한 통합 설계 방법론을 제안한다. 이를 위하여 먼저 UML을 이용하여 W3C XML Schema를 설계하기 위한 XMI. 모델링 방안을 제시하고, 아울러 교환되는 XML 데이터를 효율적으로 저장하기 위하여 ORDB 스키마 설계를 위한 데이터 모델링 방법을 제안한다.

  • PDF

객체지향 데이터베이스 기반의 XML 응용을 위한, UML을 이용한 통합 설계 모델링 (A Unified Design Modeling using UML for XML Applications based on OODB)

  • 방승윤;주경수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.35-38
    • /
    • 2002
  • B2B 전자상거래와 같이 XML을 이용한 정보교환이 확산되고 있으며 이에 따라 상호 교환되는 정보에 대하여 체계적이며 안정적인 저장관리가 요구되고 있다. 이를 위해 XML 응용과 데이터베이스 연계를 위한 다양한 연구가 관계형 데이터베이스를 중심으로 수행되었다. 그러나 계층구조를 갖는 XML 데이터를 2차원 테이블의 집합인 관계형 정보로 표현하는 관계형 데이터베이스로의 저장에는 본질적인 한계가 있어, 계층구조를 지원하는 객체지향 데이터베이스로의 저장이 요망된다. 따라서 계층구조를 갖는 XML 데이터를 객체지향 데이터베이스로 저장하기 위한 모델링 방안이 요구된다. 본 논문에서는 UML을 이용한 객체지향 데이터베이스 기반의 XML 응용을 위한 통합 설계 방법론을 제안한다. 이를 위하여 먼저 UML을 이용하여 W3C XML Schema를 설계하기 위한 XML 모델링 방안을 제시하고, 아울러 교환되는 XML 데이터를 효율적으로 저장하기 위하여 객체지향 데이터베이스 스키마 설계를 위한 데이터 모델링 방법을 제안한다.

  • PDF

공간 데이터 마이닝에서의 질의 처리 최적화 전략 (Query Optimization Infrastructure in Spatial Data Mining)

  • 김충석;이현창;김경창
    • 한국통신학회논문지
    • /
    • 제26권7A호
    • /
    • pp.1200-1211
    • /
    • 2001
  • 최근 각광을 받고 있는 데이터 마이닝 분야에서 데이터 마이닝 툴과 시스템의 등장으로 상호적이고 사용하기 쉬운 GUI 환경의 강력한 데이터 마이닝 질의 언어가 필요하게 되었다. 공간 데이터 마이닝은 공간 데이터에서 유용한 지식을 발견하기 위한 데이터 마이닝의 한 부문이며 공간 데이터는 점, 선, 사각형, 다각형 등으로 이루어져 있다. 공간 데이터 마이닝은 지리정보시스템(GIS)과 더불어 최근에 많은 관심과 연구가 활발히 진행되고 있다. 한편, 공간 데이터 마이닝을 위한 질의 언어와 그 언어에 기반한 공간 데이터 마이닝 질의 처리 및 최적화에 대한 연구가 중요하게 대두되고 있다. 공간 데이터에 대한 마이닝은 일반 관계형 데이터베이스에서의 질의 언어로는 표현이 불가능하다. 본 연구에서는 먼저 공간 데이터 마이닝 질의언어를 정의, 설계하고 질의 언어에 결과 표현 방식과 결과 데이터 집합의 저장을 명시하여 질의 표현의 효율을 높이는 방식을 제시하였다. 또한 공간 데이터 마이닝을 위한 질의 처리 및 최적화 과정을 질의에 기반한 공간 실체화 뷰의 생성과 유지, 인덱스 활용을 통한 질의 재사용, sampling 마이닝 질의 option 등의 방법론을 이용하여 제시하였다.

  • PDF

Knowledge Extraction from Academic Journals Using Data Mining Techniques

  • 남수현;김홍기
    • 디지털융복합연구
    • /
    • 제3권1호
    • /
    • pp.75-88
    • /
    • 2005
  • 최근 우리는 인접학문 간 그리고 학계와 산업계간의 연구협조가 점차 증가하고 있음을 보아오고 있다. 이러한 현상은 특히 학술저널 간 지식의존성을 촉진하는 계기를 제공하고 있다고 할 수 있다. 본 논문의 목적은 관련저널 간 지식상호 의존성을 규명하고 저널지식의 구조화를 위하여 연관성 (association), 군집화, 링크분석 등 데이터마이닝 기법을 적용하는 방법론을 제시하는 것이다. 제시된 방법을 통하여 기대되는 점들은 1) 논문의 기본 속성인 키워드, 저자, 그리고 인용데이터를 통합하는 규칙 집합을 통하여 논문지식검색기능의 향상, 2) 키워드를 기반으로 관련 저널 간 그리고 저널내부의 군집분석으로 지식동향 파악, 3) Kleinberg (1999)의 권위와 허브 개념을 인용데이터 분석에 활용하여 기존의 양적 평가 기준인 영향력지수 (impact factor)의 문제점을 보완하며, 4) 특정 논문이나 저널의 지식파급과 관련한 영향력을 산출하는 잠재적 지식파급 지수를 제안하는 것이다.

  • PDF

중요 문장추출 휴리스틱과 MMR을 이용한 질의기반 문서요약. (Query-Based Document Summarization using Important Sentence Selection Heuristics and MMR.)

  • 김동현;이승우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-291
    • /
    • 2002
  • 본 논문은 자연어 검색엔진에서의 검색결과에 대한 HIT LIST[6]와 검색 문서의 요약을 위하여 질의 기반의 3단계 문서요약을 제안한다. 첫째단계로 IR에 주어지는 질의를 유의어 DB를 통해 질의확장을 거친다. 둘째로 질의와 검색문서상의 문장의 유사도 계산을 통해 문장의 중요도 점수를 구한다. 좀더 정확한 요약을 위해 4가지 방법론을 적용하여 각 문장의 중요도를 ranking한다. 셋째로 MMR (Maximal Marginal Relevance)방식을 적용하여 요약 시 중복이 되는 부분을 줄인다. 이때 요약 압축률을 임의로 조절할 수 있다. 실험은 KORDIC의 신문기사로 구성된 문서요약 테스트 집합을 사용하여 좋은 요약결과를 얻었다.

  • PDF

상황의미론에 의한 명사구의 의미분석 (An Analysis on Noun Phrases in Situation Semantics)

  • 경정숙
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.261-267
    • /
    • 1993
  • Barwise & Cooper (1991)는 Hans Kamp(1981)의 DRS(Discourse Representation structure)를 기초로 EKN(Extended Kamp Notation)을 개발하였다. 본 논문은 EKN을 통해 실제 자연언어의 의미를 분석하는 데 그 목적이었다. 특히 이 논문은 양화사 의미해석의 기본개념이 되는 자원상황(resource situation), 치역(range), 사건(event) 등의 개념을 구체화하여 영어나 한국어 명사구의 누적성과 의존성에 관련된 의미를 분석한다. '세명의 학생이 (비디오 가게에서) 영화 일곱편을 빌렸다'라는 표현은 '학생'과 '영화'의 배분성 ${\pm}$ 과 집합성 ${\pm}$ 에 의한 일곱가지 해석 이외에 '세명의 학생이 각자 빌린 영화들이 일곱가지'라는 누적적 해석도 가능하다. 이러한 명사구의 누적적 해석에 대하여 분석하고, 'John always wears a tie,. They, were all silk,'에서 'a tie'와 'they'가 공지표화(i) 되기 위한 통사적 요건(성, 수의 일치)을 충족하지 않는 의존적 복수에 대하여도 분석한다.

  • PDF

신경계 행위 표현 및 검증을 위한 FPN 설계 (Design on a Fuzzy Petri Net for Representation and Verification for Nervous System Behaviors)

  • 김성렬;김용승;이상호;이철희
    • 한국통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.677-687
    • /
    • 1992
  • 본 논문은 신경계 행위 표현의 효율성과 동작의 정당성을 검증할 수 있는 모형화 도구로 FPN을 제안 하였다. 설계를 위해 기존의 통신망과 신경망 행위의 표현과 검증의 유사성 및 차이점을 분석하고, 신경계의 애매 모호성의 효율적인 표현을 위하여, PN에 Fuzzy 집합 이론을 적용하여 FPN 모형을 설계하였다. 설계된 FPN을 다층 퍼센트론 구조로 표현하여 그 효율성이 우수함을 보였다.

  • PDF