• 제목/요약/키워드: 부분 구문분석

검색결과 94건 처리시간 0.024초

명령형 프로그램의 핵심부분에 대한 정보흐름 보안성의 데이타 흐름 분석 (Data Flow Analysis of Secure Information-Flow in Core Imperative Programs)

  • 신승철;변석우;정주희;도경구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.667-676
    • /
    • 2004
  • 이 논문은 명령형 프로그램의 핵심 부분에 대한 정보흐름의 보안성을 데이타 흐름 분석법을 사용하여 예측하는 방법을 제시한다. 지금까지 제안된 분석 기법은 정보흐름이 안전한 프로그램을 안전하지 않다고 보수적으로 판정한다는 점에서 정밀도가 떨어지는 경우가 많이 있다. 이 논문에서는 이전의 구문중심의 접근방법보다는 분석결과가 더 정밀한 새로운 분석법을 제안하고, 그 분석의 안전성을 증명한다.

대학생들의 증명 구성 방식과 개념 이해에 대한 분석 - 부분 공간에 대한 증명 과정을 중심으로 - (An Analysis of Students' Understanding of Mathematical Concepts and Proving - Focused on the concept of subspace in linear algebra -)

  • 조지영;권오남
    • 대한수학교육학회지:학교수학
    • /
    • 제14권4호
    • /
    • pp.469-493
    • /
    • 2012
  • 본 연구는 증명을 성공적으로 구성하는 학생들은 수학적 개념을 어떻게 이해하고 있으며, 증명을 어떻게 구성하는 지를 살펴보고 이를 통해 증명을 구성하는 다양한 방식과 개념 이해의 관련성을 분석하는 데 목적이 있다. 증명 구성에 도움이 되는 수학 학습에 제언을 얻기 위해서는 증명을 구성하는 과정과 그 과정에서 개념이 어떻게 반영되고 이용되는 지를 살펴볼 필요가 있다. 이를 위하여 4명의 수학교육과 학생들을 대상으로 사례연구를 실시하였다. 그 결과 구문론적 증명을 하는 학생들은 형식적 개념의 내용을 정확하게 알고 있을 뿐만 아니라 그 개념이 담겨있는 명제는 어떠한 방식으로 증명하는 지 그 방법까지 알고 있었다. 실제 증명에서도 평소 증명 경험을 통하여 학습한 증명 전개 방법을 이용하여 증명하는 것을 볼 수 있었으며, 이로부터 증명 방법에 대한 절차적 지식이 구문론적 증명에는 중요한 요소라는 결론을 얻을 수 있었다. 의미론적 증명을 하는 학생들은 형식적 개념의 내용을 정확하게 알고 있고 그 내용과 의미를 본인만의 언어나 그림으로 표현한 개념 이미지를 가지고 있었다. 구문론적 증명을 하는 학생들의 개념 이미지와 비교해보았을 때, 의미론적 증명을 하는 학생들의 개념 이미지는 구문론적 증명을 하는 학생들의 개념 이미지보다 형식적 개념의 내용을 잘 반영하고 있었다. 이러한 개념 이미지는 개념 이미지를 활용하여 증명의 아이디어를 생각하고, 생각한 아이디어를 증명의 형식에 맞게 표현하는 데 사용된다는 점에서 의미론적 증명에 필요한 요소라는 것을 발견할 수 있었다.

  • PDF

모듈화된 신경망을 이용한 한국어 중의성 해결 시스템 (Word sense disambiguation using modular neural networks)

  • 한태식;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.39-42
    • /
    • 1995
  • 문장 안에서 한 단어가 가지는 올바른 의미를 얻기 위해 모듈화된 신경망을 이용하였다. 앞부분에 놓인 신경망은 코호넨 신경망으로 사용자의 지도가 개입되지 않은 상태로 자율학습(Unsupervised learning)이 이루어지고, 뒤에 놓인 신경망은 앞에서 결과로 얻은 2차원의 자기 조직화 형상지도(Self-organizing feature map)를 바탕으로 역전파 신경망을 이용한 지도학습(Supervised learning)을 하게 하였다. 입력 자료는 구문분석된 문장의 조사 정보를 활용하여 입력 위치를 정해준 명사의 의미표지와 동사의 의미표지를 사용하였다. 중의성이 있는 단어를 가지는 문장은 중의성의 가지수 만큼 테스트 입력 자료가 되어 신경망을 통과하여 의미를 결정하도록 한다.

  • PDF

구문해석을 이용한 색인어 자동 주출 시스템

  • 한성현;박혁로;최기선;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.16-23
    • /
    • 1990
  • 본 논문에서는 자동 색인 시스템 구현에 있어서 형태소 해석뿐만 아니라 구문해석을 응용하면 통계적 방법이나, 간단한 단서에 의한 색인어 추출보다 훨씬 나은 색인어 추출이 가능하다는 것을 보이고 한국어 필수적이 색인어로써 충분한 자질이 있다는 제안을 한다. 또 시스템의 전체적인 흐름과 필수격 처리 과정, 예외적인 자유격의 처리 등에 대한 부분을 설명하고, 결론에서는 사람이 추출한 색인어와 본 시스템의 결과를 비교, 분석한다.

  • PDF

기계독해 기반 한국어 의존 파싱 (Korean Dependency Parsing as Machine Reading Comprehension)

  • 민진우;나승훈;신종훈;김영길;김강일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.270-273
    • /
    • 2021
  • 한국어 의존 파싱은 전이 기반 방식과 그래프 기반 방식의 두 갈래로 연구되어 왔고 그 중 그래프 기반 의존 파싱 방법은 문장 내의 모든 단어에 대해 인코딩한 후 지배소, 의존소에 대한 MLP를 적용하여 각각 표상을 얻고 Biaffine 어텐션을 통해 모든 단어 쌍에 대한 그래프 점수를 얻고 트리를 생성하는 방법이 대표적이다. Biaffine 어텐션 모델에서 문장 내의 각 단어들은 구문 트리 내의 서브트리의 역할을 하지만 두 단어간의 의존성만을 판단하기 때문에 서브 트리의 정보를 이용할 수 없다는 단점이 존재한다. 본 연구에서는 이러한 단점을 해결하기 위해 제안된 Span-Span(서브트리-서브트리)로의 서브트리 정보를 이용할 수 있도록 하는 기계 독해 기반 의존 파싱 모델을 한국어 구문 분석 데이터 셋에 적용하여 소폭의 성능향상을 얻었다.

  • PDF

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

질의 응답 시스템을 위한 가변 길이 단락 검색 (Variable Length Passage Retrieval for Q&A System)

  • 이영신;황영숙;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.259-266
    • /
    • 2002
  • 질의 응답 시스템에서 보다 정확하게 정답을 판별하기 위해서는 구문분석 혹은 의미분석 등과 같은 복잡도가 높은 분석작업이 요구되며, 이러한 질의 응답 시스템 성능의 상한을 결정하는 검색 시스템은 가급적 적은 양의 검색 결과를 내주어서 질의 응답 시스템이 처리해야 할 작업량에 대한 부담을 덜어주어야 한다. 본 논문에서는 이러한 요구를 만족시키는 검색 시스템으로 가변 길이 단락 검색 시스템(variable length passage retrieval system)을 제안한다. 제안하는 검색 시스템은 질의에 대한 정답을 포함하고 있을 가능성이 있는 텍스트 영역은 질의에 따라 그 크기가 다를 것이라는 가정으로부터 출발한다. 그러므로 문서 전체를 검색하거나 고정 길이 단락으로 나누어져 색인되어 있는 부분 문서들을 검색하는 기존의 검색 방법과 달리, 제안된 시스템은 문서에서 임의의 길이로 이루어진 단락을 대상으로 동적인 단락 검객을 수행한다. TREC QA track의 질의집합 중 1번부터 100번까지의 질의에 대해 실험을 수행한 견과, 문서 검색 시스템이나 고정 길이 단락 검색 시스템은 상위 1000개의 문장까지 검색을 하였을 때 각각 96%, 98%의 재현율을 보인 반면, 가변 길이 단락 검색 시스템은 800개의 문장만으로도 98%의 재현율을 보이고, 900개의 문장을 검색하였을 경우 100%의 재현율을 보였다.

  • PDF

간호학의 기본 지식 구조 (Fundamental Structure of Knowledge in Nursing)

  • Lee, Kwang-Ja
    • 대한간호학회지
    • /
    • 제13권3호
    • /
    • pp.127-144
    • /
    • 1983
  • 오늘날은 과학문명의 발달로 인하여 기존지식의 수명이 점차 짧아져 가고있는 것이 특징이다. 지식의 증가는 단순히 지식의 양을 증가시키는 역할뿐 아니라 많은 기존지식을 불충분하고 쓸모 없는 것으로 바꿔버리게 한다. 그러므로 학교에서는 학생들에게 어떤 특정지식의 축척보다는 그 학문에 내재해 있는 기본적인 지식의 구조를 학습하게 하여 여러 가지 개념을 관련시키는 논리적 방법을 학습하게 하고 합리적인 탐구방법을 구사할 수 있도록 하여 변화하는 미지의 세계에 대처해 나갈 수 있도록 하는 것이 중요하다. 본 연구는 간호학의 기본 지식구조를 확인하는데 그 목적이 있다. 본 연구를 하게 된 동기는 간호업무의 근거로 활용도리 지식체계는 교육과정의 조직원리로 작용될 유형이나 구조를 지니고 있으며 이런 유형이나 구조를 중심으로 간호교육과정을 구성하는 것이 간호교육에 필수적이라는 문제에서 비롯되었다. 연구방법은 1982년 9월부터 1983년 5월에 걸쳐 간호학 문헌을 체계적으로 분석하여 간호학의 개념적 지식구조와 구문적 지식구조를 확인하였다. 그 결과 얻어진 결론은 다음과 같다. 1. 간호학의 개념적 구조: 모든 학문에는 탐구의 대상인 특수현상을 설명하고 서술하는데 활용되는 일련의 실질적, 개념적 구조를 가지고 있다. 그러나 그 학문의 중요한 부분 또는 중심을 포함하고 있는 개념들이 그 분야 또는 학문의 개략이라고 할 수 있는데 연구결과 간호학에서 가장 높은 순위의 대표적 특질을 지닌 개념은 인간, 건강, 환자/대상자, 간호, 행동으로 분석되었다. 2. 간호학의 구문적 지식구조 : 지식구조의 두 번째 요소인 학문의 구문(syntax)은 간호학에서의 특징적인 탐구방법과 관련되나 개념적 구조와 마찬가지로 탐구방법은 학문에 따라 다르며 그 분야의 주요양상을 나타낸다. 연구결과 간호학에서의 특징적인 탐구방법은 공동적으로 간호과정(nursing process)임이 나타났으며 그 요인으로는 사정, 진단, 계획, 수행, 평가의 다섯 단계로 분석되었다.

  • PDF

응용을 위한 품사 태깅 시스템의 매핑 (Application portable Part-Of-Speech tagger mapping)

  • 김준석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.368-375
    • /
    • 2000
  • 품사 태깅 시스템은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 분야인 구문분석, 의미분석의 전처리로 사용되거나, 기계번역, 정보검색이나 음성인식 및 합성 등과 같은 많은 응용 시스템을 위해서도 필요하다. 이렇게 여러 가지 목적을 위해 품사 태깅 시스템은 존재하는데, 각각의 응용을 위해서 최적화된 태깅 시스템을 따로 구성하기도 하고, 하나의 태깅 시스템을 여러 가지 응용을 위해서 사용하기도 한다. 이때, 문제가 되는 것 중에 하나는 각 응용마다 요구하는 품사 태그 세트가 다르다는 것이다. 품사 태그세트가 고정되어 있다면 어떤 응용을 위해서는 사용되는 품사 태그세트가 너무 적어서 문제가 되고, 반대로 품사태그세트가 너무 많아서 시스템의 수행속도가 중요시되는 응용에서 성능저하의 요인이 되기도 한다. 본 논문에서는 하나의 태깅 시스템의 품사태그세트를 조절할 수 있도록 하여 몇 가지 응용시스템에 맞게 최적화시킬 수 있는 방법론을 제시하고 실험을 통해서 시스템의 성능, 유지보수 및 시스템의 여러 리소스 관리 측면에서도 가장 효율적인 방법론임을 입증하고자 한다.

  • PDF

자동통번역 시스템의 언어 현상별 자동 평가 (Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points)

  • 최승권;최규현;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1041-1044
    • /
    • 2019
  • 자동통번역의 성능을 평가하는데 가장 잘 알려진 자동평가 기술은 BLEU이다. 그러나 BLEU로는 자동통번역 결과의 어느 부분이 강점이고 약점인지를 파악할 수 없다. 본 논문에서는 자동통번역 시스템의 언어 현상별 자동평가 방법을 소개하고자 한다. 언어 현상별 자동평가 방법은 BLEU가 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자로 하여금 해당 자동통번역 시스템의 언어 현상별 강점과 약점을 직관적으로 파악할 수 있도록 한다. 언어 현상별 정확도 측정은 Google 과 Naver Papago 를 대상으로 실시하였다. 정확률이 40%이하를 약점이라고 간주할 때, Google 영한 자동번역기의 약점은 스타일(32.50%)번역이었으며, Google 영한 자동통역기의 약점은 음성(30.00%)인식, 담화(30.00%)처리였다. Google 한영 자동번역기 약점은 구문(34.00%)분석, 모호성(27.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(30.00%)처리였다. Papago 영한 자동번역기는 대부분 정확률이 55% 이상이었으며 Papago 영한 자동통역기의 약점은 담화(30.00%)처리였다. 또한 Papago 한영 자동번역기의 약점은 구문(38.00%)분석, 모호성(32.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(20.00%)처리였다. 언어 현상별 자동평가의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.