• 제목/요약/키워드: 규칙정확도

검색결과 286건 처리시간 0.026초

Attention-based Sequence-to-Sequence 모델을 이용한 한국어 어체 변환 (Korean Text Style Transfer Using Attention-based Sequence-to-Sequence Model)

  • 홍태석;허광호;안휘진;강상우;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.567-569
    • /
    • 2018
  • 한국어의 경어체는 종결어미에 따라 구분하고, 서로 다른 경어체는 각각 고유한 경어 강도가 있다. 경어체 간의 어체 변환은 규칙기반으로 진행되어 왔다. 본 논문은 어체 변환을 위한 규칙 정의의 번거로움을 줄이고 어체 변환 데이터만을 사용한 심층 학습 기반의 어체 변환 방법을 제안한다. 본 연구는 '해요체-합쇼체' 쌍의 병렬 데이터를 이용하여 Attention-based Sequence-to-Sequence 모델을 바탕으로 한 어체 변환 모델을 학습하였다. 해당 모델을 학습하고 실험하였을 때, 정확도 91%의 우수한 성과를 얻을 수 있었다.

  • PDF

일반 등방경화 구성관계에 대한 내재적인 음력적분 : 1. 정식화 (Implicit Stress Integration of the Generalized Isotropic Hardening Constitutive Model : 1. Formulation)

  • 오세붕;이승래
    • 한국지반공학회지:지반
    • /
    • 제12권4호
    • /
    • pp.145-156
    • /
    • 1996
  • 연약한 지반의 거동을 적절하게 표현할 수 있는 일반 등방경화 규칙에 근거한 비등방경화 구성모델을 비선형 유한요소해석에 적용하기 위하여 내재적인 응력적분기법을 정식화하였다. 정식화된 응력적분기법은 비선형 해석시에 필요한 응력을 일반 사다리꼴규칙에 의하여 내재적으로 적분하고 응력변형률 접선계수를 비선형 해법에 일관되게 도출할 수 있다. 이러한 알고리즘을 통하여 해의 정확도 및 수렴도를 확보할 수 있으므로, 비등방경화 구성 관계를 적용한 비선형 해석을 정확하고 효율적으로 수행할 수 있는 토대를 구축할 수 있었다.

  • PDF

효율적인 색인을 위한 복합 명사의 분해 (Breaking Compound Nouns for Better Indexing)

  • 박수준;이현아;장명길;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.42-48
    • /
    • 1996
  • 정보검색에서의 효율적인 복합명사의 분석은 정확도와 재현율의 향상을 통해 색인의 질을 높여준다. 복합명사의 분석은 많은 노력이 요구되는 작업이다. 본 논문은 간단한 분해규칙을 이용하여 복합명사의 의미해석을 대신하였다. 실험을 위해 동아일보 사설을 대상으로 복합명사를 추출하고 이를 도출된 분해규칙을 이용하여 분해하였다. 실험을 통해 평균 96.2%의 분해 성공률을 보였다.

  • PDF

시소러스를 이용한 온톨로지의 Is-a 관계 설정 (Identification of Is-a Relation in Ontology based on Thesaurus)

  • 황금하;이신목;남윤영;신지애;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.20-23
    • /
    • 2006
  • 시소러스의 개념과 개념간 계층관계가 온톨로지 구축에 흔히 이용되고 있다. 다만 시소러스 계층관계는 is-a관계 뿐만 아니라 세분화되지 않은 관계도 포함되고 있기 때문에, 온톨로지의 기본 관계인 is-a관계를 분별하는 작업이 필요하다. 본 논문은 개념의 어휘표현 정보를 이용하여 온톨로지의 is-a관계를 설정하는 규칙을 제시하였고, 개념의 정의문 정보를 이용하여 is-a관계를 검수하는 방법을 제안하였다. IT분야 시소러스에 대한 is-a관계 설정 실험결과, 어휘표현 정보를 이용한 규칙 기반 is-a관계 설정은 85.83%의 정확도를 보였고, 정의문 정보를 이용한 is-a관계 판단의 일관성 평가 결과 일치도가 86.44%였다.

  • PDF

구조물의 3차원 모델링을 위한 직선측정기법의 적용 (The Application of Line Measurement Method for 3D Modeling of Construction)

  • 강준묵;김위현;강기석
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2002년도 추계학술발표회 논문집
    • /
    • pp.117-120
    • /
    • 2002
  • 일반적으로 많은 건축물들은 형태의 규칙성에 기인된 일련의 정의된 규칙을 이용하여 축조된다. 하지만, 기존 사진실측으로 건축물에 대한 3차원 모델링을 수행하기 위해서는 많은 기준점의 배치, 영상의 피복범위에 따른 촬영점 선점, 중복도 고려 등 다소 복잡한 절차가 수반된다. 본 연구에서는 평행, 수직성, 평면과 같은 대상물에 대한 사전정보가 유용하게 적용될 수 있는 건축물의 3차원 재건분야에 직선측정기법을 적용함으로써, 기존의 까다로운 조건을 탈피하여 보다 효율적으로 3차원 모델을 재현해 본 후, 정확도 검증을 통해 건축물 사진측량 분야에 이러한 기법의 효용 가능성을 제시하고자 하였다.

  • PDF

변환 기반 학습을 이용한 한국어 비교 문장 유형 분류 (Classifying Korean Comparative Sentences Using Transformation-based Learning)

  • 양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-34
    • /
    • 2009
  • 본 연구의 목표는 비교 문장들을 일곱 가지 유형으로 자동 분류하는 것으로서, 비교 문장 추출, 비교 문장 유형 분류, 유형별 비교 관계 분석으로 이어지는 비교마이닝 세 단계 중 두 번째 과제이다. 본 연구에서는 변환 기반 학습(Transformation-based Learning) 기법을 이용한다. 자연어 처리 분야 여러 부문에서 사용되고 있는 변환 기반 학습은 오류를 감소시키는 최적의 규칙을 자동으로 생성하여 정답을 찾는 규칙 기반 학습 방법이다. 웹상의 다양한 도메인에서 추출한 비교 문장들을 대상으로 실험한 결과, 일곱 가지 비교 문장 유형을 분류하는데 있어서 정확도 80.01%의 우수한 성능을 산출하였다.

  • PDF

규칙기반 단어 클러스터링에 의한 문서 분류의 성능 향상 (Performance Improvement of Document Classification by Rule-based Word Clustering)

  • 현우석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.196-198
    • /
    • 2006
  • 분류되지 않은 문서의 문서 분류는 현재까지 아주 중요한 문제로 대두되고 있다. 컴퓨터를 이용한 문서 검색 엔진인 Citeseer에서는 문서 인덱싱을 하기 위해서 자동문서 분류 방법을 사용하고 있다. 문서 분류는 원본 문서의 단어들을 제1의 속성 표현으로 사용한다. 그러나 이와 같은 표현은 고차원과 속성 부족을 초래하게 된다. 단어 클러스터링은 속성 차원과 속성 부족을 감소시키기 위한 효율적인 방법이며 문서 분류 성능을 향상시켜 준다. 본 연구에서는 클러스터 속성 표현을 위한 도메인 규칙기반 단어 클러스터링 방법을 사용한다. 클러스터는 다양한 도메인 데이터베이스들과 단어 철자 속성들로부터 생성되는데, 이와 같은 클러스터 속성 표현은 중요한 차원 감소뿐만 아니라 문서 헤더 라인의 평균 분류 성능에서 향상을 보여 주었고, 원본 문서 단어 기반 속성 표현과 비교해 보았을 때 도서목록 항목 추출의 정확도를 향상시켰다.

  • PDF

결합적 방법에 의한 귀납법칙 집합의 생성 (An Integrated Method for Generating Inductive Rule Sets)

  • 이창환
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.27-32
    • /
    • 2003
  • 귀납법칙 생성 시스템은 데이터에서부터 법칙을 자동으로 발견하는 시스템으로서 현재 많은 연구가 진행되고 있다. 본 논문은 정보이론을 이용하여 데이터로부터 귀납법칙을 자동으로 생성하는 시스템을 제시하고 또한 귀납법칙 생성 시스템에 의하여 생성되는 규칙들 중에서 가장 좋은 성능을 보이는 규칙 집합을 구하기 위하여 이를 유전자 알고리즘과 결합시켜 최적화된 귀납법칙 집합을 탐색하는 방법을 제시하였다. 제안된 시스템의 성능을 평가하기 위하여 다수의 기계학습 데이터를 사용하여 기존의 다른 방법들과 비교하였으며, 제안된 시스템은 대부분의 경우에 좋은 정확도를 제공하였다.

안전한 코딩을 위한 정적 C 코드 분석기 개발 (An Implementation of Static C - Code Analyzer for Secure Coding)

  • 류두진;성시원;김덕헌;한익주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.244-247
    • /
    • 2010
  • 최근 Application 의 취약성을 악용한 해커들의 시스템 공격 사례가 증가하고 있다. 본 논문에서 다루는 코드 분석기는 이러한 해커의 공격을 사전에 차단하기 위해 사용자로부터 입력받은 Application 의 소스 코드가 사전에 탑재해 놓은 일련의 보안 규칙(Security Rule)을 제대로 준수하는지의 여부를 어휘 분석(Lexical Analysis)과 구문 분석(Semantic Analysis)을 통해 판별해 낸다. 본 코드 분석기는 미국 카네기멜론대학(CMU) 산하의 인터넷 해킹 보안 기구인 CERT 에서 제시하는 규칙을 그대로 적용하여 분석 결과의 정확도와 객관성을 높였으며, 이 분석기를 통해 프로그래머가 신뢰도와 보안성이 높은 소프트웨어를 개발할 수 있도록 하였다.

이진 표현을 이용한 효율적인 연관 규칙 탐사 알고리즘 (An Efficient Algorithm for Mining Association Rules using a Binary Representation)

  • 김원영;최원길;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.375-378
    • /
    • 2008
  • 오늘날 지식을 기반으로 하는 고도의 정보사회로 나아가는 시점에서 우리는 대량의 데이터 속에서 필요한 지식을 찾아내는 것에 초점을 모으게 되었다. 따라서 대량의 데이터 속에서 필요한 지식을 자동으로 찾아내는 데이터 마이닝에 대한 연구가 활발히 진행되고 있다. 데이터 마이닝은 대용량의 데이터를 대상으로 하기 때문에 정확도뿐만이 아니라 소요시간도 중요하기 때문에 성능 향상을 위한 알고리즘들이 많이 개발되었다. 데이터 마이닝의 성능을 향상시키기 위해서 가장 좋은 방법이 데이터베이스의 스캔의 횟수를 줄이는 것이다. 본 논문에서는 연관 규칙 탐사에서 빈발 항목 집합을 찾아내는 부분을 이진 표현을 이용하여 좀 더 성능을 향상시킬 수 있는 알고리즘을 제안한다.