• 제목/요약/키워드: 존재의 언어

검색결과 711건 처리시간 0.026초

연역논증과 귀납논증 (Deductive Argument and Inductive Argument)

  • 전재원
    • 철학연구
    • /
    • 제141권
    • /
    • pp.187-202
    • /
    • 2017
  • 본 논문의 목적은 필연성과 개연성을 기준으로 연역논증과 귀납논증을 구별할 때 제기되는 몇 가지 문제점을 구체적으로 살펴보면서 현대논리학에서의 연역-귀납 개념과 아리스토텔레스의 쉴로기스모스-에파고게 개념의 차이를 명료하게 밝히는 것이다. 첫째, 현대논리학에서는 연역논증을 타당한 연역논증과 타당하지 않은 연역논증으로 구별하지만 아리스토텔레스에게는 타당하지 않은 쉴로기스모스라는 표현이 없다. 따라서 아리스토텔레스의 관점에서 보면 타당하지 않은 연역논증을 귀납논증으로 간주해야 하는 문제가 발생하지 않는다. 둘째, 현대논리학에서는 연역논증과 귀납논증 간에 심각한 불균형이 존재하지만 아리스토텔레스의 관점에서 보면 그러한 불균형이 존재하지 않는다. 현대논리학에서 연역논증과 귀납논증 간에 심각한 불균형이 존재하게 되는 이유는 연역논증의 경우에 결론이 잘 수립되는지를 확인하기 위해서 논증의 논리적 형식만 검토하면 되지만 귀납논증의 경우에는 결론이 얼마만큼의 개연성을 가지고 도출되는지를 확인하기 위하여 논증의 형식 이외에 부가적인 정보가 필요하기 때문이다. 그러나 아리스토텔레스에게는 연역논증과 귀납논증의 논리적 형식이 동일하기 때문에 그러한 불균형이 존재하지 않는다. 다만 연역논증은 언어로부터 언어에로(명제로부터 새로운 명제에로) 이동하는 논증인 반면에 귀납논증은 경험적 관찰로부터 언어에로(감각적 지각으로부터 명제에로) 이동하는 논증이라는 차이가 있을 뿐이다. 셋째, 현대논리학에서는 전제(들)이 실제로 참인 명제이든 거짓인 명제이든 참인 명제라고 가정하지만 아리스토텔레스는 그렇게 가정하지 않는다. 쉴로기스모스는 개념적으로 참인 명제로부터 출발하고 에파고게는 경험적으로 참인 명제로부터 출발한다.

KoDialoGPT2 : 한국어 일상 대화 생성 모델 (KoDialoGPT2 : Modeling Chit-Chat Dialog in Korean)

  • 오동석;박성진;이한나;장윤나;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.457-460
    • /
    • 2021
  • 대화 시스템은 인공지능과 사람이 자연어로 의사 소통을 하는 시스템으로 크게 목적 지향 대화와 일상대화 시스템으로 연구되고 있다. 목적 지향 대화 시스템의 경우 날씨 확인, 호텔 및 항공권 예약, 일정 관리 등의 사용자가 생활에 필요한 도메인들로 이루어져 있으며 각 도메인 별로 목적에 따른 시나리오들이 존재한다. 이러한 대화는 사용자에게 명확한 발화을 제공할 수 있으나 자연스러움은 떨어진다. 일상 대화의 경우 다양한 도메인이 존재하며, 시나리오가 존재하지 않기 때문에 사용자에게 자연스러운 발화를 제공할 수 있다. 또한 일상 대화의 경우 검색 기반이나 생성 기반으로 시스템이 개발되고 있다. 검색 기반의 경우 발화 쌍에 대한 데이터베이스가 필요하지만, 생성 기반의 경우 이러한 데이터베이스가 없이 모델의 Language Modeling (LM)으로 부터 생성된 발화에 의존한다. 따라서 모델의 성능에 따라 발화의 품질이 달라진다. 최근에는 사전학습 모델이 자연어처리 작업에서 높은 성능을 보이고 있으며, 일상 대화 도메인에서도 역시 높은 성능을 보이고 있다. 일상 대화에서 가장 높은 성능을 보이고 있는 사전학습 모델은 Auto Regressive 기반 생성모델이고, 한국어에서는 대표적으로 KoGPT2가 존재한다. 그러나, KoGPT2의 경우 문어체 데이터만 학습되어 있기 때문에 대화체에서는 낮은 성능을 보이고 있다. 본 논문에서는 대화체에서 높은 성능을 보이는 한국어 기반 KoDialoGPT2를 개발하였고, 기존의 KoGPT2보다 높은 성능을 보였다.

  • PDF

외국어로서 한국어 교육콘텐츠에서의 성별언어에 대한 인식 (Cognition of Teachers' and Students' Awareness on Gender for the Contents of Korean Language Education)

  • 박덕재
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.423-432
    • /
    • 2009
  • 본 연구는 외국어로서 한국어 연구 중에서 언어와 성의 문제를 분석하기 위하여 교육콘텐츠와 교사-학생의 인식의 관계를 조사하였으며, 또한 외국어 교육에 영향을 미치고 있는 성별언어의 역할을 연구하였다. 성별언어에 대한 교사의 인식과 교육콘텐츠에 대한 균형 있는 시각 및 교사, 학생의 소통은 언어습득의 효과적 결과를 가져올 수 있다. 19명의 교사와 71명의 학습자와의 인터뷰, 설문지 조사를 실시하여 교사는 89.4%가 여성언어가 존재함을 인정하였고, 학생은 49.6%가 성별언어에 대하여 차이점을 인식하고 있었다. 과거보다 언어가 중성화되고 았으며 굳이 남녀 성별언어를 구별하지 않는 이유는 여성의 사회활동 증가에 기언하는 사회적인 영향으로 보고 있었다. 그러므로 문화를 통한 언어교육이 교육콘텐츠의 역할이므로 경우와 시기에 따라 적절하게 이해되어야 할 필요가 있다. 아직 편향된 여성의 지위, 역할, 언어 등이 교재내용에 나타나 있으므로 이는 교사, 학생들의 이해와 수용이 필요하고 교육콘텐츠 개발에 반드시 반영되어야 할 부분이다.

구텐베르그 프로젝트 텍스트 데이터를 활용한 시각화 및 용례 검색 (Text Visualization and Concordance Search Using Gutenberg Project Text Data)

  • 김동성;신연수;이지안;유지민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-178
    • /
    • 2017
  • 본 연구는 거시적 빅데이터 인문학과 미시적 언어 텍스트 검색 시스템을 구축하고, 이를 통해서 언어를 통한 문화의 역동적 변화를 시간적 순서에 따라 살펴보고자 한다. 연구의 최종적인 목표는 문화도 생물체처럼 변화하는 존재라 여기고 그 구성요소들을 연구한다는 뜻인 '문화체학(文化體學; Culturomics)'과 같은 '인문학 + 정보과학 + 사회과학' 등등의 다학문간의 융합적 연구에 있다. 이 시스템을 통해서 인류 역사의 기록인 텍스트 빅데이터를 통한 인문학적 성찰을 시각화하고 있다. 이러한 구글의 업적은 인문학과 정보기술의 융합을 통해서 인문학 자체의 지평을 넓히고, 사회과학을 변형시키고, 산업과 상아탑 사이의 관계를 재조정하는데 있다.

  • PDF

한국어/영어 병렬 코퍼스에서 구 단위 정렬을 위한 단위 구 자동 추출 (Automated Unitary Phrases Extraction for Aligning Phrases in Korean-English Bilingual Corpus)

  • 김기태;김동주;김한우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.181-183
    • /
    • 2001
  • 정렬(alignment)은 병렬 코퍼스에서 원문서의 문단, 문장, 혹은 단어와 같은 단위 요소에 대해, 대역문서에서의 상응하는 단위 요소를 찾는 일로, 코퍼스 기반 기계번역 방식에서 매우 중요한 과정이다. 동일 어족간의 원문과 대역문에서는 어순이나 단위 요소들이 거의 일치하여 정렬에 큰 어려움이 없으나, 한국어와 영어와 같이 어족이 다른 언어간의 정렬은 언어의 단위 요소의 상이성과 어순의 차이 등으로 인해 않은 어려움이 존재한다. 본 논문은 어족이 다른 언어 사이의 정렬을 위해 상대 구문 고립성(Relative Syntactic Isolativity)이라는 개념을 적용하여 언어 단위의 상이성을 극복할 수 있는 단위 구를 제안하고 이들을 추출하는 방법에 대해 보인다.

  • PDF

문서영상의 낱자 단위 언어 구분 (Language Identification of Character-level in Document Image)

  • 권세광;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.613-615
    • /
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

  • PDF

PtolemyII의 CCS도메인 (CCS domain in PtolemyII)

  • 황혜정;김윤정;남기혁;김일곤;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.448-450
    • /
    • 2003
  • PtolemyII는 내장형 시스템과 같이 이질적 성질을 가진 병렬 시스템을 모델링하고 디자인 할 수 있는 환경을 지원해준다. PtolemyII의 CSP 도메인은 병렬 시스템을 효과적으로 명세할 수 있는 프로세스 알제브라 언어인 CSP를 구현한 것이다. CCS도 프로세스 알제브라 언어로써 정형적으로 병렬시스템을 명세하고 검증할 수 있다. 이 두 프로세스 알제브라 언어는 비슷한 목적으로 가지고 개발되었으나 통신의 세부적인 부분의 개념에 있어서 차이가 존재한다. 본 논문에서는 CCS 기반의 통신이 이루어 질 수 있는 CCS 도메인을 구현하여 PtolemyII에 추가하였으며, PtolemyII에 구현된 CCS 도메인의 커널구조와 구현 방법을 설명하겠다. CCS 도메인 구현은 기존의 개발자들이 actor-oriented 디자인을 하는 PtolemyII의 디자인 방법을 따라 기존의 프로세스 알제브라 언어들의 문법을 익히지 않고도 모델링 하고 시뮬레이션 할 수 있다는 것을 의미한다. 또한 PtolemyII에 CCS도메인을 추가함으로써 정형적 명세의 다양성을 높였다.

  • PDF

실제 응용프로그램들의 메모리 릭 측정 (Measuring memory leak in real applications)

  • 최진선;이인환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.272-275
    • /
    • 2006
  • C/C++언어로 구현된 응용프로그램들은 언어적인 특성으로 메모리 릭에 취약하다고 알려져왔다. 이에 이러한 언어적인 약점을 보완하기위해 가비지 컬렉션 등과 같은 기술이 연구/발표되어왔다. 그러나 릭이 실제 응용프로그램 사이에서 얼마나 발생이 되고 있으며 얼마나 심각한지 발표된 자료는 찾을 수 없었다. 제안된 보완기술들 조차 실제 응용프로그램을 적용하여 테스트한 사례는 찾을 수 없었다. 따라서, 본 논문에서는 실제 응용 프로그램을 선정하여 메모리 릭의 발생 정도를 측정하고, 발생 원인은 무엇이고 C/C++ 언어간의 릭 발생 특징은 존재하는지 조사해 보고자 한다. 또한 Valgrind 툴을 이용하면서 발견된 문제점을 토론함으로써 향후 더 우수한 동적 메모리 디버깅 툴을 개발하는데 기여하고자 한다.

  • PDF

영한기계번역에서의 전처리에 관한 연구 (A Study on Preprocessing in English-Korean Machine Translation)

  • 김성동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.249-253
    • /
    • 2010
  • 영한기계번역은 영어와 한국어 사이에 많은 언어적인 차이가 존재하며 이를 효과적으로 해결해야 한다. 규칙기반의 영한기계번역에서는 언어간의 차이를 어휘, 구문, 변환 등의 규칙을 이용하고 숙어 등의 사전정보를 활용하는 방법이 적용되고 있으나 한계가 있다. 본 논문에서는 두 언어간의 차이를 해소하는 방안으로 전처리를 적용하였으며 규칙기반의 영한기계번역에서 요구되는 전처리작업에 대해서 연구하였다. 전처리작업은 전처리문제와 해결방안으로 구성되는데, 언어간의 차이해소에 필요한 전처리문제를 조사하여 전처리문제가 영한기계번역의 어떤 단계에서 다루어져야 할지에 의해 문제들을 구분하였으며 이를 해결하기 위한 방안을 고안하여 본 논문에서 제시하였다.

  • PDF

Seq2SPARQL: 신경망 기계 번역을 사용한 지식 베이스 질의 언어 자동 생성 (Seq2SPARQL: Automatic Generation of Knowledge base Query Language using Neural Machine Translation)

  • 홍동균;심홍매;김광민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.898-900
    • /
    • 2019
  • SPARQL(SPARQL Protocol and RDF Query Language)은 지식 베이스를 위한 표준 시맨틱 질의 언어이다. 최근 인공지능 분야에서 지식 베이스는 질의 응답 시스템, 시맨틱 검색 등 그 활용성이 커지고 있다. 그러나 SPARQL 과 같은 질의 언어를 사용하기 위해서는 질의 언어의 문법을 이해하기 때문에, 일반 사용자의 경우에는 그 활용성이 제한될 수밖에 없다. 이에 본 논문은 신경망 기반 기계 번역 기술을 활용하여 자연어 질의로부터 SPARQL 을 생성하는 방법을 제안한다. 우리는 제안하는 방법을 대규모 공개 지식 베이스인 Wikidata 를 사용해 검증하였다. 우리는 실험에서 사용할 Wikidata 에 존재하는 영화 지식을 묻는 자연어 질의-SPARQL 질의 쌍 20,000 건을 생성하였고, 여러 sequence-to-sequence 모델을 비교한 실험에서 합성곱 신경망 기반의 모델이 BLEU 96.8%의 가장 좋은 결과를 얻음을 보였다.