• 제목/요약/키워드: 존재의 언어

검색결과 711건 처리시간 0.035초

번역과 웹그래프를 활용한 언어 간 위키피디아 인포박스 자동생성 기법 (An Approach to Automatically Generating Infobox for Wikipedia in Cross-languages through Translation and Webgraph)

  • 김은경;최동현;고은비;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2011
  • 여러 언어로 작성되는 위키피디아의 경우 언어 간에 등록되어 있는 정보의 양과 내용이 달라 언어 간 정보를 상호 추출하고 서로 통합하는 연구에 대한 관심이 증가하고 있다. 특히, 위키피디아의 요약본으로써 의미가 있는 인포박스는 위키피디아 아티클에 존재하는 구조화된 정보 중 가장 근간이 되는 정보로, 본 논문에서는 위키피디아에 존재하는 인포박스를 1)소스 언어 자원으로부터 획득하여 타겟 언어로 번역하고, 2)번역된 결과물과 웹그래프를 이용하여 타겟 언어 데이터에서 획득하는 정보와 결합하는 과정을 통해 자동으로 인포박스를 생성하는 기법에 대하여 설명한다. 웹그래프는 위키피디아에 존재하는 링크 구조를 통해 서로 다른 두 용어간의 관련도를 측정하여 인포박스에 추가될 내용을 파악하는데 사용한다. 본 논문의 기법은 언어 간 인포박스를 생성하는 측면에서, 영어 인포박스 데이터를 입력으로 하여 한국어 인포박스 데이터를 생성하는 방식으로 진행하였다. 평가를 위하여 기존 한국어에 실제 존재하는 인포박스 데이터와 비교 실험하는 방식을 사용하여 평균적으로 40%의 정확률과 83%의 재현율을 나타내었다. 하지만, 기존 한국어에 존재하는 인포박스 데이터의 내용이 인포박스에 포함될 완전한 데이터를 모두 포함했다고 볼 수 없으므로 본 논문에서 제안하는 수행한 실험의 정확률이 상대적으로 낮게 나온 것으로 분석되었다. 실제 사람이 수작업으로 새롭게 생성된 인포박스 데이터의 적합성을 판별한 경우 평균 76%의 정확률과 91%의 재현율을 나타내었다.

  • PDF

책의 존재와 사물의 존재(6)-글쓰기와 미메시스

  • 김상환
    • 출판저널
    • /
    • 통권154호
    • /
    • pp.6-7
    • /
    • 1994
  • 소크라테스는 진리를 언어 밖에서 찾으라고 말했다. 플라톤은 언어를 어떤 모방의 형식이라고 생각했다. 미메시스 개념에 기초한 언어관 때문이다. 따라서 그들에 의하면, 책이란 진리의 시체 통조림이자 영혼을 망쳐놓는 흉물에 불과하다. 그러나 아리스토텔레스의 "오르가논"은 언어를 상징의 형식으로 이해하면서 책을 진리의 잔치마당으로 여긴다.

  • PDF

라캉 정신분석과 언어의 노동 (Lacanian Psychoanalysis and The Labor of Language)

  • 이동석
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.421-430
    • /
    • 2023
  • 현대사회 이전의 인간은 '인간이란 어떤 존재인가'에 대한 고민이었다. 이런 사고의 시대를 겪은 인간은 자본주의로 존재를 편입시킨다. 카를 마르크스(Karl Heinrich Marx; 1818~1883)는 어떤 직업을 갖고 사는 가를 묻는다. 그 후, 우리는 현대사회를 맞이한다. 현대사회에서 인간은 욕망하는 주체에 대한 숨겨진 존재의 물음을 스스로 자문하게 된다. 숨겨진 존재는 언어에 의해 은폐된 존재이다. 이것을 필자는 언어의 노동으로 진단하고 문제의식을 펼쳐 나갈것이다. 우리는 언어의 주체이면서 언어 노동의 주체이다. 자크 라캉(Jacques Lacan;1901~1981) 정신분석은 언어의 노동에서 벗어나는 주체에 주목하고 있다. 언어의 노동의 남는 자리에는 보이지 않는 윤리가 있다. 본문에서는 언어의 노동에 저항하는 주체에 대해 숨겨진 의미를 밝히고자 한다.

인지체계속의 언어기능 (The Language Faculty in Cognitive System)

  • 문경환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.61-64
    • /
    • 1989
  • 언어 연구에 관한 방법론은 단위구조적(modular) 접근방법과 총체론적(holistic) 접근방법으로 대별될 수 있다. 전자는 인지체계가 독자적 인지단위로 나뉘어져 있으며 그 중 하나가 언어기능임을 가정하고 있다. 즉 언어는 언어기능과 여타 인지단위로 상호작용함으로써 성립된다고 가정하는 것이다. 이에 비해 후자는 언어가 총체로서의 인지체계의 소산임을 가정하며, 따라서 언어기능이란 존재를 부정한다. 이러한 총체론적 언어이론에서는 신체의 구조가 보이는 단위구 조성과 심적 수조의 총체성 사이의 "불균형"을 어떻게 설명할 것인가의 의문이 제기된다. 이 글에서는 단위 구조설의 내용이 간략히 소개된다. 언어기능을 이루고 있는 보편문법 및 개별문법의 개념이 논의되는 가운데, 과거에도 그랬고 현재에도 계속 논란의 대상이 되고 있는 이른바 "문법성"의 개념이 중점적으로 다루어진다. 문법성과 허용성이 별개의 개념일진대, 문법적이면서도 허용되지 않은 문장이 있을 수 있고, 비문법적이면서도 허용되는 문장도 있을 수 있어야 한다. 이 후자의 경우도 실제로 존재함이 보여질 것이다.

  • PDF

퍼지집합을 이용한 실수값 속성 사이에 존재하는 연관규칙의 발견 (Finding Association Rules among Real-valued Items using Fuzzy Sets)

  • 이지형;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.115-118
    • /
    • 1996
  • 연관규칙(Association Rule)은 데이터 베이스에 존재하는 속성들 사이의 관계를 기술하는 것으로, 간단하면서도 사용자에게 많은 정보를 줄 수 있다. 그러나, 지금까지는 이진 데이터베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 실수값 속성을 갖는 데이터에 관한 연구는 미비하였다. 본 논문에서는 퍼지집합을 이용하여 실수값 사이에 존재하는 연관규칙을 기술하고, 그것을 찾아내는 방법을 제시한다. 제시하는 방법은 사용자에 의해서 정의된 언어항을 이용하여, 실수값 속성을 가진 데이터를 이진 데이터로 재구성한다. 그리고 재구성된 이진 데이터에 기존의 연관규칙 발견 방법을 이용하여 연관규칙을 찾아내고, 찾아진 연관규칙을 정의된 언어항을 이용하여 다시 기술한다.

  • PDF

메타 디자인의 가능성 (Meta Design)

  • 오창섭
    • 한국디자인학회:학술대회논문집
    • /
    • 한국디자인학회 2000년도 추계 학술발표대회 논문집
    • /
    • pp.132-133
    • /
    • 2000
  • 오늘날 메타(mee)라는 용어는 '메타언어', '메타과학', '메타비평' 등의 합성어를 통해 자신의 존재를 이 사회에서 확인 받고 있다. 특히 메타언어는 메타라는 용어를 가장 적극적으로 사용하는 경우라고 할 수 있다. 왜냐하면 메타언어는 언어를 연구대상으로 하는 학문영역에서 언어의 한 특성, 흑은 자체의 구조를 설명하는 보다 일반화된 개념으로 소통되고 있기 때문이다. (중략)

  • PDF

DVB-MHP 환경에서의 내장형 DVB-HTML 브라우저 (An embedded DVB-HTML browser in DVB-HTML environment)

  • 김성기;홍건호;송하윤;한상영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.518-520
    • /
    • 2003
  • 데이터 방송을 셋톱 박스에서 시청하기 위해서 여러 가지 표준적인 플랫폼들이 존재하는데, 각 플랫폼마다 컨텐츠 표현 언어가 존재한다. 이러한 각 컨텐츠 표현 언어를 처리해주기 위해서는 데이터 방송 용 브라우저가 필수적인데, 본 논문에서는 DVB-MHP 플랫폼에서 DVB-HTML 어플리케이션의 처리가 가능한 내장형 브라우저를 설계하고 구현하였다.

  • PDF

프로세스 대수를 위한 시각화 명세 언어 (A Visual Specification Language for Process Algebra)

  • 온진호;우수정;이문근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.193-196
    • /
    • 2011
  • 공간적으로 다양하게 재구성되며 이동하는 분산/이동/실시간 시스템을 명세 및 분석하기 위한 기존의 프로세스 대수들은 명세/분석 과정에서 텍스트 기반의 명세 언어를 사용한다. 이로 인하여 프로세스 사이의 이동성과 프로세스들의 공간적 분포를 대한 명세 및 분석 방법은 매우 큰 복잡도가 존재한다. 이를 극복하기 위하여 일반 프로세스 대수를 시각적인 형태로 표현하는 다양한 기법들이 제안되었다. 이러한 시각화 언어들은 시스템의 특정 상태를 명세하거나, 시스템의 속성을 공간적 분포와 링크정보로 분리하는 방법들이 사용되었지만, 명세하고자 하는 시스템의 전체 행위에 대한 효율적인 명세 방법이 존재하지 않고, 시각화 언어임에도 불구하고 텍스트기반의 프로세스 대수와 병행되어 사용되어야만 하는 제약들이 존재한다. 이러한 제약들을 극복하기 위한 하나의 방법으로 본 논문에서는 프로세스 대수를 위한 새로운 시각화 언어인 Onion Visual Language를 제안한다. Onion Visual Language는 프로세스 사이에서 발생하는 이동과 상호작용 등의 전체 행위를 원형의 양파껍질과 같은 형태로 표현하며, 각 프로세스들 사이에서 발생하는 행위들의 관계를 액션으로 표현한다. 또한, 계층화된 프로세스 구조, 프로세스의 상태정보, 프로세스의 미래 행위 정보, 비결정적 행위정보를 포함하여 매우 복잡한 시스템의 특징을 효율적으로 명세/분석 가능하도록 하였다.

병렬 코퍼스를 이용한 한중 기계번역 오류 탐지 방법 (Method for Detecting Errors of Korean-Chinese MT Using Parallel Corpus)

  • 김운;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.113-117
    • /
    • 2008
  • 본 논문에서는 패턴기반 자동번역시스템의 효율적인 번역 성능 향상을 위해 병렬 코퍼스(parallel corpus)를 이용한 오류 자동 탐지 방법을 제안하고자 한다. 번역시스템에 존재하는 대부분 오류는 크게 지식 오류와 엔진 오류로 나눌 수 있는데 통상 이런 오류는 이중 언어가 가능한 훈련된 언어학자가 대량의 자동번역 된 결과 문장을 읽음으로써 오류를 탐지하고 분석하여 번역 지식을 수정/확장하거나 또는 엔진을 개선하게 된다. 하지만, 이런 작업은 많은 시간과 노력을 필요로 하게 된다. 따라서 본 논문에서는 병렬 코퍼스 중의 목적 언어(Target Language) 문장 즉, 정답 문장과 자동번역 된 결과 문장을 다양한 방법으로 비교하면서 번역시스템에 존재하고 있는 지식 및 엔진 오류를 자동으로 탐지하는 방법을 제안한다. 제안한 방법은 한-중 자동번역시스템에 적용하여 그 정확률과 재현률을 측정하였으며, 자동적으로 오류를 탐지하여 추출 할 수 있음을 증명하였다.

  • PDF

학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출 모델 (Deep Learning Based Causal Relation Extraction with Expansion of Training Data)

  • 이승욱;유홍연;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-66
    • /
    • 2018
  • 인과관계 추출이란 어떠한 문장에서 인과관계가 존재하는지, 인과관계가 존재한다면 원인과 결과의 위치까지 분석하는 것을 말한다. 하지만 인과관계 관련 연구는 그 수가 적기 때문에 말뭉치의 수 또한 적으며, 기존의 말뭉치가 존재하더라도 인과관계의 특성상 새로운 도메인에 적용할 때마다 데이터를 다시 구축해야 하는 문제가 있다. 따라서 본 논문에서는 도메인 특화에 따른 데이터 구축비용 문제를 최소화하면서 새로운 도메인에서 인과관계 모델을 잘 구축할 수 있는 통계 기반 모델을 이용한 인과관계 데이터 확장 방법과 도메인에 특화되지 않은 일반적인 언어자질과 인과관계에 특화된 자질을 심층 학습 기반 모델에 적용함으로써 성능 향상을 보인다.

  • PDF