• 제목/요약/키워드: 2 언어사용

검색결과 1,400건 처리시간 0.029초

Seq2SPARQL: 신경망 기계 번역을 사용한 지식 베이스 질의 언어 자동 생성 (Seq2SPARQL: Automatic Generation of Knowledge base Query Language using Neural Machine Translation)

  • 홍동균;심홍매;김광민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.898-900
    • /
    • 2019
  • SPARQL(SPARQL Protocol and RDF Query Language)은 지식 베이스를 위한 표준 시맨틱 질의 언어이다. 최근 인공지능 분야에서 지식 베이스는 질의 응답 시스템, 시맨틱 검색 등 그 활용성이 커지고 있다. 그러나 SPARQL 과 같은 질의 언어를 사용하기 위해서는 질의 언어의 문법을 이해하기 때문에, 일반 사용자의 경우에는 그 활용성이 제한될 수밖에 없다. 이에 본 논문은 신경망 기반 기계 번역 기술을 활용하여 자연어 질의로부터 SPARQL 을 생성하는 방법을 제안한다. 우리는 제안하는 방법을 대규모 공개 지식 베이스인 Wikidata 를 사용해 검증하였다. 우리는 실험에서 사용할 Wikidata 에 존재하는 영화 지식을 묻는 자연어 질의-SPARQL 질의 쌍 20,000 건을 생성하였고, 여러 sequence-to-sequence 모델을 비교한 실험에서 합성곱 신경망 기반의 모델이 BLEU 96.8%의 가장 좋은 결과를 얻음을 보였다.

국내 다크웹 사용자들의 언어 사용 특성 분석 (Analyzing the Language Usage Characteristics of Korean Dark Web Users)

  • 이유진;임다연;이용재
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.397-402
    • /
    • 2022
  • 익명 네트워크 기술에 기반한 다크웹은 일반 표면웹보다 더 강화된 익명성을 제공한다. 최근 이 익명성을 악용하여 다수의 다크웹 사용자들이 다크웹 내에서 범죄 행위를 모의하는 행위가 꾸준히 발생하고 있다. 특히, 국내 다크웹 사용자들은 마약 유포를 위한 방법을 공유하거나 성착취물 유포 행위 등에 직간접적으로 가담하고 있다. 이와 같은 범죄 행위들은 수사 기관의 눈을 피해 현재까지도 계속해서 발생하고 있어 국내 다크웹 범죄 동향 파악의 필요성이 증대되고 있다. 그러나 다크웹 특성상 범죄 행위를 논의하는 게시글을 수집하기가 어렵고, 다크웹 내에서의 언어 사용 특성에 대한 이해 부족으로 그동안 다크웹 사용자들이 어떤 내용의 범죄를 모의하는지 파악하기가 어려웠다. 본 논문에서는 국내 사용자들이 활동하는 다크웹 포럼들을 중심으로 사용자들의 언어 사용 특성을 연구하고, 이를 통해 다크웹에서 다뤄지는 범죄 유형들을 분석한다. 이를 위해, 자연어처리 기반의 분석 방법론을 적용하여 다크웹에서 공유되는 게시글을 수집하고 다크웹 사용자들의 은어와 특정 범죄군에서 선호되는 언어 특성을 파악한다. 특히 현재 다크웹 내에서 사용자들 사이에 관측되는 어휘들에 대한 기술통계 분석과 유의어 관계 분석을 수행하였고, 실제 다크웹 내에서 사용자들이 어떠한 범죄에 관심이 많은지를 분석하였으며, 더 나아가 수사의 효율성을 증대시키기 위한 소셜미디어, URL 인용 빈도에 대한 연구를 진행하였다.

  • PDF

LCS알고리즘을 이용한 한-영 대역어 추출 연구 (A Study on extraction for Korean-English word pair by using LCS algorithm)

  • 박은진;양성일;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.707-709
    • /
    • 2007
  • 매일 생성되는 웹 신문에서 독자가 접해보지 못한 단어는 독자의 이해를 돕기 위하여 괄호를 사용한다. 괄호를 사용하여 표기된 웹 신문의 한국어-영어 대역쌍은 특정 기사에는 출현빈도가 낮지만 전체적으로 여러 신문의 기사를 봤을 때, 최소한 한번 이상 출현하게 된다. 즉, 괄호 안의 동일한 영어 용어 두 개 이상의 문장을 최장일치법 알고리즘에 적용하면 한국어 단어 경계를 자동으로 인식할 수 있다. 본 논문에서는 이런 웹 신문의 괄호 표기 특성을 이용하여 한-영 대역어쌍을 추출하는 방법을 제안한다. 웹 신문 기사 43,648 건에서 최대 2,087개의 한-영 대역어를 추출하였다. 3 개의 서로 다른 테스트 그룹으로 실험한 결과 최대 84.2%의 정확도를 보였다.

공간 파서의 자동 생성 시스템에 대한 구현 (Implementation of a Spatial Parser generator)

  • 정석태;정성태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.202-204
    • /
    • 2001
  • 본 논문에서는 GUI(Graphical User Interface)를 사용하여 사용자가 상호 작용적으로 도형 언어(visual language)의 문법을 기술함으로서 자동으로 공간 파서를 생성하는 공간 파서 생성기 SPG(Spatial falser Generator)의 구현에 대하여 논한다. 본 시스템의 장점은 다음과 같다. (1) 사용자가 도형 언어의 문법을 정의하고 실제로 파싱하고 싶은 도형 언어를 입력하는데 사용되는 도형 에디터를 가지고 있다. (2) 사용자가 도형을 이용하여 대략적인 문법을 자동으로 생성한 뒤, 수정하여 최종적인 문법을 정의하도록 한다. (3) 제약 해소기(Constraint solver)를 가지고 있어서 파싱된 도형 언어들이 그 생성 규칙에 쓰여져 있는 제약을 유지한다.

  • PDF

독일어 명사변화 습득을 위한 학습자 전략 (Lernerstrategien beim Deklinationserwerb im Deutschen)

  • 김갑년
    • 한국독어학회지:독어학
    • /
    • 제7집
    • /
    • pp.25-41
    • /
    • 2003
  • 외국어 습득 시 우리는 모국어와 배우려는 언어 사이에 존재하는 언어적 차이 때문에 많은 실수를 한다. 한국어와 독일어 사이에는 물론이고 언어사적으로 친밀한 관계에 있는 언어들 사이에도 이런 어려움은 있다. 본 논문에서 필자는 Erika Diehl(1991)의 연구를 바탕으로 외국어 학습자들이 독일어 명사변화 습득 시 이러한 어려움을 극복하기 위해 특정한 전략을 사용하는가 하는 문제를 다루었다. Diehl은 2차 언어 습득은 언어적 과도체계를 형성하며 이루어진다는 견해이다. 즉 학습자는 특정하고 동일한 학습자 언어를 형성하며 외국어를 습득한다고 한다. 그녀는 연구대상 언어로 독일어와 불어를 선택하여 불어 모국어 사용자의 독어 명사변화 습득을 관찰하여 이러한 실수의 원인으로 대비가정, 동일가정, 중간언어 가정을 든다. 그러나 불어 모국어 화자들이 2차 언어로서의 독일어 명사변화 학습 시행하는 실수의 정확한 원인이 간언어적 원인인지 언어내적 이유인지 정확히 규명할 수는 없었다. 필자는 본 논문을 토대로 한국어 모국어 화자들의 독일어 명사변화 습득과정을 살펴보는 논문을 계획한다.

  • PDF

탑재소프트웨어 프로그래밍 언어 비교 - C vs. ADA

  • 박수현;구철회;강수연;이상곤
    • 한국우주과학회:학술대회논문집(한국우주과학회보)
    • /
    • 한국우주과학회 2009년도 한국우주과학회보 제18권2호
    • /
    • pp.46.2-46.2
    • /
    • 2009
  • 탑재소프트웨어는 위성의 자세, 전력, 열 제어를 담당하는 소프트웨어로서 위성의 탑재컴퓨터 상에서 실행된다. 탑재소프트웨어는 추력기, 배터리, 온도조절장치와 같은 위성의 하드웨어 장치를 자치적으로 관리한다. 지상에서 위성을 운영할 수 있도록 탑재소프트웨어는 지상으로부터 명령을 받아서 처리하고, 위성의 텔레메트리 데이터를 지상으로 전송한다. 위성의 탑재소프트웨어를 프로그래밍하기 위하여 C 언어와 ADA 언어가 주로 사용된다. 이 논문에서는 소프트웨어 디자인과 하위레벨 프로그래밍 관점에서 C 언어와 ADA 언어를 비교 분석한다. 프로그래밍언어는 소프트웨어 디자인과 불가분의 관계에 있다. 이 논문은 프로그래밍언어와 함께 다목적실용위성과 통신해양기상위성의 소프트웨어 디자인을 소개한다. 다목적실용위성의 탑재소프트웨어는 절차 지향언어인 C로 작성되었으며, 함수 호출을 기반으로 설계되었다. 통신해양기상위성의 경우, 객체지향언어인 ADA로 작성되었으며, HOOD(Hierarchical Object-Oriented Design) 기법에 따라 모델링되었다. 탑재소프트웨어 프로그래밍언어는 위성의 탑재 하드웨어와 직접적으로 상호작용하도록 요구된다. 이 논문은 C와 ADA 언어가 메모리주소 및 로우 스토리지를 다루는 방법을 보여준다.

  • PDF

문서중심 웹서비스를 위한 XML 타입을 지원하는 언어 제안 (A Proposal for the Document-centric Webservices Language Supporting XML Schema Data Type)

  • 최종명;김은회
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.259-262
    • /
    • 2005
  • B2B를 효과적으로 지원하기 위해서는 문서중심의 웹서비스를 사용해야 한다. XML 문서를 사용하는 문서중심의 웹서비스를 효과적으로 개발하기 위해서는 XML 문서의 스키마를 데이터타입으로 지원할 수 있는 언어가 필요하다. 본 논문에서는 문서중심 웹서비스가 B2B에 적합한 이유와 XML 문서의 스키마를 데이터타입으로 지원하는 언어를 설계하고, 구현할 때 고려해야 할 사항을 소개한다.

  • PDF

C-언어를 이용한 대화형 골조 해석 프로그램의 개발

  • 김한수
    • 전산구조공학
    • /
    • 제7권1호
    • /
    • pp.38-43
    • /
    • 1994
  • 본 고에서는 C-언어를 사용한 대화형 2차원 골조 해석 프로그램의 개발과정에서 얻은 몇가지 사항을 기술하였다. WYSIWYA 개념이 구조해석 프로그램에 있어서 편리한 사용자 인터페이스 방법의 하나가 될 수 있음을 보였고, 개발에 사용한 C-언어는 다양한 자료 형태, 포인터의 사용, 그래픽을 비롯한 시스템 자원의 적극적 활용 등의 면에 있어서 기존의 포트란에 비하여 그 기능이 우수하다고 판단된다. 다수의 사용자가 이용할 목적으로 개발되는 구조 해석 프로그램은 사용자 편의성이 우선적으로 고려되어야 하며 기존의 입력화일, 해석, 출력화일의 단순한 사용자 인터페이스에서 벗어나 구조해석이라는 특수한 분야에 맞는 새로운 사용자 인터페이스 방법들이 많이 개발되어져야 한다.

  • PDF

아키텍처 기반의 컴포넌트 조립을 지원하는 아키텍처 기술 언어의 설계와 구현 (Design and implementation of an architecture description language that supports architecture-based component assembly)

  • 노성환;신동익;전태웅
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.16-18
    • /
    • 2002
  • 컴포넌트 시스템은 잘 정의된 아키덱처를 기반으로 개발되어야 한다. 소프트웨어 아키텍처를 정확하고 엄밀하게 설계, 분석하기 위해서는 아키텍처 기술언어(ADL)의 사용이 필요하다. 컴포넌트 시스템의 아키텍처 모델링에 ADL을 효과적으로 사용하기 위해서는ADL로 기술된 명세 수준의 아키텍처 모델로부터 목표한 플랫폼에 부합하는 컴포넌트 시스템을 효율적으로 구현할 수 있어야 한다. 본 논문에서는 C2 스타일의 아키텍처에 기반한 컴포넌트 합성을 지원하는 ADL을 설계, 구현한 결과와 이를 EJB 컴포넌트들의 조립을 지원하는도구의 아키텍처 기술 언어로 사용한 사례를 설명한다.

  • PDF

사용자 시맨틱 어노테이션을 이용한 스크립트 언어 자동생성 기법 (Automatic Generation Script Language Base on Semantic User Annotation)

  • 송특섭;신성욱;최윤철;임순범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.601-603
    • /
    • 2005
  • 2D 또는 3D 아바타는 웹환경에서 효과적인 정보 전달 및 사용자의 흥미 유발등 많은 장점이 있다. 아바타의 다양한 장점을 살려 사이버 교육, 의료, 군사등 다양한 분야에서 응용되고 있다. 아바타를 스크립트 언어를 사용하여 아바타를 제어하고자 하는 연구는 일본 NHK사의 TVML를 비롯하여 AML, CML등 다양한 스크립트 언어가 개발되고 있다. 그러나 기존의 아바타 제어를 위해 개발된 스크립트 언어들은 주로 개발자를 대상으로 개발되어 있어 가상환경이나 스크립트 언어에 익숙하지 않은 최종사용자들이 스크립트 언어를 사용하여 아바타를 제어하는 데는 많은 어려움이 있다. 본 연구에서는 직관적인 인터페이스에 의해 생성된 사용자 정보에 기반하여 자동적으로 스크립트 언어가 생성될 수 있는 기법을 제안 한다.

  • PDF