• 제목/요약/키워드: 개체 기반

검색결과 921건 처리시간 0.022초

형제어 대체를 이용한 개체명 말뭉치 확장 (Named Entity Tagged Corpus Augmentation Using Co-hyponym Replacement)

  • 김재균;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2020
  • 말뭉치는 기계학습 및 심층학습을 위한 필수 자원이다. 한국어 개체명의 경우 학습에 사용할 잘 정제된 개체명 부착 말뭉치가 충분하지 않다. 말뭉치 정제 작업은 시간적, 경제적으로 많은 비용이 소모된다. 따라서 본 논문에서는 적은 양의 말뭉치를 이용하여 말뭉치를 자동적으로 확장하는 방법을 제안한다. 특별히 소규모 말뭉치에 속하는 문장의 단어에 대한 형제어들을 선정하여 형제어의 확률추출을 기반으로 대체함으로써 새로운 문장을 생성함으로써 말뭉치 확장하는 방법이다. 본 논문에서는 확장된 말뭉치를 이용해서 대부분의 시스템에서 성능이 향상됨을 확인할 수 있었다. 앞으로 단어의 삭제 및 삽입 등 다양한 방법으로 좀 더 다양한 문장을 생성할 수 있을 것으로 생각합니다.

  • PDF

개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출 (COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information)

  • 박채원;강지원;이다은;이문영;한진영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

BERT 모델을 이용한 한국어 공간 개체 추출 (Korean Spatial Elements Extraction using BERT)

  • 신형진;육대범;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.478-480
    • /
    • 2019
  • 텍스트에서 공간 정보를 추출하기 위해 그동안 통계 및 확률 기반 방법, 심층학습 방법 등이 연구되어 왔다. 본 연구에서는 최근 자연언어처리에서 우수한 성능을 보이고 있는 BERT 모델을 적용하여 공간 개체 정보를 추출한다. 공간 개체 추출은 공간 관계에 관련된 속성 추출을 함께 고려한 결합(joint) 모델로 구성하였으며, 한국어를 대상으로 BERT 기학습된 언어모델인 korBERT를 이용하였다. 실험결과, 기존의 방법들에 비해 1.9% 포인트 이상 증가한 성능을 보였다.

  • PDF

RoBERTa-catSeqE: 개체 연결을 이용한 RoBERTa기반 키워드 추출 (RoBERTa-catseqE: Neural keyphrase Extraction with Entity linking using RoBERTa)

  • 이정두;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.486-490
    • /
    • 2020
  • 키워드 구문 추출(Keyphrase extraction)은 각 문서에서 내용과 주제를 포괄하는 핵심 단어 또는 구문을 추출하는 것을 말한다. 이는 뉴스나 논문에서 중요한 정보를 추출하는 데 매우 중요한 역할을 한다. 본 논문에서는 기존 catSeq 모델에 한국어로 학습한 RoBERTa 언어 모델을 적용하고 개체 연결 정보를 활용해 기존 키워드 생성 디코더와 개체 연결된 단어의 키워드 여부 분류 디코더, 즉 듀얼 디코더를 사용하는 모델을 제안하고 직접 구축한 한국어 키워드 추출 데이터에 대한 각 모델의 성능을 비교한다.

  • PDF

Mobile Ad Hoc 네트워크에서 이질적 그룹 이동성을 지원하는 논리적 협업 개체 기반의 멀티캐스트 구조 연구 (A Study on Logical Cooperative Entity-Based Multicast Architecture Supporting Heterogeneous Group Mobility in Mobile Ad Hoc Networks)

  • 김갑동;김상하
    • 정보처리학회논문지C
    • /
    • 제14C권2호
    • /
    • pp.171-178
    • /
    • 2007
  • 개별적으로 이동하는 노드들과 그룹으로 이동하는 노드들로 함께 구성된 애드 혹 네트워크에서 멀티케스트 어플리케이션을 수행하는 노드들은 비슷한 이동 특성을 갖는 그룹에 속하는 경우가 많다. 그룹 이동성은 확장성을 향상시키고, 프로토콜 오버헤드를 줄이는 좋은 방법 중 하나이다. 본 논문에서는 이질적 그룹 이동성을 갖는 네트워크에서 동일한 그룹 이동성을 갖는 노드들을 다중 인터페이스의 단일 개체로 간주하여 멀티캐스트 트리를 구성하는 멀티캐스트 구조를 제안한다. 논리적 협업 개제 기반 멀티캐스트 구조의 적용은 비계층적 멀티캐스트 구조를 유지하면서 계층적 멀티캐스트 구조로부터 얻을 수 있는 확장성, 멀티캐스트 트리 단순화, 프로토콜 오버헤드 감소 등을 수용하며, 임의의 노드가 입출력 인터페이스 역할을 함으로서 데이터 포워딩 부하를 여러 노드로 분산시켜 전력 소비의 집중현상을 막을 수 있다. 시뮬레이션을 통하여 다중 인터페이스를 갖는 논리적 협업 개체 기반의 멀티캐스트 프로토콜이 효율적인 데이터 전송과 프로토콜의 확장성을 제공하는 것을 볼 수 있다.

개체의 감정기반 행동제어를 통한 동적 군중 시뮬레이션 (Dynamic Crowd Simulation by Emotion-based Behavioral Control of Individuals)

  • 안은영;김재원;한상훈;문찬일
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.1-9
    • /
    • 2009
  • 본 논문은 게임 또는 애니메이션과 같이 가상 환경 속에서의 군중 행동을 구현함에 있어 군중 전체의 움직임을 제어하기보다는 군중을 구성하고 있는 각 개체들의 감정요소를 개별적으로 제어하는 방식을 사용함으로써 군중의 형태 및 행동 양식에 사실감과 다양성을 부여하는 새로운 방안을 제시한다. 인간의 행동을 모사하기 위해 군중을 구성하고 있는 개체들이 각자의 감정과 기질에 따라 이동경로를 결정하도록 행동패턴을 설계한다. 제안된 방법은 군집을 구성하는 개체들이 제각기 주어진 기질과 환경에 따라 변화하는 감정을 기반으로 이동 경로뿐 아니라 군집간의 이동을 자유롭게 결정하기 때문에 다양한 군집이동을 표현할 수 있다. 이를 위해, 감정과 기질을 정의하고 행동제어 규칙을 정의한다. 또한 인간의 감정과 같은 모호한 정보를 처리하기 위하여 퍼지이론을 적용함으로써 기질과 감정에 대한 모호한 언어적 표현을 자연스럽게 정의하도록 한다. 실험을 통해 제안된 방법으로 자연스럽고 다양한 형태의 군중 시뮬레이션이 가능함을 보인다.

생성 기반 질의응답 채팅 시스템 구현을 위한 지식 임베딩 방법 (Knowledge Embedding Method for Implementing a Generative Question-Answering Chat System)

  • 김시형;이현구;김학수
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.134-140
    • /
    • 2018
  • 채팅 시스템은 사람의 말을 기계가 이해하고 적절한 응답을 하는 시스템이다. 채팅 시스템은 사용자의 간단한 정보 검색 질문에 대답해야 하는 경우가 있다. 그러나 기존의 생성 채팅 시스템들은 질의응답에 필요한 정보인 지식 개체(트리플 형태 지식에서의 주어와 목적어)의 임베딩을 고려하지 않아 발화에 나타나는 지식 개체가 다르더라도 같은 형태의 답변이 생성되었다. 본 논문에서는 생성 기반 채팅 시스템의 질의응답 정확도를 향상시키기 위한 지식 임베딩 방법을 제안한다. 개체와 유의어의 지식 임베딩을 위해 샴 순환 신경망을 사용하며 이를 이용해 주어와 술어를 인코딩 하고 목적어를 디코딩하는 sequence-to-sequence 모델의 성능을 향상 시켰다. 자체 구축한 채팅데이터를 통한 실험에서 제안된 임베딩 방법은 종래의 합성곱 신경망을 통한 임베딩 방법 보다 12.48% 높은 정확도를 보였다.

자율 다개체 모바일 로봇 시스템의 동적 장애물 회피 구현 (Implementing Dynamic Obstacle Avoidance of Autonomous Multi-Mobile Robot System)

  • 김동원;이종호
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.11-19
    • /
    • 2013
  • 자율적인 다개체 모바일 로봇 시스템에 관해 경로 계획과 충돌회피는 중요한 기능이며 동시에 협력과 협동적으로 주어진 일을 수행하는데 필요한 기능이다. 본 논문에서는 이러한 중요하고도 도전적인 문제를 다룬다. 제안된 방법은 포텐셜 필드 방법과 퍼지로직 시스템에 기반을 두고 있다. 첫째로, 전역경로 계획은 포텐셜 필드를 이용하여 로봇이 목적지까지 가는데 비용을 최소화할 수 있는 경로를 선택한다. 그러고 나서 지역경로 계획은 퍼지로직 시스템을 이용하여 정적이거나 동적인 장애물과의 충돌을 피하기 위해 전역경로에서 경로를 변경시킨다. 본 논문에서는 각각의 로봇은 독립적으로 목적지를 선택하며 동시에 다른 로봇은 동적인 장애물로 고려한다. 또한 장애물의 움직임을 예측할 필요도 없다. 이러한 과정은 각각의 로봇이 해당되는 목적지를 찾을 때 까지 지속된다. 이 방법을 테스트하기 위해 자율 다개체 로봇 시뮬레이터(AMMRS)를 개발했으며 시뮬레이션과 실험기반의 결과물을 제공한다. 본 결과는 다개체 모바일 로봇 시스템에 대하여 경로계획과 충돌회피 전략이 효율적이며 유용하다는 것을 보인다.

파레토 지배순위와 밀도의 가중치를 이용한 다목적 최적화 진화 알고리즘 (Evolutionary Multi - Objective Optimization Algorithms using Pareto Dominance Rank and Density Weighting)

  • 장수현
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.213-220
    • /
    • 2004
  • 진화 알고리즘은 여러 개의 상충하는 목적을 갖는 다목적 최적화 문제를 해결하기에 적합한 방법이다. 특히, 파레토 지배관계에 기초하여 개체의 적합도를 평가하는 파레토 기반 진화알고리즘들은 그 성능에 있어서 우수한 평가를 받고 있다. 최근의 파레토 기반 진화알고리즘들은 전체 파레토 프론트에 균일하게 분포하는 해집합의 생성을 위해 개체들의 밀도를 개체의 적합도를 평가하기 위한 하나의 요소로 사용하고 있다. 그러나 밀도의 역할은 전체 진화과정에서 중요한 요소가 되기보다는 파레토 프론트에 어느 정도 수렴된 후, 개체의 균일 분포를 만들기 위해 사용된다. 본 논문에서 우리는 파레토 지배 순위와 밀도에 대한 임의가중치를 적용한 다목적 최적화 진화알고리즘을 제안한다. 제안한 알고리즘은 진화 개체의 적합도를 평가하기 위해 파레토 순위와 밀도에 대한 임의의 가중치를 적용하므로 전체 진화과정에서 파레토 순위와 밀도가 비슷한 영향을 미치도록 하였다. 또한, 제안한 방법을 6개의 다목적 최적화 문제에 적용한 결과 비교적 우수한 결과를 보였다.

자기 적응형 교배기법을 이용한 반복적 죄수 딜레마 게임의 진화적 협동 수렴 분석 (Analysis on the a Self Adaptive Crossover for Iterated Prisoner's Dilemma Game of Evolutionary Convergence)

  • 김찬중;이종현;안창욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.478-481
    • /
    • 2010
  • 본 논문에서는 경제학, 사회학, 수학 분야에서 수십년 전부터 연구해오던 죄수의 딜레마 게임의 협동진화에 대해 고찰해보고자 한다. 반복적 죄수의 딜레마 게임은 게임이론의 가장 기본적인 이론으로써, 사회적 상호작용, 경제활동, 국제관계 등 다양한 현상들을 모델링 하기 위한 하나의 방법이다. 그 중에 N명이 참가하는 반복적 죄수 딜레마 게임의 전략은 유전 알고리즘(Genetic Algorithms, GAs)을 통해 진화적으로 만들어 낼 수 있으며, 이 경우에 그 결과를 일반적인 내쉬 균형 이 아닌, 모든 개체들이 유전알고리즘을 통해 협동으로 수렴하도록 유도할 수 있다는 사실은 상당히 시사하는 바가 크다. 기존에 주로 연구되어오던 죄수의 딜레마 게임은 협동으로의 수렴과정에서 일반적으로 순위기반선택(Rank-based selection)과 1점 교배기법(1point crossover)을 사용한다. 그러나 순위기반선택은 모든 개체에 순위을 매겨야 하기 때문에, 개체수가 커질수록 성능이 저하되며, 1점 교배기법은 개체 값이 분산되어있을 경우, 최적해(Optimal solution)을 찾기 힘들다는 단점이 있어, 개체수가 많은 경우에 적용하기에는 비효율적이다. 본 논문에서는 토너먼트 선택기법(Tournament selection)과 자기 적응형 교배기법(Self-adaptive crossover)을 적용한 새로운 기법을 제안한다. 또한 기존 기법과 비교 실험을 통해 제안기법이 기존기법에 비해 평균 수렴시간과 수렴 횟수에서 뛰어난 성능을 보이고 있음을 확인하였다.