• 제목/요약/키워드: 학습표현

검색결과 1,620건 처리시간 0.028초

KAISER: 워드 임베딩 기반 개체명 어휘 자가 학습 방법을 적용한 개체명 인식기 (KAISER: Named Entity Recognizer using Word Embedding-based Self-learning of Gazettes)

  • 함영균;최동호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-339
    • /
    • 2016
  • 본 논문에서는 한국어 개체명 인식의 성능 향상을 위하여 워드 임베딩을 활용할 수 있는 방법에 대하여 기술한다. 워드 임베딩이란 문장의 단어의 공기정보를 바탕으로 그 단어의 의미를 벡터로 표현하는 분산표현이다. 이러한 분산 표현은 단어 간의 유의미한 정도를 계산하는데 유용하다. 본 논문에서는 이러한 워드 임베딩을 통하여 단어 벡터들의 코사인 유사도를 통한 개체명 사전 자가 학습 및 매칭 방법을 적용하고, 그 실험 결과를 보고한다.

  • PDF

방향 벡터를 이용한 다중에이전트 휴리스틱 (The multi agent control heuristic using direction vector)

  • 김현;이승관;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.525-528
    • /
    • 2004
  • 먹이추적문제(prey pursuit problem)는 가상 격자로 이루어진 공간 내에 다중의 에이전트를 이용하여 먹이를 포획하는 것이다. 에이전트들은 먹이를 포획하기 위해 $30{\times}30$으로 이루어진 격자공간 (gride)안에서 기존 제안된 지역 제어, 분산 제어, 강화학습을 이용한 분산 제어 전략들을 적용하여 먹이를 포획하는 전략을 구현하였다. 제한된 격자 공간은 현실세계를 표현하기에는 너무도 역부족이어서 본 논문에서는 제한된 격자공간이 아닌 현실 세계와 흡사한 무한 공간 환경을 표현하고자 하였다. 표현된 환경의 모델은 순환구조(circular)형 격자 공간이라는 새로운 실험 공간이며, 새로운 공간에 맞는 전략은 에이전트와 먹이와의 추적 관계를 방향 벡터를 고려한 모델로 구현하였다. 기존 실험과는 차별화 된 환경에서 에이전트들은 휴리스틱을 통한 학습을 할 수 있다는 가정과 먹이의 효율적 포획, 충돌문제 해결이라는 결과를 얻었다.

  • PDF

웹기반 그래프 알고리즘 탐구학습을 위한 Maple 워크시트 개발 (Development of Maple Work Sheet for Web Based Graph Algorithm Exploratory Learning System)

  • 서정현;이형옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.910-912
    • /
    • 2005
  • Maple은 수학적 표현에 가까운 프로그래밍 언어로, 함수, 표현열(sequence), 집합, 리스트, 배열, 테이블, 등의 자료구조를 가지고 있다. 단순히 과학 계산과 관련된 수식처리뿐만 아니라 수식기호와 표현을 해석하여 그 문법과 의미를 파악할 수 있는 기능을 갖추고 있다. 본 연구에서는 Maple을 이용하여 그래프 이론 학습에 사용할 수 있는 white box형 워크시트를 개발하고, 개발된 워크시트를 웹에서 서비스 할 수 있도록 html로 변환하였다.

  • PDF

다목적 애플리케이션을 위한 피사계 심도 기반 후처리 프레임워크 (Depth-of-Field based Post-Processing Framework for Multipurpose Applications)

  • 김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.253-256
    • /
    • 2021
  • 본 논문에서는 합성곱 신경망을 통해 학습된 DoF(피사계 심도, Depth of field) 네트워크 아키텍처를 이용하여 객체 인식, 시점 추적, 문자 인식, 비사실적 렌더링 등 다양한 애플리케이션에 적용할 수 있는 사후 필터링 기법에 대해 살펴본다. 일반적으로 영상은 포커싱과 아웃포커싱에 의해 사용자의 관심표현이 결정되며, 이를 이용하여 영상 내 중요도를 판단한다. 영상 내에는 수많은 콘텐츠들이 혼재되어 있기 때문에 사용자가 집중적으로 보고 있는 콘텐츠를 찾아내기 어렵다. 본 논문에서는 사용자가 흥미롭고 집중적으로 보고 있는 영역을 DoF 네트워크로 학습시키고, 이를 통해 이전 기법으로는 표현할 수 없었던 DoF 기반 객체 인식, 시점 추적, 문자 인식, 비사실적 렌더링을 효율적으로 표현해낸다.

  • PDF

스마트 기반 협동학습을 통한 의사소통능력 신장에 관한 연구 (Study on Ability to Communicate with the Smart-based Cooperative Learning)

  • 김정랑;노재춘
    • 정보교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.625-632
    • /
    • 2014
  • 정보통신기술의 발달로 인하여 스마트 기기와 앱, SNS, 미러링 등을 이용한 의사소통이 이루어지고 있으며 이러한 사회의 변화를 반영하여 최근 다양한 협업 상호작용을 강조한 스마트교육이 대두되고 있다. 이에 본 연구에서는 초등학생의 의사소통능력을 신장시키기 위해 스마트교육과 LT 협동학습 모형을 연계한 '스마트 기반 협동학습' 모형을 개발하여 초등학교 3학년 사회과 수업에서 적용하고 스마트 기반 협동학습과 일반적인 협동학습이 의사소통능력에 미치는 영향을 각각 비교, 분석하였다. 그 결과, 일반적인 협동학습 모형을 적용한 수업의 초등학생들보다 스마트 기반 협동학습을 적용한 사회과 수업에서 초등학생들의 표현, 경청과 이해, 상호작용 등 의사소통능력의 모든 하위 영역이 신장되었다. 이는 스마트 기반 협동학습이 학습자의 생각이나 의견을 말과 글로 명료하게 표현하게 하고, 다른 학생들의 말과 글의 의미를 파악할 수 있게 해 주며 사회적 상황에서 목적에 맞게 상호작용하는 능력을 향상시켜 준다고 할 수 있다.

기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가 (Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment)

  • 임준호;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

수입물품의 품목 분류를 위한 멀티모달 표현 학습 (Multi-modal Representation Learning for Classification of Imported Goods)

  • 이앞길;최근호;김건우
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.203-214
    • /
    • 2023
  • 우리나라 관세청은 효과적인 원스톱(One-stop) 업무 처리가 가능한 전자통관 시스템으로 효율적으로 업무처리를 하고 있지만 기술의 발달과 비대면 서비스의 증가로 매년 수출입건수가 증가하고 있으며 그에 따른 업무량도 폭증하고 있는 실정으로 이에 따른 보다 효과적인 방법이 매우 필요하다. 수입과 수출은 모든 물품에 대한 분류 및 세율 적용을 위한 HS Code(Harmonized system code)가 필요하고 해당 HS Code를 분류하는 품목 분류는 전문지식과 경험이 필요한 업무 난이도가 높고 관세 통관절차에서 중요한 부분이다. 이에 본 연구는 품목 분류 의뢰서의 물품명, 물품상세설명, 물품 이미지 등의 다양한 유형의 데이터 정보를 활용하여 멀티모달 표현 학습(Multimodal representation learning) 기반으로 정보를 잘 반영할 수 있도록 딥러닝 모델을 학습 및 구축하여 HS Code를 분류 및 추천해 줌으로써 관세 업무 부담을 줄이고 신속한 품목 분류를 하여 통관절차에 도움을 줄 것으로 기대한다.

귀납학습과 신경망조직을 이용한 지능형 정보검색 (Intelligent Information Retrieval Using an Inductive Learning and a Neural Network Model)

  • 김성희
    • 한국문헌정보학회지
    • /
    • 제28권
    • /
    • pp.267-286
    • /
    • 1995
  • 불리언 논리에 기초한 현재 정보검색 시스템은 두 가지 본질적인 문제점 - 1)부정확하거나 불완전한 질의 표현과 2)일관성 없는 색인 - 이 있다. 많은 연구자들이 신경망조직(neural network) 이 정보경색에 있어서 불완전한 질의표현 문제를 해결할 수 있다고 주장해 온 반면 일관성 없는 문제는 아직 해결하지 못한 채 남아있다. 본고에서는 이러한 두 가지 문제점을 해결하기 위해 신경망 조직과 귀납학습이 소개되고 있다. 또한 이 논문에서는 신경망 조직이 어떻게 귀납학습과 통합해서 효율적인 정보 검색시스템에 응용될 수 있는지를 보여주고 있다.

  • PDF

다국어 학습을 위한 XML기반 학습시스템의 설계 (Developing XML based multilingual language education system)

  • 정휘웅;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-412
    • /
    • 1999
  • XML은 언어정보의 재사용성 및 다른 유형의 정보로 변환이 용이하여 최근 그 사용이 급증하고 있다. 그러나 XML은 아직까지 일부 분야에 국한되어 이용되고 있으며, 국내에서도 XML을 실제 활용하여 개발되고 있는 시스템은 극히 미약하다. 본 연구에서는 XML의 이점을 살려 한글을 포함한 다국어간 언어학습 컨텐트를 쉽게 구성하고 가공할 수 있는 XML 문서 내의 다국어 표현 방법에 대해 연구하였다. 또한 다국어 정보를 웹 환경에서 구현하기 위한 XSL과 유사한 문서 변환 구조 및 이를 처리할 수 있는 XML 처리기의 구조에 대해서도 소개한다. 본 연구에서 소개하는 문서 변환 구조를 이용할 경우 문자로 표현 가능한 매체를 매개로 하여 다양한 멀티미디어 컨텐트를 쉽게 작성할 수 있다.

  • PDF

FMM 신경망에서 연관도요소를 이용한 규칙 추출 기법 (A Rule Extraction Method Using Relevance Factor for FMM Neural Networks)

  • 이승강;이재혁;김호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.377-380
    • /
    • 2012
  • 본 연구에서는 학습데이터의 빈도요소를 반영하도록 수정된 구조의 FMM 신경망을 소개하고, 이로부터 패턴 분류를 위한 지식 표현을 생성하는 방법론을 제안한다. 하이퍼박스 멤버쉽함수는 5종류의 퍼지 분할을 기반으로 설정한 구간에 대하여 소속정도를 반영하여 결정하며, 각 차원별로 특징범위의 폭과 빈도 요소로부터 가중치 값이 학습된다. 본 연구에서는 제안된 이론을 수화인식 문제를 대상으로 고찰하였다. 인식 시스템의 구성은 특징추출을 위하여 3차원으로 확장된 구조의 CNN 모델을 사용하였으며, 수화패턴 데이터의 표현은 모션 히스토리 볼륨(Motion History Volume) 구조를 기반으로 하였다. 6종류의 수화패턴 동영상으로부터 27개 특징요소를 추출하고 이를 사용한 FMM 신경망의 학습과정과 지식의 추출 과정을 실험으로 보이고 그 유용성을 고찰한다.