• 제목/요약/키워드: 공간정보추출언어

검색결과 50건 처리시간 0.029초

휴대전화에서 단문 메시지로부터 일정 자동 등록 (Automatically Registering Schedules from SMS Messages on Handheld Devices)

  • 김재훈;김형철
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2011
  • 휴대전화가 대중에게 널리 보급됨에 따라, 단문 서비스(SMS)가 새로운 의사소통 수단으로 등장하고 있다. 단문 서비스는 가격이 저렴할 뿐 아니라 단문 메시지를 쉽게 저장할 수 있어 약속이나 일정 알림용으로 널리 사용된다. 본 논문은 단문 메시지로부터 일정 정보(시간과 장소)를 추출하여 자동으로 일정 관리 시스템에 등록하는 시스템을 개발한다. 단문 메시지는 짧고 간결하지만 비속어나 준말 등이 많이 사용된다. 이것이 일정 정보를 추출하는데 더욱 어렵게 한다. 또한 휴대전화에는 계산 능력과 저장 공간이 충분하지 못하므로 형태소 분석과 같은 일반적인 자연언어 처리 모듈을 그대로 사용하는 것은 다소 무리가 있다. 이 문제를 해결하기 위해서 본 논문에서는 형태소 분석과 같이 복잡한 언어 처리 모듈을 사용하지 않고 기계학습 기반으로 일정 정보를 추출하고 추출된 정보를 휴대전화의 일정 관리 시스템에 등록한다. 본 논문에서 제안된 자동 일정 등록 시스템은 삼성전자 옴니아 휴대전화에 탑재되어 정상적으로 잘 동작함을 확인할 수 있었다.

  • PDF

문자열 커널을 이용한 인터넷 영화평의 감정 분석 (A Sentiment Analysis of Internet Movie Reviews Using String Kernels)

  • 김상도;윤희근;박성배;박세영;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-60
    • /
    • 2009
  • 오늘날 인터넷은 개인의 감정, 의견을 서로 공유할 수 있는 공간이 되고 있다. 하지만 인터넷에는 너무나 방대한 문서가 존재하기 때문에 다른 사용자들의 감정, 의견 정보를 개인의 의사 결정에 활용하기가 쉽지 않다. 최근 들어 감정이나 의견을 자동으로 추출하기 위한 연구가 활발하게 진행되고 있으며, 감정 분석에 관한 기존 연구들은 대부분 어구의 극성(polarity) 정보가 있는 감정 사전을 사용하고 있다. 하지만 인터넷에는 나날이 신조어가 새로 생기고 언어 파괴 현상이 자주 일어나기 때문에 사전에 기반한 방법은 한계가 있다. 본 논문은 감정 분석 문제를 긍정과 부정으로 구분하는 이진 분류 문제로 본다. 이진 분류 문제에서 탁월한 성능을 보이는 Support Vector Machines(SVM)을 사용하며, 문서들 간의 유사도 계산을 위해 문장의 부분 문자열을 비교하는 문자열 커널을 사용한다. 실험 결과, 실제 영화평에서 제안된 모델이 비교 대상으로 삼은 Bag of Words(BOW) 모델보다 안정적인 성능을 보였다.

  • PDF

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

지능형 정보검색을 위한 KP AGENT의 설계 (A Design of KP AGENT for Intelligent Information Retrieval)

  • 박경우;배상현
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.443-451
    • /
    • 2000
  • 지금가지 과학기술정보를 데이터베이스화한 여러 형태의 학술정보 데이터베이스가 있었지만, 이용자의 욕구를 만족시켜주는데는 미흡하였다. 따라서 이용자의 학술정보 데이터베이스의 기능을 보충하는 새로운 지식표현 패러다임으로 기술정보공간(ICPIS : Information Communication Papers Intelligent Surveyor)을 제안한다. 이것은 기술정보로부터 자동적으로 구축되어 그 중에서 이용자가 자유롭게 탐방 할 수 있는 정보 공간이다. 구축방법과 탐방기능을 명확히 하여 실 시스템을 구축, 평가하는 것이 연구의 목적이다, 이를 위해 ICPIS는 Keyword로 기술된 논문군을 입력하여 논문내용의 항목별 요약, 유사논문의 시각적 표시와 비교, 인과관계의 추출을 시작으로 논문의 요약정보, Survey정보를 사용자에게 제공한다. ICPIS에서 중심적 역할을 나타내는 것은 KP(Knowledge Piece)로 불리고, 이는 기술정보의 추출법과 구조화법을 일체화한 Domain지식의 패키지이다. ICPIS는 KP별로 기술된 Keyword에서 자연언어처리에 해당되는 기술정보를 논문 중에서 추출하여 KP에서 규정된 요약구조로 생성한다.

  • PDF

언어네트워크 분석을 통한 재난안전정보와 관련한 국내 연구동향 분석 (Analysis of Trends on Disaster Safety Information based on Language Network Analysis Methods)

  • 정지나;정힘찬;김용
    • 한국비블리아학회지
    • /
    • 제28권3호
    • /
    • pp.67-93
    • /
    • 2017
  • 본 연구는 언어 네트워크 분석을 통해 재난정보와 관련한 국내 연구동향 분석을 목적으로 한다. 이를 위하여 학술연구정보서비스(RISS)를 검색하여 2008년부터 2017년 사이에 발간된 재난정보와 관련한 국내 학위논문 및 학술지논문 312건을 수집하였다. 그리고 논문들의 서지사항을 토대로 통계분석을 실시하였다. 뿐만 아니라 연구논문들의 논문명을 대상으로 키워드를 추출하여 빈도분석 및 언어 네트워크 분석을 실시하였다. 분석 결과, 최근 재난분야에서 빅데이터와 관련한 연구가 급증하였으며, 재난정보 공유 및 활용의 중요성이 증대되고 있다. 또한 재난대응을 위하여 공간정보, 실시간정보, 지리정보 등 다양한 유형의 재난정보가 활용되고 있었다.

시각적 형태 정보에 관한 감성어휘 분류 (Classification of KANSEI Vocabulary according to Visual Shape Information)

  • 백선경;황광수;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2006
  • 인간의 주관적이고 애매한 감성은 차세대 컴퓨팅의 다양한 분야에서 연구되며. 인간의 감성을 이해하고 감성의 변화에 능동적으로 반응하는 사용자 중심의 정보 처리에 대한 요구가 급격히 증가하고 있다. 우리는 감성기반 이미지 검색을 위해 저차원 시각정보에 대한 강성처리를 연구하고 있다. 기존의 저차원 시각정보 특징을 고려한 내용기반 이미지 검색 방법은 사용자의 취향이나 감성 요구에 적합한 결과를 검색하기에는 많은 어려움이 있다. 본 논문에서는 인간의 감성을 이해, 검색, 인식하기 위한 시각정보와 감성간의 관계 연구 중 우리의 기존 연구인 시각적 형태 정보의 감성어휘 공간에서 형태와 어휘간의 감성거리를 이용한 분류방법을 제안한다. 그리고 분류된 각 영역에서의 대표 어휘를 추출하여 시각적 형태에 따른 감성어휘간의 구체적 계층 관계를 정의한다. 이는 감성기반 이미지 검색 분야에 활용 가능한 연구이며, 우리가 사용하는 언어에 내재된 감성정보를 해석하고 그 어휘들의 체계적인 시각적 감성관계를 정의하는 의의를 갖는다.

  • PDF

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

Context 정보를 이용한 명령어 음성인식의 성능향상 (Performance improvement of Command Speech recognition using Context Information)

  • 김영주;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.718-720
    • /
    • 2005
  • 이동 단말기의 대중화로 사용자는 시간과 공간의 제약 없이 필요한 다양한 정보 서비스를 쉽게 접할 수 있게 되었다. 그러나 사용자 인터페이스에 있어 이동 단말기는 제약사항이 않음으로 적시적소에 원하는 정보를 접근하기가 어렵기 때문에 음성인식을 통한 인터페이스 연구가 진행되고 있으며, 특히 잡음환경에서 강인한 음성인식 처리를 위한 연구가 활발히 진행되고 있다. 지금까지 잡음환경을 위한 음성인식 접근 방법으로는 언어모델의 개선과 음향모델 개선으로 크게 구분할 수 있다. 그러나 이러한 접근 방법들은 적용하는데 있어 많은 시간과 비용이 요구됨으로 효율성이 떨어진다. 따라서 본 논문에서는 이러한 효율성 문제를 보완하기 위해 음성인식기로부터 인식되어 나오는 결과를 문맥정보와 융합하여 정보를 추출하고 이 정보를 이용한 후처리 모듈을 이용하여 인식시에 발생하는 오류를 적은 비용과 시간으로 수정하여 이동 단말기에 이용할 수 있도록 한다.

  • PDF

GIS를 이용한 산불 정보관리시스템 개발 (Development of Forest Fire Information Management System using GIS)

  • 조명희;오정수;이시영;조윤원;백승렬
    • 한국지리정보학회지
    • /
    • 제4권3호
    • /
    • pp.41-50
    • /
    • 2001
  • 본 연구에서는 GIS를 이용하여 산불관련 데이터베이스를 구축하고 효과적인 산불 현황정보 검색시스템을 개발하여 산불 관리자에게 효율적인 공간분석 도구를 제공함으로서 산불에 관한 종합적인 공간정보를 빠른 시간 내에 분석하여 속성을 갱신 추출할 수 있도록 하는 효과적인 산불정보관리시스템을 개발하였다. 이를 위하여 최근 10년간의 산불 현황통계자료를 이용한 전국 시 군 단위의 공간분포도를 작성하여 전국 산불 발생현황을 시 공간적으로 분석하고 산불 발생에 미치는 다양한 요인들과의 상관성 분석이 가능하였다. 특히 최근 산불 발생이 빈번한 삼척시의 지형도 및 임상도, 위성영상, 현지사진을 이용하여 GIS 데이터베이스를 구축함으로써 산불 발생위험지역에 대한 보다 상세한 정보를 얻을 수 있다. 본 시스템은 응용프로그램 개발을 위한 플랫폼은 IBM호환 PC에서 Windows 98을 운영체제로 하여 DBMS는 Access 2000을 이용하였고 프로그래밍 언어로는 객체지향언어인 Visual Basic 6.0과 GIS 기능을 구현하기 위해서 Component GIS인 MapObjects 2.0을 사용하였다. 그 결과 산불 관리자는 진화에 필요한 관리구역내의 정보를 신속하게 제공받을 뿐만 아니라 산불 방제사업에 대한 효과적인 의사결정지원과 함께 실무자 중심의 산불관리행정을 도모하고 산림자원 관리비가 효율적으로 이용될 것이다.

  • PDF

아이즈너 교육과정에 의한 '도서관과 정보생활' 교과서 교육목표 분석에 관한 연구 (A Study on the Analysis of Educational Objectives of 'Library and Information Life' Textbooks Based on the Eisner Curriculum)

  • 이병기
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.57-80
    • /
    • 2024
  • 아이즈너는 교육과정 개발에 있어서 행동목표 외에 문제해결목표, 표현목표의 중요성과 언어적, 시각적, 청각 모드 등 멀티 모달에 의한 의사소통을 강조하였다. 본 연구는 정보활용교육을 위해서 개발된 교과서인 '도서관과 정보생활'을 교육목표 유형(행동목표, 문제해결목표, 표현목표)과 멀티 모달(언어적, 시각적, 청각적, 공간적, 행동적)을 기준으로 분석하여, 정보활용교육을 위한 교육목표 설정과 교과서 개발을 위한 시사점을 도출하고자 한다. '도서관과 정보생활' 교과서는 초등학교 저학년용, 초등학교 고학년용, 중학생용, 고등학생용의 4책으로 구성되어 있다. 교과서로부터 교육목표를 추출하여, 사서교사 3인에게 교육목표 분석을 의뢰하였다. 본 연구의 주요 결과와 시사점은 다음과 같다. 첫째, 교육목표 유형별로 볼 때, 행동목표의 비중이 지나치게 높게 나타났으며, 문제해결목표와 표현목표의 비중을 강화할 필요가 있다. 둘째, 문제해결목표는 행동목표와 중복되는 경향이 있으며, 조건과 해결책의 요건을 갖춘 진정한 의미의 문제해결목표를 개발할 필요가 있다. 셋째, 특정 대-단원에 집중되어 있는 표현목표는 다른 대-단원에서도 고르게 배치할 필요가 있다. 넷째, 멀티 모달의 경우 언어적 모드의 비중을 줄이고, 시각적, 청각적, 공간적, 행동적 모드의 비중을 높여야 하며, 각 모드의 특성이 명확한 교육목표를 설정할 필요가 있다.