• Title/Summary/Keyword: 단어 입력

검색결과 431건 처리시간 0.032초

텍스트 마이닝을 이용한 특허정보검색 개발에 관한 연구 (A Study on Development of Patent Information Retrieval Using Textmining)

  • 고광수;정원교;신영근;박상성;장동식
    • 한국산학기술학회논문지
    • /
    • 제12권8호
    • /
    • pp.3677-3688
    • /
    • 2011
  • 특허정보검색의 목적은 다양한 목적성을 지니고 있다. 일반적으로 특허정보검색은 제한된 키워드들에 의한 검색으로 이루어지며, 선행 특허권과 유사특허를 파악하기 위하여 반복적인 검색과 검토의 노력이 필요하다. 본 논문에서는 특허문서의 전체 텍스트를 분석하여 특징치를 찾아내는 내용기반 검색방법을 제안하고 검색결과를 질의문서와 유사한 문서 순으로 우선 배치하여 검색에 효율을 높일 수 있는 방법을 제안한다. 즉, 제안된 알고리즘은 텍스트 분석과정을 통해 각 문서별로 특징치가 부여되고 문서 간 특징치 비교를 통해 유사문서를 찾고 문서를 랭킹하여 유사정보를 제공한다. 텍스트 분석과정은 Stop-word과정, 핵심단어 추출과정, 핵심단어 가중치 산출 과정으로 이루어진다. 실험결과에서는 정확도 측정을 실시하여 일반검색엔진과 본 논문에서 제안한 알고리즘의 검색 정확도를 비교하였다. 본 논문은 검색결과를 질의한 문서와 유사한 문서 순으로 랭킹하기 때문에 검색이용자가 검색결과 검토과정에서 유사한 문서를 먼저 검토할 수 있도록 하여 검토시간을 줄이고 검색의 효율을 높일 수 있다. 또한 특허문서 전체 텍스트를 입력받아 사용하기 때문에 특허검색에 익숙하지 않는 이용자도 검색을 쉽고 빠르게 이용할 수 있다. 그리고 내용 기반 검색이 이루어지기 때문에 키워드 및 검색 식을 이용하는 방법보다 검색범위를 넓힐 수 있어서 검색에 누락되는 데이터를 줄일 수 있는 효과를 가진다.

회선 신경망을 활용한 자모 단위 한국형 감성 분석 모델 개발 및 검증 (Development and Validation of the Letter-unit based Korean Sentimental Analysis Model Using Convolution Neural Network)

  • 성원경;안재영;이중정
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.13-33
    • /
    • 2020
  • 본 연구는 자모 단위의 임베딩과 회선 신경망을 활용한 한국어 감성 분석 알고리즘을 제안한다. 감성 분석은 텍스트에서 나타난 사람의 태도, 의견, 성향과 같은 주관적인 데이터 분석을 위한 자연어 처리 기술이다. 최근 한국어 감성 분석을 위한 연구는 꾸준히 증가하고 있지만, 범용 감성 사전을 사용하지 못하고 각 분야에서 자체적인 감성 사전을 구축하여 사용하고 있다. 이와 같은 현상의 문제는 한국어 특성에 맞지 않게 형태소 분석을 수행한다는 것이다. 따라서 본 연구에서는 감성 분석 절차 중 형태소 분석을 배제하고 초성, 중성, 종성을 기반으로 음절 벡터를 생성하여 감성 분석을 하는 모델을 개발하였다. 그 결과 단어 학습 문제와 미등록 단어의 문제점을 최소화할 수 있었고 모델의 정확도는 88% 나타내었다. 해당 모델은 입력 데이터의 비 정형성에 대한 영향을 적게 받으며, 텍스트의 맥락에 따른 극성 분류가 가능하게 되었다. 한국어 특성을 고려하여 개발된 본 모델이 한국어 감성 분석을 수행하고자 하는 비전문가에게 보다 쉽게 이용될 수 있기를 기대한다.

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

2006년 '화학의 해'의 언론매체 속 화학 이미지 분석 (The Analysis of Chemistry's Image in Daily newspaper on '2006, the Year of Chemstry')

  • 신선영;조미주;박종석
    • 과학교육연구지
    • /
    • 제32권1호
    • /
    • pp.47-60
    • /
    • 2008
  • 기초 과학 진흥과 과학의 대중화를 위한 노력의 일환으로 과학기술부는 2004년을 '과학문화의 해', 2005년을 '물리의 해', 2006년을 '화학의 해', 2007년을 '생물의 해' 그리고 2008년을 '지구의 해'로 정해 다양한 행사를 기획 시행하였고, 하고 있다. 2006년 '화학의 해'에는 화학을 소재로 한 각종 전시 행사 및 대회가 개최되었다. 과학연극 '산소'의 무료 전국순회공연이 있었고, 이동화학관은 2006년도뿐만 아니라 올해도 분주하게 전국투어를 하고 있다. 한국방송공사(KBS)에서는 '화학의 해'를 기념하여 특별기획 프로그램을 여러 차례 방영하였다. 이만큼 '화학의 해'에는 화학이 대중들에게 가까이 다가갔었다. 이 같은 환경 속에서 2006년 화학의 해에 대중매체 중 일간지에서는 화학이 어떻게 그려졌었는지, 그것은 대중들에게 어떻게 보여 졌는지 궁금하였다. 이에 국내 4대 일간지를 선정 '화학의 해'인 2006년에 보도된 화학 관련 기사를 여러 검색어를 이용 검색하여 기사에 나타난 화학의 이미지를 분석하였다. 검색어는 화학 관련 단어를 설문조사하여 빈도수가 가장 많은 5개의 단어 선정하였고, 이를 인터넷 신문사 검색 창에 입력하여 기사를 찾았다. 찾아진 기사는 연구자들이 읽어가면서 화학 관련된 것을 선별하였고, 선별된 기사들을 읽어 기사 속 화학의 이미지를 긍정과 부정 그리고 기사의 속성 등으로 분석하였다. 대중매체에 제시되는 화학의 이미지는 대중들에게 가장 쉽게 전달될 수 있는 경로이므로 대중매체에 나타나는 화학의 이미지는 음양으로 대중들에게 커다란 영향을 줄 수 있을 것이다.

  • PDF

해외어학연수의 외국어 정확성 향상에 대한 효과 (The Effect of Overseas Language Training on the Development of Foreign Language Accuracy)

  • 차미양
    • 산업융합연구
    • /
    • 제18권4호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구는 해외어학연수의 외국어 정확성 향상에 대한 효과를 조명하기 위해 한 학기 동안 해외대학에서 어학연수를 받은 27명의 한국 대학생들이 한 학기의 시간차를 두고 작성한 두 영작문 간의 차이와 오류들을 조사하고, 그러한 차이가 통계적으로 유의미한지를 검정하여 외국어 정확도 면에서의 변화를 분석하였다. 어학연수 이후에 영작문의 길이와 문장의 길이가 증가하였으나 전체 문장수는 감소하였다. 학생들은 더 많은 수의 단어를 더 복잡한 구조의 문장에서 사용하여 오류의 수도 증가하였다. 이를 볼 때, 어학연수 이후 학생들의 문장 생성능력이 향상되고 복잡한 형태의 문장들을 쓰려고 시도한 것을 알 수 있다. 본 연구의 결과는 한 학기 동안 해외어학연수를 받은 이후 대체로 학생들의 문장생성능력은 다소 증진하였지만, 문법적 요소들을 문장 속에서 정확하게 사용하는 문법적 정확성은 크게 향상하지 않은 것으로 나타났다. 이는 비록 해외 어학연수가 집중적으로 목표언어만 학습하여 언어입력을 확대할 수 있을 뿐만 아니라, 목표언어에 자연스럽게 노출될 수 있는 환경적 이점을 제공하긴 하지만, 한 학기라는 기간 안에 문법적으로 정확한 문장을 생성해내는 문법능력을 향상시키는 데는 크게 효과적이지 않았다는 것을 시사한다.

핵심어 검출을 위한 단일 끝점 DTW알고리즘 (A Single-End-Point DTW Algorithm for Keyword Spotting)

  • 최용선;오상훈;이수영
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.209-219
    • /
    • 2004
  • 본 논문에서는 핵심어 검출 시스템을 실시간 적용이 가능한 하드웨어로 구현하기 위해 연산량이 적고 구조가 간단한 단일 끝점 DTW 방법을 제안한다. 제안된 알고리즘은 일반적 DTW가 양쪽 끝점을 요구하는데 비하여 단지 한쪽 끝점만 필요하므로 이용하기에 편리하며, 국부 검색의 연속이 전역 경로를 이루게 되므로 매우 적은 연산량을 가진다. 그리고, 제안한 단일 끝점 DTW가 보다 나은 성능을 지니도록 하기 위해 새로운 경사 가중치와 거리 측정법을 가지도록 하였다. 이외에도, 단일 끝점 DTW는 특징벡터 정규화를 적용하여 특징벡터 각각의 차원에서 데이터들이 같은 표준편차를 가지게 하며 모든 프레임이 같은 에너지를 가지도록 정규화 되었다 또한, 주어진 학습 패턴들에 클러스터링을 적용한 후, 각 클러스터 내에서 평균을 계산하여 구한 패턴을 해당 핵심어를 대표하는 여러 개의 기준패턴으로 삼았다. 이러한 기준패턴들과 입력 음성의 특징벡터가 이미 정해진 문턱값 보다 작은 거리 내에 있을 때 핵심어는 검출된다. 제안된 알고리즘을 고립단어 음성인식과 핵심어 검출 실험에 적용하여 다른 방법을 이용한 결과보다 성능이 뛰어남을 확인하였다.

부정적 피드백과 강화학습을 이용한 사용자 프로파일 학습 (Learning for User Profile Based on Negative Feedback and Reinforcement Learning)

  • 손기준;임수연;이상조
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.754-759
    • /
    • 2007
  • 정보추천은 동적인 사용자의 정보요구를 기준으로 문서들을 선별하여 제시한다. 사용자의 정보요구는 하나 이상의 단어들로 구성된 프로파일로 표현이 되며, 문서의 추천 과정 동안에 발생하는 사용자의 관련성 평가를 통해 구체적인 내용으로 변할 수 있다. 기존 연구의 경우 사용자는 자신이 직접 관련성 평가에 참여하여 평가 정보를 입력하고, 사용자가 평가한 긍정적 피드백 정보를 이용하여 사용자 프로파일을 학습한다. 본 연구는 사용자가 평가한 긍정적 피드백, 부정적 피드백 정보와 강화학습을 이용한 사용자 프로파일의 학습 방법을 제안한다. 제안된 방법과 기존의 긍정적 평가 정보만을 이용한 방법의 성능을 측정하기 위해 동일한 토픽에 대한 추천 성능을 비교 실험하였다. 실험한 결과 제안된 방식에 의한 추천성능이 긍정적 평가 정보만을 이용한 피드백 방법보다 나은 성능을 보였다.

아바타를 내장한 한글 지문자 학습 게임 개발에 관한 연구 (A Study on the Development of a Korean Manual Alphabet Learning Game with Avatar)

  • 오영준;정기철
    • 한국게임학회 논문지
    • /
    • 제9권4호
    • /
    • pp.67-80
    • /
    • 2009
  • 본 논문은 아바타를 내장한 한글 지문자 학습 게임 개발에 관한 논문으로써, 초보자가 수화아바타에게서 지문자를 쉽게 배우고 쉽게 연습할 수 있도록 한글 지문자 인식 게임 프로그램개발을 제안한다. 지문자는 단어를 철자로 표현하는 한국수화의 어휘에 대응한다. 지문자 자모가 한글 자모에 일치하고 사용자에 의하여 한글이 손 모양으로 표현되었다. 시스템은 OpenGL에 기반한 수화아바타강사 GUI 팝업윈도우와 지문자 인식모듈, 여러 한글 자음 글자가 아래로 이동하는 게임 모듈, USB 카메라로 구성된다. 지문자는 한글 자모를 표현하는 것으로써, 사용자는 아바타로부터 지문자를 배우고 USB 카메라를 이용하여 시스템에 지문자를 간단하게 입력한다. 우리는 사용자들의 검증을 통하여 개발된 시스템의 성능을 평가하였다.

  • PDF

감정 기반 모바일 손제스쳐 애니메이션 제작 시스템 (Emotion Based Gesture Animation Generation Mobile System)

  • 이정숙;변혜원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.129-134
    • /
    • 2009
  • 최근 모바일의 문자 서비스를 사용하여 사람들과 소통하는 사용자가 늘어나고 있다. 하지만 기존 문자 서비스의 문장과 이모티콘 만으로는 자신의 감정을 정확히 표현하기 어렵다. 이러한 점에 착안하여, 본 논문에서는 문자 내용이 나타내는 감정과 분위기 및 뉘앙스를 정확하고 재미있게 전달하기 위해서 캐릭터 애니메이션을 활용하였다. 문자 내용의 감정을 말보다 역동적이고 뚜렷하게 전달하기 위해서 캐릭터의 얼굴 표정과 손제스쳐로 감정과 내용을 나타내는 감정 기반 모바일 손제스쳐 애니메이션 제작 시스템을 제안한다. Michel[1]등은 화자의 스타일을 나타낸 손제스쳐 애니메이션 제작을 위해서 인터뷰 영상을 분석하고 손제스쳐가 자연스럽게 연결되는 애니메이션 생성을 위한 손제스쳐 생성 그래프를 제안하였다. 본 논문에서는 Michel[1]의 논문을 확장하여 캐릭터의 감정을 손제스쳐로 과장되게 표현한 디즈니 애니메이션에서 단어의 감정을 표현하는 손제스쳐를 추출하고 자연스럽게 연결된 모바일 3차원 애니메이션으로 제작하는 것에 초점을 맞춘다. 특히 입력된 문장의 감정에 맞는 손제스쳐를 선택하는 감정 손제스쳐 생성 그래프를 제안하고 감정의 자연스러운 흐름을 반영하는 방법을 제시한다. 제안된 시스템의 타당성과 기존 서비스와의 대체 적정도를 알아보기 위해서 사용자 반응을 조사 분석한다.

  • PDF

웹 게시판 비속어 처리 프로그램의 설계 및 구현 (Design and Implementation of a Swearing Remover Program on Web board)

  • 조아영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권10호
    • /
    • pp.1317-1328
    • /
    • 2001
  • 기존의 웹 게시판 비속어 처리 프로그램들은 입력 차단형이라는 한계성 때문에 비속어의 모양이 조금만 변형이 되어도 비속어를 차단하지 못하는 문제점이 있었다. 이러한 한계성을 극복하기 위하여 본 논문에서는 인터넷의 열려있는 게시판에 대해 분석 및 삭제/치환하는 감시형 프로그램을 개발하였다. 이를 위해 먼저 웹 상의 비속어 패턴을 분류하였고 이를 바탕으로 이러한 패턴들을 분석할 수 있는 토크나이저를 개발하였다. 그리고 각 게시판에 대한 토크나이징 및 비속어 삭제/치환 모듈을 스레드로 구현하여 각각 병렬적으로 작업제어가 되도록 구현하였다. 이 프로그램을 웹 게시판의 데이터에 실험적으로 작동시킨 결과 대부분의 비속어를 검출하여 91.9%의 재현율을 보였으나 형태소적 변형 비속어와 문맥적 비속어의 검출에는 다소 미흡함을 나타내었다. 이 프로그램은 품사적, 의미적 중의어와 문맥적 비속어의 처리에 있어서 이 프로그램의 수동모드의 확장을 통해 앞으로 더욱 보완되어야 할 것이다. 이 프로그램은 게시판 사용자들을 적절한 단어사용에로 유도하며, 공공기관, 학교, 방송국 등의 게시판 관리자의 수작업을 대체해 줄 수 있을 것으로 기대된다.

  • PDF