• 제목/요약/키워드: 어휘추출

검색결과 435건 처리시간 0.035초

지역이미지 감성어휘 추출을 통한 효과적인 지방자치단체 홍보영상제작에 관한 연구 (The Study of making Visual Media for Public Relations by the Extraction of Emotional vocabulary from City Images)

  • 원강식;조동민
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.475-482
    • /
    • 2012
  • 지방자치시대에 모든 지방자치단체들은 본인들의 지방정부를 좋은 이미지로 알려 관광이나 경제통상에 이득이 되도록 노력하고 있기 때문에 지역이미지가 조각된 홍보영상은 중요하고 필요하다. 따라서 본 연구는 지역이미지와 시정홍보영상 이미지간의 관계를 알아보고 효과적인 시정홍보영상제작을 위한 기초자료를 제공하고자 한다. 평소 지역에 대해 가지고 있는 이미지를 감성어휘로 추출하여 시정홍보영상 이미지에도 동일한 감성어휘가 들어가 있는지와 홍보영상이미지에서의 이미지 어휘에 대한 평균값이 상승 혹은 하락을 하였는지를 조사하여 지역이미지가 긍정적으로 투영된 시정홍보영상 이미지 제작을 해야 한다는 것을 알 수 있었다.

시각적 형태 정보에 관한 감성어휘 분류 (Classification of KANSEI Vocabulary according to Visual Shape Information)

  • 백선경;황광수;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2006
  • 인간의 주관적이고 애매한 감성은 차세대 컴퓨팅의 다양한 분야에서 연구되며. 인간의 감성을 이해하고 감성의 변화에 능동적으로 반응하는 사용자 중심의 정보 처리에 대한 요구가 급격히 증가하고 있다. 우리는 감성기반 이미지 검색을 위해 저차원 시각정보에 대한 강성처리를 연구하고 있다. 기존의 저차원 시각정보 특징을 고려한 내용기반 이미지 검색 방법은 사용자의 취향이나 감성 요구에 적합한 결과를 검색하기에는 많은 어려움이 있다. 본 논문에서는 인간의 감성을 이해, 검색, 인식하기 위한 시각정보와 감성간의 관계 연구 중 우리의 기존 연구인 시각적 형태 정보의 감성어휘 공간에서 형태와 어휘간의 감성거리를 이용한 분류방법을 제안한다. 그리고 분류된 각 영역에서의 대표 어휘를 추출하여 시각적 형태에 따른 감성어휘간의 구체적 계층 관계를 정의한다. 이는 감성기반 이미지 검색 분야에 활용 가능한 연구이며, 우리가 사용하는 언어에 내재된 감성정보를 해석하고 그 어휘들의 체계적인 시각적 감성관계를 정의하는 의의를 갖는다.

  • PDF

무제한 정보 추출을 이용한 지식베이스 확장 (Incremental Ontology Building Using Open Information Extraction)

  • 김병수;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.228-232
    • /
    • 2014
  • 지식 베이스(Knowledge Base)는 주어진 질의 문에 대한 잠재적인 답과 답에 대한 단서가 될 수 있는 구조화된 형태의 정보를 포함하고 있기 때문에 질의응답 시스템에서 매우 중요하다. 하지만 비록 DBpedia, Freebase, YAGO 등과 같이 이용 가능한 여러 개의 지식 베이스가 존재함에도 불구하고 이러한 지식 베이스에 포함되어 있는 정보는 웹(Web)상에 존재하는 정보에 비하면 매우 제한적이다. 본 논문에서는 무제한 정보 추출 기술을 이용하여 정형화되지 않은 텍스트로부터 트리플(Triple)을 추출하고, 추출된 트리플의 각 개체 및 관계 어휘를 대상 온톨로지(Ontology) 상의 어휘에 사상시킴으로써 지식 베이스를 확장 시키는 방법을 제안한다. 이를 통하여 무제한 정보 추출 방법과 명확화(Disambiguation) 기술이 지식 베이스를 확장시키는데 어떻게 사용될 수 있고, 어떠한 요소가 전체 시스템의 주된 성능 저하를 일으키며 개선되어야 하는지 알아보도록 한다.

  • PDF

코퍼스를 이용한 상하위어 추출 연구 (A Study of the Automatic Extraction of Hypernyms and Hyponyms from the Corpus)

  • 방찬성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.46-53
    • /
    • 2007
  • 본 연구는 코퍼스 내 어휘들의 상하위 관계를 중심으로 패턴들을 추출하는 방법을 제안한다. 한국어 어순의 자유로움으로 인한 제약으로 주로 사전 뜻풀이말을 중심으로 하였던 패턴 추출 방식에서 벗어나 본 연구는 코퍼스를 이용하여 다양한 패턴들을 제시하고자 하였다. 연구 방법으로는 세종전자 사전을 이용하여 상하위어 쌍들의 목록을 선정한 후 코어넷으로 상하위어 목록을 추가한다. 그리고 이 두 상하위어 목록의 어휘 쌍들을 포함하는 문장들을 코퍼스에서 추출한 후 체계적으로 패턴화 할 수 있는 문장들을 추출하여 21가지 패턴으로 일반화하였다. 21가지 패턴들을 정규식으로 표현한 뒤 각각 동일한 패턴들을 가진 문장들을 코퍼스에서 다시 추출한 결과 57%의 정확률이 측정되었다.

  • PDF

신경회로망을 이용한 화자종속 음성인식 성능에 관한 연구 (A study of speaker dependent speech recognition using neural network)

  • 윤지원;이종수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.153-156
    • /
    • 2003
  • 본 연구는 화자종속 소어휘 음성인식의 성능을 개선하는 데 그 목적이 있다. 인식에 사용될 음성의 특징을 얻기 위해 Winer 필터와 LPC&Cepstrum을 이용하여 프레임 당 12차 패턴을 추출하였다. 추출된 특징패턴을 인식하는 인식부는 특히 소어휘 음성인식에 우수한 성능을 보이는 기존의 역전파 신경회로망(Backpropagation Neural Network)에 인식율 개선을 위하여 퍼지추론시스템을 결합한 형태로 구현되었다. 실험결과 신경망만을 사용한 경우에 비하여 인식율이 향상됨을 연구하였다.

  • PDF

자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구 (A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구 (A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel)

  • 최성필;정창후;전홍우;조현양
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.251-275
    • /
    • 2011
  • 본 논문에서는 단백질 간 상호작용 자동 추출을 위해서 기존에 연구되어 높은 성능을 나타낸 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존 구문 트리 커널의 문제점은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대한 단순 외형적 비교로 인해, 실제 의미적으로는 유사한 두 구문 트리의 커널 값이 상대적으로 낮아지는 현상이며 결국 상호작용 자동 추출의 전체 성능에 악영향을 줄 수 있다는 점이다. 본 논문에서는 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 어휘 의미적 유사도 계산을 위해서 문맥 및 워드넷 기반의 어휘 중의성 해소 시스템과 이 시스템의 출력으로 도출되는 어휘 개념(WordNet synset)의 추상화를 통한 기존 커널의 확장을 시도하였다. 실험에서는 단백질 간 상호작용 추출(PPII, PPIC) 성능의 심층적 최적화를 위해서 기존의 SVM에서 지원되던 정규화 매개변수 외에 구문 트리 커널의 소멸인자와 시맨틱 구문 트리 커널의 어휘 추상화 인자를 새롭게 도입하였다. 이를 통해 구문 트리 커널을 적용함에 있어서 소멸인자 역할의 중요성을 확인할 수 있었고, 시맨틱 구문 트리 커널이 기존 시스템의 성능향상에 도움을 줄 수 있음을 실험적으로 보여주었다. 특히 단백질 간 상호작용식별 문제보다도 비교적 난이도가 높은 상호작용 분류에 더욱 효과적임을 알 수 있었다.

기계가독형사전에서 상위어 판별을 위한 규칙 학습 (Learning Rules for Identifying Hypernyms in Machine Readable Dictionaries)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.171-178
    • /
    • 2006
  • 기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다.

SMS 변형된 문자열의 자동 오류 교정 시스템 (Automatic Error Correction System for Erroneous SMS Strings)

  • 강승식;장두성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (A)
    • /
    • pp.59-60
    • /
    • 2007
  • 휴대폰과 메신저 등 통신 환경에서 사용되는 표준어가 아닌 SMS의 변형된 어휘 및 띄어쓰기 오류를 자동으로 교정하여 형태소 분석 및 품사 태깅의 성능 저하 문제를 방지하는 문자열 오류의 교정 방법을 제안하였다. 통신 어휘들의 문자열 사전 구축 방법으로 통신어휘집을 기반으로 수동으로 구축하는 방법과 수작업으로 구축된 말뭉치로부터 자동으로 변형된 문자열을 추출하는 방법, 그리고 문맥을 고려하는 방법을 비교-분석하고 실험 및 성능 평가 결과를 제시하였다.

  • PDF

교육용 모바일 증강현실 게임을 위한 지능형 어휘 추천 에이전트 (Intelligent Vocabulary Recommendation Agent for Educational Mobile Augmented Reality Games)

  • 김진일
    • 융합정보논문지
    • /
    • 제9권2호
    • /
    • pp.108-114
    • /
    • 2019
  • 본 논문에서는 모바일 교육 증강현실 게임 환경에서 게임 학습 참여자의 학습 필요와 요구에 부응하는 어휘를 자동으로 제공해주는 지능형 어휘 추천 에이전트를 제안한다. 제안된 에이전트는 모바일 기술의 특성과 증강 현실 기술의 특성을 최대한 반영하여 설계하도록 하고 상황 어휘 추론 모듈, 싱글 게임 어휘 추천 모듈, 배틀 게임 어휘 추천 모듈, 학습 어휘 목록 모듈, 유의어 모듈로 구성한다. 연구 결과, 게임 학습 참여자들은 대체적으로 만족함을 알 수 있다. 상황 어휘 추론과 유의어의 정확도는 각각 4.01점, 4.11점으로 게임 학습 참여자가 처한 상황과 관련이 깊은 어휘가 추출되는 것을 보여준다. 하지만 만족도의 경우에는 배틀 게임 어휘(3.86)는 개인별 학습자의 추천 어휘 중에서 공동으로 사용할 수 있는 어휘를 추천하기 때문에 싱글 게임 어휘(3.94)보다는 상대적으로 낮은 결과가 나타났다.