• 제목/요약/키워드: sematic relation

검색결과 2건 처리시간 0.015초

단어 의미와 자질 거울 모델을 이용한 단어 임베딩 (A Word Embedding used Word Sense and Feature Mirror Model)

  • 이주상;신준철;옥철영
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.226-231
    • /
    • 2017
  • 단어 표현은 기계학습을 사용하는 자연어 처리 분야에서 중요하다. 단어 표현은 단어를 텍스트가 아닌 컴퓨터가 분별할 수 있는 심볼로 표현하는 방법이다. 기존 단어 임베딩은 대량의 말뭉치를 이용하여 문장에서 학습할 단어의 주변 단어를 이용하여 학습한다. 하지만 말뭉치 기반의 단어 임베딩은 단어의 등장 빈도수나 학습할 단어의 수를 늘리기 위해서는 많은 양의 말뭉치를 필요로 한다. 본 논문에서는 말뭉치 기반이 아닌 단어의 뜻풀이와 단어의 의미 관계(상위어, 반의어)를 이용하며 기존 Word2Vec의 Skip-Gram을 변형한 자질거울모델을 사용하여 단어를 벡터로 표현하는 방법을 제시한다. 기존 Word2Vec에 비해 적은 데이터로 많은 단어들을 벡터로 표현 가능하였으며 의미적으로 유사한 단어들이 비슷한 벡터를 형성하는 것을 확인할 수 있다. 그리고 반의어 관계에 있는 두 단어의 벡터가 구분되는 것을 확인할 수 있다.

시멘틱웹 구축을 위한 스키마 관리 기법 연구 (Schema management skills for semantic web construction)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.9-15
    • /
    • 2007
  • 전 세계적으로 인터넷의 사용이 일반화되면서 인터넷상의 정보의 양이 기하급수적으로 증가하였고, 이에 따라 이러한 정보들을 수집하고 통합하여 특정집단 또는 일반인들의 의사결정을 지원하기 위한 시멘틱웹에 대한 중요성이 갈수록 증대되고 있다. 시멘틱웹을 구성하는 기본 구조는 온톨로지이며, XML, RDF/RDF스키마, OWL 같은 언어들은 온톨로지의 스키마를 구성하는 기본 수단이다. 온톨로지의 스키마를 구성하고 관리할 때 중요한 고려사항 중 하나는 스키마는 시간이 지남에 따라 변화한다는 것이다. 그러므로 스키마상의 도메인의 변화 데이터 개념의 변화 혹은 자원간의 관계의 변화 등을 감지하고 이를 반영할 수 있는 형태로 구현되어야 한다. 본 연구에서는 시멘틱웹의 스키마관리를 위한 버전 관리 기법을 제안한다. 이를 위하여 버전의 변화 형태를 카테고리 별로 분류하고 이를 바탕으로 버전 그래프를 생성하였다. 생성된 그래프를 바탕으로 이행성규칙 등을 정의하여 적용하였으며, 좀 더 세세한 적용이 가능하도록 표식을 사용하여 적용 가능한 버전 스키마의 범위를 확장하도록 하였다.

  • PDF