• 제목/요약/키워드: sense ambiguation

검색결과 5건 처리시간 0.024초

어휘의미 중의성이 인터넷 정보검색 효율에 미치는 영향에 관한 연구 (A Study of Word Sense Ambiguation which Affects Efficiency of the Internet-based Information Retrieval)

  • 황상규;오경묵;변영태
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.65-82
    • /
    • 1999
  • 부적절한 검색어의 선정 및 검색식의 작성은 인터넷 정보검색 수행 시 검색 효율 저하의 주요 원인으로 작용하게 된다. 또한 정보검색 수행 시 발생하는 어휘의미중의성(Word Sense Ambiguation) 역시 검색 효율 저하의 주요 원인으로 작용하는데, 어휘의미중의성에 의한 효율 저하 정도를 실험을 통해 확인하였다. 어휘의미중의성에 의한 검색 효율 저하란 검색어로 입력한 어휘가 문서에서 서로 다른 의미로 사용됨에 따라 의도하지 않은 다른 문서가 검색될 수 있음을 의미한다. 본 논문에서는 새로운 정보검색 환경인 인터넷기반정보검색에 있어 어휘의미중의성이 검색 정확률에 미치는 영향을 살펴보고, 기존의 정보검색에 있어 어휘의미중의성에 관한 연구가 인터넷기반 정보검색에 있어서도 제대로 적용되는지를 조사 분석하였다.

  • PDF

어휘의미중의성이 인터넷기반 정보검색에 미치는 영향 (Effect of Word Sense Ambiguation on Internet-Based Information Retrieval)

  • 황상규;오경묵;변영태;천윤심
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.151-155
    • /
    • 1999
  • 기존의 문헌정보검색에 있어 어휘의미중의성은 검색 효율 저하의 주요 원인 중 하나로 생각되어져 왔다. 어휘 의미중의성에 의한 검색 효율 저하란 검색어로 입력한 어휘가 문서에서 서로 다른 의미로 사용됨에 따라 의도하지 않은 다른 문서가 검색될 수 있음을 의미한다. 본 논문에서는 새로운 정보 검색 환경인 인터넷기반 정보검색에 인어 어휘의미중의성이 검색 정확율에 미치는 영향을 살펴보고, 기존에 문헌정보검색에 있어 어휘 의미중의성에 관한 연구가 인터넷기반 정보검색에 있어서도 제대로 적용되는지를 확인해 보았다. 또한 실험을 통해 검색어 수와 어휘의미중의성 간의 상관관계를 조사하였으며, 일반 이용자가 인터넷기반 정보검색 수행시 어휘의미중의성에 의한 검색 효율 저하를 최대한 방지할 수는 방법에 대해 모색해 보았다.

  • PDF

어휘사전 워드넷을 활용한 의미기반 웹 정보필터링 (Semantic-Based Web Information Filtering Using WordNet)

  • 변영태;황상규;오경묵
    • 한국정보처리학회논문지
    • /
    • 제6권11S호
    • /
    • pp.3399-3409
    • /
    • 1999
  • Information filtering for internet search, in which new information retrieval environment is given, is different from traditional methods such as bibliography information filtering, news-group and E-mail filtering. Therefore, we cannot expect high performance from the traditional information filtering models when they are applied to the new environment. To solve this problem, we inspect the characteristics of the new filtering environment, and propose a semantic-based filtering model which includes a new filtering method using WordNet. For extracting keywords from documents, this model uses the SDCC(Semantic Distance for Common Category) algorithm instead of the TF/IDF method usually used by traditional methods. The world sense ambiguation problem, which is one of causes dropping efficiency of internet search, is solved by this method. The semantic-based filtering model can filter web pages selectively with considering a user level and we show in this paper that it is more convenient for users to search information in internet by the proposed method than by traditional filtering methods.

  • PDF

온톨로지 기반 전사적 아키텍처 상호운용성 방안 연구 (The Study for Methodology of Ontology-based Enterprise Architecture Interoperability)

  • 황상규;김왕석;변영태
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2006년도 춘계학술대회
    • /
    • pp.424-429
    • /
    • 2006
  • 정부의 행정 서비스를 보다 효과적이고 효율적으로 제공하는 것은 정부혁신의 핵심키워드이다. 이를 위한 수단으로 정부 공공기관들은 전사적 아키텍처(Enterprise Architecture)를 적극적으로 도입, 활용해야 한다. 전사적 아키텍처란 아직까지도 진화중인 개념으로 해당 기관 정보화 업무의 전 영역을 업무 프로세스(Business Processes), 정보 흐름 및 관계(Information Flow and Relationships), 애플리케이션(Applications),데이터 명세 및 관계(Date Descriptions and Relationships), 그리고 기술 하부구조(Technology Infrastructure)로 구분 짓고 각각을 구조화된 산출물로 정리함으로써 공공정보화의 청사진을 제시한다. 이렇게 구축된 아키텍처 결과물은 기관 내 뿐 아니라 타 기관 EA와의 연계를 통해 상호 운용되어야 하며, 이 과정에서 어휘의미중의성(Word Sense Ambiguation)등 상호운용성 문제가 핵심 이슈로 대두되리라 예상된다. 공공분야로 한정짓더라도 200여 정부부처 EA간의 상호운용성 문제는 정부조직 간 경계를 넘어 통합된 EA정보를 취합, 활용하는 데 있어 가장 큰 장애요인이 되리라 예상된다. 본 논문에서는 온톨로지를 사용하여 각기 서로 다른 EA간 상호운용성 문제를 해결하는 방안에 대해 논의하고자 한다.

  • PDF

양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석 (Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation)

  • 기호연;신경식
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.197-208
    • /
    • 2020
  • 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다. 주변 문맥의 정보를 충분히 반영한다면, 어휘적 중의성 문제를 해결하고, 문장이 나타내려는 감정을 하나로 압축할 수 있다는 가정을 기반으로 한다. 양방향 LSTM은 문맥 정보를 필요로 하는 자연어 처리 연구 분야에서 자주 활용되는 알고리즘으로 본 연구에서도 문맥을 학습하기 위해 활용하고자 한다. GloVe 임베딩을 본 연구 모델의 임베딩 층으로 사용했으며, LSTM, RNN 알고리즘을 적용한 모델과 비교하여 본 연구 모델의 성능을 확인하였다. 이러한 프레임워크는 SNS 사용자들의 감정을 소비 욕구로 연결시킬 수 있는 마케팅 등 다양한 분야에 기여할 수 있을 것이다.