• 제목/요약/키워드: Folksonomy mining

검색결과 5건 처리시간 0.02초

형식개념분석을 이용한 폭소노미 마이닝 기법과 지원도구의 개발 (On development of supporting tool for Folksonomy Mining based on Formal Concept Analysis)

  • 강유경;황석형;양해술
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1877-1893
    • /
    • 2009
  • 폭소노미(folksonomy)는 웹에 존재하는 리소스에 대해 사용자가 자유롭게 선택한 태그(tag)를 붙여서 정보를 체계화하는 새로운 분류 체계이다. 폭소노미 기반의 시스템에서는 사용자들의 협력태깅에 의해 사용자, 태그, 리소스사이의 관계를 나타내는 3항원 소데이터가 생성된다. 이와 같은 폭소노미 데이터는 웹 리소스에 대한 정보체계화를 위한 메타데이터로서 시맨틱 웹과 웹2.0 분야에 활용되고 있다. 본 논문에서는 다종다양한 폭소노미 데이터를 다양한 관점으로 분석하여 유용한 정보를 추출하기 위한 형식개념분석 기반의 폭소노미 데이터 마이닝 기법을 제안하고, 이를 지원하기 위한 분석도구 FMT를 개발하였다. 또한, 제안한 기법과 FMT의 유용성을 검증하기 위하여, 폭소노미 기반 시스템인 del.icio.us의 데이터를 대상으로 실험을 수행하고, 그 결과를 보고한다.

형식개념분석기법을 이용한 폭소노미 데이터 마이닝 (Folksonomy Data Mining using Formal Concept Analysis)

  • 강유경;황석형;양해술
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.562-565
    • /
    • 2009
  • 웹 2.0시대의 대표적인 특징인 폭소노미(folksonomy)는 웹에 존재하는 리소스에 대해 구성원이 자유롭게 선택한 태그(tag)를 붙여서 정보를 체계화하는 새로운 분류 체계이다. 폭소노미를 기반으로하는 웹 애플리케이션 시스템에는 WWW를 이용하는 전 세계의 수많은 사용자들의 다양한 데이터가 축적되어 있으며, 이러한 웹 데이터는 계속적으로 증가 확장 변화하고 있다. 본 논문에서는, 방대한 양의 폭소노미 데이터로부터 유용한 정보를 추출하기 위해 형식개념분석기법을 기반으로, 사용자, 태그, 리소스들 사이의 3항관계를 고려한 폭소노미 데이터 마이닝 기법을 제안하고, 본 연구에서 제안한 기법을 BibSonomy의 데이터에 적용하여 분석한 실험 결과를 보고한다.

WordNet기반의 형식개념분석기법을 이용한 사용자태그 분류체계의 구축 (Construction of Hierarchical Classification of User Tags using WordNet-based Formal Concept Analysis)

  • 황석형
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.149-161
    • /
    • 2013
  • 본 논문에서는, 어휘정보를 체계화한 워드넷(WordNet)을 토대로 형식개념분석기법(Formal Concept Analysis)을 사용하여 폭소노미 사용자들의 태그데이터를 분석하여 사용자태그의 분류체계를 구축하기 위한 기법을 제안하였다. 또한, 제안된 기법을 지원하기 위한 도구(TagLighter)의 개발에 대하여 설명하고, 그 유용성을 확인하기 위하여 Bibsonomy.org의 사용자 태그데이터를 대상으로 실시한 실험결과를 기술하였다. TagLighter에 의해 구축된 사용자태그 분류계층구조는 사용자태그에 대한 보다 상세한 이해를 제공하기 때문에, 폭소노미기반 시스템에서의 정보검색과 데이터 분석에 유용하다. 본 논문의 연구결과는, 폭소노미기반의 웹서비스와 소셀네트워크시스템, 시맨틱웹 어플리케이션 등을 대상으로 하는 웹데이터 마이닝분야에 응용할 수 있다.

딜리셔스에서 유사태그 추출에 관한 연구 (Mining Semantically Similar Tags from Delicious)

  • 이관
    • 정보관리학회지
    • /
    • 제26권2호
    • /
    • pp.127-147
    • /
    • 2009
  • 자연언어에서 유사어의 처리는 사람과 컴퓨터간의 의사소통에 적지 않은 장애가 되어왔고, 이는 사용자의 임의적 단어사용에 기반을 두고 있는 웹 2.0 애플리케이션, 특히 소셜태깅 분야에 있어서 그 장애의 정도가 더 심각해질 수 있다. 본 연구는 한 대표적인 웹 2.0 애플리케이션에서 자동 유사어 추출에 관한 문제를 다루고 있다. 더 구체적으로, 가장 널리 사용되는 소셜북마킹 애플리케이션인 딜리셔스를 기반으로, 유사태그를 추출하는 방법(FolkSim)을 제시하고자 한다. 제시한 방법의 평가를 위하여, 문서유사도의 측정을 위해서 쓰여진 고전적 벡터모델에 의거한 유사태그를 추출하는 방법(CosSim)과 그 결과들을 서로 비교분석하여 보았다. 몇 가지 면에서 FolkSim가 더 나은 결과 산출해내는 증거들이 관찰되어졌다. 또한, FolkSim 방법에 의한 유사태그가 만들어지지 않는 경우에 대비하여, 그 대안 또한 제시하고 있다.

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.