• 제목/요약/키워드: Wikipedia

검색결과 157건 처리시간 0.022초

Anonymous Participation and Collaboration Efficiency in Online Communities

  • Hong Joo Lee;Jong Woo Kim;Hyun Jung Park;Sung Joo Park
    • Asia pacific journal of information systems
    • /
    • 제30권3호
    • /
    • pp.497-512
    • /
    • 2020
  • Anonymity is one of the key factors that influence communication and the work behaviours of people. It is even more evident in an online community where the role of anonymity can be akin to a double-edged sword: it can increase participation while at the same time having detrimental effects due to irresponsible and disruptive behaviour. Most studies on anonymous participation in groups or communities have reported this ambivalent view of anonymity: positive or negative. Furthermore, the effects of anonymous participation may be different in a dynamic sense because the task characteristics of participation can vary across time. In this study, we hypothesise that the effects of anonymity in online collaboration differ across the stages of collaboration. We analysed 2,978 featured articles on the English-language Wikipedia website and investigated the contributions of anonymous participants. While the contributions of anonymous participants were negative to collaboration efficiency as a whole, the negative effect of anonymous participants was stronger in the earlier stage than the later stage of collaboration. These findings indicate that the effect of anonymity has two sides in terms of collaboration efficiency in the same collaborative environment.

위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델 (A Semantic Text Model with Wikipedia-based Concept Space)

  • 김한준;장재영
    • 한국전자거래학회지
    • /
    • 제19권3호
    • /
    • pp.107-123
    • /
    • 2014
  • 텍스트마이닝 연구의 기본적인 난제는 기존 텍스트 표현모델이 자연어 문장으로 기술된 텍스트 데이터로부터 의미 또는 개념 정보를 표현하지 않는데 기인한다. 기존 텍스트 표현모델인 벡터공간 모델(vector space model), 불리언 모델(Boolean model), 통계 모델(statistical model), 텐서공간 모델(tensor space model) 등은 'Bag-of-Words' 방식에 바탕을 두고 있다. 이러한 텍스트 모델들은 텍스트에 포함된 단어와 그것의 출현 횟수만으로 텍스트를 표현하므로, 단어의 함축 의미, 단어의 순서 및 텍스트의 구조를 전혀 표현하지 못한다. 대부분의 텍스트 마이닝 기술은 대상 문서를 'Bag-of-Words' 방식의 텍스트 모델로 표현함을 전제로 하여 발전하여 왔다. 하지만 오늘날 빅데이터 시대를 맞이하여 방대한 규모의 텍스트 데이터를 보다 정밀하게 분석할 수 있는 새로운 패러다임의 표현모델을 요구하고 있다. 본 논문에서 제안하는 텍스트 표현모델은 개념공간을 문서 및 단어와 동등한 매핑 공간으로 상정하여, 그 세 가지 공간에 대한 연관 관계를 모두 표현한다. 개념공간의 구성을 위해서 위키피디어 데이터를 활용하며, 하나의 개념은 하나의 위키피디어 페이지로부터 정의된다. 결과적으로 주어진 텍스트 문서집합을 의미적으로 해석이 가능한 3차 텐서(3-order tensor)로 표현하게 되며, 따라서 제안 모델을 텍스트 큐보이드 모델이라 명명한다. 20Newsgroup 문서집합을 사용하여 문서 및 개념 수준의 클러스터링 정확도를 평가함으로써, 제안 모델이 'Bag-of-Word' 방식의 대표적 모델인 벡터공간 모델에 비해 우수함을 보인다.

위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법 (A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia)

  • 이호경;안재현;윤정민;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.813-821
    • /
    • 2017
  • 개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.

국가이미지 분석을 위한 위키피디아 실시간 동적 온톨로지 구축 알고리즘 및 적용 (Dynamic ontology construction algorithm from Wikipedia and its application toward real-time nation image analysis)

  • 이영환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.979-991
    • /
    • 2016
  • 이 연구에서는 국가이미지를 실시간 측정하기 위하여 위키피디아의 키워드를 추출하여 반자동 동적 온톨로지를 구축하는 알고리즘을 개발하였다. 이 DCDKC (double-crossing double keyword collection)라 명명된 알고리즘에 의해 추출된 국가이미지 온톨로지인 위키온토 (WikiOnto)는 동적으로 변화하는 국가이미지를 실시간으로 자동 측정하여 제공할 수 있도록 하였다. 따라서 국가이미지 관리에 효율성을 기하고 뜻밖에 있을 지도 모르는 국가이미지의 급박한 변화에 선제적으로 대응할 수 있는 도구를 개발하고자 하였다. DCDKC 알고리즘은 과거 오프라인 설문조사에 상당부분 의존하던 각종 국가브랜드지수 모델과는 달리 온라인 실시간 동적 국가이미지 모니터링 시스템에 잘 적용될 수 있음을 보여주었다. DCDKC 알고리즘을 적용한 시스템의 유용성을 검증하기 위하여 아시아의 3대 수출국인 한중일 삼국의 국가이미지를 측정하기 위한 동적 온톨로지 위키온토를 구축하고 국가 이미지의 동적 변화를 실시간으로 추적가능함을 확인하였다. 결론적으로 DCDKC를 이용한 위키온토의 구축을 통한 국가이미지 실시간 관리체계에 대한 가능성을 확인하였을 뿐더러 저렴하고 탁월한 솔류션이 될 수 있음을 증명하였다.

Classification of Speleology in Wikipedia

  • Oh, Jong-Woo
    • 동굴
    • /
    • 제82호
    • /
    • pp.17-25
    • /
    • 2007
  • The use of a low-frequency cave radio can also verify survey accuracy. A receiving unit on the surface can pinpoint the depth and location of a transmitter in a cave passage by measurement of the geometry of its radio waves. A survey over the surface from the receiver back to the cave entrance forms an artificial loop with the underground survey, whose loop-closure error can then be determined. In the past, caves were reluctant to redraw complex cave maps after detecting survey errors. Today, computer cartography can automatically redraw cave maps after data has been corrected.

웹문서를 이용한 단계별 한국어 미등록어 인식 모델 (Phase-based Model Using Web Documents for Korean Unknown Word Recognition)

  • 박소영
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1898-1904
    • /
    • 2009
  • 신문이나 블로그와 같은 실제 문서에서는 위키백과(Wikipedia)와 같은 기존에 없던 새로운 단어를 포함하고 있다. 그러나, 대부분의 정보 처리 기술은 시스템 개발 당시 확보한 자료를 바탕으로 사전을 구축하므로, 이러한 새로운 단어에 대해 신속하게 대처할 수 없다는 한계가 있다. 따라서 본 논문에서는 사전에 등록되어 있지 않은 한국어 미등록어를 자동으로 인식하는 모델을 제안한다. 제안하는 모델은 전문분석 기반 미등록명사 인식 단계, 웹 출현빈도 기반 미등록용언 인식 단계, 웹 출현빈도 기반 미등록명사 인식 단계로 구성된다. 제안하는 모델은 문서에서 여러 번 나타난 미등록어에 대해 전문분석을 통해 정확하게 인식할 수 있다. 그리고, 제안하는 모델은 문서에 한번 나타난 미등록어에 대해서도 웹문서를 바탕으로 광범위하게 인식할 수 있다. 또한, 제안하는 모델은 기본형이 어절에 그대로 나타나는 미등록명사뿐만 아니라 기본형이 변형하여 나타날 수 있는 미등록용언도 인식할 수 있다. 실험 결과 기존 미등록어 인식방법에 비해 제안하는 접근방법은 정확률 1.01%와 재현을 8.50%를 개선하였다.

집단지성의 정치 - 지식패러다임의 변화와 민주주의의 가능성 - (Politics of Collective Intelligence - Paradigm Shift of Knowledge and its Possibility on Democracy -)

  • 조화순;최재동
    • 정보화정책
    • /
    • 제17권4호
    • /
    • pp.61-79
    • /
    • 2010
  • 본 연구는 정보화시대의 지식패러다임 변화에 주목하면서 사례분석을 통해 집단지성의 내부적인 메커니즘에 대한 이론적인 접근을 시도하였다. 이 글의 분석대상은 세계 최대의 온라인 백과사전인 위키피디아와 한국사회에서 집단지성에 관한 사회적 관심을 촉발시킨 2008년의 촛불시위이다. 두 사례를 통해 과거의 시스템과 같이 전문가가 지식을 생산하는 것이 아니라, 일반 시민이 집단적이고 수평적으로 지식을 생산 공유하며 다양한 활동을 증대하고 있다는 사실에 주목하면서 집단지성의 유형과 그 메커니즘에 대한 시론적 분석을 시도해 보고자 한다. 본 연구는 지식패러다임을 정보와 지식의 양적인 변화를 의미하는 접속의 정도(Connectivity)와 질적인 변화를 의미하는 숙의의 정도(Quality of deliberation)를 기준으로 유형화하고 사례를 분석하였다. 위키피디아와 2008 촛불집회는 높은 접속성을 공유하지만 다양성과 독립성, 통합 메커니즘이라는 지표로 평가할 수 있는 숙의의 측면에서 결정적인 차이를 보이고 있다.

  • PDF

다차원 가상세계 모델 개발을 위한 연구 -시간축이 부여된 가상세계 모델을 중심으로- (A Proposition of Incorporating Time and Space in a Virtual World)

  • 길태숙;장준호;백형목;이대웅
    • 한국게임학회 논문지
    • /
    • 제9권4호
    • /
    • pp.21-32
    • /
    • 2009
  • 본 논문에서는 디지털매체의 복합적 특징을 포괄적으로 활용할 수 있도록 기존 가상세계 모델에 시간축을 부여하여 확장하는 방안을 제안하였다. 시간축이 부여된 가상세계의 구현은 현재의 공간정보가 포함된 전 세계의 맵을 기반으로 하여 형성된 가상세계 시뮬레이션에 시간축으로의 정보를 부여함으로써 가능하다. 시간축을 적용한다는 것은 그 시대에 맞는 정치, 경제, 문화, 사회의 제도가 적용된다는 의미이며 이에 사용자들은 시대에 적합한 행동을 함으로 가상세계인으로서 생존할 수 있고, 또한 시대 커뮤니티를 형성할 수 있다. 본 논문에서 제시한 시간축이 부여된 가상세계는 사용자의 상호소통과 참여를 유도하여 계속적인 유지 확장이 가능하며, 이에 궁극적으로는 전세계 시공간적 콘텐츠 내에서의 사용자 스토리텔링을 지원하는 것을 지향한다.

  • PDF

위키피디아 기반 개체명 사전 반자동 구축 방법 (A Semi-automatic Construction method of a Named Entity Dictionary Based on Wikipedia)

  • 송영길;정석원;김학수
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1397-1403
    • /
    • 2015
  • 개체명은 다양한 자연어처리 연구 및 서비스에 중요한 정보로 이용된다. 개체명 인식의 성능을 향상시키기 위한 여러 연구에서 개체명 사전을 이용한 자질이 개체명 인식 성능에 큰 영향을 준다는 것을 보이고 있다. 그러나 개체명 사전을 구축하는 것은 매우 시간 소모적이고, 인력 소모적인 작업이다. 이를 완화하기 위해서 본 논문에서는 개체명 사전을 반자동으로 구축하는 방법을 제안한다. 제안 시스템은 능동학습을 이용하여 위키피디아 분류정보로 구성된 가상 문서를 개체명 범주 당 하나씩 생성한다. 그리고 잘 알려진 정보검색 모델인 BM25를 이용하여 위키피디아 엔트리와 가상문서 사이의 유사도를 계산한다. 마지막으로 유사도를 바탕으로 각 위키피디아 엔트리를 개체명 범주로 분류한다. 서로 다른 3종류의 개체명 범주 집합에서 실험한 결과, 제안 시스템은 매크로 평균 F1-점수 0.9028, 마이크로 평균 F1-점수 0.9554이라는 높은 성능을 보였다.

실시간 스트리밍 서비스에서 신조어 정보 제공 시스템 (System for Neologism Information Support in Real-Time Streaming Service)

  • 이승용;김능회
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.203-207
    • /
    • 2023
  • 최근 실시간 스트리밍 서비스가 MZ 세대의 각광을 받고 있으며 시장 규모 또한 지속적으로 커지고 있다. 사전에 촬영된 영상, 편집된 동영상은 단방향적 커뮤니케이션의 모습만 보여주지만 이와 달리 양방향 통신인 실시간 스트리밍 서비스는 사용자의 질문이나 요구에 즉각적으로 대응할 수 있다는 데에 강점이 있다. 또한 COVID-19 팬데믹으로 인해 대면 문화에서 비대면 문화로 전환됨에 따라 수업, 회의, 기타 여가 활동 등을 실시간 영상으로 소통하는 이용자가 폭발적으로 증가하였다. 하지만 실시간 스트리밍 서비스가 활성화되며 다양한 세대가 참여함에 따라 신조어를 포함하여 서로 간의 언어 차이에 의한 갈등 상황이 생기는 문제점이 발생하였다. 이를 해결할 방안으로 본 논문에서는 위키피디아 API 를 활용하여 신조어의 뜻을 수집 후 출력하여 서로에게 확인시켜주는 방법을 통해 서로에게 의도를 파악하는 방법을 고안하였다.