• 제목/요약/키워드: wikipedia

검색결과 157건 처리시간 0.018초

지식검색 서비스에서의 소셜 네트워크 기반 영향력 지수 알고리즘 (An Influence Value Algorithm based on Social Network in Knowledge Retrieval Service)

  • 최창현;박건우;이상훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.43-53
    • /
    • 2009
  • 집단지성을 이용한 지식검색 서비스는 개방적 구조와 축적된 자료를 공유할 수 있다는 커뮤니티적인 특성으로 큰 인기를 얻고 있다. 하지만 방대한 지식공유 속에서 사용자가 진정으로 원하는 답변 획득은 점점 더 어려워지고 있다. 최근 알고리즘에서 가장 정교하다고 평가 받는 구글을 통해 상위에 랭크된 검색 결과들 중에는 집단지성을 통해 구축된 위키피디아, 야후 Q/A와 같은 소셜 검색엔진의 검색 결과들이 상당수 존재한다. 본 논문은 대부분의 질문은 인간으로부터 문제해결의 실마리를 얻을 수 있다는 점과 온라인상의 사용자에 대한 연구를 통해 지식검색 서비스 사용자 중 영향력 자를 찾는 것에 목적을 둔다. 이에 국내 소셜 검색엔진의 대표인 네이버 지식iN을 중심으로 지식검색내의 사용자 활동성과 신뢰성을 소셜 네트워크 기반으로 정의하고, 사용자간의 관계를 중앙성으로 분석하는 영향력 지수 알고리즘을 제안한다. 제안된 알고리즘을 통한 영향력 지수는 지식검색 서비스에서 문제 해결의 실마리를 가진 사용자를 랭킹화 함으로써 질문에 적합하고신뢰성 있는 답변을 하는 사용자를 분별하는 지표가 되며 이를 바탕으로 지식검색 서비스내의 영향력 자를 식별 가능하게 된다. 이는 지식검색 서비스사용자의 최대 목적인 사용자가필요로 하는 정보와 지식을 보다 용이하게 획득 가능케 함으로써 검색 만족도 향상에 큰 기여를 할 것이다.

딥러닝 프레임워크의 비교: 티아노, 텐서플로, CNTK를 중심으로 (Comparison of Deep Learning Frameworks: About Theano, Tensorflow, and Cognitive Toolkit)

  • 정여진;안성만;양지헌;이재준
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.1-17
    • /
    • 2017
  • 딥러닝 프레임워크의 대표적인 기능으로는 '자동미분'과 'GPU의 활용' 등을 들 수 있다. 본 논문은 파이썬의 라이브러리 형태로 사용 가능한 프레임워크 중에서 구글의 텐서플로와 마이크로소프트의 CNTK, 그리고 텐서플로의 원조라고 할 수 있는 티아노를 비교하였다. 본문에서는 자동미분의 개념과 GPU의 활용형태를 간단히 설명하고, 그 다음에 logistic regression을 실행하는 예를 통하여 각 프레임워크의 문법을 알아본 뒤에, 마지막으로 대표적인 딥러닝 응용인 CNN의 예제를 실행시켜보고 코딩의 편의성과 실행속도 등을 확인해 보았다. 그 결과, 편의성의 관점에서 보면 티아노가 가장 코딩 하기가 어렵고, CNTK와 텐서플로는 많은 부분이 비슷하게 추상화 되어 있어서 코딩이 비슷하지만 가중치와 편향을 직접 정의하느냐의 여부에서 차이를 보였다. 그리고 각 프레임워크의 실행속도에 대한 평가는 '큰 차이는 없다'는 것이다. 텐서플로는 티아노에 비하여 속도가 느리다는 평가가 있어왔는데, 본 연구의 실험에 의하면, 비록 CNN 모형에 국한되었지만, 텐서플로가 아주 조금이지만 빠른 것으로 나타났다. CNTK의 경우에도, 비록 실험환경이 달랐지만, 실험환경의 차이에 의한 속도의 차이의 편차범위 이내에 있는 것으로 판단이 되었다. 본 연구에서는 세 종류의 딥러닝 프레임워크만을 살펴보았는데, 위키피디아에 따르면 딥러닝 프레임워크의 종류는 12가지가 있으며, 각 프레임워크의 특징을 15가지 속성으로 구분하여 차이를 특정하고 있다. 그 많은 속성 중에서 사용자의 입장에서 볼 때 중요한 속성은 어떤 언어(파이썬, C++, Java, 등)로 사용가능한지, 어떤 딥러닝 모형에 대한 라이브러리가 잘 구현되어 있는지 등일 것이다. 그리고 사용자가 대규모의 딥러닝 모형을 구축한다면, 다중 GPU 혹은 다중 서버를 지원하는지의 여부도 중요할 것이다. 또한 딥러닝 모형을 처음 학습하는 경우에는 사용설명서가 많은지 예제 프로그램이 많은지 여부도 중요한 기준이 될 것이다.

가상 커뮤니티의 멤버 유동성과 지식 협업: 멤버 유동성에 대한 다각적 접근 (Membership Fluidity and Knowledge Collaboration in Virtual Communities: A Multilateral Approach to Membership Fluidity)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.19-47
    • /
    • 2015
  • 오늘날의 지식기반경제에서 핵심적인 역할을 수행하고 있는 가상 커뮤니티의 성공을 위해 턴오버(turnover)는 매우 중요한 의미를 가지고 있다. 그런데, 이에 대한 연구는 많이 부족한 실정이다. 우선, 턴오버를 측정하는 방법부터가 명확하지 않다. 가상 커뮤니티에서 새로운 구성원의 유입은 비교적 확실하게 인지할 수 있지만, 탈퇴는 명시적으로 탈퇴 처리를 하는 사람들이 드물고 재방문 가능성이 상존하기 때문에 구별하기가 쉽지 않다. 그리고, 특정기간 동안 임의의 구성원이 해당 커뮤니티를 위해 활동하고 있는 진정한 구성원인지를 판단하는 방식이 분명하지 않아 전통적인 조직의 턴오버 공식을 그대로 적용하기 힘든 면이 있다. 본 연구에서는 이러한 한계점과 가상 커뮤니티 구성원의 행위 패턴을 고려하여, 일차적으로 턴오버를 포함한 가상 커뮤니티 구성원의 유동성(fluidity) 관련 척도들을 도출하고, 이를 토대로 유동성과 가상 협업 성과의 관계를 작업의 전문적인 특성을 반영하여 분석하였다. 요컨대, 대표적인 지식 협업 커뮤니티인 영어 위키피디아의 2,978개 피쳐드 아티클(featured article)에 대한 지식 협업 행위로부터 다음과 같은 결과를 얻었다. 첫째, 협업 효율성에 대한 턴오버의 관계는 오른쪽 부분이 짧은 U자 형태를 보이며, 똑같은 턴오버율에 대해 보다 학문적인 아티클을 완성하는 것이 더 오래 걸리고, 이 차이는 턴오버율이 증가함에 따라 감소한다. 둘째, 협업효율성에 대한 재방문기간의 관계는 왼쪽 부분이 짧은 U자 형태의 관계를 가지며, 전문적이지 않은 작업일수록 재방문기간의 일단위 변화에 대한 협업 효율성의 변화가 크다. 그리고, 똑같은 재방문기간에 대해 보다 학문적인 아티클을 완성하는 것이 더 오래 걸리며, 이 차이는 재방문기간이 평균이상으로 증가함에 따라 더욱 커진다. 셋째, 협업효율성에 대한 월(month)별 유입 신규 구성원 수의 관계는 왼쪽 부분이 짧은 역 U자 관계를 가지며, 이 관계에 대한 작업 특성의 영향은 유의하지 않은 것으로 보인다.

가상현실(Virtual Reality) 광고가 소비자 구매의도에 미치는 영향: 이성적인 반응과 감성적인 반응의 통합 (The Effects of Virtual Reality Advertisement on Consumer's Intention to Purchase: Focused on Rational and Emotional Responses)

  • 차재열;임건신
    • Asia pacific journal of information systems
    • /
    • 제19권4호
    • /
    • pp.101-124
    • /
    • 2009
  • According to Wikipedia, virtual reality (VR) is defined as a technology that allows a user to interact with a computer-simulated environment. Due to a rapid growth in information technology (IT), the cost of virtual reality has been decreasing while the utility of virtual reality advertisements has dramatically increased. Nevertheless, only a few studies have investigated the effects of virtual reality advertisement on consumer behaviors. Therefore, the objective of this study is to empirically examine the effects of virtual reality advertisement. Compared to traditional online advertisements, virtual reality advertisement enables consumers to experience products realistically over the Internet by providing high media richness, interactivity, and telepresence (Suh and Lee, 2005). Advertisements with high media richness facilitate consumers' understanding of advertised products by providing them with a large amount and a high variety of information on the products. Interactivity also provides consumers with a high level of control over the computer-simulated environment in terms of their abilities to adjust the information according to their individual interests and concerns and to be active rather than passive in their engagement with the information (Pimentel and Teixera, 1994). Through high media richness and interactivity, virtual reality advertisements can generate compelling feelings of "telepresence" (Suh and Lee, 2005). Telepresence is a sense of being there in an environment by means of a communication medium (Steuer, 1992). Virtual reality advertisements enable consumers to create a perceptual illusion of being present and highly engaged in a simulated environment, while they are in reality physically present in another place (Biocca, 1997). Based on the characteristics of virtual reality advertisements, a research model has been proposed to explain consumer responses to the virtual reality advertisements. The proposed model includes two dimensions of consumer responses. One dimension is consumers' rational response, which is based on the Information Processing Theory. Based on the Information Processing Theory, product knowledge and perceived risk are selected as antecedents of intention to purchase. The other dimension is emotional response of consumers, which is based on the Attitude-Structure Theory. Based on the Attitude-Structure Theory, arousal, flow, and positive affect are selected as antecedents of intention to purchase. Because it has been criticized to have investigated only one of the two dimensions of consumer response in prior studies, our research model has been built so as to incorporate both dimensions. Based on the Attitude-Structure Theory, we hypothesized the path of consumers' emotional responses to a virtual reality advertisement: (H1) Arousal by the virtual reality advertisement increases flow; (H2) Flow increases positive affect; and (H3) Positive affect increases intension to purchase. In addition, we hypothesized the path of consumers' rational responses to the virtual reality advertisement based on the Information Processing Theory: (H4) Increased product knowledge through the virtual reality advertisement decreases perceived risk; and (H5) Perceived risk decreases intension to purchase. Based on literature of flow, we additionally hypothesized the relationship between flow and product knowledge: (H6) Flow increases product knowledge. To test the hypotheses, we conducted a free simulation experiment [Fromkin and Streufert, 1976] with 300 people. Subjects were asked to use the virtual reality advertisement of a cellular phone on the Internet and then answer questions about the variables. To check whether subjects fully experienced the virtual reality advertisement, they were asked to answer a quiz about the virtual reality advertisement itself. Responses of 26 subjects were dropped because of their incomplete answers. Responses of 274 subjects were used to test the hypotheses. It was found that all of six hypotheses are accepted. In addition, we found that consumers' emotional response has stronger impact on their intention to purchase than their rational response does. This study sheds much light into practical implications for both IS researchers and managers. First of all, while most of previous research has analyzed only one of the customers' rational and emotional responses, we theoretically incorporated and empirically examined both of the two sides. Second, we empirically showed that mediators such as arousal, flow, positive affect, product knowledge, and perceived risk play an important role between virtual reality advertisement and customer's intention to purchase. In addition, the findings of this study can provide a basis of practical strategies for managers. It was found that consumers' emotional response is stronger than their rational response. This result indicates that advertisements using virtual reality should focus on the emotional side, and that virtual reality can be served as an appropriate advertisement tool for fancy products that require their online advertisements to give an impetus to customers' emotion. Finally, even if this study examined the effects of virtual reality advertisement of cellular phone, its findings could be applied to other products that are suited for virtual experience. However, this research has some limitations. We were unable to control different kinds of consumers and different attributes of products on consumers' intention to purchase. It is, therefore, deemed important for future research to control the consumer and product types for more reliable results. In addition to the consumer and product attributes, other variables could affect consumers' intention to purchase. Thus, the future research needs to find ways t control other variables.

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.