• 제목/요약/키워드: web data mining

검색결과 411건 처리시간 0.027초

HONCODE를 근거로 한 갑상선암에 대한 의료정보 제공사이트의 질 평가 (Evaluation of Thyroid Cancer Medical Information Sites using HONCODE)

  • 허준;정용규;신성철;김장일
    • 서비스연구
    • /
    • 제3권2호
    • /
    • pp.45-52
    • /
    • 2013
  • 정보통신기술의 발달과 함께, 인터넷의 사회 경제적 영향력 및 중요성이 급증하고 있으며, 이는 보건의료 분야에서도 다르지 않다. 인터넷상에서 건강정보가 증가하고, 이를 찾고 사용하는 사람들이 증가함에 따라 인터넷에서 제공되는 건강정보는 보건의료전문가, 정보전문가, 건강정보 소비자들의 관심 주제가 되고 있으며, 인터넷에서 제공되는 건강정보의 질 관리 및 올바른 활용을 위하여 건강정보의 질을 보장하거나 판단 시 필요한 기준, 제공시 필요한 기준들이 계속적으로 제시되고 있다. 본 논문은 HON(Health On the Net) Foundation에서 제정하고 있는 HONCODE를 이용하여 현재 국내 인터넷에 정보화 되어 있는 갑상선암에 대한 의료정보를 평가한다. 이를 통하여 갑상선암에 대한 의료정보 제공의 질 제고에 기어코자 한다.

  • PDF

Statistical Profiles of Users' Interactions with Videos in Large Repositories: Mining of Khan Academy Repository

  • Yassine, Sahar;Kadry, Seifedine;Sicilia, Miguel Angel
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.2101-2121
    • /
    • 2020
  • The rapid growth of instructional videos repositories and their widespread use as a tool to support education have raised the need of studies to assess the quality of those educational resources and their impact on the quality of learning process that depends on them. Khan Academy (KA) repository is one of the prominent educational videos' repositories. It is famous and widely used by different types of learners, students and teachers. To better understand its characteristics and the impact of such repositories on education, we gathered a huge amount of KA data using its API and different web scraping techniques, then we analyzed them. This paper reports the first quantitative and descriptive analysis of Khan Academy repository (KA repository) of open video lessons. First, we described the structure of repository. Then, we demonstrated some analyses highlighting content-based growth and evolution. Those descriptive analyses spotted the main important findings in KA repository. Finally, we focused on users' interactions with video lessons. Those interactions consisted of questions and answers posted on videos. We developed interaction profiles for those videos based on the number of users' interactions. We conducted regression analysis and statistical tests to mine the relation between those profiles and some quality related proposed metrics. The results of analysis showed that all interaction profiles are highly affected by video length and reuse rate in different subjects. We believe that our study demonstrated in this paper provides valuable information in understanding the logic and the learning mechanism inside learning repositories, which can have major impacts on the education field in general, and particularly on the informal learning process and the instructional design process. This study can be considered as one of the first quantitative studies to shed the light on Khan Academy as an open educational resources (OER) repository. The results presented in this paper are crucial in understanding KA videos repository, its characteristics and its impact on education.

온라인 쇼핑몰의 상품평 자동분류를 위한 감성분석 알고리즘 (A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall)

  • 장재영
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.19-33
    • /
    • 2009
  • 급속한 전자상거래의 발전으로 인하여 온라인상으로 상품을 구매하고 그에 대한 평가를 작성하는 것이 일반적인 구매 패턴이 되었다. 기존 구매자들의 상품평들은 다른 잠재적인 소비자들의 상품 구입을 이끌어내는데 큰 동기가 된다. 사용자가 작성한 상품평은 하나의 상품에 대해 실제 사용자의 좋고 나쁨에 대한 감정을 표현한 결과로, 개개인에 따라 긍정 또는 부정적인 의견으로 나눠진다. 상품평 중에서 소비자가 원하는 정보를 얻기 위해서는 이들을 일일이 수작업으로 확인해야하지만, 온라인 쇼핑몰에 상품평이 대용량으로 축적된 환경에서 이러한 작업은 비효율적일 수밖에 없다. 본 논문에서는 오피니언 마이닝 기술을 이용하여 제품 사용자의 주관적 의견을 자동으로 분류할 수 있는 감성분석 알고리즘을 제시한다. 본 논문에서 제시하는 알고리즘은 온라인 쇼핑몰에 등록된 개별 상품평을 대상으로 긍정 및 부정 의견으로 판단하여 요약된 결과를 제공하는 기능을 한다. 본 논문에서는 또한 제안된 알고리즘을 바탕으로 개발된 상품평 자동분석 시스템을 소개하고, 알고리즘의 효율성을 검증하기 위한 실험결과도 제시한다.

  • PDF

디자인개발을 위한 eCRM솔루션구현 (The Implementation of eCRM Solution for Design Development)

  • 홍정표;양종열;이유리;오민권
    • 디자인학연구
    • /
    • 제15권3호
    • /
    • pp.271-280
    • /
    • 2002
  • 최근 정보기술과 인터넷은 눈부신 발전을 해오고 있다. 이렇게 변화하는 환경 속에서 기존의 오프라인 관점에 근거한 전략이나 마케팅은 더 이상 기업경쟁력 향상의 역할을 수행하기가 어렵게 되어가고 있으며, 기업과 고객 사이에서의 디지털 네트워킹으로 인한 고객들에 대한 정보관리 및 마케팅실행방법 등에 있어서 많은 변화를 가져오고 있다. 이러한 발전과 변화는 디자인 연구 방법론 에 있어서도 많은 변화를 유도하고 있다. 따라서 디자인적인 측면과 사회·환경적인 측면을 고려하여 본 연구는 Bloch(1995)가 주장한 제품디자인에 대한 소비자반응 프레임웍 즉, 선호정도-디자인이미지형용사-디자인요소들간의 명확한 인과관계모형을 구축한 후, IT기반 인터렉션부분인 eCRM을 결합하여 디자인 개발에 적용할 수 있는 실시간 디자인 정보 추출 솔루션을 구축하였다. 이를 통해 소비자들이 어떤 이미지를 제공하는 제품디자인을 선호하며 선호하는 제품디자인이 제공하는 이미지는 어떤 디자인요소들로 구성되는지에 대한 인과관계를 규명하여 디자이너들이 좀더 객관적이고 신뢰 할 수 있는 디자인요소들을 선택하여 디자인할 수 있는 지침을 온라인 상에서 실시간에 제공받을 수 있다.

  • PDF

Perceptions of Residents in Relation to Smartphone Applications to Promote Understanding of Radiation Exposure after the Fukushima Accident: A Cross-Sectional Study within and outside Fukushima Prefecture

  • Kuroda, Yujiro;Goto, Jun;Yoshida, Hiroko;Takahashi, Takeshi
    • Journal of Radiation Protection and Research
    • /
    • 제47권2호
    • /
    • pp.67-76
    • /
    • 2022
  • Background: We conducted a cross-sectional study of residents within and outside Fukushima Prefecture to clarify their perceptions of the need for smartphone applications (apps) for explaining exposure doses. The results will lead to more effective methods for identifying target groups for future app development by researchers and municipalities, which will promote residents' understanding of radiological situations. Materials and Methods: In November 2019, 400 people in Fukushima Prefecture and 400 people outside were surveyed via a web-based questionnaire. In addition to basic characteristics, survey items included concerns about radiation levels and intention to use a smartphone app to keep track of exposure. The analysis was conducted by stratifying responses in each region and then cross-tabulating responses to concerns about radiation levels and intention to use an app by demographic variables. The intention to use an app was analyzed by binomial logistic regression analysis. Text-mining analyses were conducted in KH Coder software. Results and Discussion: Outside Fukushima Prefecture, concerns about the medical exposure of women to radiation exceeded 30%. Within the prefecture, the medical exposure of women, purchasing food products, and consumption of own-grown food were the main concerns. Within the prefecture, having children under the age of 18, the experience of measurement, and having experience of evacuation were significantly related to the intention to use an app. Conclusion: Regional and individual differences were evident. Since respondents differ, it is necessary to develop and promote app use in accordance with their needs and with phases of reconstruction. We expect that a suitable app will not only collect data but also connect local service providers and residents, while protecting personal information.

중고거래 어플리케이션 <당근마켓> 리뷰텍스트에 나타난 소비자의 인성 함축단어 텍스트마이닝 분석 (Analysis of Text Mining of Consumer's Personality Implication Words in Review of Used Transaction Application )

  • 정예린;주영애
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 중고거래 어플리케이션 <당근마켓>의 리뷰텍스트에 나타난 소비자의 인성 함축단어의 사용실태를 분석하였다. 데이터 수집은 2021년 5월로부터 과거 6개월간 서울과 경기권을 대상으로 하였다. 이는 웹 크롤러를 개발하여 무작위 추출 총 1368건을 수집 후, 최종 570건을 전처리하여 사용하였다. 결과는 다음과 같다. 첫째, 제품의 상거래 플랫폼임에도 리뷰텍스트의 48.2%는 소비자의 인성 관련 내용이었다. 둘째, 리뷰 텍스트는 긍정적 반응이 주를 이루며 이는 감사라는 키워드를 기반으로 텍스트 네트워크 구조를 형성하였다. 셋째, 소비자 인성을 함축하는 리뷰 텍스트는 소비자의 '대타적 인성'과' 대내적 인성'으로 그룹화되었고, 이는 플랫폼에서 통합적으로 작용하였다. 결론적으로 인성 관련 요인들이 플랫폼 거래 과정의 상호작용에서 중요한 역할을 함을 확인하였고, 앞으로 플랫폼의 서비스 품질에도 소비자의 인성이 경쟁력으로 작용할 것이므로, 이에 대해 다각도에서 연구되어야 할 것임을 제언하였다.

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

MapReduce 환경에서 재그룹핑을 이용한 Locality Sensitive Hashing 기반의 K-Nearest Neighbor 그래프 생성 알고리즘의 개선 (An Improvement in K-NN Graph Construction using re-grouping with Locality Sensitive Hashing on MapReduce)

  • 이인희;오혜성;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.681-688
    • /
    • 2015
  • k-Nearest Neighbor(k-NN)그래프는 모든 노드에 대한 k-NN 정보를 나타내는 데이터 구조로써, 협업 필터링, 유사도 탐색과 여러 정보검색 및 추천 시스템에서 k-NN그래프를 활용하고 있다. 이러한 장점에도 불구하고 brute-force방법의 k-NN그래프 생성 방법은 $O(n^2)$의 시간복잡도를 갖기 때문에 빅데이터 셋에 대해서는 처리가 곤란하다. 따라서, 고차원, 희소 데이터에 효율적인 Locality Sensitive Hashing 기법을 (key, value)기반의 분산환경인 MapReduce환경에서 사용하여 k-NN그래프를 생성하는 알고리즘이 연구되고 있다. Locality Sensitive Hashing 기법을 사용하여 사용자를 이웃후보 그룹으로 만들고 후보내의 쌍에 대해서만 brute-force하게 유사도를 계산하는 two-stage 방법을 MapReduce환경에서 사용하였다. 특히, 그래프 생성과정 중 유사도 계산하는 부분이 가장 많은 시간이 소요되므로 후보 그룹을 어떻게 만드는 것인지가 중요하다. 기존의 방법은 사이즈가 큰 후보그룹을 방지하는데 한계점이 있다. 본 논문에서는 효율적인 k-NN 그래프 생성을 위하여 사이즈가 큰 후보그룹을 재구성하는 알고리즘을 제시하였다. 실험을 통해 본 논문에서 제안한 알고리즘이 그래프의 정확성, Scan Rate측면에서 좋은 성능을 보임을 확인하였다.

카테고리 연관 규칙 마이닝을 활용한 추천 정확도 향상 기법 (A Study on the Improvement of Recommendation Accuracy by Using Category Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.27-42
    • /
    • 2020
  • 인터넷이라는 가상 공간을 활용함으로써 물리적 공간의 제약을 갖는 오프라인 쇼핑의 한계를 넘어선 온라인 쇼핑은 다양한 기호를 가진 소비자를 만족시킬 수 있는 수많은 상품을 진열할 수 있게 되었다. 그러나, 이는 역설적으로 소비자가 구매의사결정 과정에서 너무 많은 대안을 비교 평가해야 하는 어려움을 겪게 함으로써 오히려 상품 선택을 방해하는 원인이 되기도 한다. 이런 부작용을 해소하기 위한 노력으로서, 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 구매의사결정 과정 중 정보탐색 및 대안평가에 소요되는 시간과 노력을 줄여주고 이탈을 방지하며 판매자의 매출 증대에 기여할 수 있다. 연관 상품 추천에 사용되는 연관 규칙 마이닝 기법은 통계적 방법을 통해 주문과 같은 거래 데이터로부터 서로 연관성 높은 상품을 효과적으로 발견할 수 있다. 하지만, 이 기법은 거래 건수를 기반으로 하므로, 잠재적으로 판매 가능성이 높을지라도 충분한 거래 건수가 확보되지 못한 상품은 추천 목록에서 누락될 수 있다. 이렇게 추천 시 제외된 상품은 소비자에게 구매될 수 있는 충분한 기회를 확보하지 못할 수 있으며, 또 다시 다른 상품에 비해 상대적으로 낮은 추천 기회를 얻는 악순환을 겪을 수도 있다. 본 연구는 구매의사결정이 결국 상품이 지닌 속성에 대한 사용자의 평가를 기반으로 한다는 점에 착안하여, 추천 시 상품의 속성을 반영하면 소비자가 특정 상품을 선택할 확률을 좀더 정확하게 예측할 수 있다는 점을 추천 시스템에 반영하기 위한 목적으로 수행되었다. 즉, 어떤 상품 페이지를 방문한 소비자는 그 상품이 지닌 속성들에 어느 정도 관심을 보인 것이며 추천 시스템은 이런 속성들을 기반으로 연관성을 지닌 상품을 더 정교하게 찾을 수 있다는 것이다. 상품의 주요 속성의 하나로서, 카테고리는 두 상품 간에 아직 드러나지 않은 잠재적인 연관성을 찾기에 적합한 대상이 될 수 있다고 판단하였다. 본 연구는 연관 상품 추천에 상품 간의 연관성뿐만 아니라 카테고리 간의 연관성을 추가로 반영함으로써 추천의 정확도를 높일 수 있는 예측모형을 개발하였고, 온라인 쇼핑몰로부터 수집된 주문 데이터를 활용하여 이루어진 실험은 기존 모형에 비해 추천 성능이 개선됨을 보였다. 실무적인 관점에서 볼 때, 본 연구는 소비자의 구매 만족도를 향상시키고 판매자의 매출을 증가시키는 데에 기여할 수 있을 것으로 기대된다.

감성분석을 이용한 온라인 체험 내 비정형데이터의 주관도가 고객만족에 미치는 영향 분석 (Sentiment Analyses of the Impacts of Online Experience Subjectivity on Customer Satisfaction)

  • 서예은;이상용
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.233-255
    • /
    • 2023
  • 코로나19로 인한 팬데믹 상황에서도 여전히 여행에 대한 욕구와 수요가 시장에 존재하고 있다. 이러한 상황에서 정보기술(IT)의 발달로 인해 온라인에 대한 접근성과 유용성 및 디지털 기기의 활용도 함께 증가하였고, 비대면으로도 새로운 경험을 얻을 수 있는 '온라인 체험(Online Experience)' 시장이 급격하게 성장하였다. 본 연구는 AirBnB 온라인 체험 서비스에서 서비스제공자(Provider-oriented)와 서비스이용자(User-oriented)에 의해 생성된 정형 및 비정형 데이터가 고객만족에 미치는 영향에 대해 분석하였다. 분석에 사용된 데이터는 파이썬 웹크롤러로 수집되었으며, 주요 변수인 비정형 데이터는 전처리와 감성분석을 거쳐 회귀분석에 사용되었다. 분석 결과, 주요변수인 호스트가 생성한 체험 소개글, 호스트 소개글과 같은 비정형 데이터는 텍스트의 생성 목적에 따라 주관도(Subjectivity)가 다르게 나타나며, 체험 소개글은 주관적일수록, 호스트 소개글은 객관적일수록 고객 만족에 유의한 정의 영향을 미치는 것을 확인하였다. 또한, 에어비앤비 온라인 체험에 참여한 게스트가 생성한 정형 데이터는 다른 게스트의 만족에 긍정적인 영향을 미치는 것을 확인하였다. 본 연구 결과는 온라인 공유경제 플랫폼 이해관계자 및 온라인 체험 지식경영에 관심을 갖는 연구자에게 다양한 시사점을 제공할 것으로 기대한다.