• 제목/요약/키워드: 동시출현단어 분석

검색결과 115건 처리시간 0.023초

독자 추천도서 정보를 이용한 작가 이미지 분석 연구 (Analysis of Author Image Based on Book Recommendation from Readers)

  • 최상희
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.153-171
    • /
    • 2017
  • 여가를 위해 독서를 하는 독자는 특정 작가를 선호하는 경우가 많은데 독서분야를 확장할 때에도 자신이 선호하는 작가와 연관된 작가나 장르로 독서분야를 확장하는 성향이 있다. 이 연구에서는 중심작가로 에드거 앨런 포를 선정한 후 독자들이 에드거 앨런 포와 연관하여 다른 독자에게 추천하는 작가와 작품정보를 기반으로 작가 이미지를 분석하였다. 에드거 앨런 포와 동시출현한 작가와 작품의 빈도수를 분석하고 추천작가간, 작품간 관계를 네트워크 기법으로 분석하였다. 분석결과 에드거 앨런 포의 장르적 이미지와 연관된 작가군, 작가들 간의 관계, 연관 도서가 파악되었다, 이 연구에서 제시한 특정 작가의 이미지, 연관 작가 및 작품 정보를 도출하는 방안은 특정 작가를 중심으로 도서관 독서 프로그램이나 문화 프로그램, 북 큐레이션을 하게 될 경우 활용할 수 있는 도구가 될 것이다.

텍스트마이닝 기법을 이용한 한국 사회의 혐오 양상 분석 (Analyzing the Phenomena of Hate in Korea by Text Mining Techniques)

  • 김혜진
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.431-453
    • /
    • 2022
  • 혐오는 타인에 대한 배타성이 집단적으로 표출된 것으로, 잘못된 대중적 인식을 통하여 양산되고 재생산된다. 이 연구는 우리사회에서 언급되고 있는 '혐오' 양상을 거시적으로 탐색하고자 1990년부터 2020년까지 발행된 뉴스데이터 17,867건을 대상으로 텍스트마이닝 기법을 활용하여 키워드 네트워크와 군집 분석을 수행하였다. 그리고 단어를 추출하기 전에 먼저 기사를 문장으로 분리하는 전처리 과정을 거쳐 '혐오', '편견', '차별'이라는 단어를 포함하고 있는 문장 총 52,520개를 추출하여 분석에 활용함으로써 '혐오'라는 단어와 인접한 단어들로 구성된 키워드 네트워크를 구축하였다. 수집한 뉴스데이터의 단어 동시출현빈도 분석 결과, 우리 사회에서 혐오와 관련되어 가장 빈번하게 등장하는 대상은 여성, 인종, 성소수자 등이며, 관련된 이슈는 이들 집단과 관련된 법과 범죄 등이었다. 키워드 네트워크 군집 분석 결과, 성별(41.4%), 소수자(28.7%), 인종·민족(15.1%), 선택적·이해관계적(8.5%), 정치·이념(5.7%), 환경·생존적(0.3%) 혐오 등 총 6개의 혐오 군집들이 발견되었다. 논의에서는 군집 분석 결과 구체적으로 드러나지 않은 혐오의 표적(대상)을 모두 추출하여 분석하였다.

소셜미디어를 통한 우울 경향 이용자 담론 주제 분석 (An Analysis of the Discourse Topics of Users who Exhibit Symptoms of Depression on Social Media)

  • 서하림;송민
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.207-226
    • /
    • 2019
  • 우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 '우울' 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.

동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가 (User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence)

  • 이현우;한요섭;김래현;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF

네트워크 분석을 기반으로 한 웹 아카이빙 주제영역 연구 (A Study on Web Archiving Subject Analysis Based on Network Analysis)

  • 김희정
    • 한국비블리아학회지
    • /
    • 제22권2호
    • /
    • pp.235-248
    • /
    • 2011
  • 본 연구에서는 Web of Science DB를 대상으로 주제어(topic)가 web archiving에 해당하는 288건의 논문을 대상으로 동시출현단어 네트워크 분석을 수행하였다. 분석 결과 웹 아카이빙 주제 영역에서는 의학영역 정보기술 및 시스템과 관련된 이미지 아카이빙 관련연구들이 가장 중점적으로 수행되어 왔다. 문헌정보학 및 기록관리학 영역에서의 웹 아카이빙 연구는 크게 웹 아카이빙 및 디지털 보존 프로젝트 주제와 웹 아카이빙툴과 방법론 주제를 중심으로 수행되어왔으며, 향후 웹 아카이빙 소프트웨어 및 툴 관련 연구가 활성화될 수 있을 것으로 예측된다.

동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가 (User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence)

  • 이현우;한요섭;김래현;차정원
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.459-476
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF

국가 정책지식의 구조와 특성에 관한 연구 (A Study on the Structures and Characteristics of National Policy Knowledge)

  • 이지수;정영미
    • 정보관리연구
    • /
    • 제41권2호
    • /
    • pp.1-30
    • /
    • 2010
  • 이 연구에서는 경제인문사회연구회 산하 19개 정부출연 연구기관이 2003년부터 2007년까지 5년동안 생산한 정책지식은 사회와 경제 분야의 10개 정책에 집중되고 있음을 확인하고, 연구기관들의 연구과제 유사성을 다차원축척법을 사용하여 표현하였다. 이 중 5대 정책에 대해 이슈의 생존주기 유형을 파악하고 정책지식의 생산량 추이와 비교함으로써 언론관심도와 정책지식의 생산 상관관계를 살펴보았다. 또한 정책지식의 문헌에서 추출한 핵심어를 동시출현단어 분석을 통해 각 정책을 구성하는 하위 주제를 파악하였으며, 정책지식 생산기관의�汰恝諛喚� 분석 결과,�泰逞╂岵막� 유사성을 갖는 기관들은 인용관계에서 있어서도 상호 선호하는 경향을 나타냄을 확인하였다.

한국 사회의 불평등 관련 연구 동향 분석안 (Analysis of Research Trends in Inequality of Korean Society)

  • 김용환
    • 한국문헌정보학회지
    • /
    • 제55권2호
    • /
    • pp.263-287
    • /
    • 2021
  • 한국사회의 불평등과 관련된 연구는 다양한 영역에서 산발적으로 진행되어 왔다. 이 연구에서는 불평등 관련 연구 동향을 한국학술지인용색인을 통해 수집한 논문 데이터를 활용하여 기초 통계 분석, 단어 동시 출현 분석, 주 경로 분석을 통해 통합적으로 분석하였다. 기초 통계 분석을 통해 핵심저자, 저널, 논문을 파악할 수 있었다. 동시출현 분석을 통해 소득불평등, 교육불평등, 복지불평등, 불평등 정책이 핵심 주제로 확인되었다. 주 경로 분석을 통해 2004년 이후의 불평등 연구 흐름은 두 가지로 나타났다. 하나는 경제적 불평등에 관한 연구이고, 다른 하나는 건강 불평등 및 사회 구조적 불평등과 관련된 연구로 나타났다.

동시출현 핵심단어 분석을 활용한 암반발파 분야의 연구 동향 분석 (Analysis of Research Trends in the Rock Blasting Field Using Co-Occurrence Keyword Analysis)

  • 김민주;권상기
    • 화약ㆍ발파
    • /
    • 제40권1호
    • /
    • pp.1-16
    • /
    • 2022
  • 효과적이며 안전한 발파 기술을 개발하거나 국내에 도입하기 위해서는 세계 각국에서의 발파 분야 연구 동향을 파악하는 것이 필요하다. 국내외 발파 관련 연구 동향 분석은 일부 연구 논문들을 대상으로 제한적인 범위에서 수행되는 것이 일반적이다. 본 논문에서는 국제학술지에 게제된 전체 논문들을 대상으로 VOSviewer를 이용한 계량서지분석을 실시하여 발파 분야의 연구 동향 변화를 파악하고자 하였다. 시기별 핵심단어 분석 결과, 2000년대는 대체적으로 게재 논문의 수가 적고 전체적인 핵심단어 수도 적었지만, 2010년 이후 게재 논문 개수의 급격한 증가와 핵심단어의 다양화, 특히 인공지능과 관련된 핵심단어들이 등장하였다. 2017~2021년의 핵심단어 분석 결과, 다양한 하이브리드 인공지능 기법들이 발파 영향 평가에 활발하게 활용되고 있음을 알 수 있었다.

조현병과 정신분열병에 대한 뉴스 프레임 분석을 통해 본 사회적 인식의 변화 (Text Mining Driven Content Analysis of Social Perception on Schizophrenia Before and After the Revision of the Terminology)

  • 김현지;박서정;송채민;송민
    • 한국문헌정보학회지
    • /
    • 제53권4호
    • /
    • pp.285-307
    • /
    • 2019
  • 질환자에 대한 사회적 낙인을 제거하기 위해 2011년, 대한의사협회는 정신분열병을 '조현병'으로 개정하였다. 병명을 변경한 지 약 9년이 지났지만 실제로 사회적 인식이 어느 정도 변화하였는지 정량적으로 분석한 연구는 아직 없다. 이에 본 연구에서는 병명 개정에 따른 조현병에 대한 사회적 인식 변화를 확인하고자 네이버 뉴스 기사를 수집 분석하였다. 텍스트 분석에는 LDA 토픽 모델링, TF-IDF, 동시출현 단어, 감성분석 기법을 사용하였다. 분석 결과, 병명 개정 전보다 후에, 그리고 병명 개정 후 병용되는 정신분열병과 조현병 중 조현병에 대한 사회적 인식이 더 부정적인 것으로 나타났다. 즉, 병명 개정이 낙인을 해소하지 못했음을 알 수 있었다.