• 제목/요약/키워드: 동시단어 분석

검색결과 188건 처리시간 0.024초

텍스트마이닝 기법을 활용한 국내외 장소성 관련 연구동향 분석 (Analyzing the Study Trends of 'Sense of Place' Using Text Mining Techniques)

  • 이인아;김혜진
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.189-209
    • /
    • 2019
  • 주경로 분석(Main Path Analysis, MPA)은 문헌의 인용정보를 기반으로 지식이 전달되는데 기여한 핵심 문헌을 추출하는 텍스트마이닝 기법 중 하나이다. 본 연구는 1990년부터 2018년까지 국내외에서 발행된 장소성 관련 논문의 인용정보와 초록을 토대로 주경로 분석과 단어동시출현빈도 연관어 네트워크 분석을 적용하여 연구동향을 파악하였다. 1990년부터 2018년까지 수집된 문헌을 5년씩 기간 구분하여 (마지막 기간은 3년) 각 기간 별로 국내외에서 장소성 관련 연구가 전반적으로 어떻게 진행되었는지 비교 분석하여 제시하였다. 주경로 분석 결과, 1990년부터 해외의 장소성 관련 연구는 개인 정체성, 공공 토지 관리, 환경 교육, 도시 개발 분야 순으로 진행되어 온 것으로 나타났다. 단어동시출현을 기반으로 한 연관어 네트워크를 통해서는 국내의 경우 도시 개발, 문화, 문학, 역사 등 다양한 차원에서 장소성이 논의되는 격변기를 겪는 것으로 해석할 수 있었다. 반면 국외에서는 건강, 정체성, 경관, 도시 개발 관련 논의가 90년대부터 꾸준히 이루어지고 있는 것으로 파악되었다. 본 연구는 장소성 연구동향을 기존의 특정 영역에 장소성 개념을 적용하여 분석하는 미시적 관점의 분석이 아닌 다양한 텍스트마이닝 기법을 적용하여 장소성을 주제로 삼고 있는 논문의 전반적인 흐름을 파악하는 통시적 접근의 방법을 제시하였다는 점에서 시사점을 지닌다.

비정형 빅데이터를 이용한 치면열구전색(치아홈메우기)에 대한 인식분석 (A Study on the Perception of Pit and Fissure Sealant using Unstructured Big Data)

  • 조한아
    • 대한치위생과학회지
    • /
    • 제6권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 연구배경: 본 연구는 치면열구전색(치아홈메우기)에 대한 전반적인 인식을 살펴봄으로써 현재 정체되어 있는 치면열구전색의 활성화를 위한 방안을 제시하고자 수행되었다. 연구방법: 치면열구전색 보장성 정책의 변화에 따른 사회적 인식을 확인하고자 5개 차수로 시기를 분류하였다. 1차시기(2009.12.1.~2010.11.30.), 2차시기(2010.12.1.~2012.9.30.), 3차시기(2012.10.1.~2013.5.5.), 4차시기(2013.5.6.~2017.9.30.), 5차시기(2017.10.1.~2022.12.31.)로 각각 설정하였다. 비정형 빅데이터 분석방법인 텍스트마이닝 분석방법을 활용하였다. 텍스톰을 사용하여 키워드를 수집 및 분석하였으며, 상위 키워드 30개의 빈도수, 의미 연결망의 구조적 특징, 중심성 분석, QAP 상관분석 및 동시출현 단어분석을 실시하였다. 연구결과: 빈도분석 결과 시기별로 상위권에 속한 키워드는 '충치', '치료', '어린이' 등이 공통적으로 나타났다. 치면열구전색의 시기별 의미연결망 구조적 특징에서 밀도지수는 모든 시기별 약 1.00으로 확인되었다. QAP 상관분석결과 1차시기와 2차시기, 4차시기와 5차시기의 상관계수가 0.834로 가장 높은 상관을 보였다. 동시출현 단어분석결과 모든 시기에 걸쳐 '충치'와 '예방'이 1위로 나타났다. 결론: 본 연구를 통해 치면열구전색은 충치예방을 위한 술식과 예방치료로써 사회적 인식이 잘 형성되었음을 알 수 있었다. 그러나 보건교육에 대한 인식은 낮았다. 정체된 치면열구전색을 활성화하기 위해서는 효과적인 교육을 강화해 나가야 하는 노력이 필요하겠다.

A Method for Compound Noun Extraction to Improve Accuracy of Keyword Analysis of Social Big Data

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.55-63
    • /
    • 2021
  • 소셜 빅데이터는 신조어나 고유명사를 포함하는 경우가 많으며, 이들을 처리하기 위해 단어별 출현 빈도수를 기반으로 한 통계적인 형태소 분석 방법이 많이 활용되고 있다. 그러나 이들 방법에서는 복합 명사를 제대로 인지하지 못해, 키워드 추출의 정확도가 떨어지는 문제점이 지적되고 있다. 본 논문에서는 소셜 빅데이터의 키워드 분석에 있어 복합 명사를 추출하기 위한 방법을 제안한다. 제안 방법은 형태소 분석 단계를 통해 얻어진 단어를 조합하여 복합 명사 후보군을 만들고, 주어진 리뷰에서 이들의 출현 빈도를 조사하여 얻어진 빈도수를 기반으로 복합 명사를 추출한다. 복합 명사 후보군을 구성하는 방법에 따라 두 가지 알고리즘을 제안하였으며, 각 알고리즘의 성능을 수식으로 표현하고 비교한다. 그리고 온라인에서 수집된 실제 데이터를 대상으로 실험을 통해 비교 결과를 검증하는 동시에, 제안 방법이 실시간 처리에도 적합함을 보여준다.

문헌정보학 분야의 지적구조 및 연구 동향 변화에 대한 시계열 분석: 2003년부터 2017년까지 (Time Series Analysis of Intellectual Structure and Research Trend Changes in the Field of Library and Information Science: 2003 to 2017)

  • 최형욱;최예진;남소연
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.89-114
    • /
    • 2018
  • 학문 분야의 연구 동향 변화에 대한 연구는 해당 분야의 세부 연구주제와 구조에 대한 파악뿐만 아니라 시간 흐름에 따른 변화 모습을 관찰할 수 있는 방법이다. 이에 본 연구에서는 국내 문헌정보학 분야의 연구 동향을 살펴보기 위하여 2003년부터 2017년까지 한국학술지인용색인(KCI)에 등재된 문헌정보학 분야 학술지 중 인용지수가 가장 높은 3종에 개제된 논문의 한국어 저자키워드를 대상으로 동시출현단어 분석을 수행하였다. 시계열 분석을 위해 15년의 연구 기간을 5년 단위로 누적하여 2003년~2007년, 2003년~2012년, 2003년~2017년으로 구분하였고, 기간별로 출현빈도 10회 이상의 저자키워드를 선정하여 분석하고 이를 시각화하였다. 분석 결과, 2003년~2007년 기간의 지적구조는 총 25개의 키워드로 구성된 8개의 영역이 확인되었으며, 2003년~2012년 기간의 지적구조에서는 총 76개의 키워드로 구성된 3영역 17 군집이 확인되었다. 또한, 2003년~2017년 기간의 지적구조는 총 132개의 키워드로 구성된 6영역 32군집으로 나타났다. 누적 기간별 종합 분석 결과, 한국의 문헌정보학 분야는 지난 15년간 기간별로 새로운 키워드가 포괄적으로 추가되었으며, 세부 주제 역시 세분화 되어 점차 세분화되고 확장되고 있음을 확인하였다.

국내 정보학분야 연구동향 분석, 2000-2011 (Detecting Research Trends in Korean Information Science Research, 2000-2011)

  • 서은경;유소영
    • 정보관리학회지
    • /
    • 제30권4호
    • /
    • pp.215-239
    • /
    • 2013
  • 21세기에 들어서서 디지털 정보환경이 발빠르게 변화함에 따라 국내 정보학 연구 역시 많은 발전과 변화를 겪고 있는 것을 산학계 모두 인지하고 있지만 실제 2000년부터 현재까지 어느 정도로 변화되었는지를 분석한 논문은 많지 않다. 이에 따라 본 연구는 2000년에서부터 2011기간동안 연구재단에 등재된 문헌정보학 관련 학회지에 수록된 정보학분야 논문 1,007편의 논문을 대상으로 정보학분야의 연구동향을 분석하였다. 먼저 시간에 따른 연구주제의 변화를 살펴보기 위하여 논문 데이터를 주제 범주화 한 후, 각 주제 범주 내에서의 논문 및 주요 키워드의 성장률을 시계열적으로 분석하였다. 그리고 단어 동시출현 네트워크를 2000-2011년뿐 아니라 2000-2005년과 2006-2011년의 두 시기로 나누어 시각화하고 분석함으로써, 한국의 정보학 분야의 연구경향의 변화를 살펴보았다. 분석 결과, 지난 12년간의 한국의 정보학 연구는 정보시스템중심적 연구에서 이를 도서관에 적용하는 도서관응용적 연구로 나아가고 있는 것을 확인하였다. 특히 지식관리, 웹기반 시스템 평가, 정보검색 분야에서 두드러지게 변화가 나타났다. 다른 연구의 결과와 비교해 볼 때, 이 연구는 정보학 연구분야의 한국 로컬화의 변화를 찾아냈다는 점에서 의의가 있다고 할 수 있다.

언어 네트워크 분석 방법을 활용한 학술논문의 내용분석 (A Content Analysis of Journal Articles Using the Language Network Analysis Methods)

  • 이수상
    • 정보관리학회지
    • /
    • 제31권4호
    • /
    • pp.49-68
    • /
    • 2014
  • 본 연구의 목적은 국내 학술논문 데이터베이스에서 검색한 언어 네트워크 분석 관련 53편의 국내 학술논문들을 대상으로 하는 내용분석을 통해, 언어 네트워크 분석 방법의 기초적인 체계를 파악하기 위한 것이다. 내용분석의 범주는 분석대상의 언어 텍스트 유형, 키워드 선정 방법, 동시출현관계의 파악 방법, 네트워크의 구성 방법, 네트워크 분석도구와 분석지표의 유형이다. 분석결과로 나타난 주요 특성은 다음과 같다. 첫째, 학술논문과 인터뷰 자료를 분석대상의 언어 텍스트로 많이 사용하고 있다. 둘째, 키워드는 주로 텍스트의 본문에서 추출한 단어의 출현빈도를 사용하여 선정하고 있다. 셋째, 키워드 간 관계의 파악은 거의 동시출현빈도를 사용하고 있다. 넷째, 언어 네트워크는 단수의 네트워크보다 복수의 네트워크를 구성하고 있다. 다섯째, 네트워크 분석을 위해 NetMiner, UCINET/NetDraw, NodeXL, Pajek 등을 사용하고 있다. 여섯째, 밀도, 중심성, 하위 네트워크 등 다양한 분석지표들을 사용하고 있다. 이러한 특성들은 언어 네트워크 분석 방법의 기초적인 체계를 구성하는 데 활용할 수 있을 것이다.

텍스트 마이닝을 활용한 저출산 정책과 대중인식 비교 (Comparative Analysis of Low Fertility Policy and the Public Perceptions using Text-Mining Methodology)

  • 배기련;문현정;이재일;박미나;박아름
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.29-42
    • /
    • 2021
  • 한국의 저출산 심화에 따라 본 연구는 정부의 저출산 대응정책과 그에 대한 대중인식을 비교하여 근본적인 차이점을 밝히고자 했다. 이를 위해 네 차례의 '저출산·고령사회 기본계획'과 제3·4차 기본계획 발표 직후 2주간의 뉴스 댓글을 분석대상으로 선정하여, 빈도분석, 동시출현단어 분석, 구조적 등위성 분석을 실시하였다. 정책문서 빈도분석결과 제1·2차 시기는 직접적인 보육지원이, 제3·4차 시기부터는 사회구조적인 접근이 눈에 띄었다. 동시출현단어 분석에서는 정책과 댓글 모두 '육아'에서 일과 가정의 양립을 지향하였다. '결혼'과 '출산'의 경우 댓글은 연속성, 정책은 단절성이 두드러지며 특히 주거와 고용문제에서 큰 차이가 있었다. 댓글의 구조적 등위성 분석 결과에서는 대중들의 자녀 양육환경에 대한 관심, 정책 실효성에 대한 문제의식을 확인할 수 있었다. 본 연구는 빅데이터를 활용해 대중들의 인식을 확인하였다는 점에서 의의를 가지므로, 이에 근거한 정책 개선 등 향후 저출산 대응이 나아가야 할 방향을 수립하는 데 도움을 줄 수 있을 것이다.

언어 네트워크 분석을 통한 현대자동차의 기업 문화마케팅 변화 연구 (Semantic Network Analysis of Trends in Hyundai Motor's Corporate Cultural Marketing)

  • 김정현;이진우
    • 예술경영연구
    • /
    • 제51호
    • /
    • pp.75-102
    • /
    • 2019
  • 본 연구는 언어 네트워크 분석 기법을 이용하여 현대자동차의 문화마케팅 유형과 변화를 분석하고 국내 문화마케팅의 발전 양상을 제시하고자 하였다. 기존 연구는 기업 문화마케팅의 개념 규정과 유형화, 문화마케팅의 영향 및 성과 등을 살펴보았지만, 시간의 흐름에 따른 기업 문화마케팅의 변화는 주목하지 않았다. 이에, 본고는 다양한 형태의 문화마케팅을 시행해온 현대자동차를 대상으로, 현대자동차의 문화마케팅이 보도된 2001년부터 2018년까지를 시간적 범주로 설정하고 국내 일간지 기사 2,315건을 분석하였다. 18년의 시간을 4개 시기로 분류하고, 시기마다 빈출단어를 추출하여 한국어 언어 분석 프로그램 텍스톰(Textom)과 언어 네트워크 분석 프로그램 유씨넷(UCINET)으로 분석하였다. 연구 결과, 현대자동차는 문화마케팅을 판매와 영업 성과를 향상하기 위한 수단으로 활용함과 동시에 기업과 브랜드 정체성을 차별화하기 위한 전략으로 발전시키고 있었다. 2000년대 초반에는 '고객', '위대한 회화의 시대: 렘브란트와 17세기 네덜란드 회화전', '공연'이 빈도수가 높은 단어로 추출되었다. 현대자동차가 공연 중심의 문화 행사를 고객 대상으로 개최하여, 특정 소비자 그룹에 혜택을 제공하는 방식으로 시작하였다. 2000년대 후반에 상위 노출된 단어는 '예술의 전당', '서울시립교향악단'으로, 인지도 높은 문화예술기관의 주요 문화 행사에 후원하였다. 2010년대 초반에는 기존고객 중심에서 잠재 고객으로 대상을 넓히고, 문화마케팅을 아우르는 브랜드와 공간('브릴리언트'와 '현대아트홀')을 선보였다. 2010년대 중후반에는 노출 빈도가 높은 '브랜드'와 '글로벌'에서 보여주듯, 문화마케팅의 초점이 고객에서 브랜드 구축으로, 국내에서 글로벌로 확장되고 있다.

효과적인 메모리 할당을 위한 정량적 분석 (A Quantitative Analysis for An Efficient Memory Allocation)

  • 홍윤식
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2395-2403
    • /
    • 1998
  • 메모리 할당은 두 개의 독립적인 목표가 있다. 즉, 메모리 개수를 최소화하는 것과 한 개의 메모리 내의 레지스터(즉 단어)수를 최소화시키는 것이다. 우리의 관심은 메모리 할당시 이들 바인딩이 일어나는 순서에 있다. 바인딩이 일어나는 순서를 변경하여 세 가지의 전혀 다른 메모리 할당 알고리즘을 만들고 이들을 분석하였다. 실험 결과 경험적 비용 함수를 도입하여 부분 작업을 동시에 실행시켰을 때 메모리 면적을 최대 20%까지 줄일 수 있음을 확인하였다.

  • PDF

의미 지향성 분석을 통한 단문 텍스트 기반 감정인지 (Emotion Recognition based on Short Text using Semantic Orientation Analysis)

  • 김현우;이승룡;정태충;윤석환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.375-377
    • /
    • 2012
  • 스마트폰과 같은 모바일 기기가 발전함에 따라 SNS, 모바일 메신저, SMS와 같은 단문 기반 메시지는 자신의 감정을 가장 잘 표현하는 매체이다. 그럼에도 불구하고 기존 연구는 주로 장문의 텍스트로부터 긍정, 부정 분류나 문서의 성향을 분석하는 것에 그치는 경우가 많다. 의미지향(Semantic Orientation)방법은 검색엔진을 통해 감정 키워드와 인지하고자 하는 단어의 동시 빈출 정도를 PMI로 계산한 것으로 WordNet과 같은 의미 사전이 존재하지 않는 한국어의 특성에서 적용 가능한 방법이다. 본 논문에서는 의미 지향성 및 다른 텍스트 기반 감정 분류 기술에 대해 비교하고 이들을 활용하여 한국어로 구성된 단문 텍스트에서 효율적인 감정 분류 기법을 제안하고자 한다.