• 제목/요약/키워드: bigram network analysis

검색결과 5건 처리시간 0.019초

A Survey of Machine Translation and Parts of Speech Tagging for Indian Languages

  • Khedkar, Vijayshri;Shah, Pritesh
    • International Journal of Computer Science & Network Security
    • /
    • 제22권4호
    • /
    • pp.245-253
    • /
    • 2022
  • Commenced in 1954 by IBM, machine translation has expanded immensely, particularly in this period. Machine translation can be broken into seven main steps namely- token generation, analyzing morphology, lexeme, tagging Part of Speech, chunking, parsing, and disambiguation in words. Morphological analysis plays a major role when translating Indian languages to develop accurate parts of speech taggers and word sense. The paper presents various machine translation methods used by different researchers for Indian languages along with their performance and drawbacks. Further, the paper concentrates on parts of speech (POS) tagging in Marathi dialect using various methods such as rule-based tagging, unigram, bigram, and more. After careful study, it is concluded that for machine translation, parts of speech tagging is a major step. Also, for the Marathi language, the Hidden Markov Model gives the best results for parts of speech tagging with an accuracy of 93% which can be further improved according to the dataset.

네트워크 분석을 통한 국내 '스마트 팜' 특허 동향 연구 (A Study on the Patent Trend of 'Smart Farm' in Domestic through Network Analysis)

  • 민경빈;박홍진
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.413-422
    • /
    • 2022
  • 농업의 고질적인 인력 부족과 고령화 문제를 해결하는 방안 중 스마트 팜은 크게 주목받고 있다. 6차 산업혁명이라고 불리는 스마트 팜 산업은 경쟁력의 강화가 필요하다. 혁신 가능한 IT 기술을 농업에 접목하기 위해 선행적인 연구나 특허에 대한 정보 수집 및 분석은 중요하다. 본 논문은 국내 특허정보검색서비스(KIPRIS)를 이용하여 스마트 팜에 관련된 5,789건의 특허데이터를 통해 스마트 팜 특허 동향을 살펴본다. 키워드 네트워크, 에고 네트워크, 동시 출현 네트워크, 바이그램 네트워크 분석 등을 통해 스마트 팜 정보의 국내 특허 동향을 알아본다. 스마트 팜 특허 관련 네트워크 분석 결과, 스마트 팜 시스템을 이용하거나 시스템 제어 기술과 관련된 특허가 가장 많았다. 본 논문은 향후 스마트 팜 관련 특허 연구 방향 설정에 있어 도움을 제공할 수 있다.

토픽 모델링 및 바이그램 네트워크 분석 기법을 통한 여대생의 건강관리 및 웨어러블 디바이스 인식에 관한 연구 (Analyzing Female College Student's Recognition of Health Monitoring and Wearable Device Using Topic Modeling and Bi-gram Network Analysis)

  • 정우경;신동희
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.129-152
    • /
    • 2021
  • 본 연구는 토픽 모델링 및 네트워크 분석 기법을 활용하여 여대생들의 웨어러블 디바이스에 대한 인식 및 선호도 분석, 건강관리에 대한 요구를 분석함으로써 여대생에게 맞는 웨어러블 디바이스 개발 방안을 제시하였다. 이를 위하여 S여자대학교 재학생들이 사용하는 커뮤니티에서 건강관리 및 웨어러블 디바이스와 관련된 게시글 2,457건을 수집하였고. 수집된 게시글과 댓글 데이터를 전처리한 뒤 LDA 기반의 토픽 모델링을 실시하였다. 토픽 모델링 기법을 통해 건강관리 및 웨어러블 디바이스와 관련하여 여대생들의 주요 쟁점들을 도출하고, 관련 키워드가 포함된 포스팅에 대해 바이그램 분석과 네트워크 분석을 수행하여 여대생들이 웨어러블 기기에 대해 가지고 있는 견해를 파악하고자 한다.

텍스트마이닝기법을 활용한 남녀 학생의 인구문제에 관한 인식 분석: 인구교육의 시사점 도출을 위하여 (A Study on the Recognition of Population Problems of Male and Female Students using Text-mining: To Drive the Implications of Population Education)

  • 왕석순;심준영
    • 한국가정과교육학회지
    • /
    • 제31권3호
    • /
    • pp.73-90
    • /
    • 2019
  • 이 연구는 인구 문제에 대한 남녀 학생들의 인식의 차이를 규명하여 인구교육의 시사점을 도출하기 위한 것을 목적으로 하였다. 이를 위해 J 대학교의 인구교육 강좌인 「인구와 사회」수업을 수강한 학생이 개인별로 최종 제출한 보고서를 분석 자료로 활용하였다. 분석 자료는 텍스트 마이닝 기법을 활용하여 성별에 따라 인구 문제에 대한 인식에 차이가 있는 가를 분석하였다. 우선, 출현 빈도가 높은 단어를 중심으로 성별에 따른 차이를 확인하고, 핵심단어를 추출하여 의미연결망 분석을 하고 시각화를 실시하였다. 분석 결과는 다음과 같다. 첫째, 상위 출현 빈도 단어 100개를 기준으로 살펴본 결과, 10위까지의 단어는 '인구', '교육', '문제', '결혼', '사회', '출산', '심각', '사람', '우리' 등으로 남녀가 동일하였다. 또 출현 빈도, 연관분석에 따라 핵심단어를 추출한 후, 의미 연결망을 시각화한 결과, 출현 빈도를 기준으로 한 경우, 의미 연결망 중앙에 위치하는 단어에 남녀 차이가 없었다. 둘째, 연관분석에 따라 추출된 핵심 단어와 바이그램 단위로 추출한 핵심 단어는 성별에 따라 큰 차이를 보였다. 즉, 여학생의 단어의 의미 연결망에서 '생활'-'결혼'-'출산'-'임신'의 연결망이 독립적으로 나타나서, 인구 문제에 대해 분리된 객관적 연결망을 보이는 남학생과 구별되었다. 따라서 남학생과 여학생은 인구 문제에 대해 다른 인식 구조를 갖는 이질적인 집단으로 봐야 하고, 인구 교육에 있어 내용과 방법을 성별에 따라 다르게 접근해야 할 것이라는 시사점을 도출하였다.

빅데이터와 스몰데이터로 본 선형공원 - 시카고 606 트레일과 서울 경춘선 숲길을 중심으로 - (Using Big Data and Small Data to Understand Linear Parks - Focused on the 606 Trail, USA and Gyeongchun Line Forest, Korea -)

  • 심지수;오창송
    • 한국조경학회지
    • /
    • 제48권5호
    • /
    • pp.28-41
    • /
    • 2020
  • 이 연구는 경관 인식 모델의 세 가지 요소(활동, 물리적 환경, 이용자)를 기본으로 하는 스몰데이터인 설문조사와 빅데이터인 소셜미디어 분석을 통해 문화가 다른 두 지역(미국, 한국)의 선형 공원 두 곳을 분석하고자 한다. 소셜 미디어의 사용이 증가하고 경관을 보는 새로운 매체로 부상했음에도 불구하고, 현재 소셜 미디어를 활용한 공원 연구는 제한적이다. 이에 본 연구는 소셜 미디어 분석과 설문 조사를 동시에 활용해서 비교함으로써 설문 조사가 갖는 한계를 보완함과 동시에 소셜 미디어 분석의 제한점을 보완하고자 한다. 미국 시카고의 606 트레일와 한국 서울의 경춘선 숲길은 버려진 길에 조성된 공원이다. 이 두 곳을 대상으로 총 505부의 설문조사를 시행했고, 그 결과는 통계 분석, 주성분 분석, 회귀 분석을 활용해서 분석하였다. 또한 각 선형 공원을 언급한 트위터를 총 20,000건 이상 수집했다. 이 트위터를 대상으로 군집 분석, 바이그램 네트워크 분석 등을 통해 각 공원이 갖는 장소적 특성 및 물리적 환경을 분석했다. 연구 결과는 공원 디자인이 다양해질수록 행동은 단순화 된다는 것을 발견할 수 있었다. 공원 이용자들의 절반은 선형 공원을 최종 목적지까지 도달하는 지름길로 이용했고, 공원의 특징에 따라 다양한 활동과 혜택을 확인할 수 있었다. 소셜 미디어 분석 결과, 606트레일은 경춘선 숲길 보다 주민들과 더욱 밀접한 관계를 갖고 있다는 것을 확인했다. 또한 경춘선은 606트레일보다 공원 내 이벤트와 연관이 깊음을 발견할 수 있었다.