• 제목/요약/키워드: 단어빈도

검색결과 541건 처리시간 0.028초

텍스트 마이닝과 토픽모델링 활용한 사회서비스 품질의 학술연구 동향 분석 (The Analysis of Research Trends in Social Service Quality Using Text Mining and Topic Modeling)

  • 이혜정;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 연구는 텍스트 마이닝과 토픽모델링을 활용하여 우리나라에 사회서비스가 본격적으로 도입된 2007년부터 2020년 까지의 사회서비스 품질에 대한 학술연구 동향을 분석하였다. 이를 토대로 사회서비스 품질에 관한 논문의 패턴 및 전체 데이터 속에 의미를 파악하여 사회서비스 발전방향에 대한 기초자료를 제공하고자 함에 목적이 있다. 자료수집은 학술연구정보서비스(RISS)에서 사회서비스, 사회복지서비스, 품질 키워드로 97편의 논문을 선정하였고, 2개 구간으로 구분하여 텍스트 마이닝을 활용하여 데이터를 분석하였다. 본 연구의 결과는 첫째, 본 연구에서 활용된 97개의 논문 중 1구간은 38편, 2구간은 59편으로 나타났고, 연 평균 6.9개의 논문이 발표되었다. 둘째, 단어빈도 분석 결과 1구간과 2구간의 공통 키워드는 서비스, 품질, 사회서비스, 만족도, 이용자, 품질관리, 재이용, 정책, 바우처 등의 순으로 나타났다. TF-IDF 분석 결과 1구간과 2구간의 공통 키워드는 사회서비스, 만족도, 이용자, 고객만족, 재이용, 바우처, 품질, 노인요양시설, 품질관리, 지역사회서비스투자사업 등의 순으로 나타났다. 셋째, 토픽 모델링 분석 결과 1구간의 주요 토픽은 서비스 제공유형, 서비스 비용, 재이용, 이용자 중심, 일자리 창출로 나타났고, 2구간은 품질관리체계, 공공성, 제공인력 관리체계, 공급방식체계, 서비스 만족도로 나타났다. 본 연구 결과를 바탕으로 사회서비스 품질 학술연구의 방향성을 제시하였다.

정보탐색과정(ISP)에 의한 스캐폴딩 전략 모형 개발 (Development of Scaffolding Strategies Model by Information Search Process (ISP))

  • 임정훈
    • 한국도서관정보학회지
    • /
    • 제54권1호
    • /
    • pp.143-165
    • /
    • 2023
  • 본 연구에서는 학습 과정의 중재 역할에 대한 설계 및 구현 전략을 제시한 Kuhlthau의 ISP 모형을 활용하여 정보탐색과정에 적용할 수 있는 스캐폴딩 전략을 제안하고자 하였다. 이를 위해 관련 문헌을 검토하여 스캐폴딩 전략을 범주화하고, 대전지역의 중학생 150명을 대상으로 ISP 모형 기반의 스캐폴딩 전략을 적용한 프로젝트 수업을 시행한 후, 이에 대한 소감문 텍스트를 수집하였다. 수집된 자료는 전처리 과정을 거쳐 분석에 적합한 형태로 가공한 후 단어 빈도를 추출하고, STM(Structural Topic Modeling)을 활용하여 토픽 분석을 수행하였다. 먼저, 최적의 토픽 개수를 결정하고 ISP 모형 각 단계별로 토픽을 추출한 후 추출된 토픽을 인지적 영역-거시적 관점, 인지적 영역-미시적 관점, 정서적 영역 관점의 3가지 유형으로 구분하였다. 이 과정에서 텍스트마이닝을 통해 추출한 단어 가운데 인지동사와 감정동사를 중점적으로 살펴보았으며, 대표 문서 사례를 검토하여 각 토픽과 관련된 스캐폴딩 전략 모형을 제시하였다. 본 연구의 결과를 토대로 정보탐색과정(ISP) 단계에서 적절한 스캐폴딩 전략이 제공된다면, 학습자들의 자기 주도적 과제해결에 긍정적인 영향을 기대할 수 있을 것이다.

InferSent를 활용한 오픈 도메인 기계독해 (Open Domain Machine Reading Comprehension using InferSent)

  • 김정훈;김준영;박준;박성욱;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2022
  • 오픈 도메인 기계독해는 질문과 연관된 단락이 존재하지 않아 단락을 검색하는 검색 기능을 추가한 모델이다. 문서 검색은 단어 빈도 기반인 TF-IDF로 많은 연구가 진행됐으나 문서의 양이 많아지면 낮은 성능을 보이는 문제가 있다. 아울러 단락 선별은 단어 기반 임베딩으로 많은 연구가 진행됐으나 문장의 특징을 가지는 단락의 문맥을 정확히 추출하지 못하는 문제가 있다. 그리고 문서 독해는 BERT로 많은 연구가 진행됐으나 방대한 파라미터로 느린 학습 문제를 보였다. 본 논문에서는 언급한 3가지 문제를 해결하기 위해 문서의 길이까지 고려한 BM25를 이용하며 문장 문맥을 얻기 위해 InferSent를 사용하고, 파라미터 수를 줄이기 위해 ALBERT를 이용한 오픈 도메인 기계독해를 제안한다. SQuAD1.1 데이터셋으로 실험을 진행했다. 문서 검색은 BM25의 성능이 TF-IDF보다 3.2% 높았다. 단락 선별은 InferSent가 Transformer보다 0.9% 높았다. 마지막으로 문서 독해에서 단락의 수가 증가하면 ALBERT가 EM에서 0.4%, F1에서 0.2% 더 높았다.

빅데이터 분석을 통한 발명 교육 센터에 대한 사회적 인식 (Social Perception of the Invention Education Center as seen in Big Data)

  • 이은상
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.71-80
    • /
    • 2022
  • 이 연구의 목적은 빅데이터 분석 방법을 이용하여 발명 교육 센터에 대한 사회적 인식을 확인해 보는 데 있다. 이를 위해 TEXTOM 사이트를 이용하여 네이버와 다음 사이트의 블로그, 카페, 뉴스 채널에서 '발명+교육+센터'를 검색 키워드로 2014년 1월부터 2021년 9월까지의 데이터를 수집하였다. 수집된 데이터는 TEXTOM 사이트에서 정제하였으며, 텍스트 마이닝 분석과 의미 연결망 분석을 위해 TEXTOM 사이트, Ucinet 6, Netdraw 프로그램을 이용하였다. 수집된 데이터는 1차와 2차의 정제 과정을 거쳐 단어빈도를 바탕으로 주요 키워드 60개를 선정하였으며, 선정된 주요 키워드는 매트릭스 데이터로 변환하여 의미 연결망 분석을 실시하였다. 이 연구의 텍스트 마이닝 분석 결과 '학생', '운영', '한국발명진흥회', '특허청' 등이 의미 있는 키워드임을 확인하였다. 의미 연결망 분석 결과 발명 교육 센터와 관련된 '교육 운영', '발명 대회', '교육 과정 및 진행', '사업 모집 및 지원', '주관 및 선정 기관' 등 5개의 군집을 확인할 수 있었다. 이 연구의 결과는 발명 교육 센터에 대한 연구를 수행하는 연구자나 정책 입안자의 학술 연구에 활용될 수 있을 것이다.

중등학교 교과서에서 삽화 콘텐츠 활용 연구 : 고등학교 '사회.문화' 교과서를 중심으로 (A Study on the Illustration Content Used in Secondary School Textbooks : Focusing on the 'Society.Culture' Textbooks)

  • 민일홍
    • 만화애니메이션 연구
    • /
    • 통권18호
    • /
    • pp.57-72
    • /
    • 2010
  • 정보화 사회에서 요구되는 교과서는 학습 동기와 흥미 유발에 긍정적 영향을 미치는 삽화, 사진을 적절하게 활용하는 것이 필요하다. "그림은 수천 단어 이상의 의미가 있다."는 말에서 알 수 있듯이 시각적 매체의 활용이 중요하다. 이러한 시대적 요청에 의해 고등학교 사회 문화 검인정 교과서 7종 중 'IV 인간과 문화 현상의 이해' 단원을 조사한 결과 삽화, 사진은 총 348쪽에서 삽화 123개, 사진 342개가 사용되었고, 삽화/사진 비율은 35.65%로 조사되었다. 콘텐츠의 내용 요소별 빈도는 삽화는 탐구활동에서 59개(47.96%), 사진은 본문에서 145개(42.4%)로 가장 많이 사용되었다. 또한 사회 문화 수업을 하는 교사를 대상으로 심층 면담을 통해 콘텐츠에 대한 교사들의 활용 실태를 조사한 결과, 교사들은 수업 시 발문에서 많이 이용하고 있으며, 내용을 쉽고 명확하게 하기 위해서 사진보다 삽화의 증가를 요구하였고, 학습자의 학습 도모를 위해 탐구활동에 보다 많은 콘텐츠의 제공을 원했다. 마지막으로 교과서 콘텐츠의 분석 결과 모범적 사례는 제시한 삽화가 탐구활동의 주제나 본문 주제를 잘 드러내어 본문 내용을 읽지 않아도 충분히 내용 전달이 가능하였으며, 중단원 주제를 표현한 삽화 한 장으로 이 단원에서 학습하는 내용을 잘 드러낸 것도 있었다. 반면에 부적절한 사례로는 실생활에서는 일어나기 힘든 경우를 삽화로 제시하거나, 무엇을 의미하는지 이해하기 힘든 삽화도 있었으며, 본문에서 제시하는 내용과 거리가 있는 삽화도 눈에 띠었다. 앞으로는 이러한 점이 수정된다면 좀 더 좋은 교과서가 될 것이다.

  • PDF

중학교 과학 교사가 '힘과 운동' 단원 수업 중에 사용하는 과학용어 분석 (Analysis of the Science Words Used by Science Teachers in Teaching the Unit of 'Force and Motion')

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제35권2호
    • /
    • pp.209-216
    • /
    • 2015
  • 과학 교실에서 과학용어는 교사와 학생의 의사소통 측면과 학생들의 과학 학습 측면에서 매우 중요하다. 본 연구는 실제 과학 수업 속 과학 교사의 발화에서 과학용어들이 사용되는 실태를 구체적으로 살펴보고 학생과의 의사소통 측면 및 효과적인 설명 전략의 측면에서 어떠한 문제점이 있는지 알아보고자 실시되었다. 3명의 과학 교사로부터 중학교 '힘과 운동' 단원 가운데 '운동' 부분에 해당하는 13차시 수업을 녹음한 뒤, 분석 프로그램을 이용하여 과학용어를 추출하고 사용하는 과학용어의 종류, 교육과정과 교과서와의 연계 등의 질적분석 및 사용하는 과학용어의 수, 사용 빈도 등의 양적 분석을 실시하였다. 연구 결과 의사소통의 측면에서는 수업 중 교사 발화의 비율이 너무 높고, 발화 가운데 과학용어가 차지하는 비율이 높았으며, 중요한 과학용어의 사용 빈도가 낮은 편이고, 주요 개념을 설명하기 위해 더 높은 수준의 단어를 사용하고 있는 등의 문제가 드러났다. 또 과학학습의 측면에서는 주요 개념을 담은 용어들의 사용이 교사 및 교과서에 따라 선택적으로 이루어지고 있었고, 개념의 위계상 상위 교육과정에서 다루는 용어가 혼용되고 있었으며, 전공 교사와 비전공 교사 사이의 차이 등이 문제점으로 드러났다.

타임라인데이터를 이용한 트위터 사용자의 거주 지역 유추방법 (Location Inference of Twitter Users using Timeline Data)

  • 강애띠;강영옥
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.69-81
    • /
    • 2015
  • SNS사용자의 거주 지역을 유추하여 그들이 생성한 데이터에 거주위치를 부여하는 것은 위치희박(location sparsity)과 생태학적 오류문제로 인해 연구결과의 신뢰성이 떨어진다는 평가를 받아온 공간빅데이터 연구에 대안이 될 수 있다. 본 연구에서는 Tweet 사용자의 거주 지역을 유추하는 방법으로 사용자 타임라인데이터 속에서 찾아낸 일상생활활동패턴을 이용하는 방법을 고안하였다. 트윗 사용자의 일상생활활동패턴은 이동궤적과 사용자의 언어(text)에서 확인할 수 있었으며 전자를 활용한 모델을 일상이동패턴모델, 후자를 활용한 모델을 일상 활동장 모델이라 명명하고 각각 모델에 입력될 변수를 선정하였다. 자신의 거주 지역에서 가장 높은 빈도의 트윗 발생 여부와 가장 높은 빈도의 거주행정구역 표현 단어를 사용하는지 아닌지를 종속변수로 한 판별분석을 실시하여 모델을 작성하였으며 설명력은 일상 이동패턴모델, 일상 활동장 모델 각각 67.5%, 57.5%였다. 이 모델을 스트레스 관련 트윗을 작성한 사용자의 타임라인데이터로 구성된 테스트데이터에 입력해본 결과 전체 사용자 48,235명 중 5,301명의 거주 지역을 유추하였고 이를 활용하여 위치 부여된 스트레스 관련 트윗 9,606개를 확보하였다. 본 연구의 유추기법을 통해 기존 SNS데이터 분석연구에서 사용하는 데이터 수집 방법보다 44배 많은 위치 부여 트윗을 확보할 수 있었다. 본 연구방법론은 SNS데이터를 이용한 연구에서 위치 부여된 데이터를 확보하는데 활용 가능할 것으로 판단되며, 각종 지역통계와 상관관계파악을 통해 지역적 현상 분석에도 SNS데이터를 이용할 수 있는 가능성을 높일 것으로 판단된다.

안경원의 브랜드 네임 유형에 관한 연구 - 대구지역 안경원 브랜드를 중심으로 - (A Study on the Brand Name Type of Optical Shop - Centric on Optical Shop in Daegu Region -)

  • 홍성일;손정식
    • 한국안광학회지
    • /
    • 제20권4호
    • /
    • pp.415-423
    • /
    • 2015
  • 목적: 대구지역 안경원 브랜드를 중심으로 안경원 브랜드 네임의 유형 연구를 통해 새로운 브랜드 네이밍에 필요한 객관적인 자료로 활용하고자 하였다. 방법: 브랜드 네임의 개념과 기능 등의 브랜드 네임 특성들을 살펴보고 대구지역의 안경원 브랜드에 대한 한글과 영어, 국 영문 혼합, 음절 그리고 서술적, 암시적, 조어적 브랜드 네임의 유형과 대안의 창출 제시, 많이 사용된 키워드 분석 등으로 브랜드 네임 유형을 분석하였다. 결과: 한글의 자음에는 'o'이 가장 많았고 다음으로 'ㅅ' 이었다. 한글과 영어, 조합 등에서는 브랜드 네임의 57.1%의 과반수가 한글을 사용하는 것으로 나타났고 영어를 사용한 브랜드 네임도 약 32.7%가 되었다. 음절 수는 3음절이 30.4%로 많았지만 2, 4음절도 비슷한 빈도수로 각 29.7%와 25.0%를 차지하였다. 암시적, 서술적 유형이 51개, 40개로 각 17.0%와 13.3%로 나타났으며 대안의 창출에 따른 유형에서는 단어를 조합한 유형이 가장 많았고 상징물 사용이 뒤를 이었다. 기타 유형에서는 타 업종의 이름과 안경원이 소재하고 있는 지역명을 사용하고 있는 브랜드 네임이 많았다. 마지막으로 안경원 브랜드 네임에 사용된 키워드로는 '아이(eye)'가 45회로 빈도수가 가장 많았고 '당'과 '안경'이라는 키워드 순으로 사용된 것으로 나타났다. 결론: 창업을 위해 상호를 만들고 알리는데 그치는 단순한 이름이 아니라 들어서 기억하고 부르기 쉬우며 의미가 있는 브랜드 네임, 안경원에 대한 바람직한 연상과 독특하고 호감을 주는 창의적인 브랜드 네임이 되어야 한다.

미래워크숍을 활용한 진로직업상담가의 미래인식과 미래역량 및 미래적응력 변화 탐색 (An Investigation on the Future Recognition of Career Counselors and their Future Competency and Future Adaptability change by using the Future Workshop)

  • 염인숙;임금희
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.557-567
    • /
    • 2019
  • 본 연구는 미래워크숍을 활용하여 진로직업상담가의 미래인식과 미래역량을 도출하고 미래적응력 향상에 대한 효과성을 검증하기 위하여 수행되었다. 이를 위해 진로직업상담가 25명을 대상으로 미래워크숍을 진행하였으며, 서면 작성된 자료와 미래워크숍에서 진행된 토론 내용을 통합하여 분석하였다. 분석을 위해 단어 빈도분석과 대응표본 T검증을 실시하였고, 합의를 통해 주제어 도출을 하였다. 연구결과, 첫째, 미래인식 키워드는 로봇, 인공지능, 여가, 교육, 편리, 장애인 등의 빈도가 높게 나타났다. 둘째, 미래노동현장에서는 첨단 기술로 인한 변화를 가장 많이 전망했다. 셋째, 진로직업상담 현장에서는 제4차 산업혁명 관련 전문 진로직업상담사와 로봇상담사가 등장할 것으로 전망했다. 넷째, 진로직업상담가의 미래역량으로 정보처리능력, 전문상담능력, 의사소통능력, 윤리의식이 도출되었다. 끝으로 미래워크숍 참여 이후 진로직업상담가의 미래적응력이 높아지는 것으로 확인되었다. 본 연구에서 도출된 미래역량은 진로직업상담가의 직무교육에도 활용될 수 있을 것으로 기대된다.

텍스트 마이닝을 활용한 미국 노년 소비자와 애완용 로봇 간 상호작용에 대한 분석: Joy For All Companion Pets에 대한 아마존 리뷰를 중심으로 (Text-Mining Analysis on the Interaction between the American Consumers Aged over 60 and Companion Pets Robots: Focused on Amazon Reviews for Joy For All Companion Pets)

  • 정예은;이유림;정재은
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.469-489
    • /
    • 2021
  • 본 연구는 정서 지원 애완용 로봇에 대한 소비자의 담론을 살펴보고 키워드를 통해 해당 제품에 대한 노년 소비자의 반응을 파악하고자 아마존 사이트 내 하즈브로(Hasbro)의 Companion Pets 제품 사용에 대한 미국 소비자들의 리뷰를 수집하고, R을 이용하여 단어 빈도분석, 토픽모델링 LDA 분석을 실시하였다. 첫째, 키워드 빈도분석 결과 애완용 로봇의 형태가 실제 동물과 유사한지에 대한 관심이 높은 것으로 나타났다. 둘째, 토픽모델링 결과 5개의 토픽으로 인지, 감정, 행동적 반응이 도출되었으며 이는 긍정 및 부정으로 크게 분류되었다. 셋째, 소비자와 애완용 로봇의 상호작용에 영향을 미치는 사용자, 제품 및 환경적 특성이 확인되었다. 애완용 로봇은 반려동물을 키우기 어려운 사람들이 이를 대체하기 위하여 사용하고, 인지적 어려움이 있는 노년 소비자와 신체적 어려움이 있는 소비자가 이를 이용하는 것으로 나타났다. 본 연구는 코로나19와 같은 팬데믹 상황에서 정서 지원 기능을 수행하는 애완용 로봇에 대하여 이해하고, 소비자의 효용을 극대화하는 서비스를 제공하는데 도움을 줄 것으로 기대한다.