• 제목/요약/키워드: 텍스트 출현 빈도

검색결과 102건 처리시간 0.026초

접속 부사의 사용에 따른 설득문과 보도문의 대응 분석 (Correspondence Analysis of Reports and Persuasives based on a Newspaper Corpus)

  • 김혜영;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-180
    • /
    • 2013
  • 본 논문은 동아, 조선, 중앙, 한겨레 신문의 2000~2011년 신문 사설과 보도문에서서 나타나는 접속부사의 사용에 대한 분석이다. 구체적으로, 텍스트 구조를 드러내는 표지의 기능을 하는 접속부사에 대해 논의하고자 한다. 12년 동안 출현한 고빈도 접속부사 '그러나, 하지만, 그런데, 그리고, 따라서, 그래서, 그렇지만, 그러면, 그러므로, 하물며'를 대상으로 보도문에서의 빈도 변화와 신문 사설에서의 빈도 변화를 대응 분석과 군집 분석을 통해 객관적, 통계적, 통시적으로 분석하였다. 연구 결과, 나열의 구조에서 보도문은 '그리고'를 선호하고 신문 사설은 '하물며'를 선호하여 사용하며, 대조의 표지로서 보도문은 '하지만'을 신문 사설은 '그러나, 그렇지만'을 선호하여 사용하였다. 화제 전환을 나타낼 때 보도문은 '그러면'을 사용하는 반면 신문 사설은 '그런데'를 사용하고, 문제에 대한 결과를 제시할 때 '보도문'은 '그러므로, 그래서'를 신문 사설은 '따라서'를 더 많이 사용하는 경향이 나타났다.

  • PDF

주제어 네트워크 분석(network analysis)을 통한 국내 감정노동의 연구동향 탐색 (Exploration of Emotional Labor Research Trends in Korea through Keyword Network Analysis)

  • 이남연;김준환;문형진
    • 융합정보논문지
    • /
    • 제9권3호
    • /
    • pp.68-74
    • /
    • 2019
  • 본 연구는 최근 10년 동안(2009-2018) 국내 학술지에 발표된 감정노동(emotional labor) 관련 892편의 논문을 텍스트 마이닝(text-mining) 및 네트워크 분석(network analysis)을 활용하여 연구동향을 파악하는 것이 목적이다. 이를 위해 이들 논문의 주제어를 수집 및 코딩하여 최종적으로 871개의 노드(node)와 2625개의 링크(link)로 변환시켜 네트워크 텍스트로 분석하였다. 첫째, 네트워크 텍스트 분석 결과로 동시출현빈도에 따른 상위 4개 주요 주제어는 번아웃, 이직의도, 직무스트레스, 직무만족 순으로 나타났으며, 연결중심성에 따른 상위 4개 주제어들의 빈도와 연결중심성 모두 비교적 높은 것으로 확인되었다. 둘째, 연결중심성 상위 4개의 주제어를 바탕으로 자아(ego)연결망 분석을 실시하여 각 네트워크의 연결중심도에 대한 주제어를 제시하였다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

신문 사설의 특징적 표현들에 대한 연구 (Key Expressions in Editorial Texts: Determining the Unithood and Termhood of Word Sequences based on a 2009 Newspaper Corpus)

  • 김혜영;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.185-190
    • /
    • 2012
  • 본 논문은 동아, 조선, 중앙, 한겨레 신문의 2009년 신문 사설의 제목과 본문에서 나타나는 n-gram에 대한 논의이다. 구체적으로 자주 출현하는 단어들의 연속 단위 3~6개의 형태소를 추출하여 신문 사설에서 나타난 고빈도 형태소 연속체를 살펴본다. 또한 이들을 기사문에서 추출한 패턴과 로그공산비로 비교하여 신문 사설에서 더 특징적인 의미로 사용되는 어휘들을 살펴본다. 그 결과, 사설 본문에서는 3-gram은 '아야 한다'. 4-gram은 'ㄹ 것이다', 5-gram은 'ㄹ 수밖에 없다', 6-gram은 '아야 할 것이다' 등이, 사설 제목은 '것인가, 안 된다'가 하나의 용어처럼 사용되고 있었다. 이러한 형태소 연속체를 살펴봄으로써, 신문사설의 텍스트 특징과 정형적인 표현에 대해서 살펴볼 수 있다.

  • PDF

교육개발협력에 관한 국제 학술지 연구 동향 고찰 : 텍스트 네트워크 분석을 중심으로(2002~2017) (A Study on the International Research Trend in Education Development focused on Text Network Analysis(2002~2017))

  • 김상미;김영환;조원겸
    • 비교교육연구
    • /
    • 제28권1호
    • /
    • pp.1-24
    • /
    • 2018
  • 본 연구는 교육개발협력에 관한 글로벌 연구 동향을 살펴보고, 이를 통해 국내 관련 연구에서의 향후 방향과 시사점을 탐색하는 것을 목적으로 한다. 이를 위해 교육개발협력 분야의 국제 학술지인 "International Journal of Educational Development"를 선정하고, 2002년부터 2017년까지 약 15년간 게재된 연구 논문 966편을 대상으로 연구 초록에 제시된 (저자) 키워드를 텍스트 네트워크 분석하여 시기별, 교육영역별로 연구 주제가 어떻게 변화하고 이에 나타나는 특징이 무엇인지를 알아보았다. 이에 대한 주요 연구 결과는 다음과 같다. 첫째, 분석 대상 전체 논문에 나타난 연구 주제어의 출현 빈도를 살펴본 결과, 교육프로그램관리, 학교수업, 지역공공행정, 교육지원서비스, 초등교육 순으로 높았으며, 빈도 순 상위 20개의 핵심주제어에 대한 네트워크 중앙성 분석 결과는 빈도수 결과와 유사한 상관관계를 나타내었다. 그러나 중등교육, 학습, 교육연구, 교육변화, 교육의질 등의 주제어는 출현 빈도에 비해 높은 중앙성 지수를 나타내고 있어 다른 키워드들과 높은 관계성을 가지고 있었다. 둘째, 시기별 핵심 주제어 분석 결과 MDGs 전기 대비 후기와 SDGs 초기에는 새로운 키워드(초등교육, 초중등학교, 학교수업, 교육의 질, 중등교육, 교육계획)가 다양하게 나타났고, 중앙성 지수에서도 높은 수치를 나타내고 있어 새로운 핵심 연구 주제가 되고 있음을 알 수 있다. 셋째, 교육일반, 기초교육, 중등교육, 고등교육으로 분류한 교육영역별 분석 결과에서는 빈도수와 중앙성이 높은 핵심 주제어가 각각 다소 상이하게 나타나고 있어 영역에 따른 연구 키워드가 구분되고 있다는 특징이 부각되었다. 본 연구는 국제 아젠다로서의 교육개발협력 특성을 고려하여 국제적 수준에서 약 15년간 누적된 연구 논문들을 대상으로 객관적 데이터 분석 프로그램을 활용해 연구 주제의 변화 동향을 조망하였다는데 의의가 있으며, 현재 국내에서 실천적 노력과 더불어 교육개발협력에의 학문적 연구 개발이 지속적으로 강화되어야 할 시점임을 고려할 때, 향후 보다 다양한 분야에서의 연구 개발에서 참고할 만한 시사점을 제공할 수 있을 것이다.

텍스트 정보와 시각 특징 정보를 이용한 효과적인 웹 이미지 캡션 추출 방법 (An Efficient Web Image Caption Extraction Method based on Textual and Visual Information)

  • 황지익;박주현;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.346-348
    • /
    • 2006
  • 기존의 웹 이미지 검색 시스템들은 웹 페이지에 포함된 텍스트들의 출현빈도, 태그유형 등을 고려해 각 키워드들의 중요도를 평가하고 이를 이용해 이미지의 캡션을 결정한다. 하지만 텍스트 정보만으로 캡션을 결정할 경우, 키워드와 이미지 사이의 관련성을 평가할 수 없어 부적절한 캡션의 배제가 어렵고, 사람의 인지와 맞지 않는 캡션이 추출되는 문제점이 있다. 본 논문에서는 기존의 웹 이미지 마이닝 방법을 통해 웹 페이지로부터 캡션 후보 키워드를 추출하고, 자동 이미지 주석 방법을 통해 이미지의 개념 부류 키워드를 결정한 후, 두 종류의 키워드를 결할하여 캡션을 선택한다. 가능한 결합 방법으로는 키워드 병합 방법, 공통 키워드 추출 방법, 개념 부류 필터링 방범 캡션 후보 필터링 방법 등이 있다. 실험에 의하면 키워드 병합 방법은 높은 재현율을 가져 이미지에 대한 다양한 주석이 가능하고 공통 키워드 추출 방법과 개넘 부류 키워드 필터링 방법은 정확률이 높아 이미지에 대한 정확한 기술이 가능하다. 특히, 캡션 후보 키워드 필터링 방법은 기존의 방법에 비해 우수한 재현율과 정확률을 가지므로 기존의 방법에 비해 적은 개수의 캡션으로도 이미지를 정확하게 기술할 수 있으며 일반적인 웹 이미지 검색 시스템에 적용할 경우 효과적인 방법이다.

  • PDF

텍스트 마이닝을 활용한 대학 화학 실험 수업의 서술형 강의 평가 내용 분석 (Analysis of Descriptive Course Evaluation of University Chemistry Laboratory Class using Text Mining)

  • 윤정현;박금주
    • 대한화학회지
    • /
    • 제66권3호
    • /
    • pp.218-227
    • /
    • 2022
  • 이 연구는 대학 화학 실험 수업에 참여한 수강생이 작성한 강의평가의 서술형 내용 중 수업의 좋은 점과 개선사항에 대해 텍스트 마이닝 기법을 적용하여 학생들의 의견을 분석하고, 수업의 개선 방안을 도출하는 데 목적이 있다. 연구 방법은 텍스트 마이닝 기법을 적용하여 핵심단어의 출현 빈도, 동시 출현 빈도, 네트워크 분석을 실시하였다. 연구결과, 화학 실험 수업의 좋은점 네트워크에서는 수업과 교수님 간 언급이 가장 많았고, 설명, 이해, 학생, 열정, 재미, 조교, 실험, 도움 등과 함께 언급되었다. 화학 실험 수업의 개선점 네트워크에서는 수업과 학생 간 언급이 가장 많았고, 교수님, 내용, 설명, 시험, 좋겠다, 실험, 이해, 어렵다, 생각, 문제 등과 함께 언급되었다. 즉, 학생들은 '쉽고 자세한 설명'과 '조교의 도움'으로 인해 실험 수업 내용이 잘 이해되고, 실험 과정에 재미와 만족을 느꼈다는 의견을 수업의 좋은 점으로 제시하였다. 반면에 '수업 내용과 시험의 어려움', '과도한 과제', '수업 환경'으로 인해 수업 내용에 대한 이해도와 집중도가 떨어진다는 부정적인 의견을 수업의 개선점으로 제시하였다.

분산 멀티미디어 스트리밍 시스템 설계 및 구현 (Design and Implementation of a Distribute Multimedia System)

  • 김상국;신화종;김세영;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.677-680
    • /
    • 2000
  • 웹이 등장하면서 지금까지 인터넷 상에서 텍스트와 이미지를 이용하여 정보를 표현하고 전달하는 방법이 가장 많이 사용되어왔다. 그러나 웹 관련 기술의 비약적인 발달과 네트워크 속도의 증가 및 인터넷의 급속한 보급으로 단순한 텍스트와 이미지 중심의 HTML 문서를 이용한 정보의 전달이 아닌 멀티미디어 데이터를 이용한 정보의 표현과 전달이 점차 증대되고 있다. 이에 따라 멀티미디어 데이터를 전송하기 위한 스트리밍 프로토콜도 등장하였다. 최근에는 컴퓨터의 성능 증가 및 네트워크 속도의 증가(초고속 통신 서비스의 보급)에 의해 멀티미디어 데이터의 전송이 가능하게됨으로써 기존의 공중파나 CATV 방송국의 형태 지니고 인터넷 상에서 실시간 생방송 서비스와 VOD(Video On Demand) 서비스를 제공하는 인터넷 방송국이 급속하게 생겨나고 있다.[11] 인터넷 방송은 동영상과 오디오의 실시간 전달을 가능하게 하는 멀티미디어 스트리밍 기술과 멀티미디어를 실시간으로 전송할 수 있는 실시간 전송 프로토콜을 기반으로 발전하고 있다. 인터넷 상에서 멀티미디어 스트리밍 서비스를 하는 대부분의 인터넷 방송은 스트리밍 서버로서 RealNetworks사의 RealSystem과 Microsoft사의 WMT(Windows Media Technologies)를 사용하고 있다. 본 논문은 Real Server와 WMT의 비교 분석을 통해 실시간 전송 프로토콜을 지원하고, 멀티미디어 스트리밍 기술을 지원하는 자바를 기반으로 한 분산 서버 구조의 스트리밍 서버, 서버간의 부하를 제어하는 미들웨어, 멀티미디어 스트림을 재생할 수 있는 클라이언트를 설계하고 구현한다. 방법에 대해서 자세히 살펴보고 실제 SQL Server 7.0 환경에서 구축된 공간 엔진 및 OLE DB 제공자 컴포넌트의 구현 예에 대하여 살펴볼 것이다. 혈액내방사선 조사량이 안전용량 범위(200rad)에 속하며 48시간 후 체내잔류량은 서양인과 큰 차이가 없었다.비출현의 소견을 보이는 악성종양 환자의 골 신티그람 53개중 44개 (83.0%)에서 척추 및 늑골에 미만성, 또는 다발성 침습이 관찰되었다. 또 골전이 부위를 두개골, 척추, 견대부, 늑골, 골반, 사지의 근위부 장골의 6개 부위로 나누어 분석할 경우 49개(92.5%)에서 3부위 이상에 전이가 발견되었고, 35개(66.0%)에서 4부위 이상에 전이가 발견되었으며, 5부위 이상, 6개 부위에 모두 전이가 발견된 것은 각각 20개 (37 7%), 11개(20.8%)이었다. 이상의 성적으로 보아 악성종양 환자의 골 신피그라피에서 신장 영상의 비출현은 종양의 광범위한 골전이를 간접적으로 시사하는 소견으로 생각된다. 여러 악성종양중 전립선암에서 신장 영상 비출현의 빈도가 가장 높았으며, 특히 위암에서 골전이 및 신장 영상 비출현의 빈도가 높음은 주목할 만한 것이라 하겠다.출한 결과 인,규소 증가와 자가영양성 미소플랑크톤(ANP)증가에 미치는 요인이 해안과 외해에서 동일하게 가장 큰 설명력을 보였다. N:P 비도 해안에서 36.4, 외해에서 32.6을 보이고 있어 인이 상당히 부족한 것으로 나타났다. 따라서 조사해역은 인이 식물플랑크톤 성장에 중요한 제한요인으로 작용하고 있다고 판단된다.의 회전. 전위력의 강도, 적용시점, 그리고 키, 체중등의 신체적 요인 등이 있으나 능숙한 기계사

  • PDF

토픽모델링을 이용한 국내 패션디자인 연구동향 분석 (Research Trend Analysis in Fashion Design Studies in Korea using Topic Modeling)

  • 장남경;김민정
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.415-423
    • /
    • 2017
  • 본 연구는 국내 패션 디자인 분야의 연구동향을 파악하기 위해 패션 디자인 분야에 초점을 맞춘 국내 대표적인 학술지인 "한국패션디자인학회지"의 2001년 창간호부터 2015년까지 발표 논문의 주제어와 초록을 수집하여 텍스트 마이닝과 토픽모델링 기법을 수행하였다. 우선 텍스트 마이닝을 통해 총 338편 논문의 주제어와 초록에 사용된 7137개 단어 중 30회 이상의 출현빈도를 가지는 183개의 핵심 용어들을 도출하였다. 그 중 압도적으로 높은 빈도를 보인 핵심 용어는 'fashion'과 'design'이었다. 다음으로 토픽모델링 기법 중 LDA 알고리즘을 사용하여 20개의 연구주제를 도출하였는데 대부분 기존 패션 디자인 분야의 연구주제와 연결할 수 있었지만 패션 브랜드 마케팅 및 디지털 기술 등 최신 트렌드를 반영한 다양한 연구주제들이 추가적으로 발견되었다. 마지막으로 연구주제별로 연도별 트렌드 분석을 통해 상승세와 하강세에 있는 연구주제를 구분하였다. 이러한 국내 패션 디자인 분야의 연구주제 및 트렌드 추이 파악은 지금까지의 국내패션 디자인 연구 내용과 향후 방향성을 이해하는데 유용할 것이다.

텍스트 마이닝 기법을 활용한 기후변화관련 식품분야 논문초록 분석 (Analysis of the abstracts of research articles in food related to climate change using a text-mining algorithm)

  • 배규용;박주현;김정선;이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1429-1437
    • /
    • 2013
  • 빅 데이터 분석기법 중 비정형데이터 분석기법인 텍스트 마이닝 기법을 이용하여 기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도를 분석하였다. 이를 위하여 용어-문헌 행렬을 만들고, 용어들간의 비유사성 측도를 바탕으로 계층적 군집분석기법을 적용하여 문서들을 군집화하였다. 군집화된 문서들간의 상호 연관성과 군집별로 특정용어의 빈도를 파악하여 문서군집을 특정주제별로 분류하였다. 이러한 연구를 통하여 식품분야의 기후변화 관련 논문들의 추세와 관심주제어를 파악할 수 있었으며, 향후 기후변화 적응 및 대응 체계 로드맵 작성 시 연구 개발 기초 자료로 활용할 수 있을 것이다.