• 제목/요약/키워드: 텍스트형

검색결과 432건 처리시간 0.025초

텍스트마이닝을 이용한 건설공사 위험요소의 계절별 중요도 분석 (Analysis of Seasonal Importance of Construction Hazards Using Text Mining)

  • 박기창;김형관
    • 대한토목학회논문집
    • /
    • 제41권3호
    • /
    • pp.305-316
    • /
    • 2021
  • 건설사고는 근로자의 부주의, 안전장비 미착용, 안전규칙 미준수 등 다양한 요인이 복합적으로 작용해 발생할 수 있다. 건설사고를 유발하는 여러 요인 중 야외작업이 많은 건설업의 특성상 기상 조건은 건설사고 발생 요인 중 하나가 될 수 있다. 과거 발생한 건설사고 데이터는 사고예방을 위한 좋은 자료로 활용될 수 있지만, 건설업 재해사례 데이터는 자연어로 기술된 텍스트형태로 제공되기 때문에 건설업 재해사례 데이터에서 건설공사 위험요소(Hazard)를 추출하는 것은 많은 시간과 비용이 발생한다. 따라서, 본 연구에서는 텍스트마이닝을 이용해 국내에서 발생한 2,026건의 건설업 재해사례 텍스트데이터에서 건설공사 위험요소를 추출하고 빈도 분석(Frequency analysis)과 중심성 분석(Centrality analysis)을 통해 건설공사 위험요소의 계절별 중요도분석을 수행했다. 국토교통부에서 정의한 254개 건설공사 위험요소 중 51개 위험요소를 건설사고 텍스트데이터에서 추출했으며, 분석결과 봄, 가을은 거푸집, 여름은 비계, 겨울은 크레인이 계절별 가장 중요한 위험요소로 나타났다. 제안방법은 날씨, 계절, 기후 관련 건설사고 안전대책 마련에 활용될 수 있다.

인과관계문형 기반 사회이슈 발생원인 도출 방법 연구 (A study on the method of deriving the cause of social issues based on causal sentences)

  • 이남연;이재형
    • 디지털융복합연구
    • /
    • 제19권3호
    • /
    • pp.167-176
    • /
    • 2021
  • 최근 빅데이터 분석 기술이 발전하면서 사회 이슈를 분석하기 위해 그 동안 많은 텍스트 마이닝 기법을 활용한 연구들이 진행되어왔다. 사회이슈를 도출하기 위한 기존의 연구들을 살펴보면 다량의 텍스트 데이터를 뉴스, SNS 등으로부터 수집하여 토픽 모델링, 네트워크 분석 등의 기법을 이용하여 데이터로부터 이슈를 추출하고 분석하는 방식으로 연구들이 이루어져왔다. 사회 이슈는 다양한 사회현상들이 누적되어 나타나는 결과물이다. 하지만 기존 연구들이 가지는 한계점은 사회적으로 나타나는 이슈, 즉 결과에 대한 분석에 초점이 맞춰져 있어 해당 이슈의 발생 원인을 밝히는 것에는 한계를 가진다는 것이다. 사회이슈에 적절하게 대응하기 위해서는 어떠한 사회이슈가 존재하는지를 확인하는 것뿐만 아니라 사회이슈의 발생 원인을 파악하는 것이 필요하다. 이러한 한계점을 극복하기 위해서 본 연구에서는 사회 이슈와 관련한 텍스트로부터 사회이슈의 원인이 되는 요인을 도출하는 방법을 국어학의 품사이론을 기반으로 제안하였다. 이를 위해서 2017년 1월부터 2019년 12월까지의 3년 동안의 사회이슈와 관련한 뉴스데이터를 수집하여 수집된 텍스트 내 단어들의 인과관계를 인과문형을 찾아 분석한 후 기존 텍스트마이닝 기법 접목하여 사회이슈의 원인 단어들을 찾는 방법론을 제안하였다.

텍스트 마이닝을 활용한 대학 화학 실험 수업의 서술형 강의 평가 내용 분석 (Analysis of Descriptive Course Evaluation of University Chemistry Laboratory Class using Text Mining)

  • 윤정현;박금주
    • 대한화학회지
    • /
    • 제66권3호
    • /
    • pp.218-227
    • /
    • 2022
  • 이 연구는 대학 화학 실험 수업에 참여한 수강생이 작성한 강의평가의 서술형 내용 중 수업의 좋은 점과 개선사항에 대해 텍스트 마이닝 기법을 적용하여 학생들의 의견을 분석하고, 수업의 개선 방안을 도출하는 데 목적이 있다. 연구 방법은 텍스트 마이닝 기법을 적용하여 핵심단어의 출현 빈도, 동시 출현 빈도, 네트워크 분석을 실시하였다. 연구결과, 화학 실험 수업의 좋은점 네트워크에서는 수업과 교수님 간 언급이 가장 많았고, 설명, 이해, 학생, 열정, 재미, 조교, 실험, 도움 등과 함께 언급되었다. 화학 실험 수업의 개선점 네트워크에서는 수업과 학생 간 언급이 가장 많았고, 교수님, 내용, 설명, 시험, 좋겠다, 실험, 이해, 어렵다, 생각, 문제 등과 함께 언급되었다. 즉, 학생들은 '쉽고 자세한 설명'과 '조교의 도움'으로 인해 실험 수업 내용이 잘 이해되고, 실험 과정에 재미와 만족을 느꼈다는 의견을 수업의 좋은 점으로 제시하였다. 반면에 '수업 내용과 시험의 어려움', '과도한 과제', '수업 환경'으로 인해 수업 내용에 대한 이해도와 집중도가 떨어진다는 부정적인 의견을 수업의 개선점으로 제시하였다.

한국형 슈퍼히어로 영화의 영상미학적 특성 연구 -영화 <전우치>의 플롯구조와 인물구성을 중심으로- (The Aesthetic Characteristics of Korean Superhero Film : Focus on Plot and Character of )

  • 현승훈
    • 한국콘텐츠학회논문지
    • /
    • 제13권10호
    • /
    • pp.132-139
    • /
    • 2013
  • 본 연구는 영화 <전우치>의 텍스트 분석을 통해 한국형 슈퍼히어로 영화의 영상 미학적 특성을 고찰하고 있다. 기본적으로 영상 미학이라 함은 이야기의 구조, 인물 그리고 미장센 등 다양한 요소들을 포함한다. 따라서 본 연구에서는 영화<전우치>의 플롯구조에 대한 일차적 분석을 토대로 인물과 화면 등 기타 미학적 요소의 구성과 특징을 분석해 보았다. 본 연구가 특별히 영화 <전우치>를 텍스트로 선택한 이유는 기존의 할리우드 슈퍼히어로 영화와 비교될 만한 유사한 스토리 진행과 구성 그리고 장르적 스타일 때문이었다. 따라서 본 연구를 통해서 기존의 할리우드 슈퍼히어로 영화와 영화 <전우치> 사이에서의 공통된 영상미학적 특징들을 발견할 수 있었음과 동시에 국내 고전소설과 서구형 영웅장르의 새로운 접목으로 인한 제작상의 한계점 또한 존재함을 확인할 수 있었다.

텍스트마이닝 기법을 이용한 제 2형 당뇨환자 온라인 담론의 어휘 및 구문구조 분석 (Lexical and Phrasal Analysis of Online Discourse of Type 2 Diabetes Patients based on Text-Mining)

  • 황문현;박정식
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.655-667
    • /
    • 2014
  • 본 연구는 질병과 관련한 온라인 포럼에서 추출한 언어 데이터를 통해 제 2형 당뇨병 환자의 질병에 대한 담론을 양적으로 분석하였다. 또한 환자 언어행위의 양적분석을 통해 환자들의 주요 관심사와 심리적 특징의 일반화가 가능한지에 대해 실증적으로 검증하였다. 분석방법으로는 기존의 인터뷰에 기반한 정성적 연구방법론과 달리 환자들의 담론 표본 전체를 파싱 (parsing)과 POS 태깅을 통해 언어학적으로 형태소 분류를 하였다. 주요 어휘빈도 추출과 N-gram을 통한 최빈도 구문구조 분석을 병행하여, 질병과 관련한 이슈의 주요 범주와 심리상태에 관한 언어적인 특징을 살펴보았다. 연구 결과 환자들의 자발적 대화는 주로 다이어트, 운동, 증상, 약물치료, 심리상태의 5가지 범주로 나타나고 있음을 확인하였고, 최빈도 구문구조 분석을 통해 질병치료와 식생활습관 개선 전반에 대한 부정적인 견해가 두드러진 것을 확인하였다. 결과적으로 의료진의 정확한 정보 전달과 전문가의 조언, 정서적 지원 등이 당뇨환자에 대한 심리적 상태에 중요한 만큼 심리치료 서비스이 개선이 필요할 것으로 보인다. 이런한 결과는 기존의 의료제도 안에서의 환자의 관심사와 심리적 특징이 온라인 상에서도 적절하게 투영되고 있음을 시사한다.

영화 리뷰의 상품 속성과 고객 속성을 통합한 지능형 추천시스템 (An Intelligent Recommendation System by Integrating the Attributes of Product and Customer in the Movie Reviews)

  • 홍태호;홍준우;김은미;김민수
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.1-18
    • /
    • 2022
  • 디지털 기술이 산업 전반의 전자상거래 시장에 융합되면서 온라인 거래의 활성화와 이용률을 증가시켰으며, 이러한 시장의 흐름은 최근 코로나와 같은 감염병이 확산함에 따라 더욱 가속화되어 다양한 상품 정보를 온라인을 통해 고객들에게 제공할 수 있게 되었다. 다양한 정보의 제공은 고객들에게 다양한 선택의 기회를 제공하지만 의사결정에 어려움을 주기도 한다. 추천시스템은 고객의 의사결정에 도움을 줄 수 있으나 기존 추천시스템 연구는 정량적 데이터만에 국한되어 있으며, 상품 및 고객의 세부적인 요인을 반영하지 못하였다. 이에 본 연구에서는 온라인 리뷰를 기반으로 정성적 데이터를 텍스트 마이닝 기법을 적용하여 상품 및 고객의 속성을 정량화하고 기존의 객관적 지표인 총평점과 감성 및 감정을 통합한 지능형 추천시스템을 제안한다. 제안된 지능형 추천모형은 총평점 위주의 추천 모형보다 우수한 추천성과를 보여주었으며, 상품 및 고객의 세부적 요소를 반영한 추천결과를 통해 새로운 비즈니스 가치를 창출할 것으로 기대한다.

인포그래픽 제작 연수 프로그램을 통한 과학교사 전문성 신장 방안 탐색 -지구과학 교과를 중심으로 (Exploring Ways to Improve Science Teacher Expertise through Infographics Creation Teacher Training Program: Focus on the Subject Earth Science)

  • 김현종
    • 한국과학교육학회지
    • /
    • 제42권4호
    • /
    • pp.429-438
    • /
    • 2022
  • 본 연구에서는 2015 개정 교육과정 지구과학 교과서를 중심으로 인포그래픽 유형을 분석하고 교사들의 그래픽 제작 도구 활용 실태를 점검함으로써 인포그래픽 제작 연수 프로그램을 통한 과학교사 전문성 신장 방안을 제안하고자 하였다. 이를 위해 지구과학 교과서에 제시된 시각화자료를 분석하여 인포그래픽의 유형에 따른 특징을 파악하였다. 또한, 인포그래픽 제작 연수 프로그램의 실행 결과를 유형별로 제시하고 연수 프로그램 이수 전후 설문 조사를 통해 과학교사들의 인포그래픽에 대한 인식 및 역량 변화를 분석하였다. 교과서 분석 결과 지구과학 교과에서는 도표형, 지도형, 비교분석형 인포그래픽을 가장 많이 사용하고 있으며, 주로 텍스트 보조형 인포그래픽으로 제시하였다. 과학교사 112명을 대상으로 인포그래픽 제작 연수프로그램을 5회 진행한 결과 완성형, 텍스트 보조형, 불완전형, 그레이디언트형 인포그래픽을 제작하였으며, 평가 문항 출제를 위한 불완전형 인포그래픽의 제작 수요가 가장 높았다. 설문 조사 결과에 따르면 대부분의 과학교사는 인포그래픽의 중요성을 인지하고 있으나, 인포그래픽을 제작해 본 경험이 없어 양질의 인포그래픽을 제작할 수 있는 역량이 부족한 것으로 나타났다. 연수 이수 후, 74.1%의 교사들이 수업자료와 평가 문항의 질이 향상되었다고 느꼈으며, 새로운 유형의 인포그래픽을 개발하는 과정이 전공 지식 재교육과 교수-학습방법 개선에 도움이 된다고 응답하였다. 연구 결과를 토대로 인포그래픽 제작 연수 프로그램을 통한 과학교사의 전문성 신장 방안을 제안하였다.

텍스트 기반 생성형 인공지능의 이해와 과학교육에서의 활용에 대한 논의 (Understanding of Generative Artificial Intelligence Based on Textual Data and Discussion for Its Application in Science Education)

  • 조헌국
    • 한국과학교육학회지
    • /
    • 제43권3호
    • /
    • pp.307-319
    • /
    • 2023
  • 본 연구는 최근 주목받고 있는 텍스트 기반 생성형 인공지능에 대해 관심과 활용이 증가함에 따라 과학교육적 측면에서의 활용을 위해 생성형 인공지능의 주요 개념과 원리를 설명하고, 이를 효과적으로 활용할 수 있는 방안과 그 한계를 지적하며 이를 토대로 과학교육의 실행과 연구의 측면에서 시사점을 제공하는 것을 목적으로 한다. 최근 들어 증가하고 있는 생성형 인공지능은 대체로 인코더와 디코더로 이뤄진 트랜스포머 모델을 기반으로 하고 있으며, 인간의 피드백을 활용한 강화학습과 보상 모델에 대한 최적화, 문맥에 대한 이해 등을 통해 놀라운 발전을 이루고 있다. 특히, 다양한 사용자의 질문이나 의도를 이해하는 능력과 이를 바탕으로 한 글쓰기, 요약, 제시어 추출, 평가와 피드백 등 다양한 기능을 수행할 수 있다. 또한 교수자가 제시하는 예를 토대로 주어진 응답을 평가하거나 질문과 적절한 답변을 생성하는 등 학습자에 대한 진단과 실질적 교육내용의 구성 등 많은 유용성을 가지고 있다. 그러나 생성형 인공지능이 가지고 있는 한계로 인해 정확한 사실이나 지식에 대한 잘못된 전달, 과도한 확신으로 인한 편향, 사용자의 태도나 감정 등에 미칠 영향의 불확실성 등에 대한 문제 등에 대해 해가 없는지 검토가 필요하다. 특히, 생성형 인공지능이 제공하는 응답은 많은 사람들의 응답 데이터를 기반으로 한 확률적 접근이므로 매우 거리가 멀거나 새로운 관점을 제시하는 통찰적 사고나 혁신적 사고를 제한할 우려도 있다. 이에 따라 본 연구는 과학교수학습을 위해 인공지능의 긍정적 활용을 위한 여러 실천적 제언을 제시하였다.

반응형 웹 사이트의 접근성 평가 및 분석 (Evaluation and Analysis of Web Accessibility for the Responsive Web Sites)

  • 박성제;홍순구;김종원
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.47-55
    • /
    • 2016
  • 최근 다양한 디바이스에서의 접근 및 활용을 위한 반응형 웹 기술에 대한 연구와 활용이 급증하고 있다. 그러나 반응형 웹에서의 접근성 준수 및 분석을 수행한 연구는 미흡한 실정이다. 이에 본 연구에서는 웹 구현에서의 중요한 요소인 접근성과 반응형 웹을 접목하여, 국내의 대표적인 반응형 웹 사이트에 대한 접근성을 평가하고 그 결과를 분석하였다. 그 결과 이미지 콘텐츠의 대체텍스트 제공, 키보드 접근과 사용, 포커스의 논리적 이동 및 적절한 제목 제공 등 접근성 오류가 있는 것으로 나타났다. 이는 웹 접근성을 준수하지 않은 오류로서의 문제와 다양한 디바이스에서 접근 및 사용하는 반응형 웹으로서의 목적 및 기능에도 부합하지 않는 것으로 해석되어 그 보완 및 수정의 필요성이 높은 것으로 분석되었다.

내장형 소프트웨어를 위한 성능 평가 로그 분석 방법 (Performance Evaluation in Embedded Software)

  • 곽동규;조용윤;유재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.605-608
    • /
    • 2004
  • 내장형 시스템(embedded system)의 발전에 따라, 더욱 복잡하고 높은 신뢰성을 가지는 내장형 응용프로그램의 개발 필요성이 요구된다. 내장형 소프트웨어의 성능 평가 및 분석 도구는 내장형 소프트웨어 개발 속도와 신뢰성을 높이기 위한 유용한 도구이다. 개발자나 사용자는 성능 평가 결과와 로그 정보를 직관적으로 판단하기 위해 GUI 형태의 결과보고 도구(result report tool)나 뷰어(viewer)를 이용할 수 있다. 그러나 보통의 성능 평가 및 분석 도구가 이용하는 로그 데이터는 텍스트 기반의 저수준 정보이므로, 개발자의 다양한 요구에 맞는 분석 결과보고 도구 나 뷰어를 생성하기 위해서는 로그 정보에 대해 많은 분석 시간과 노력을 기울여야 한다. 본 논문은 내장형 시스템 개발자가 쉽고 편리하게 원하는 GUI 형태의 결과 분석도구를 생성할 수 있도록 하기 위한 프로파일 로그 분석 방법을 제안한다. 제안하는 로그 분석 방법은 저수준의 성능 평가 로그를 분석하여 자료구조화 하는 모듈과 이것을 GUI 형태로 쉽게 변경할 수 있는 API 수준의 함수를 제공한다. 제안하는 로그 분석 방법에 의한 API를 통해 개발자나 사용자는 자신의 취향에 맞는 GUI 형태의 결과 분석 도구를 쉽고 빨르게 생성하여 내장형 소프트웨어 개발의 효율성을 높일 수 있다.

  • PDF