• 제목/요약/키워드: 과학 텍스트

검색결과 601건 처리시간 0.033초

2015 개정 교육과정의 교과서에 제시된 '한반도의 지질' 내용 비교: 지구과학 II 및 한국지리 교과서를 중심으로 (Comparison of Content related to 'Geology of the Korean Peninsula' presented in the Textbooks of the 2015 Revised Curriculum: Focused on Earth Science II and Korean Geography Textbooks)

  • 박경진
    • 한국지구과학회지
    • /
    • 제44권3호
    • /
    • pp.236-252
    • /
    • 2023
  • 지구과학 II 및 한국지리 교과서는 '한반도의 지질'과 관련된 내용을 공통적으로 중요하게 다루고 있다. 이 연구는 지구과학 II 및 한국지리 교과서에 제시된 '한반도의 지질' 관련 내용의 차이를 분석하고, 차이가 있다면 최신 과학 지식과의 일치 여부를 비교하기 위한 것이다. 이를 위하여 2015 개정 교육과정에서 발간된 교과서 7종(지구과학 II 4종, 한국지리 3종)을 분석 대상으로 선정하고, 한반도의 지체구조, 지질 연대 자료 및 지질시대별 지질학적 특성의 설명 텍스트에 대한 차이를 비교하였다. 분석 결과, 한반도의 지체구조와 관련된 용어, 명칭, 분포 범위에서 교과서 간에 불일치 사례가 발견되었다. 한반도의 지질 연대 자료도 불일치 사례를 보였는데, 한국지리 교과서의 경우 오래된 자료를 인용하여 최신 과학 지식과의 차이를 보였다. 또한, '한반도의 암석 분포', '평안누층군의 특징', '고생대의 대결층'에 대한 설명 텍스트에서 불일치 사례가 발견되었다. 지구과학 및 지리 교과는 중복되는 내용 요소가 많기 때문에 교과 간의 내용 차이를 최소화하는 노력이 필요하며, 이를 위해서는 최신의 과학 지식을 반영한 적절한 내용을 선정하여 교과에 관계없이 일관성 있게 제시하는 것이 중요하다.

QualityRank : 소셜 네트워크 분석을 통한 Q&A 커뮤니티에서 답변의 신뢰 수준 측정 (QualityRank : Measuring Authority of Answer in Q&A Community using Social Network Analysis)

  • 김덕주;박건우;이상훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권6호
    • /
    • pp.343-350
    • /
    • 2010
  • 질문(Question)과 답변(Answer)을 하는 커뮤니티 기반의 지식검색서비스에서는 질의를 통해 원하는 답변을 얻을 수 있지만, 수많은 사용자들이 참여함에 따라 방대한 문서 속에서 신뢰성있는 문서를 찾아내는 것은 점점 더 어려워지고 있다. 지식검색서비스에서 기존 연구는 사용자들이 생성한 데이터 즉 추천수, 조회수 등의 비텍스트 정보를 이용하거나 답변의 길이, 자료첨부, 연결어 등의 텍스트 정보 이용하여 문서의 품질을 평가하고, 이를 검색에 반영하여 검색성능을 향상시키는 데 활용했다. 그러나 비텍스트 정보는 질의/응답의 초기에 사용자들에 의해 충분한 정보를 확보할 수 없는 단점이 있으며, 텍스트 정보는 전체의 문서를 답변의 길이, 연결어등과 같은 일부요인으로 판단해야하기 때문에 품질평가의 한계가 있다고 볼 수 있다. 본 논문에서는 이러한 비텍스트 정보와 텍스트 정보의 문제점을 개선하기 위한 QualityRank 알고리즘을 제안한다. QualityRank는 텍스트/비텍스트 정보와 소셜 네트워크 분석 기반의 사용자 중앙성을 고려하여 질문에 적합하고 신뢰성 있는 답변을 랭킹화 한다 실험결과 제안한 알고리즘을 사용했을 경우 텍스트/비텍스트 모델 보다 랭킹성능에 있어 향상된 결과를 얻을 수 있었다.

감정 온톨로지의 구축을 위한 구성요소 분석 (Component Analysis for Constructing an Emotion Ontology)

  • 윤애선;권혁철
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.157-175
    • /
    • 2010
  • 의사소통에서 대화자 간 감정의 이해는 메시지의 내용만큼이나 중요하다. 비언어적 요소에 의해 감정에 관한 더 많은 정보가 전달되고 있기는 하지만, 텍스트에도 화자의 감정을 나타내는 언어적 표지가 다양하고 풍부하게 녹아들어 있다. 본 연구의 목적은 인간언어공학에 활용할 수 있는 감정 온톨로지를 구축할 수 있도록 그 구성요소를 분석하는 데 있다. 텍스트 기반 감정 처리 분야의 선행 연구가 감정을 분류하고, 각 감정의 서술적 어휘 목록을 작성하고, 이를 텍스트에서 검색함으로써, 추출된 감정의 정확도가 높지 않았다. 이에 비해, 본 연구에서 제안하는 감정 온톨로지는 다음과 같은 장점이 있다. 첫째, 감정 표현의 범주를 기술 대상과 방식에 따라 6개 범주로 분류하고, 이들 간 상호 대응관계를 설정함으로써, 멀티모달 환경에 적용할 수 있다. 둘째, 세분화된 감정을 분류할 수 있되, 감정 간 차별성을 가질 수 있도록 24개의 감정 명세를 선별하고, 더 섬세하게 감정을 분류할 수 있는 속성으로 강도와 극성을 설정하였다. 셋째, 텍스트에 나타난 감정 표현을 명시적으로 구분할 수 있도록, 경험자 기술 대상과 방식 언어적 자질에 관한 속성을 도입하였다. 넷째, 본 연구의 감정분류는 Plutchik의 분류와 호환성을 갖고 있으며, 언어적 요소의 기술에서 국제표준의 태그세트를 수용함으로써, 다국어 처리에 활용을 극대화할 수 있도록 고려했다.

  • PDF

감성 패턴을 이용한 영화평 평점 추론 (A Rating Inference of Movie Reviews Using Sentiment Patterns)

  • 김정호;인주호;채수환
    • 감성과학
    • /
    • 제17권1호
    • /
    • pp.71-78
    • /
    • 2014
  • 본 연구는 보다 정확한 텍스트의 감성 분석을 위해 새로운 감성 특징인 감성 패턴을 제안하고, 이를 이용한 영화평 평점 추론에 대해 소개한다. 텍스트 감성 분석은 텍스트에 포함된 감성인 긍정과 부정을 인식하고 분류하는 작업으로, 이를 위해 감성 특징인 감성 단어와 구문 패턴을 이용한다. 텍스트 내에 존재하는 감성 단어와 구문 패턴의 감성을 통해 텍스트 전체의 감성을 분류하는 것이다. 하지만, 기존 감성 분석은 감성 단어와 구문 패턴의 감성을 독립적으로 고려하기 때문에 문장 혹은 글 전체의 감성 정보를 정확히 파악하기 어렵다는 한계를 가지고 있다. 그러므로 본 연구는 기존 감성 특징들을 독립적으로 고려하는 것뿐만 아니라 문장 내에서 출현하는 감성들을 의미적으로 연결하여 하나의 패턴으로 정의한 감성 패턴을 제안하고, 감성 분석의 세부 연구 주제인 평점 추론에 감성 패턴을 새로운 감성 특징으로 사용하였다. 제안하는 감성 패턴의 효과를 검증하기 위해 영화평에 대한 평점 추론 실험을 수행하였다. 감성 패턴을 포함한 모든 감성 특징들을 사전에 정의한 학습 영화평들로부터 추출하고, 이를 확률 기법을 이용해 실험 영화평들의 평점을 추론하였다. 그 결과 감성 패턴을 사용하였을 경우 기존 감성 특징들만 사용했을 때 보다 추론한 평점이 더욱 정확함을 확인하였다.

소셜미디어 분석을 통한 전고체 배터리 감성분석과 이슈 탐색 (Sentiment Analysis and Issue Mining on All-Solid-State Battery Using Social Media Data)

  • 이지연;이병희
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.11-21
    • /
    • 2022
  • 전고체 배터리는 차세대 배터리의 유력 후보 중 하나로 특히 미래 전기차 산업을 이끌 핵심 부품으로 주목받고 있다. 본 연구에서는 글로벌 소셜미디어인 레딧(Reddit)의 전고체 배터리 관련 댓글 10,280건을 분석하여 전고체 배터리와 관련된 정책 이슈 및 대중의 관심사를 파악한다. 수집된 글로벌 데이터에 빈도분석, 연관규칙분석, 토픽모델링 등 텍스트마이닝 기법과 감성분석을 적용하여 세계적 동향을 읽고, 이를 우리 정부의 전고체 배터리 발전전략과 비교 및 관련 국가R&D의 정책적 방향을 제시하고자 한다. 분석 결과, 2016년부터 2021년까지의 전고체 배터리 이슈에 대한 전반적인 감성은 긍정이 50.5%, 부정이 39.5%로 긍정인 것으로 나타났다. 또한 세부 감성을 분석한 결과, 대중들은 전고체 배터리에 대해 신뢰와 기대를 가지고 있음과 동시에 해결되지 않은 기술적 문제들에 대한 두려움과 우려의 감정이 공존함을 알 수 있었다. 본 연구에서는 전고체 배터리와 관련된 핵심 이슈 도출을 위한 텍스트마이닝 분석 방법을 적용하였고, 정부 정책 분석을 바탕으로 한 하향식 접근방법과 대중의 인식을 분석하는 상향식 접근방법을 수용하여, 보다 포괄적인 동향 분석 방법을 제시하였다.

지형 과학 자료 관리를 위한 공개 소프트웨어 기반 Web-GIS 시스템 모델 (A Web-GIS System Model on Public Domain Softwares for Managing of Geographical Science Data)

  • 이희두;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.656-658
    • /
    • 1998
  • 환경, 생물 다양성, 기상 등의 많은 과학 자료들을 과학적으로 표현하고 관리하기 위해서는 지리 정보를 사용할 필요가 있다. 이러한 자료 관리 주체 대부분은 환경 단체, 지방 단체, 연구 단체들이고 이러한 단체의 수가 많고 지역적으로 분산되어 있다는 특성이 있다. 때문에 고가의 상업용 GIS 소프트웨어에 의존하여 엄청난 외화 지불을 야기하고 국내 GIS 기반 기술의 축적을 어렵게 하는 현재의 국내 상황은 적절치 않다. 본 논문은 이러한 상황을 타개하기 위한 하나의 대안으로서 공개 소프트웨어 기반한 Web-GIS 시스템 모델을 제안한다. 이 모델에서는 공간 자료 관리를 위해서는 GRASS, 텍스트 및 멀티미디어 자료 관리는 MySQL, 이들을 하나로 통합 운용하고 웹에 접속하기 위해서 GRASSLinks와 CGI를 사용한다.

  • PDF

문헌정보와 유전자 발현 및 상호 작용 데이터를 통합, 암의 단계를 고려한 질병 유전자 예측 방법 (The gene prediction method considering stages of cancer, obtained by integrating gene expression, genetic interaction data and document)

  • 김정림;여윤구;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1113-1116
    • /
    • 2013
  • 유전체에 대한 관심이 크게 증가하면서, 이에 따른 다양한 연구가 이루어졌다. 그 결과 유전체와 관련된 다양한 종류의 데이터가 얻어졌으며, 그것을 해석하고 다른 데이터와 통합하는 것이 중요한 연구과제 중 하나가 되었다. 본 논문은 유전자 상호작용(genetic interaction) 데이터, 유전자 발현 데이터, 문헌으로부터 텍스트마이닝 기술을 통해 얻은 이종(heterogeneous) 데이터를 통합하여 암과 관련이 있는 유전자를 찾는 실험을 수행하였다. 또한, 단순히 질병(disease)-정상(normal)의 대조가 아니라 암의 단계(stage)를 고려한 실험을 수행하였다. 데이터를 통합하지 않거나 암의 단계를 고려하지 않았을 경우에 비하여 제안하는 방법이 더 높은 유전자 예측 성능을 나타냈다.

언론 기사에 나타난 신(조)어 조사 도구의 설계 및 구현 (Design and Implementation of Detecting Tool for New Word in Korean Journal Articles)

  • 송인성;정희석;이상곤;이래호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.114-117
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고 새롭게 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하고 이 기사에서 사전의 표제어와 기존에 조사된 신어를 제외하여 국어 전공자가 신어를 찾아내는 작업을 하는데 사용하는 시스템을 설계하고 구현하였다.

가변 속성 포스팅 구조의 설계 (A Design of Variable Attributes Posting Structures)

  • 안후영;이승희;박영호;이종훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.759-760
    • /
    • 2009
  • 최근, 이질적인 형태의 멀티미디어 데이터들의 증가와 함께, 멀티미디어 콘텐츠들의 저장 및 검색의 중요성이 대두되고 있다. 기존의 검색 엔진들은 대부분 텍스트 데이터만을 대상으로 하고 있으며, 특별한 도메인에서는 객체 지향 데이터베이스, 객체 관계 데이터베이스 등 별도의 데이터베이스를 활용하여 검색에 사용하고 있다. 본 논문에서는 다양한 멀티미디어 콘텐츠들의 저장 및 색인에 유연한 가변 속성 포스팅 구조를 제안한다. 제안하는 가변 포스팅 구조는 벡터의 개념을 사용하여 포스팅의 속성을 추가할 수 있게 하였다. 본 논문에서 제안하는 포스팅 구조는 이질적인 형태의 멀티미디어 콘텐츠들을 각 콘텐츠들의 속성에 따라 가변적으로 저장 구조를 정의하고, 이에 따라 인덱스를 구축할 수 있는 확장성 있는 방안이다.

텍스트 구성요소 판별 기법과 자질을 이용한 문서 요약 시스템의 개발 및 평가 (Development and Evaluation of a Document Summarization System using Features and a Text Component Identification Method)

  • 장동현;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.678-689
    • /
    • 2000
  • 논 본문은 문서의 주요 내용을 나타내는 문장을 추출함으로써 요약문을 작성하는 자동 요약 기법에 대해 기술하고 있다. 개발한 시스템은 문서 집합으로부터 추출한 어휘적, 통계적 정보를 고려하여 요약 문장을 작성하는 모델이다. 시스템은 크게 두 부분, 학습과정과 요약과정으로 구성이 된다. 학습 과정은 수동으로 작성한 요약문장으로부터 다양한 통계적인 정보를 추출하는 단계이며, 요약 과정은 학습 과정에서 추출한 정보를 이용하여 각 문장이 요약문장에 포함될 가능성을 계산하는 과정이다. 본 연구는 크게 세 가지 의의를 갖는다. 첫째, 개발된 시스템은 각 문장을 텍스트 구성 요소의 하나로 분류하는 텍스트 구성 요소 판별 모델을 사용한다. 이 과정을 통해 요약 문장에 포함될 가능성이 없는 문장을 미리 제거하는 효과를 얻게 된다. 둘째, 개발한 시스템이 영어 기반의 시스템을 발전시킨 것이지만, 각각의 자질을 독립적으로 요약에 적용시켰으며, Dempster-Shafer 규칙을 사용해서 다양한 자질의 확률 값을 혼합함으로써 문장이 요약문에 포함될 최종 확률을 계산하게 된다. 셋째, 기존의 시스템에서 사용하지 않은 새로운 자질 (feature)을 사용하였으며, 실험을 통하여 각각의 자질이 요약 시스템의 성능에 미치는 효과를 알아보았다.

  • PDF