• 제목/요약/키워드: number word

검색결과 706건 처리시간 0.026초

자연수의 혼합계산에 대한 초등학생들과 예비교사들의 오류 분석 (An Analysis on the Error Types of Elementary Students and Pre-service Teachers in Mixed Calculations of Natural Number)

  • 이대현
    • 한국학교수학회논문집
    • /
    • 제20권2호
    • /
    • pp.141-161
    • /
    • 2017
  • 초등학교에서 자연수의 혼합계산은 사칙계산이 섞여 있는 수식의 계산 순서를 알고 해결할 수 있는 능력을 길러 주는데 초점을 두고 있다. 이런 목표에 비추어 본 연구에서는 초등학생 67명과 예비교사 57명을 대상으로 수식과 문장제로 이루어진 검사지를 이용하여 혼합계산에 대한 해결 정도와 오류 유형을 분석하였다. 검사 결과, 초등학생들은 수식과 문장제로 된 혼합계산에서 86.2%와 73.5%의 정답률과 수식에서 계산 순서의 오류, 문장제에서 수식을 구성하지 못하는 오류를 나타내었다. 예비교사들의 경우에 나타난 몇 개의 오류와 해결과정에 비추어 혼합계산이 이루어지는 식의 계산 원리와 규약을 이해할 수 있도록 교과 교육 내용을 유의해서 지도할 필요를 제시하였다. 또한 검사 결과를 통해 혼합계산 시 괄호 사용의 유무와 적절성, 등호 개념의 사용 방법에서 문제점을 확인할 수 있었다.

  • PDF

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

연구 논문의 의미 구조 기반 메타데이터 항목의 자동 식별 처리를 위한 문장 구조 분석 (Analyzing the Sentence Structure for Automatic Identification of Metadata Elements based on the Logical Semantic Structure of Research Articles)

  • 송민선
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.101-121
    • /
    • 2018
  • 본 연구는 연구논문의 논리적 의미 구조 메타데이터 항목에 해당하는 데이터에 담겨 있는 문장의 구성에 따라 시스템에서 적절한 항목으로 자동 식별 처리될 수 있도록 하는, 문장의미론(Sentence Semantics)적 분석 방법을 제안하고자 하는 목적으로 수행되었으며, 의미 구조 메타데이터 항목 중 'Research Objectives'와 'Research Outcomes'에 해당하는 연구 논문 문장의 구조를 어절 수, 접속어 종류, 다수 출현한 단어들의 문장 내 역할, 문장에서 다수 출현한 어미 형태 등을 기준으로 분석해 정리하였다. 연구 결과, 문장들의 어절 수는 'Research Objectives'는 평균 38개, 'Research Outcomes'는 평균 212개로 나타났으며, 접속어의 경우 'Research Objectives'는 인과-순접-대등-환언/요약 관계를 나타내는 접속어 순으로, 'Research Outcomes'는 인과-대등-순접-환언/요약 관계를 나타내는 접속어 순으로 많이 출현한 것으로 파악되었다. 출현빈도가 높은 분석 대상 단어들은 각각 문장 내에서 주어, 목적어, 서술어 역할 등으로 사용되고 있었으며, '역할'이나 '요인', '관계'는 목적이나 결과 부분 모두에서 비슷한 역할을 담당하고 있었지만 '연구'는 같은 단어라도 연구의 목적 부분과 결과 부분에서 사용되는 역할에 차이를 보였다. 마지막으로 문장 내 동사의 어미는 'Research Objectives'에서 '~고자'와 '~였다', 'Research Outcomes'에서 '~었다', '~있다', '~였다'가 많이 출현하였다. 본 연구는 연구자의 학술적 이해형성을 지원하기 위해 연구논문이 담고 있는 공통된 논리적 의미를 반영한 메타데이터 요소의 자동 식별과 입력 방안을 제시하는 데 활용할 수 있는 기초 연구로서 의의가 있다.

텍스트 마이닝을 이용한 건강검진 수요 예측 (Prediction of Physical Examination Demand Using Text Mining)

  • 박경보;김미량
    • 한국IT서비스학회지
    • /
    • 제21권5호
    • /
    • pp.95-106
    • /
    • 2022
  • Recently, physical examinations have become an important strategy to reduce costs for individuals and society. Pre-physical counseling is important for an effective physical examination. However, incomplete counseling is being conducted because the demand for physical examinations is not predicted. Therefore, in this study, the demand for physical examination was predicted using text mining and stepwise regression. As a result of the analysis, the most recent text data showed a high explanatory power of the demand for physical examination. Also, large amounts of data have high explanatory power. In addition, it was found that the high frequency of the text "health food" reduces the number of health examination customers. And the higher the frequency of the text of the word "food", the lower the number of physical examination customers. However, when the word "wild ginseng" was exposed a lot on Twitter, the number of physical examination customers visiting hospitals increased. In other words, customers consume efficiently by comparing the health examination price with the price of consumer goods. The proposed research framework can help predict demand in other industries.

워드임베딩을 활용한 복압성 요실금 관련 연구 동향에 관한 융합 연구 (A Convergence Study of the Research Trends on Stress Urinary Incontinence using Word Embedding)

  • 김준희;안선희;곽경태;원영수;유화익
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.1-11
    • /
    • 2021
  • 본 연구의 목적은 '복압성 요실금'을 키워드로 검색된 연구들의 경향과 특성을 단어 빈도를 통해 분석하고, 워드 임베딩을 사용하여 그 관계를 모델링 하고자 하였다. 의학 서지 데이터베이스인 MEDLINE에 등록되어 있는 복압성 요실금 연구 9,868개 논문들의 초록 문자 데이터를 Python 프로그램을 이용하여 추출하였다. 그런 다음 빈도 분석을 통해 10개의 키워드를 선택하였다. 키워드 관련 단어들의 유사도는 Word2Vec 머신러닝 알고리즘으로 분석하였다. 그리고, t-SNE 기법을 사용하여 단어의 위치와 거리가 시각화하였고, 이에 따라 그룹을 분류하여 이를 분석하였다. 복압성 요실금과 관련된 연구는 1980년대 이후 빠르게 증가했다. 키워드 분석을 통해 논문 초록에서 가장 많이 사용된 키워드는 '여성', '요도', '수술'로 나타났다. Word2Vec 모델링을 통해 복압성 요실금 관련 연구에서 주요 키워드들과 가장 높은 연관성을 나타내는 단어들에는 '여성', '절박', '증상' 등이 있었다. 그리고, t-SNE 기법을 통해 키워드와 관련 단어들은 복압성 요실금의 증상, 신체 기관의 해부학적 특성, 그리고 수술적 중재를 중심으로 하는 3개의 그룹으로 분류될 수 있었다. 본 연구는 초록을 구성하는 단어들의 키워드 빈도 분석 및 워드임베딩 방식을 이용하여 복압성 요실금 관련 연구들의 동향을 살펴본 최초의 연구이다. 본 연구의 결과는 향후 연구자들이 복압성 요실금 관련 연구 분야의 주제와 방향성을 선택하는 데 있어 기초자료로 활용될 수 있을 것이다.

온라인 배너 광고 강화학습의 최적 탐색-활용 전략: 구전효과의 영향 (Optimal Exploration-Exploitation Strategies in Reinforcement Learning for Online Banner Advertising: The Impact of Word-of-Mouth Effects)

  • 김범수;유건재;이준겸
    • 서비스연구
    • /
    • 제14권2호
    • /
    • pp.1-17
    • /
    • 2024
  • 온라인 배너 광고 산업에서는 일반적으로 복수의 배너 대안이 제작된다. 이때 중요한 의사결정은 어떤 광고 배너 대안을 선택해서 고객에게 노출하느냐 하는 것이다. 각 배너 대안을 고객이 클릭할 확률을 미리 알 수 없기 때문에 경영자는 실험적으로 여러 대안을 노출한 후, 고객의 클릭 여부에 따라 각 대안의 클릭 확률을 추정하며 최적의 대안을 찾아야 하고 이것은 온라인 광고와 관련된 강화학습 프로세스이다. 이 과정에서의 주요 의사결정 문제는 축적된 추정 클릭 확률 지식을 이용해서 최적의 대안을 노출하는 활용 전략과, 잠재적으로 더 우수한 대안을 찾기 위해 새로운 대안을 시도해보는 탐색 전략의 최적 균형점을 찾는 것이다. 본 연구는 구전효과와 대안의 수가 이러한 최적 탐색-활용 전략에 미치는 영향을 분석하였다. 이는 고객이 노출된 배너를 클릭하는 경우 관련 제품을 주위에 홍보하는 과정을 통해 광고 배너의 클릭률이 높아지는 구전효과를 온라인 광고 관련 강화학습에 추가하여 구현한 것이다. 분석을 위해 Multi-Armed Bandit 모형을 이용한 시뮬레이션 기법을 사용하였다. 분석 결과, 구전효과의 크기가 커지고 배너 대안의 수가 적을수록 광고 강화학습의 최적 탐색 수준이 높아지는 것이 관측되었다. 이는 구전효과에 의해 고객이 광고 배너를 클릭할 확률이 증가함에 따라 기존에 축적했던 추정 클릭률 지식의 가치가 낮아지고, 따라서 새로운 대안을 탐색하는 것의 가치가 증가하기 때문으로 분석되었다. 또한 광고 대안의 수가 작을 경우에는 구전효과 크기가 커질 때 최적 탐색 수준이 더 큰 폭으로 증가하는 경향을 발견하였다. 최근 온라인 구전으로 인해 구전효과의 영향이 커지는 시점에서 본 연구는 의미 있는 시사점을 제공한다.

운율 정보를 이용한 한국어 위치 정보 데이타의 발음 모델링 (Pronunciation Variation Modeling for Korean Point-of-Interest Data Using Prosodic Information)

  • 김선희;박전규;나민수;전재훈;정민화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.104-111
    • /
    • 2007
  • 본 논문은 두 가지의 구조적 운율 정보, 즉 운율어와 음절수를 이용하여 한국어 위치 정보 데이타의 발음모델링을 수행할 경우에 음성인식기의 성능을 평가하는 것을 목표로 하는 이다. 먼저, 위치 정보 데이타가 운율어로 구성되어 있다는 전제 하에 운율어를 이용하여 위치 정보 데이타의 가능한 모든 발음을 생성하고, 다시 음절수를 기준으로 발음변이 수를 조절하는 방법을 제시하였다. 제안한 방법에 의하여 9개의 테스트 세트와 9개의 학습 세트로 총 81개의 실험을 통하여 음성인식의 성능을 평가하였다. 실험 결과 운율어를 이용하여 발음 사전을 제작한 모든 경우에 베이스라인과 비교하여 성능이 향상되었다. 음절수에 따라서 발음 변이의 수를 조절한 결과도 전체적으로는 3음절로 그 수를 제한한 경우에 가장 좋은 인식 성능을 얻을 수 있어서, 음절수에 따른 발음 변이 수의 조절이 효과적임을 알 수 있었다. 제안한 방법과 같이 운율어와 음절수를 이용한 경우에 베이스라인의 WER 4.63%에서 최대 8.4%의 WER가 감소하였다.

과학적 소양 관련 논문에서 서술자의 종류와 빈도 특성 연구 (A Study of the Kinds and Frequency Characteristics of Descriptors in the Articles Related to Scientific Literacy)

  • 이명제
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제29권4호
    • /
    • pp.401-413
    • /
    • 2010
  • This study analyzed the kinds and frequencies of descriptors in 154 articles in ERIC data base on the 4th day of January in 2010. The titles of the articles includes the words, 'scientific literacy'. As each descriptor is constituted of two words and over, in this study the first word in the descriptor was defined as 'restrictive word' and the rest word(s) as 'target word(s)'. The results are as follows. First, the descriptors which show high frequencies of target words are the traditionally important themes of scientific literacy education. Target words which show relatively high frequency are 'education', 'literacy', 'instruction' and 'countries'. Low frequency word is 'curriculum', which has various restrictive words and represents wide differentiation. Second, among the descriptors which show low frequencies of target words, relatively high frequency descriptors are '(and)society', 'change', 'secondary education', 'concepts', and 'biology', which have been given more attention in scientific literacy research than the rest descriptors. Third, the number of the descriptors that shows largely distributed pattern A, which happens over 15 years continuously, is over the half of all analyzed descriptors, which shows that they have been the major objectives in researches about scientific literacy. Most descriptors of pattern A shows normal distribution of frequency or the trends of increasing frequency as the time is nearer. Fourth, The descriptors are divided into four groups according to the time span. Each research trends are as follows. In later 80s, the research which emphasizes the importance of the sociality and technology in all level school science curriculum. In later 90s the research for educational change of inquiry-centered science curriculum which considers technological literacy in social contexts. In earlier 2000s the research that scientists and science teachers develop science curricula mostly related to scientific principles and thinking in chemistry and biology especially. In later 2000s case studies which relates teaching methods and science process activities to students' attitudes, scientific concepts and curricula.

  • PDF

개봉 전 후 영화의 구전효과와 판촉방식에 따른 인구통계학적 집단 간의 차이에 관한 연구 (A Study to Compare between Groups Glassified by Demographic Characteristic into Effects of Word of Mouth and Methods of Sales Promotion in Intention of Watching Movies)

  • 김양석;이보영
    • 벤처창업연구
    • /
    • 제10권6호
    • /
    • pp.59-68
    • /
    • 2015
  • 영화흥행에 있어서 구전의 영향력을 높이기 위해서는 구전의 효과를 분석하는 것이 중요하다. 그리고 영화의 흥행성공을 위해서는 구전활동과 더불어 사은품이나 경품, 가격할인과 같은 다양한 판촉활동을 병행하는 것이 필요하다. 본 연구는 개봉 전 후 영화의 구전효과와 영화의 판촉방식에 의한 소비자의 영화의 관람의도를 파악한 후 그 표본을 인구통계학적 방식으로 구분하고 그 집단 간의 차이 비교를 연구의 목적으로 한다. 기존 영화의 구전활동이나 판촉방식과 관련한 연구들이 이론적 근거에 치중한 반면, 본 연구에서는 현 시점에서 영화 제작사나 상영관, 그리고 배급사와 제휴사 등에 의하여 실제로 실시되고 있는 판촉방식을 사례로 들어 영화판촉과 관련한 사회현상을 이론화하였다는데 그 의의를 찾을 수 있다. 서울 시내 소재 B대학교 재학생 500여명을 대상으로 설문지를 배포하여 379부가 회수되었으며 불성실하게 응답한 10부를 제외하고 연구에는 총 369부의 설문지를 대상으로 연구를 진행하였다. Likert 5점 척도로 문항을 설정하고 상당한 의향이 있는 경우를 5점, 전혀 의향이 없는 경우를 1점으로 정하여 설문지를 제작하였다. 남녀 간, 전공계열 별 월평균 영화관람 횟수에 따라서 각각 T분석과 ANOVA분석을 실시하고 집단 간 비교분석을 시행한 후 사후분석을 실시하였다. 연구의 결과는 다음과 같다. 첫째, 영화의 판촉방식에 있어서 경품의 경우 남성에게 더 효과적이고 사은품의 경우 여성에게 더 효과적이었다. 둘째, 예술계열에 재학중인 학생들과 인문사회계열이나 자연계열에 재학 중인 학생들 간에 판촉방식에 따른 영화관람 의도에 차이가 있을 것이라는 예상과는 달리 그 차이를 찾아볼 수 없었다. 셋째, 판촉방식별로 구분해 보면 경품의 경우 월 평균 영화 관람 횟수에 따른 집단 간에 차이가 없었으나, 사은품 지급이나 가격할인의 경우 월 평균 영화 관람 횟수에 따른 집단 간에 영화관람 의도와 관련하여 차이를 발견할 수 있었다. 특히 구전효과의 경우 월 평균 1회 미만의 영화관람 집단과 1~2회 집단, 2~3회 집단 그리고 3회 이상과의 집단 간에 차이를 확인할 수 있었다. 넷째, 판촉 방식 중 가장 큰 효과가 있었던 것은 영화의 개봉 전 후 구전효과에 의한 관람의도였다. 따라서 영화의 제작사나 배급사에서 영화의 홍보 활동을 실시할 경우, 전문가 의견, 네티즌 평가 그리고 SNS 등 영화와 관련한 구전활동에 더욱 큰 관심을 두고 진행하여야 한다.

  • PDF

한국표준 학령전기용 단음절어표 (Korean Standard Monosyllabic Word Lists for Preschoolers, KS-MWL-P)의 심리음향기능곡선 연구 (A Study of Psychometric Function Curve for Korean Standard Monosyllabic Word Lists for Preschoolers (KS-MWL-P))

  • 신현욱;김진숙
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.534-541
    • /
    • 2009
  • 아동을 위한 단어인지도 검사 (word recognition test, WRT)는 아동의 의사소통장애정도를 진단하고, 보청기 사용을 위한 처방을 하고, 청각재활과 언어치료의 계획을 수립하고, 병변부위를 판단하는데 유용하게 사용될 수 있다. 한국표준 학령전기용 단음절어표 (Korean standard monosyllabic word lists for preschoolers, KS-MWL-P)는 문헌에서 주어진 기준을 고려하여 개발되었다. 그러나 KS-MWL-P의 저자들은 어표의 개발과정 중 단지 8명만 참여하여 분석된 심리음향 기능곡선을 검증하기 위하여 더 많은 대상을 포함한 연구를 제안하였다. 그러므로 본 연구의 목적은 KS-MWL-P 어표의 제한성을 보완하기 위하여 심리음향기능분석으로 어표의 동질성을 연구하고자 한다. 정상청력을 가진 23명의 학령전기아동을 대상으로 100개의 KS-MWL-P단어가 그림과 함께 제시되었다. -10에서 40 dB dBIH.까지 여러 강도에서 각 단어의 인지도 검사를 계산하여 20%와 80% 정답률 기준의 선형기울기로 심리음향기능곡선을 수집하고 분석하였다. 연구결과 강도에 따라 정답률이 증가하는 S자형 심리음향기능곡선이 나타났고 각 단어와 표간 통계적 유의성은 나타나지 않았다. 표간 유사한 그래프 형태를 통해 우수한 동질성을 보여주었고 표 1,2,3,4의 평균기울기는 4.48, 3.86, 4.65, 4.50 이었으며 일원 분산분석으로 분석할 때 표간 유의성이 없는 것 (p>0.05)으로 나타나서 표간 난이도의 동질성에 문제가 없는 것으로 확인되었다. 그리고 항목 번호의 순서에 따른 기울기의 P값도 표 1, 2, 3, 4에서 0.93, 0.59, 0.91, 0.70으로 모두 유의하지 않아 모든 표에서 $1{\sim}10$, $1{\sim}20$, $1{\sim}25$의 항목간 차이는 없는 것으로 나타났다. 그러나 KS-MWL-P는 낮은 번호의 항목은 더 어린 연령을 위하여 쉬운 단어로 배치하고자 하였으나 본 연구결과는 그렇지 못한 것으로 나타났다. 이러한 점을 고려할 때 어린 연령대를 위한 쉬운 단어가 낮은 항목에 배치되도록 항목의 배치를 재조정하여야 할 것으로 사료된다. 이러한 점을 제외하면 결론적으로 KS-MWL-P는 학령전기를 위한 임상과 재활의 평가 및 훈련도구로 유용한 것으로 입증되었다.