• 제목/요약/키워드: data labeling

검색결과 474건 처리시간 0.02초

데이터 라벨링 중심의 머신러닝 교육이 초등학생 컴퓨팅 사고력에 미치는 효과 (Effect of Machine Learning Education Focused on Data Labeling on Computational Thinking of Elementary School Students)

  • 문우종;김봄솔;김정아;김봉철;서영호;오정철;김용민;김종훈
    • 정보교육학회논문지
    • /
    • 제25권2호
    • /
    • pp.327-335
    • /
    • 2021
  • 본 연구는 초등학생의 컴퓨팅 사고력을 향상시키기 위한 교육 방법으로 데이터 라벨링 중심의 머신러닝 교육 프로그램을 개발하여 적용한 후 그 효과를 검증하였다. 교육 프로그램은 현직 초등학교 교사 100명을 대상으로 실시한 사전 요구분석 결과를 바탕으로 설계 및 개발을 진행하였다. 개발한 교육 프로그램의 효과를 검증하기 위하여 K 초등학교에 재학 중인 6학년 학생 17명을 대상으로 1일 2차시씩 총 6주간 12차시의 교육을 진행하였다. 해당 교육이 컴퓨팅 사고력 향상에 미친 효과를 측정하기 위해 ' 버챌린지(Bebras Challenge)'를 활용하여 사전 사후 검사를 진행하여 교육적 효과를 분석하였다. 분석 결과 데이터 라벨링 중심의 머신러닝 교육이 초등학생의 컴퓨팅 사고력 향상에 기여한 것으로 나타났다.

Indoor Path Recognition Based on Wi-Fi Fingerprints

  • Donggyu Lee;Jaehyun Yoo
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제12권2호
    • /
    • pp.91-100
    • /
    • 2023
  • The existing indoor localization method using Wi-Fi fingerprinting has a high collection cost and relatively low accuracy, thus requiring integrated correction of convergence with other technologies. This paper proposes a new method that significantly reduces collection costs compared to existing methods using Wi-Fi fingerprinting. Furthermore, it does not require labeling of data at collection and can estimate pedestrian travel paths even in large indoor spaces. The proposed pedestrian movement path estimation process is as follows. Data collection is accomplished by setting up a feature area near an indoor space intersection, moving through the set feature areas, and then collecting data without labels. The collected data are processed using Kernel Linear Discriminant Analysis (KLDA) and the valley point of the Euclidean distance value between two data is obtained within the feature space of the data. We build learning data by labeling data corresponding to valley points and some nearby data by feature area numbers, and labeling data between valley points and other valley points as path data between each corresponding feature area. Finally, for testing, data are collected randomly through indoor space, KLDA is applied as previous data to build test data, the K-Nearest Neighbor (K-NN) algorithm is applied, and the path of movement of test data is estimated by applying a correction algorithm to estimate only routes that can be reached from the most recently estimated location. The estimation results verified the accuracy by comparing the true paths in indoor space with those estimated by the proposed method and achieved approximately 90.8% and 81.4% accuracy in two experimental spaces, respectively.

준지도 학습 기반 객체 탐지 모델에서 데이터셋 변화에 따른 성능 변화 (Performance Change accroding to Data Set Size Change in Semi-Supervised Learning based Object Detection)

  • 유승수;황원준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.88-90
    • /
    • 2022
  • Semi Supervised Learning 은 일부의 data 에는 labeling 을 하고 나머지 data 에는 labeling 을 안한채로 학습을 진행하는 방법이다. Object Detection 은 이미지에서 여러개의 객체들의 대한 위치를 여러개의 바운딩 박스로 지정해서 찾는 Computer Vision task 이다. 당연하게도, model training 단계에서 사용되는 data set 의 크기가 크고 객체가 많을 수록 일반적으로 model 의 성능이 좋아 질 것이다. 하지만 실험 환경에 따라 data set 을 잘 확보하지 못하던가, 실험 장치가 데이터 셋을 감당하지 못하는 등의 문제가 발생 할 수 있다. 그렇기에 본 논문에서는 semi supervised learning based object detection model 을 알아보고 data set 의 크기를 조절해가며 modle 을 training 시킨 뒤 data set 의 크기에 따라 성능이 어떻게 변화하는 지를 알아 볼 것이다.

  • PDF

추론 및 비교사학습 기법 기반 레이블링을 적용한 탐지 모델 (A Detection Model using Labeling based on Inference and Unsupervised Learning Method)

  • 홍성삼;김동욱;김병익;한명묵
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.65-75
    • /
    • 2017
  • 탐지 모델은 인공지능 기법들이나 데이터 마이닝 기법, 또는 지능형 알고리즘들을 이용하여 어떠한 목적에 맞는 결과를 찾고자 하는 모델들이다. 사이버 보안에서는 주로 침입탐지, 악성코드 탐지, 침해사고 탐지, 공격 탐지로 활용되고 있다. 보안데이터와 같은 실제 환경에 수집되는 데이터들을 레이블이 되지 않은 데이터들이 많다. 클래스 레이블이 정해지지 않아 유형을 알 수 없는 데이터가 많아 정확한 탐지 및 분석을 하기 위해서는 레이블 결정과정이 필요하다. 본 논문에서 제안하는 방법은 레이블 결정을 위해 D-S 추론 알고리즘과 비교사 방법인 k-means 알고리즘을 적용하여 각 데이터의 레이블을 융합하여 결정할 수 있는 KDFL(K-means and D-S Fusion based Labeling)제안하였으며 이를 적용한 탐지 모델 구조를 제안하였다. 제안하는 방법은 실험을 통해 기존의 방법에 비해 탐지율, 정확도, F1-measure 성능 지표에서 우수한 성능을 나타냈다. 또한 오류율도 크게 개선된 결과를 나타내어 제안하는 방법의 성능을 검증할 수 있었다.

합성수지제 및 유리제 식품용 기구의 라벨 표시사항에 대한 소비자 활용도 및 인식도 분석 (Analysis on Consumer Use and Perception on Labeling of Cooking Utensils Made of Plastic and Glass)

  • 김명신;김효정;김미라
    • 한국생활과학회지
    • /
    • 제19권1호
    • /
    • pp.167-177
    • /
    • 2010
  • This study examined consumer perception and use on labeling of cooking utensils made of plastic and glass to get information about improving the labeling. The data were collected from 505 adults in Seoul, Busan, Daegu, Daejeon, Incheon, and Gwangju. The data were analyzed by SPSS Windows V.14.0. Frequencies, t tests, one-way analysis of variance, and Duncan's multiple range tests were carried out. Many respondents checked off 'precautions in use' more than any other notice when they purchased the cooking utensils made of plastic and glass. Respondents were dissatisfied with the letter size and intelligibility of foreign language on the labeling. Most respondents preferred 'tag' for most cooking utensils made of plastic and glass. In addition, on necessity of precautions for each category of plastic cooking utensils, frying pans, plastic baskets, plastic water buckets, plastic seasoning bottles, the frying pan showed the highest need for 'do not place close to the fire'. Plastic cups and plastic containers showed the highest in 'whether utensils could be used in the microwave oven and accompanying precautions', and plastic cutting board showed the highest in 'matters relating to washing before use.' In the case of cooking utensils made of glass, 'precaution on shock' was the highest for glass cups and mugs and 'whether utensils could be used in the microwave oven and accompanying precautions' was the highest for glass pans, dishes and containers.

고령층을 위한 웹 사이트 정보 구조 평가: 조직화 체계와 레이블링 체계를 중심으로 (An Evaluation of Website Information Architecture for Old Adults: Focused on Organization and Labeling System)

  • 서지웅;김희섭
    • 정보관리학회지
    • /
    • 제33권1호
    • /
    • pp.181-196
    • /
    • 2016
  • 본 연구의 목적은 고령층을 위한 웹 사이트의 정보 구조를 조직화 체계와 레이블링 체계의 측면에서 평가하는데 있다. 본 연구의 목적을 달성하기 위하여 고령자들이 비교적 많이 이용하는 국내 웹 사이트 한 곳(네이버)을 선정하고, 실험참가자들은 주어진 세 가지의 정보탐색 과제를 수행한 후, 사후 설문과 필요한 경우 추가적인 인터뷰를 통하여 총 74명의 실험 데이터를 수집하였다. 수집된 데이터는 SPSS Ver.20으로 통계분석을 실시했다. 연구 결과를 요약하면, 실험대상으로 선정한 웹 사이트는 정보 구조의 조직화 측면에서 실험참가자들에게 긍정적인 평가를 받았는데, 특히 콘텐츠의 체계적인 주제별 분류와 시간순이나 연대순 브라우징에 대하여 긍정적이었다. 또한 실험참가자들은 단어 레이블보다 아이콘 레이블을 더 잘 이해하는 것으로 파악되었고, 이는 실험참가자 개인의 학습정도에 따라 차이가 있는 것으로 나타났다.

액티브 러닝을 활용한 영상기반 건설현장 물체 자동 인식 프레임워크 (Automated Vision-based Construction Object Detection Using Active Learning)

  • 김진우;지석호;서준오
    • 대한토목학회논문집
    • /
    • 제39권5호
    • /
    • pp.631-636
    • /
    • 2019
  • 최근 많은 연구자들이 대규모 현장에 투입된 건설자원의 유형과 위치를 자동 파악하는 영상분석기술을 활발히 개발하고 있다. 하지만 기존의 방법들은 인식하고자 하는 건설 물체(작업자, 중장비, 자재 등)를 학습용 이미지 데이터에 표시하는 Labeling 작업을 요구하고 이에 불필요한 시간과 노력이 낭비된다는 한계가 있다. 이러한 한계를 보완하기 위해서 본 연구는 액티브 러닝을 활용한 영상기반 건설현장 물체 자동 인식 프레임 워크를 제안함을 목표로 한다. 개발 프레임워크 검증을 목적으로 건설분야 Benchmark 데이터셋을 이용하여 실제 실험을 진행하였다. 그 결과, 액티브 러닝을 통해 학습한 모델은 다양한 특성을 지닌 건설물체를 성공적으로 인식할 수 있었고, 기존의 학습 DB 구축 방식과 비교할 때 더 적은 데이터 수와 반복학습 횟수로도 높은 성능을 가지는 영상분석모델을 개발할 수 있었다. 결과적으로 기존에 요구되던 학습 DB 구축을 위한 Labeling 작업을 줄일 뿐만 아니라 총 시간과 비용을 최소화할 수 있다.

An Ontology-Based Labeling of Influential Topics Using Topic Network Analysis

  • Kim, Hyon Hee;Rhee, Hey Young
    • Journal of Information Processing Systems
    • /
    • 제15권5호
    • /
    • pp.1096-1107
    • /
    • 2019
  • In this paper, we present an ontology-based approach to labeling influential topics of scientific articles. First, to look for influential topics from scientific article, topic modeling is performed, and then social network analysis is applied to the selected topic models. Abstracts of research papers related to data mining published over the 20 years from 1995 to 2015 are collected and analyzed in this research. Second, to interpret and to explain selected influential topics, the UniDM ontology is constructed from Wikipedia and serves as concept hierarchies of topic models. Our experimental results show that the subjects of data management and queries are identified in the most interrelated topic among other topics, which is followed by that of recommender systems and text mining. Also, the subjects of recommender systems and context-aware systems belong to the most influential topic, and the subject of k-nearest neighbor classifier belongs to the closest topic to other topics. The proposed framework provides a general model for interpreting topics in topic models, which plays an important role in overcoming ambiguous and arbitrary interpretation of topics in topic modeling.

탄소라벨링 브랜드 충성도를 결정하는 요인: 가치태도행동 모형의 적용 (Factors Affecting Carbon-Labeling Brand Loyalty : Applying Value-Attitude-Behavior Model)

  • 김광석;박경원;박기완
    • 환경정책연구
    • /
    • 제13권3호
    • /
    • pp.109-133
    • /
    • 2014
  • 기후변화와 온실가스 감축에 대한 사회적 관심과 정부의 정책이 증가하는 요즘 탄소 라벨링 제도는 저탄소 생산과 저탄소 소비를 연결하는 환경정책으로 시장에 점차 확대되고 있다. 따라서 탄소 라벨링 제품에 대한 소비자 태도와 브랜드 충성도를 분석하기 위하여 탄소 라벨링 소비자 모형을 제시하여, 소비자의 내재된 가치가 탄소 라벨링 제품 및 기업 이미지 형성에 영향을 주고 나아가 브랜드 충성도를 제고하는 과정을 분석하였다. 2차에 걸친 설문조사를 통해 패널 데이터를 수집하여 분석한 결과 소비자의 자율성 가치는 지각된 통제소재에 긍정적인 영향을 주고 기업 이미지를 긍정적으로 형성시켰으며, 환경적 가치는 지각된 소비자 효과를 높이고, 나아가 지각된 장애를 줄임으로써 제품 이미지에 영향을 미침을 확인하였다. 궁극적으로, 긍정적인 기업 이미지와 제품 이미지는 브랜드 충성도를 향상시켰다. 이와 같은 결과는 탄소 라벨링 정책이 기후변화 대응을 위해 온실가스를 감축하는 데 도움이 될 뿐만 아니라 동시에 소비자의 기업 및 제품에 대한 이미지와 브랜드 충성도를 향상시키는 순기능이 있음을 보여준다. 탄소 라벨링책이 소비자 태도와 브랜드 충성도에 미치는 영향을 분석하는 고유의 모형을 제시하고 실증분석한 점에 그 학문적 기여도가 높다고 하겠다. 더욱이, 연구결과는 정부에게 환경정책의 효율성을 높이기 위한 정책제언을 제시하고 있고, 기업에게도 탄소 라벨링과 관련된 마케팅 전략의 방향성을 제안하고 있다는 점에서 실무적 공헌을 갖고 있다.

  • PDF

A Sector-Labeling for generating the Hilbert Space-filling Curve and Its Intention

  • Slamet, Santosa;Naoi, Tohru
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.38-41
    • /
    • 2002
  • Many scientifc applications include manipulation of data points tying in a space. We describe a method, based on sector labeling to generate a space-filling curve for partitioning such given data points. Our method is straightforward and flexible, equipping a one-one correspondence between point-values on the curve and data points in space in more efficient than designated methods found in the literature. It is widely believed that the Hilbert curve achieves the desired properties on linear mappings due to the locality between data points. Therefore we focus on the Hilbert curve since, later on, we identify it as the most suitable for our application. We demonstrate on using our method for the data particles of an n-body simulation that based on Barnes-Hut algorithm.

  • PDF