• 제목/요약/키워드: 학습용 데이터

검색결과 472건 처리시간 0.026초

회전한 상표 이미지의 진위 결정을 위한 기계 학습 데이터 확장 방법 (Machine Learning Data Extension Way for Confirming Genuine of Trademark Image which is Rotated)

  • 구본근
    • Journal of Platform Technology
    • /
    • 제8권1호
    • /
    • pp.16-23
    • /
    • 2020
  • 상표권 보호를 위한 상표 이미지의 진위 결정에 심층 신경망인 합성곱 신경망을 이용할 수 있다. 이를 위해, 상표로 등록되어 있는 한 장의 상표 이미지를 반복적으로 학습하는 것은 기계학습의 성능을 감소시키는 원인이 된다. 따라서, 이러한 응용에서 학습 데이터는 다양한 방법으로 생성된다. 하지만 대상 이미지가 회전되어 있으면 원본이라 하더라도 인식하지 못하거나 위조 상표로 분류되기도 한다. 본 논문에서는 회전한 상표 이미지의 진위 결정을 위한 기계학습 데이터의 확장 방법을 제안한다. 본 논문에서 제안하는 학습 데이터 확장 방법은 기울어진 이미지를 생성하고 이를 학습 데이터로 사용하는 것이다. 본 논문에서 제안하는 학습 데이터 확장 방법의 유효성 검증을 위해 대학의 로고를 대상으로 학습 데이터를 생성하였으며, 이를 활용하여 합성곱 신경망을 학습시킨 후 검증용 데이터를 이용하여 정확도를 평가하였다. 정확도 평가 결과에 따르면 본 논문에서 제안한 방법으로 생성한 학습 데이터를 활용하면 회전한 상표를 대상으로 한 진위 여부 결정에 합성곱 신경망을 활용할 수 있다.

  • PDF

인공지능 학습용 데이터의 개인정보 비식별화 자동화 도구 개발 연구 - 영상데이터기반 - (Research on the development of automated tools to de-identify personal information of data for AI learning - Based on video data -)

  • 이현주;이승엽;전병훈
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.56-67
    • /
    • 2023
  • 최근 데이터 기반 산업계의 오랜 숙원이었던 개인정보 비식별화가 2020년 8월 데이터3법[1]이 개정되어 명시화 되었다. 4차 산업시대의 원유[2]라 불리는 데이터를 산업 분야에서 활성화할 수 있는 기틀이 되었다. 하지만, 일각에서는 비식별개인정보(personally non-identifiable information)가 정보주체의 기본권 침해를 우려하고 있는 실정이다[3]. 이에 개인정보 비식별화 자동화 도구인 Batch De-Identification Tool을 개발 연구를 수행하였다. 본 연구에서는 첫 번째로, 학습용 데이터 구축을 위해 사람 얼굴(눈, 코, 입) 및 다양한 해상도의 자동차 번호판 등을 라벨링하는 이미지 라벨링 도구를 개발하였다. 두 번째로, 객체 인식 모델을 학습하여 객체 인식 모듈을 실행함으로써 개인정보 비식별화를 수행할 수 있도록 하였다. 본 연구의 결과로 개발된 개인정보 비식별화 자동화 도구는 온라인 서비스를 통해 개인정보 침해 요소를 사전에 제거할 수 있는 가능성을 보여주었다. 이러한 결과는 데이터 기반 산업계에서 개인정보 보호와 활용의 균형을 유지하면서도 데이터의 가치를 극대화할 수 있는 가능성을 제시하고 있다

  • PDF

멀티미디어 저작도구 립스틱(LipStick)98

  • 추일대
    • 한국컴퓨터정보학회지
    • /
    • 제5권1호
    • /
    • pp.47-53
    • /
    • 1998
  • 멀티미디어 애플리케이션 개발이나 CD-ROM 타이틀 개발 등 문자, 영상, 음성, 비디오, 하이퍼, 애니메이션 등의 각종 멀티미디어 데이터를 포함한 형태의 교안 작성이나, 멀티미디어용 안내서, 홍보물 혹은 광고물 제작, 학습용, CD-ROM 타이틀을 제작할 수 있으며, 특히 대학에서 멀티미디어 수업 교재로 활용을 많이 할 수 있는 S/W이다.

  • PDF

대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강 (Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning)

  • 황예찬;임진수;이영준;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

고차 데이터 분류를 위한 순차적 베이지안 샘플링을 기반으로 한 하이퍼네트워크 모델의 진화적 학습 기법 (Evolutionary Learning of Hypernetwork Classifiers Based on Sequential Bayesian Sampling for High-dimensional Data)

  • 하정우;김수진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.336-338
    • /
    • 2012
  • 본 연구에서는 고차 데이터 분류를 위해 순차적 베이지만 샘플링 기반의 진화연산 기법을 이용한 하이퍼네트워크 모델의 학습 알고리즘을 제시한다. 제시하는 방법에서는 모델의 조건부 확률의 사후(posterior) 분포를 최대화하도록 학습이 진행된다. 이를 위해 사전(prior) 분포를 문제와 관련된 사전지식(prior knowledge) 및 모델 복잡도(model complexity)로 정의하고, 측정된 모델의 분류성능을 우도(likelihood)로 사 용하며, 측정된 사전분포와 우도를 이용하여 모델의 적합도(fitness)를 정의한다. 이를 통해 하이퍼네트워크 모델은 고차원 데이터를 효율적으로 학습 가능할 뿐이 아니라 모델의 학습시간 및 분류성능이 개선될 수 있다. 또한 학습 시에 파라미터로 주어지던 하이퍼에지의 구성 및 모델의 크기가 학습과정 중에 적응적으로 결정될 수 있다. 제안하는 학습방법의 검증을 위해 본 논문에서는 약 25,000개의 유전자 발현정보 데이터셋에 대한 분류문제에 모델을 적용한다. 실험 결과를 통해 제시하는 방법이 기존 하이퍼네트워크 학습 방법 뿐 아니라 다른 모델들에 비해 우수한 분류 성능을 보여주는 것을 확인할 수 있다. 또한 다양한 실험을 통해 사전분포로 사용된 사전지식이 모델 학습에 끼치는 영향을 분석한다.

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

지능형 튜터링 시스템을 위한 사용자 프로파일 에이전트 모델 설계 (A Design of User Profile Agent Model for Intelligent Tutoring System)

  • 장진철;홍성호;홍성용;이문용;윤완철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1222-1225
    • /
    • 2011
  • 개인화된 IT 서비스의 트렌드는 학습자를 위한 튜터링 시스템에도 학습자의 능력과 수요를 고려한 개인화된 서비스를 요구하고 있다. 본 연구에서는 지능형 튜터링 시스템을 위해 사용자 프로파일 에이전트(UPA, User Profile Agent) 모델을 제안한다. UPA는 프로세스, 메타데이터, 사용자 인터페이스로 구성되어 있으며, 사용자의 기본 정보와 학력 및 경력 정보, 학습 영역 지식, 개인 능력 측정 정보를 메타데이터에 기반으로 저장한다. 저장된 사용자 프로파일 정보는 에이전트의 프로세스에 의해 가공되어 학습자에게 유용한 정보를 제공할 수 있도록 기여할 수 있다. 향후 본 논문의 모형 설계를 기반으로 이러닝 기술 환경의 변화를 반영한 지능화된 지능형 튜터링 시스템 개발에 기여할 수 있도록 연구 발전시키는 것을 목표로 한다.

골재의 신속한 품질평가를 위한 AI 학습용 데이터 구축에 관한 연구 (Research on building AI learning data for rapid quality assessment of aggregates)

  • 민태범;김인;이재삼;백철승
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 가을학술발표대회논문집
    • /
    • pp.209-210
    • /
    • 2023
  • In this study, the accuracy of the assembly rate of fine aggregate and the cleavage rate of coarse aggregate was analyzed using the constructed learning data. As a result, it was possible to predict the distribution of assembly rate for fine aggregate through a simple sample collection image, showing an accuracy of 96%. The classification of the aggregates could be confirmed by analyzing the fracture shape of the gravel, showing an accuracy of 97%.

  • PDF

지능형 학습 시스템을 위한 메타데이터 모형 분석 및 설계 연구 (A Study on Analysis and Design of Metadata Model for Intelligent e-Learning System)

  • 장진철;홍성용;이문용
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2011년도 동계학술대회
    • /
    • pp.211-217
    • /
    • 2011
  • 소셜 네트워크 서비스의 부각과 다매체 환경에서의 사용자 참여 확대와 같은 최근 IT 기술 환경의 변화로 이러닝 시스템 역시 다양한 환경에서 변화하고 있다. 메타데이터는 시스템 간의 상호운용성을 위한 데이터의 규약이며, 이러닝 메타데이터는 국내외 기판에 의해 표준화가 이루어지고 있으나, 주변 환경의 다양한 변화를 고려하는 메타데이터 요소의 제안이 요구되는 상황이다. 본 논문에서는 지능형 학습 시스템을 위한 메타데이터 모형을 분석 및 설계하는 방법을 연구 제안하고, 표준 메타데이터인 KEM 3.0을 기반으로 향후 필요할 것으로 예상되는 메타데이터 요소의 요구사항을 도출하였다. 도출된 요구사항을 바탕으로 요구사항을 중요도에 따라 분류할 수 있는 카노 모형에 따라 3-Layer 모델로 설계하였다. 향후 본 논문의 모형 설계를 기반으로 이러닝 기술 환경의 변화를 반영한 지능형 학습 시스템을 개발하여 국제적 표준화로 발전되기를 기대한다.

  • PDF

머신러닝 기반 유클리드 거리를 이용한 붓꽃 품종 분류 재구성 (A Reconstruction of Classification for Iris Species Using Euclidean Distance Based on a Machine Learning)

  • 남수태;신성윤;진찬용
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.225-230
    • /
    • 2020
  • 기계학습은 데이터를 기반으로 한 컴퓨터를 학습시켜 컴퓨터 스스로 데이터의 경향성을 파악하게 하여 새로운 입력 데이터의 출력을 예측하도록 하는 알고리즘이다. 기계학습은 크게 지도학습, 비지도학습, 강화학습으로 나눌 수 있다. 지도학습은 데이터에 대한 레이블이 주어진 상태로 기계를 학습시키는 방법이다. 즉, 데이터 및 레이블의 쌍을 통해 해당 시스템의 함수를 추론하는 방법으로 새로운 입력 데이터에 대해서 추론한 함수를 이용하여 결과를 예측한다. 그리고 예측하는 결과 값이 연속 값이면 회귀분석, 예측하는 결과 값이 이산 값이면 분류로 사용된다. 새로운 붓꽃 데이터 Sepal length(5.01)과 Sepal width(3.43)을 이용하여 기초 데이터와 유클리드 거리를 분석하였다. 분석결과, 테이블 3의 8번(5, 3.4, setosa), 27번(5, 3.4, setosa), 41번(5, 3.5, setosa), 44번(5, 3.5, setosa) 그리고 40번(5.1, 3.4, setosa)의 데이터 순으로 유사도가 높은 붓꽃으로 분류되었다. 따라서 이론적 실무적 시사점을 제시하였다.