• 제목/요약/키워드: 데이터 종류

검색결과 2,131건 처리시간 0.028초

랜드마크 이미지 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안 연구 (A Study on Designing Metadata Standard for Building AI Training Dataset of Landmark Images)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제54권2호
    • /
    • pp.419-434
    • /
    • 2020
  • 본 연구의 목적은 랜드마크 이미지의 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안을 제시하기 위함이다. 이를 위해, 이미지 검색시스템의 종류와 각각의 색인 방식에 관한 최신 기술 현황을 포괄적으로 조사하여 분석하고, AI 머신러닝을 적용한 랜드마크 인식에 필수적인 학습용 공개 데이터셋과 이미지 객체 인식에 관한 기계학습 도구를 조사하였다. 이를 통해, 랜드마크 이미지 AI 학습용 데이터에 최적화된 메타데이터 요소를 선정하고 각각의 요소에 대한 입력 데이터를 정의하였다. 결론 및 제언에서는 랜드마크 인식을 활용한 추천시스템을 포함한 응용서비스 개발 방안을 논의하였다.

Pocket PC기반의 효율적인 한글 정합 시스템 구현 (Implementation of an efficient Pocket PC- based Hangul Matching System)

  • 박종민;조범준
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1546-1552
    • /
    • 2004
  • 전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)둥에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 정합 알고리즘을 제안하고 구현하였다. 제안된 정합 알고리즘은 입력된 데이터를 곡률을 이용하여 기본획으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다.

빅데이터 처리에 관한 NoSQL 비교연구 (Comparative study on NoSQL for Processing a Big Data)

  • 장래영;배정민;정성재;소우영;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.351-354
    • /
    • 2014
  • 빅데이터의 등장은 RDBMS로 대변되던 기존 데이터베이스 시장에 다양한 변화를 가져왔다. 빅데이터들은 데이터의 양은 증가했으나 개개의 데이터크기는 작아지고, RDBMS상의 데이터들과 비교해 단순해졌다. 이런 특징은 새로운 데이터처리기술을 요하게 되고, 그에 따라 빅데이터처리에 특화된 다양한 데이터베이스기술이 등장하게 되었다. 이를 NoSQL이라고 정의한다. NoSQL은 각각 데이터의 특성에 따른 처리방식이 달라 하나로 정의하기는 어렵다. 이에 본 논문에서는 다양한 NoSQL의 종류별 특징에 따라 분류하고 실제 빅데이터 운용에 있어 적합한 NoSQL을 알아보고자 한다.

  • PDF

승강기 원격 관제를 위한 데이터 수집기 설계 및 구현 (Design and Implementation of Data Logger for Elevator Remote Monitoring)

  • 구본근
    • Journal of Platform Technology
    • /
    • 제8권4호
    • /
    • pp.3-10
    • /
    • 2020
  • 승강기 유지보수 업체는 다양한 종류의 승강기 유지 보수를 담당하고 있어 승강기 제조사, 승강기 모델에 독립적인 승강기 원격 관제 시스템이 필요하다. 이를 위해 각 승강기에서 수집된 승강기 운행 데이터를 수신하여 데이터베이스에 전송할 수 있는 데이터 수집기가 필요하다. 본 논문에서는 중소 규모의 승강기 유지 보수 업체에서 활용할 수 있는 원격 관제 시스템의 데이터 수집기를 설계, 구현한다. 데이터 수집기는 승강기의 운행 상태를 전송하는 센서 모듈이 전송한 데이터 패킷을 수신하여, 데이터를 해석, 변환한 후 자체 개발한 API 를 이용하여 서버로 전송을 한다. 본 논문에서는 파이썬으로 구현한 데이터 수집기에 대해 기술하고, 실 운행 환경에 있는 승강기에 설치된 센서 모듈에서 전송한 데이터를 수신하고, API 서버로 전송하는 것을 화면에 표시된 로그를 통해 보인다.

  • PDF

작물의 병충해 분류를 위한 이미지 활용 방법 연구 (Study on Image Use for Plant Disease Classification)

  • 정성호;한정은;정성균;봉재환
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.343-350
    • /
    • 2022
  • 서로 다른 특징을 가지는 이미지를 통합하여 작물의 병충해 분류를 위한 심층신경망을 훈련하는 것이 학습 결과에 어떤 영향을 미치는지 확인하고, 심층신경망의 학습 결과를 개선할 수 있는 이미지 통합방법에 대해 실험하였다. 실험을 위해 두 종류의 작물 이미지 공개 데이터가 사용되었다. 하나는 인도의 실제 농장 환경에서 촬영된 작물 이미지이고 다른 하나는 한국의 실험실 환경에서 촬영한 작물 이미지였다. 작물 잎 이미지는 정상인 경우와 4종류의 병충해를 포함하여 5개의 하위 범주로 구성되었다. 심층신경망은 전이학습을 통해 사전 훈련된 VGG16이 특징 추출부에 사용되었고 분류기에는 다층퍼셉트론 구조를 사용하였다. 두 공개 데이터는 세 가지 방법으로 통합되어 심층신경망의 지도학습에 사용되었다. 훈련된 심층신경망은 평가 데이터를 이용해 평가되었다. 실험 결과에 따르면 심층신경망을 실험실 환경에서 촬영한 작물 이미지로 학습한 이후에 실제 농장 환경에서 촬영한 작물 이미지로 재학습하는 경우에 가장 좋은 성능을 보였다. 서로 다른 배경의 두 공공데이터를 혼용하여 사용하면 심층신경망의 학습 결과가 좋지 않았다. 심층신경망의 학습 과정에서 여러 종류의 데이터를 사용하는 방법에 따라 심층신경망의 성능이 달라질 수 있음을 확인하였다.

심음을 이용한 SVM 기반의 심장 질환 판별에 관한 연구 (A study of a cardiac disorder distinction based on SVM by using a heart sound)

  • 김보리;백승화;김동완;백승은;권순태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.2173-2174
    • /
    • 2006
  • 심음은 심장이 수축, 확장 시에 심장의 움직임과 혈류의 흐름에 의해 발생하는 음향이다. 심음은 여러 신호원으로 이루어져 있고, 매우 복잡하고 비고정적인 신호이다. 심장의 질환에 따라 심음의 소리는 다르게 나타난다. 심음을 구분하여 심장 질환의 유무를 판단하는 가장 기초적인 기준이 될 수 있다. 본 연구에서는 Support Vector Machine 기법을 이용하여 심음을 통한 심장 질환 판별 검출 알고리즘을 제안하였다. Support Vector Machine은 신경망의 한 종류이며 이진분류에서 좋은 성능을 보인다. 또한 Polynomial Radial Basis Function, Multi-Layer Perceptron Classifiers를 위한 대안적인 학습방법으로 사용된다. 이러한 특성을 사용하여 심음의 데이터들을 일정한 기준에 의하여 (+)데이터와 (-)데이터로 분리한 후, 각 데이터들을 학습시켜 최적의 데이터를 만든다. 이후 각 데이터들은 점층적인 추가 학습을 시킴으로써 적은 양의 학습 데이터만으로도 높은 분류 성능을 표현할 수 있다. 이 연구에서 제안된 SVM을 실제 심음 데이터에 적용한 실험에서 심장 질환의 유무 판별에 우수한 성능을 보임을 확인할 수 있을 것으로 판단된다.

  • PDF

Particle Swarm Optimization 알고리즘을 이용한 바이오칩 데이터의 군집화 및 분류화 기법 (Clustering and Classifying DNA Chip Data using Particle Swarm Optimization Algorithm)

  • 이윤경;윤혜정;이민수;윤경오;최혜연;김대현;이근일;김대영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.151-154
    • /
    • 2007
  • 바이오 칩 분석 시스템은 다양한 종류의 바이오칩에서 자료를 추출하고 유용한 정보를 얻기 위해 데이터를 분석하는 시스템이다. 데이터를 분석하는 다양한 기법 중 대표적인 것이 클러스터링과 분류화(classification)이다. 클러스터링은 비슷한 개체들을 한 집단으로 묶는 방법이고, 분류화는 미리 정해진 클래스에 데이터를 해당하는 클래스로 분류하는 기법이다. 다양한 알고리즘을 통해서 데이터를 클러스터링 및 분류화를 할 수 있는데 바이오칩과 같이 데이터의 양이 방대한 경우는 생태계를 모방한 알고리즘을 적용하는 것이 효율적이다. 본 논문에서는 생태계 모방알고리즘 중 하나인 PSO 집단 알고리즘을 사용하여 바이오칩 데이터로부터 클러스터의 중심을 찾아 클러스터링을 하교, 분류 규칙을 발견하여 이를 바이오 데이터에 적용, 분류해 주는 시스템을 기술하고 있다.

  • PDF

스냅샷을 가지는 다중 레벨 공간 DBMS에서의 효율적인 스냅샷 교체 기법 (Efficient Snapshot Replacement Technique in Multi-Level Spatial DBMS with Snapshot)

  • 오은석;어상훈;김호석;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.196-198
    • /
    • 2005
  • 오늘날 우리가 사용할 수 있는 정보의 양은 실로 막대하면서도 지속적으로 늘어가고 있는 추세이며, 동시에 데이터들의 신속한 처리에 대한 관심이 늘고 있다. 특히 GIS에서 사용되는 대용량 데이터나 빠른 처리 속도가 요구되는 인증 시스템 데이터와 같은 다양한 종류의 데이터 특성을 고려하여 효율적인 관리를 하는 데이터베이스 관리 시스템을 필요로 하고 있다. 스냅샷 데이터를 갖는 다중 레벨 공간 DBMS는 대용량, 또는 빠른 트랜잭션 처리 속도가 필요한 데이터들을 효율적으로 관리하는 데이터베이스 관리 시스템으로서, 대용량 데이터는 디스크 데이터베이스에서 그리고 빠른 트랜잭션 처리를 요구하는 데이터들은 스냅샷의 형태로 메모리 데이터베이스에서 관리한다. 메모리 데이터베이스에 저장되는 스냅샷은 상대적으로 더욱 중요한 스냅샷들이 집중적으로 생성되거나 스냅샷이 가진 특성이 변화될 경우, 메모리 데이터베이스 내에서의 저장 가치를 잃을 수가 있다. 따라서 메모리 데이터베이스에 불필요한 스냅샷들이 축적되는 문제를 해결하고 메모리의 이용성과 성능을 보존하기 위해서 효율적으로 스냅샷들을 교체하는 기법이 필요하다. 본 논문에서는 다중 레벨 공간 DBMS에서 질의 패턴을 이용한 효율적인 스냅샷 교체 기법을 제안한다. 제안된 기법은 메모리 데이터베이스 내에서 스냅샷에 대한 교체요청이 있을 경우, 메모리 데이터베이스 및 메모리 관리 시스템의 상창을 분석하여 주어진 상황에 대응하는 스냅샷 교체 기법을 수행한다.

  • PDF

의료 빅데이터의 활용과 해결과제 (Applications and Issues of Medical Big Data)

  • 우성희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.545-548
    • /
    • 2016
  • 빅데이터는 디지털 환경에서 생성되는 모든 데이터를 의미하며 규모가 방대하고 생성주기가 짧고 다양한 형태를 가지는 특성이 있다. 스마트폰과 인터넷이 대중화되면서 사용자들이 남기는 데이터의 양과 종류는 점점 더 큰 규모로 생성되고 있으며 생성된 빅 데이터로 부터 사용가치가 있는 정보만을 추출하여 활용하는 시기로 전환되고 있다. 빅데이터는 또한 의료 산업이나 보건 분야에도 응용될 수 있으며 IoT, 스마트 헬스케어등의 기술과 함께 융합되어 시너지 효과를 창출하고 있다. 그러나 방대한 데이터를 의미있고 안전하게 활용하기 위해서는 정보보호 등의 선행과제가 존재한다. 따라서 본 연구에서는 의료 빅데이터 활용사례와 기대효과, 해결과제, 마지막으로 의료 빅데이타의 미래전망을 분석한다.

  • PDF

디지털콘텐츠 메타데이터 포맷의 비교 연구 (A Comparative Study on Metadata Formats of Digital Contents)

  • 조윤희
    • 한국문헌정보학회지
    • /
    • 제37권2호
    • /
    • pp.135-152
    • /
    • 2003
  • 인터넷의 급속한 확산으로 디지털콘텐츠가 기하급수적으로 증가하고, 그 종류도 매우 다양해졌다. 분산 네트워크 환경하인 인터넷을 통해 디지털콘텐츠의 식별 및 검색을 용이하게 하기 위해서는 메타데이터의 조직과 관리가 필요하다. 본 연구는 여러 분야에서 다양하게 접근되고 있는 메타데이터 포맷의 데이터 요소를 비교 분석함으로써 상이한 메타데이터 포맷의 상호운용성 확보를 위한 기초 자료를 제공하고자 하였다. 포괄적으로 모든 영역에서 사용되고 있는 디지털콘텐츠의 메타데이터 포맷으로 Dublin Core, Semantic Header, MARC, IAFA Templates TEI Header를 선정하여 문헌고찰을 통하여 비교분석을 수행하였다.